一种动态配置语音识别服务的方法及系统与流程

文档序号：16308971发布日期：2018-12-19 05:12阅读：214来源：国知局

本发明涉及智能语音
技术领域：
，特别涉及一种动态配置语音识别服务的方法及系统。
背景技术：
语音识别和语音合成是语音技术在计算机领域中的两大关键技术，其中语音识别是智能计算机系统的重要特征，通过语音识别服务计算机系统能够改变传统的人机交互界面，实现人机语音合成。现如今随着语音技术的发展，语音识别服务提供商多种多样，各家的语音识别服务能力和支持擅长的领域各不相同，由于各家语音识别服务系统采用不同的接口封装，相互不兼容，因此现有的终端语音平台通常只集成一家的语音识别服务，用户不能根据自身需求自主配置语音识别服务影响用户体验，此外，当语音识别服务系统出现失效或者由于其他原因停用服务时，终端语音平台不能通过后台配置选择其他语音识别服务，给用户造成不便。技术实现要素：为了解决现有技术的问题，本发明提供了一种动态配置语音识别服务的方法及系统。所述技术方案如下：一方面，提供了一种动态配置语音识别服务的方法，所述方法包括以下步骤：采用通用接口封装不同语音识别服务商提供的语音识别服务，使所述语音识别服务能够继承所述通用接口；终端与云端建立长链接；向云端发送用户定制化信息；接收云端根据所述用户定制化信息发送来的配置信息，所述配置信息包括所述语音服务的调用逻辑；根据配置信息并通过所述通用接口调用相应的语音识别服务。进一步地，该方法还包括：通过所述云端更新配置信息；所述根据配置信息并通过所述通用接口调用相应的语音识别服务包括：终端根据云端发送的配置信息调出相应的语音识别服务，判断旧的语音识别服务是否初始化，若初始化则释放旧的语音识别服务，初始化并使用新的语音识别服务；若未初始化则直接初始化并使用新的语音识别服务。进一步地，所述用户定制化信息包括用户属性信息和用户个性信息；所述用户属性信息由终端主动获取，所述用户个性信息由终端被动获取。进一步地，所述终端为智能电视机。进一步地，所述通用接口包含有语音识别服务操作的抽象方法，所述抽象方法包括语音识别、语音合成。另一方面，提供了一种动态配置语音识别服务的系统，所述系统包括：终端和云端服务器；所述终端，用于获取和向所述云端服务器发送用户定制化信息，并根据所述云端服务器反馈的配置信息调用相应的语音识别服务；所述云端服务器，用于接收并根据所述用户定制化信息向所述终端发送配置信息。进一步地，所述终端包括第一连接模块，用于与云端服务器建立长链接；用户定制化信息存储模块，用于存储用户定制化信息；语音识别服务存储模块，用于存储语音识别服务，所述语音识别服务采用通用接口封装；第一处理模块，用于根据云端发送来的配置信息调用相应的语音识别服务。进一步地，所述用户定制化信息存储模块包括：用户属性信息获取模块，用于获取用户属性信息；用户个性信息获取模块，用于获取用户个性信息。进一步地，所述云端服务器包括第二连接模块，用于与终端建立长链接；配置信息存储模块，用于存储配置信息；第二处理模块，用于根据终端发来的用户定制化信息发送相应的配置信息。进一步地，所述云端服务器还包括配置信息更新模块，用于更新配置信息；所述第一处理模块还包括初始化模块，用于判断以及初始化语音识别服务。本发明提供的技术方案带来的有益效果是：本发明将不同语音识别服务商提供的语音识别服务用通用接口封装后存储在终端上，将调用不同语音识别服务的配置信息存储在云端上，然后通过云端控制终端调用语音识别服务，一方面实现了不同语音识别服务在同一个终端语音平台上的集成，另一方面通过云端能够方便后台控制和更新配置信息，从而使得终端能够按照用户需求选择相应的语音识别服务商，也避免了因语音识别服务停用而影响用户体验情况。附图说明为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。图1是本发明实施例1提供的动态配置语音识别服务的方法流程图；图2是本发明实施例1提供的动态配置语音识别服务的系统结构图；图3是本发明实施例2提供的动态配置语音识别服务的方法流程图；图4是本发明实施例2提供的动态配置语音识别服务的系统结构图；图5是本发明实施例3提供的通用接口封装类图。具体实施方式为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。实施例1如图1所示，一种动态配置语音识别服务的方法，主要包括以下步骤：采用通用接口封装不同语音识别服务商提供的语音识别服务，使所述语音识别服务能够继承所述通用接口；终端与云端建立长链接；向云端发送用户定制化信息；接收云端发送来的配置信息，其中配置信息包括语音识别服务的调用逻辑；根据配置信息并通过所述通用接口调用相应的语音识别服务。其中用户定制化信息包括用户属性信息和用户个性信息；用户属性信息由终端主动获取，即为终端的id信息、定位信息、终端型号信息等。用户个性信息由终端被动获取，即为用户自主输入至终端内的信息，如用户个人信息、个人习惯、喜好等。通用接口包含有语音识别服务操作的抽象方法，其中抽象方法包括语音识别和语音合成。如图2所示，一种动态配置语音识别服务的系统，包括：终端和云端服务器，其中终端用于向云端服务器发送用户定制化信息，并根据云端服务器反馈的配置信息调用相应的语音识别服务；云端服务器用于接收并根据用户定制化信息发送配置信息。终端包括第一连接模块，用于与云端服务器建立长链接；用户定制化信息存储模块，用于存储用户定制化信息；语音识别服务存储模块，用于存储语音识别服务；第一处理模块，用于根据云端发送来的配置信息调用相应的语音识别服务。其中用户定制化信息存储模块包括：用户属性信息获取模块，用于获取用户属性信息；用户个性信息获取模块，用户获取用户个性信息。云端服务器包括第二连接模块，用于与终端建立长链接；配置信息存储模块，用于存储配置信息；第二处理模块，用于根据终端发来的用户定制化信息发送相应的配置信息。本系统通过终端和云端服务器中的第一连接模块和第二连接模块进行用户定制化信息和配置信息的传递，从而达到通过云端控制调用语音识别服务的目的。实施例2如图3所示，一种动态配置语音识别服务的方法，主要包括以下步骤：采用通用接口封装不同语音识别服务商提供的语音识别服务，所述通用接口包含有语音识别服务操作的抽象方法；终端与云端建立长链接；向云端发送用户定制化信息；云端更新配置信息；接收云端发送来的配置信息；根据云端发送的配置信息并通过所述通用接口调出相应的语音识别服务；终端判断旧的语音识别服务是否初始化，若初始化则释放旧的语音识别服务，重新初始化并使用新的语音识别服务；若未初始化则直接初始化并使用新的语音识别服务。其中用户定制化信息包括用户属性信息和用户个性信息；用户属性信息由终端主动获取，用户个性信息由终端被动获取。如图4所示，一种动态配置语音识别服务的系统，包括：终端和云端服务器。终端包括第一连接模块，用于与云端服务器建立长链接；用户定制化信息存储模块，用于存储用户定制化信息；语音识别服务存储模块，用于存储语音识别服务；第一处理模块，用于根据云端发送来的配置信息调用相应的语音识别服务。其中用户定制化信息存储模块包括：用户属性信息获取模块，用于获取用户属性信息；用户个性信息获取模块，用户获取用户个性信息。云端服务器包括第二连接模块，用于与终端建立长链接；配置信息存储模块，用于存储配置信息；配置信息更新模块，用于更新配置信息；第二处理模块，用于根据终端发来的用户定制化信息发送相应的配置信息，第一处理模块还包括初始化模块，用于判断以及初始化语音识别服务。实施例2提供了配置信息更新情况下的动态配置语音识别服务的方法和系统。配置信息由维护人员通过云端服务器更新，并通过终端和云端服务器之间建立的长链接传递。实施例3实施例3提供在智能电视机上使用本发明一种动态配置语音识别服务的方法和系统的情形。由于各个语音识别服务的提供商采用的语音识别sdk(软件包)均不相同，因此为了使不同类语音识别sdk集成在同一智能电视机上就需要对语音识别sdk进行封装，如下表1所示，3个不同厂家提供不同的语音服务的sdk，所提供的语音识别和播报的方法也不相同，表1sdk开始识别方法停止识别方法开始播报方法停止播报方法baiduduerossdkstartrecognition()stoprecognition()speaktts()stoptts()speechduisdkstartdialog()stopdialog()speak()shutup()hcicloudsdkhciseedasrstartrecorder()hciseedasrstoprecorder()hciseedttsplay()hciseedttsstop()采用ivoicesdkmanager接口封装，如下表2所示，ivoicesdkmanager接口包含开始语音识别、停止语音识别、开始语音合成、停止语音合成等一些语音识别操作的抽象方法，这里的语音合成包括了语音播报的方法。不同的sdk会有一些不同的内部逻辑调用，例如事件上报，结果解析等，将在封装成的voicesdkmanager内部完成，业务逻辑层无需考虑voicesdkmanager内部具体实现逻辑，只需要调用ivoicesdkmanager定义好的接口即可。封装类图如图5所示，不同类都继承通用接口ivoicesdkmanager，应用包含的业务逻辑层持有ivoicesdkmanager的实例，依赖通用接口ivoicesdkmanager。表2接口开始识别方法停止识别方法开始播报方法停止播报方法ivoicesdkmanagerstartrecorder()stoprecorder()starttts()stoptts()用户使用时，将智能电视机开机联网后，与云端服务器建立长链接，并向云端服务器发送用户定制化信息，所述用户定制化信息包括用户属性信息和用户个性信息。云端服务器根据接收到的用户定制化信息箱智能电视机发送配置信息，配置信息包括语音识别服务的调用逻辑，智能电视机应用包括业务逻辑层，业务逻辑层持有语音识别服务实例，根据接收到的配置信息以及业务逻辑调用相应的语音识别服务。当需要更新配置信息时，运维人员通过云端服务器更新配置信息，智能电视机接收到更新后的配置信息后，调出相应的语音识别服务实例，然后判断旧的语音识别服务实例是否初始化，若是则释放旧的语音识别服务实例，重新初始化并使用新的语音识别服务实例，若否则直接初始化并使用新的语音识别服务实例。基于上述方法设计的一种动态配置语音识别服务的系统，包括：智能电视机和云端服务器。智能电视机包括第一连接模块，可以是wlan无线连接模块；用户定制化信息存储模块，用于存储用户定制化信息，包括用户定制化信息存储模块和用户个性信息获取模块；语音识别服务存储模块，用于存储语音识别服务；第一处理模块，用于根据云端发送来的配置信息调用相应的语音识别服务。云端服务器包括第二连接模块，用于与终端建立长链接；配置信息存储模块，用于存储配置信息；配置信息更新模块，用于更新配置信息；第二处理模块，用于根据终端发来的用户定制化信息发送相应的配置信息，第一处理模块还包括初始化模块，用于判断以及初始化语音识别服务。上述所有可选技术方案，可以采用任意结合形成本发明的可选实施例，在此不再一一赘述。以上所述仅为本发明的较佳实施例，并不用以限制本发明，凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：许山蒙;易群;裴英
技术所有人：苏宁智能终端有限公司
我是此专利的发明人

上一篇：一种人脸跟踪方法和系统与流程
上一篇：应用机器手臂之记忆体模组智能检测系统的制作方法