语音输入的处理方法，终端和网络服务器与流程

文档序号：14653508发布日期：2018-06-08 22:28阅读：191来源：国知局

本发明涉及通信领域，具体而言，涉及一种语音输入的处理方法，终端和网络服务器。

背景技术：

在相关技术中，语音助手是一款智能型的手机应用，通过智能对话与即时问答的智能交互，实现帮忙用户解决问题，其主要是帮忙用户解决生活类问题，通过此类应用，可以大大提高在不同场景下操作手机的便利性。自2011年苹果将Siri带进手机市场开创语音助手先河之后，语音助手类应用可谓火的一塌糊涂。随着技术发展，人们需求的不断提高，手机语音功能的广泛使用是一种必然趋势。

但目前语音的使用场景还比较单一，主要是对话形式或者转化为一条指令。

针对相关技术中，用户通过语音输入来操作手机实现的用途单一的问题，目前还没有有效的解决方案。

技术实现要素：

本发明实施例提供了一种语音输入的处理方法，终端和网络服务器，以至少解决相关技术中用户通过语音输入操作手机用途单一的问题。

根据本发明的一个实施例，提供了一种语音输入的处理方法，包括：

终端接收用户的语音指令；

所述终端获取与所述语音指令关联的多个待执行任务，并执行所述多个待执行任务。

可选地，所述终端获取与所述语音指令关联的多个待执行任务，包括以下之一：

所述终端依据所述语音指令从所述终端的本地数据库中查找与所述语音指令对应的任务，并将查找到的任务确定为所述多个待执行任务；

在所述终端依据所述语音指令从所述终端的本地数据库中没有查找到与所述语音指令对应的任务的情况下，所述终端将所述语音指令发送到网络服务器，并接收所述网络服务器获取的与所述语音指令对应的任务，并将该任务确定为所述多个待执行任务。

可选地，所述终端获取与所述语音指令关联的多个待执行任务，包括：

所述终端将所述语音指令转换为字符指令，获取与所述字符指令关联的所述多个待执行任务。

可选地，执行所述多个待执行任务之前，所述方法还包括：

所述终端显示所述多个待执行任务；

接收用户输入的调整指令，并依据所述调整指令管理所述多个待执行任务。

可选地，在依据所述调整指令管理所述多个待执行任务之后，将所述调整后的多个待执行任务上传至网络服务器，其中，所述网络服务器存储有所述语音指令与所述多个待执行任务的映射关系。

可选地，执行所述多个待执行任务，包括：

所述终端依据预设顺序调用所述终端内置的多个应用程序分别执行所述多个待执行任务。

根据本发明的另一个实施例，还提供了一种语音输入的处理方法，包括：

网络服务器接收终端上传的通过转换语音指令得到的字符指令；

获取与所述字符指令对应的多个待执行任务，并将所述多个待执行任务下发到所述终端。

可选地，在获取与所述字符指令对应的多个待执行任务之后，所述网络服务器将记录有所述多个待执行任务的第一列表发送到所述终端；

接收所述终端发送的第二列表，其中，所述第二列表是所述终端依据用户的调整指令调整过的所述第一列表；

建立所述第二列表与所述字符指令的映射关系，并存储所述映射关系。

根据本发明的另一个实施例，还提供了一种终端，其特征在于，包括：

语音采集电路，用于接收用户的语音指令，并将所述语音指令传输到第一处理器；

第一处理器，用于获取与所述语音指令关联的多个待执行任务，并执行所述多个待执行任务。

可选地，所述第一处理器还用于通过以下方式之一获取与所述语音指令关联的多个待执行任务：

所述第一处理器用于依据所述语音指令从所述终端的本地数据库中查找与所述语音指令对应的任务，并将查找到的任务确定为所述多个待执行任务；

所述第一处理器还用于在依据所述语音指令从所述终端的本地数据库中没有查找到与所述语音指令对应的任务的情况下，将所述语音指令发送到网络服务器，并接收所述网络服务器获取的与所述语音指令对应的任务，并将该任务确定为所述多个待执行任务。

可选地，所述第一处理器还用于将所述语音指令转换为字符指令，获取与所述字符指令关联的所述多个待执行任务。

可选地，所述第一处理器还用于在执行所述多个待执行任务之前，通过所述终端的显示器显示所述多个待执行任务；

所述第一处理器还用于接收用户输入的调整指令，并依据所述调整指令管理所述多个待执行任务。

可选地，所述第一处理器还用于在依据所述调整指令管理所述多个待执行任务之后，将调整后的多个待执行任务上传至网络服务器，其中，所述网络服务器存储有所述语音指令与所述多个待执行任务的映射关系。

可选地，所述第一处理器用于依据预设顺序调用所述终端内置的多个应用程序分别执行所述多个待执行任务。

根据本发明的另一个实施例，还提供了一种网络服务器，包括：

通信装置，用于接收终端上传的通过转换语音指令得到的字符指令，并将第二处理器获取的多个待执行任务下发到所述终端；

所述第二处理器，用于获取与所述字符指令对应的所述多个待执行任务。

可选地，所述通信装置用于将记录有所述多个待执行任务的第一列表发送到所述终端，并接收所述终端发送的第二列表，其中，所述第二列表是所述终端依据用户的调整指令调整过的所述第一列表；

所述第二处理器，还用于建立所述第二列表与所述字符指令的映射关系，并存储所述映射关系。

根据本发明的又一个实施例，还提供了一种存储介质。该存储介质设置为存储用于执行以下步骤的程序代码：

终端接收用户的语音指令；

所述终端获取与所述语音指令关联的多个待执行任务，并执行所述多个待执行任务。

可选地，存储介质还设置为存储用于执行以下步骤的程序代码：

网络服务器接收终端上传的通过转换语音指令得到的字符指令；

获取与所述字符指令对应的多个待执行任务，并将所述多个待执行任务下发到所述终端。

通过本发明，终端接收到用户输入的语音，将语音转换之后，识别出语音中表达的事件，终端自身识别或者求助于网络服务器，解析出执行该事件过程中需要进行的多个任务，后续依次执行上述多个任务。解决了相关技术中用户通过语音输入来操作手机实现的用途单一的问题，有效扩展了用户通过语音来操控终端的便捷性。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本申请的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1是根据本发明实施的一种终端的硬件结构框图；

图2是根据本发明实施例的一种网络服务器的硬件结构框图；

图3是根据本发明实施例的一种语音输入的处理方法流程图；

图4是跟本发明优选实施例中四大模块依据语音执行后续步骤的流程图。

具体实施方式

下文中将参考附图并结合实施例来详细说明本发明。需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

实施例一

本申请文件中的技术方案可以运行于手机，平板电脑等终端上。

图1是根据本发明实施的一种终端的硬件结构框图，如图1所示，该终端10包括：

语音采集电路102，用于接收用户的语音指令，并将该语音指令传输到第一处理器104；需要补充的是，语音采集电路可以是麦克风或者耳机等语音输入设备的相关电路。语音指令可以是用户直接发出的，也可以是音频设备预先存储的再播放出来的。

第一处理器104，用于获取与该语音指令关联的多个待执行任务，并执行该多个待执行任务。

可选地，该第一处理器104还用于通过以下方式之一获取与该语音指令关联的多个待执行任务：

该第一处理器104用于依据该语音指令从该终端的本地数据库中查找与该语音指令对应的任务，并将查找到的任务确定为该多个待执行任务；

该第一处理器104还用于在依据该语音指令从该终端的本地数据库中没有查找到与该语音指令对应的任务的情况下，将该语音指令发送到网络服务器，并接收该网络服务器获取的与该语音指令对应的任务，并将该任务确定为该多个待执行任务。

可选地，该第一处理器104还用于将该语音指令转换为字符指令，获取与该字符指令关联的该多个待执行任务。

可选地，该第一处理器104还用于在执行该多个待执行任务之前，通过该终端的显示器显示该多个待执行任务；

该第一处理器104还用于接收用户输入的调整指令，并依据该调整指令管理该多个待执行任务。

可选地，该第一处理器104还用于在依据该调整指令管理该多个待执行任务之后，将调整后的多个待执行任务上传至网络服务器，其中，该网络服务器存储有该语音指令与该多个待执行任务的映射关系。

可选地，该第一处理器104用于依据预设顺序调用该终端内置的多个应用程序分别执行该多个待执行任务。

图2是根据本发明实施例的一种网络服务器的硬件结构框图，如图2所示，该网络服务器20包括：

通信装置202，用于接收终端上传的通过转换语音指令得到的字符指令，并将第二处理器获取的多个待执行任务下发到该终端；

该第二处理器204，用于获取与该字符指令对应的该多个待执行任务。

可选地，该通信装置202用于将记录有该多个待执行任务的第一列表发送到该终端，并接收该终端发送的第二列表，其中，该第二列表是该终端依据用户的调整指令调整过的该第一列表；

该第二处理器204，还用于建立该第二列表与该字符指令的映射关系，并存储该映射关系。

实施例二

图3是根据本发明实施例的一种语音输入的处理方法流程图，如图3所示，该方法包括以下步骤：

步骤S302，终端接收用户的语音指令；

步骤S304，该终端获取与该语音指令关联的多个待执行任务，并执行该多个待执行任务。

采用上述技术方案，终端接收到用户输入的语音，将语音转换之后，识别出语音中表达的事件，终端自身识别或者求助于网络服务器，解析出执行该事件过程中需要进行的多个任务，后续依次执行上述多个任务。解决了相关技术中用户通过语音输入来操作手机实现的用途单一的问题，有效扩展了用户通过语音来操控终端的便捷性。

可选地，该终端获取与该语音指令关联的多个待执行任务，包括以下之一：

该终端依据该语音指令从该终端的本地数据库中查找与该语音指令对应的任务，并将查找到的任务确定为该多个待执行任务；

在该终端依据该语音指令从该终端的本地数据库中没有查找到与该语音指令对应的任务的情况下，该终端将该语音指令发送到网络服务器，并接收该网络服务器获取的与该语音指令对应的任务，并将该任务确定为该多个待执行任务。

可选地，该终端将该语音指令转换为字符指令，获取与该字符指令关联的该多个待执行任务。

可选地，执行该多个待执行任务之前，该终端显示该多个待执行任务；

接收用户输入的调整指令，并依据该调整指令管理该多个待执行任务。

可选地，在依据该调整指令管理该多个待执行任务之后，将该调整后的多个待执行任务上传至网络服务器，其中，该网络服务器存储有该语音指令与该多个待执行任务的映射关系。

可选地，该终端依据预设顺序调用该终端内置的多个应用程序分别执行该多个待执行任务。

根据本发明的另一个实施例，还提供了一种语音输入的处理方法，其特征在于，包括：

网络服务器接收终端上传的通过转换语音指令得到的字符指令；

获取与该字符指令对应的多个待执行任务，并将该多个待执行任务下发到该终端。

可选地，在获取与该字符指令对应的多个待执行任务之后，该网络服务器将记录有该多个待执行任务的第一列表发送到该终端；

接收该终端发送的第二列表，其中，该第二列表是该终端依据用户的调整指令调整过的该第一列表；

建立该第二列表与该字符指令的映射关系，并存储该映射关系。

下面结合本发明的优选实施例进行详细说明。

在本申请文件中提供的语音识别的终端具有以下各个模块的功能：语音识别模块(相当于上述实施例中的语音采集电路102)，需求解析模块，中央处理模块，需求记录模块(后续三个模块的功能相当于上述实施例中的第一处理器104)。

语音识别模块，用于采集和识别用户的语音并转化为一条字符指令,这里称为一个用户故事，输出给需求解析模块。(需要补充的是，本优选实施例中记载的用户故事包括多个需求，该多个需求即上述实施例中的多个待执行任务)。

需求解析模块，预先将用户故事数据发送到本地需求数据库进行解析，若解析无果再发送到云端需求解析数据服务器进行解析。并将需求解析结果发送到中央处理模块。

该云端需求数据服务器，根据大量用户的行为数据统计学习并结合数据挖掘系统以及采用向量机分类器等方法，建立需求分类数据库，并不断更新和升级。并将解析出的需求数据以指定格式，输出到中央处理模块。

具体实现：一条用户指令为“我10月15号要去北京出差”，云端需求解析服务器会先从指令中提取出关键数据“10月15号，北京，出差”，并将关键数据在需求解析数据库中进行需求匹配，最终深度解析出一些列需求：订机票/火车票，订酒店，起床闹钟，定时叫车等一系列需求。

中央处理模块，用于接收需求数据，并以时间顺序排列成列表，以UI界面的形式呈现给用户，用户可(用语音或手动)进行修改和配置，待用户确认后，将故事的需求列表输出到需求记录模块进行保存。然后按顺序开始执行该故事的需求列表。一个用户故事可能包含多条需求，中央处理器需要协作调用各个应用模块完成这些需求，还可根据需求提供界面或语音让用户进行选择。每当执行完该故事的一条需求，通知需求记录模块从需求列表中移除该条需求。执行每条需求时可通过语音或界面提示用户。

需求记录模块，该模块接收并保存用户确认的需求列表，用户的一个语音指令我们称之为一个故事，该故事对应一个需求列表。提供操作接口给中央处理模块，以便删除已完成的需求，所有需求完成，该故事也自动删除。

本发明优选实施例中的具体技术方案如下：

第一步：语音识别模块，采集语音指令，识别并转化为字符指令(即一个用户故事)，输出给需求解析模块。

第二步：需求解析模块，将用户故事数据发送到本地需求数据库进行解析，若解析无果再发送到云端需求解析数据服务器进行解析。并将需求解析结果发送到中央处理模块。

具体用例：一条用户指令为“我10月15号要去北京出差”，云端需求解析服务器会先从指令中提取出关键数据“10月15号，北京，出差”，并将关键数据在需求解析数据库中进行需求分析和匹配。关键字“出差”解析出的需求有：订机票/火车票，订酒店，设置日程闹钟，定时叫车等一系列需求，再与“时间”“目的地”等关键字进行组合，最终输出的需求为：

1)订机票/火车票(10月15号到达)

2)订北京的酒店(10月15号起)

3)日程闹钟(10月15号7点)

4)定时叫车(10月15号8点)

这些需求可能会转换为已协议预定的字符或格式返回.

第三步：中央处理模块，

(1)接收需求数据，并以时间顺序排列成列表，以UI界面的形式呈现给用户，用户可以说“修改第X条”或手动点击需求条目，进入子界面进行修改。例如在上述例子中，用户可以修改订机票还是火车票，订酒店的起止日期，闹钟的时间，以及打车的时间和目的地，或者删除某一条需求，然后确认执行。待用户确认后，中央处理模块将该故事的需求列表输出到需求记录模块进行保存。

(2)然后按顺序开始执行该故事的需求列表。一条需求可能对应多个功能，中央处理器需要协作调用各个应用模块完成该需求。

例子1:订机票(10月15号),需要联动的模块有

a)打开定位开关，获取当前城市信息。

b)用语音助手播报“正在为你预定去北京的机票，请您确认航班”。

c)打开订票软件(若没有即打开订票网站)，并将起点终点城市信息进行搜索，等待用户选择和预定搜索出来的航班。

例子2：叫车去机场(10月15号8点)

a)设置一个10月15号8点的需求型日程闹钟，并将该需求的编号保存到日程闹钟内容里。

b)日程闹钟到时，触发中央处理模块去读取日程中的需求编号，并从需求模块查找和执行该需求“叫车去机场”。

c)打开定位开关获取当前起点位置。

d)将起止地点输入打车软件开始查询价格，等待用户确认叫车。

(3)当一条需求执行完成，中央处理器会自动检查是否会影响列表中的其他需求，找出可能受到影响的需求，进行自动调整，并弹出相关的需求条目请用户确认：

(a)日程闹钟(10月15号12点)

(b)定时叫车(10月15号13点)

(4)每当执行完一条需求，中央处理模块即从需求记录模块中移除该条需求。

第四步：需求记录模块,记录各个用户故事对应的需求列表，提供操作接口给中央处理模块，以便删除已完成的需求，所有需求完成，该故事也自动删除。同时也为用户提供了入口可以随时删除需求列表，从而中断需求任务的执行。

图4是跟本发明优选实施例中四大模块依据语音执行后续步骤的流程图，如图4所示，中央处理器可以联动控制图4中左侧的多个模块分别执行上述任务，最重要的是中央处理模块和云端需求解析服务器,中央处理模块负责解析需求并调用其他所有模块共同联动工作，可以比喻为一台智能化机器人。本地和云端需求解析服务器，对用户需求进行智能挖掘和分析，云端服务器可以不断学习和更新升级。

采用上述优选实施例中的技术方案，为用户提供一套智能化语音服务系统，可以准确和深度解析用户一句简短指令中包含的需求,并协调各个应用模块联动为用户提供服务，以完成用户希望的系列需求。极大程度为用户节约时间，给用户提供更方便和人性化的语音体验服务。

实施例三

本发明的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

S1，终端接收用户的语音指令；

S2，该终端获取与该语音指令关联的多个待执行任务，并执行该多个待执行任务。

可选地，存储介质还被设置为存储用于执行以下步骤的程序代码：

S3，网络服务器接收终端上传的通过转换语音指令得到的字符指令；

S4，获取与该字符指令对应的多个待执行任务，并将该多个待执行任务下发到该终端。

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地，在本实施例中，处理器根据存储介质中已存储的程序代码执行上述实施例中的方法步骤。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本发明的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本发明不限制于任何特定的硬件和软件结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李颖
技术所有人：中兴通讯股份有限公司
我是此专利的发明人

上一篇：一种音频数据播放方法和双屏移动终端与流程
上一篇：一种分布式云拼接系统及其拼接方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。