基于云端和多命令词的汽车语音控制方法、系统及装置与流程

文档序号：13616209阅读：210来源：国知局

本发明涉及语音控制领域，尤其是基于云端和多命令词的汽车语音控制方法、系统及装置。

背景技术：

随着汽车信息技术的不断发展，车载语音控制系统也得到的快速的发展，语音控制系统应用于汽车内部电子电器控制具有十分重要的意义。车载语音控制系统可以有效减少驾驶员在行车过程中的复杂的手势动作及其它不方便的驾驶动作，通过对驾驶员的语音识别可以快速、准确有效地实现驾驶员所需要的行车中的任务功能。车载语音控制系统为驾驶员和车辆之间提供一种了简单、有效地互动方式，使驾驶员能轻松完成各种控制和操作，提高驾驶安全性的同时也能提高驾驶乐趣。

现有技术中的车载语音控制系统，在采集到用户输入的语音命令后，直接将用户输入的语音命令与车载语音控制系统的命令词数据库进行匹配，进而获取用户的语音命令所对应的汽车控制指令，实现对汽车的控制操作。现有的车载语音控制系统在与用户的交互过程中，每次只能识别并执行一个命令词动作，无法满足用户需要一次性执行多个动作的需求，而且现有车载语音系统直接对客户的语音命令进行匹配处理，匹配准确率较低，交互性较差。

技术实现要素：

为解决上述技术问题，本发明的目的在于：提供一种能同时执行多个命令词动作，匹配准确率高，交互性好的基于云端和多命令词的汽车语音控制方法、系统及装置。

本发明所采取的第一个技术方案是：

基于云端和多命令词的汽车语音控制方法，包括以下步骤：

对语音命令进行语音识别，得到语音识别后的文字信息；

云端对得到的文字信息进行语义分析，根据云端存储的命令词数据库匹配生成含有一个或多个命令词的结构化数据；

根据生成的结构化数据执行相应控制命令。

进一步，所述对语音命令进行语音识别，得到语音识别后的文字信息这一步骤，包括以下步骤：

车载端对用户发出的语音命令进行语音降噪；

车载端对降噪后的语音命令进行语音识别，得到语音识别后的文字信息；

车载端将语音识别后的文字信息发送给云端。

进一步，所述云端对得到的文字信息进行语义分析，根据云端存储的命令词数据库匹配生成含有一个或多个命令词的结构化数据这一步骤，包括以下步骤：

云端对得到的文字信息进行命令词模式匹配操作；

云端根据命令词模式匹配操作的结果，生成含有一个或多个命令词的结构化数据。

进一步，所述云端对得到的文字信息进行命令词模式匹配操作这一步骤，包括以下步骤：

根据命令词数据库，云端对得到的文字信息进行核心命令词匹配，得到文字信息中的一个或多个命令词；

根据得到的一个或多个命令词，云端对得到的文字信息进行命令词前后缀匹配，并对匹配得到的命令词前后缀进行规则匹配处理；

根据得到的一个或多个命令词，云端对得到的文字信息进行命令词幅度匹配，并对匹配得到的命令词幅度进行格式化处理。

进一步，所述对匹配得到的命令词前后缀进行规则匹配处理这一步骤，包括以下步骤：

判断命令词的前后缀是否存在否定词，若是则执行下一步骤；反之，则直接执行根据得到的一个或多个命令词，云端对得到的文字信息进行命令词幅度匹配，并对匹配得到的命令词幅度进行格式化处理这一步骤；

判断否定词是否为命令词的前缀，若是则根据文字信息确定是否将命令词判定为非执行指令并结束云端对得到的文字信息进行语义分析这一步骤；反之，则直接执行根据得到的一个或多个命令词，云端对得到的文字信息进行命令词幅度匹配，并对匹配得到的命令词幅度进行格式化处理这一步骤。

进一步，所述对匹配得到的命令词幅度进行格式化处理这一步骤，包括以下步骤：

将文字信息中的命令词幅度表述统一转换为阿拉伯数字表述；

根据转换后的命令词幅度表述，对命令词幅度的计量单位进行标准化处理。

进一步，所述根据生成的结构化数据执行相应控制命令这一步骤，包括以下步骤：

车载端从云端生成的结构化数据中解析出命令执行码和相应的动作幅度，并根据解析的结果执行相应控制命令；

车载端从云端生成的结构化数据中解析出响应话语，并将解析出的响应话语合成相应的响应语音。

进一步，还包括云端对命令词数据库进行存储和实时更新的步骤，所述云端对命令词数据库进行存储和实时更新的步骤包括以下步骤：

用户通过云端录入新的命令词；

云端根据新的命令词，对命令词数据库进行存储和实时更新；

云端根据命令词数据库进行存储和实时更新的结果，对命令词的语义分析规则进行更新。

本发明采取的第二个技术方案是：

基于云端和多命令词的汽车语音控制系统，包括：

车载接口模块，用于对语音命令进行语音识别，得到语音识别后的文字信息；

云端处理模块，用于云端对得到的文字信息进行语义分析，根据云端存储的命令词数据库匹配生成含有一个或多个命令词的结构化数据；

车载主控模块，用于根据生成的结构化数据执行相应控制命令。

本发明采取的第三个技术方案是：

基于云端和多命令词的汽车语音控制装置，包括：

存储器，用于存储程序；

处理器，执行所述程序，以用于：对语音命令进行语音识别，得到语音识别后的文字信息；云端对得到的文字信息进行语义分析，根据云端存储的命令词数据库匹配生成含有一个或多个命令词的结构化数据；根据生成的结构化数据执行相应控制命令。

本发明的有益效果是：本发明的基于云端和多命令词的汽车语音控制方法、系统及装置，将用户的语音命令转换成文字信息，然后通过云端对文字信息进行语义分析，能够同时分析出文字信息中的多个命令词，并由车载端同时执行多个命令动作，克服了现有车载语音控制系统无法同时执行多个命令词动作的缺点，提高了执行效率；而且将用户的语音命令先转换成文字信息再通过云端对文字信息进行语义分析，与直接对客户的语音命令进行匹配处理的方式相比，匹配准确率更高，交互性更好。

进一步，本发明通过云端对命令词数据库进行存储和实时更新，克服了现有车载语音控制系统收录命令词个数有限且无法方便更新的缺点，能够实时方便地更新命令词数据库且命令词数量不限。

附图说明

图1为本发明基于云端和多命令词的汽车语音控制方法的步骤流程图；

图2为本发明实施例一车载端执行用户命令的步骤流程图；

图3为本发明实施例一云端进行命令词数据库更新的步骤流程图；

图4为本发明实施例一云端识别多个命令词的步骤流程图；

图5为本发明实施例一云端对命令词的前后缀以及动作幅度进行处理的步骤流程图；

图6为本发明实施例一云端处理否定词前缀的步骤流程图。

具体实施方式

参照图1，基于云端和多命令词的汽车语音控制方法，包括以下步骤：

对语音命令进行语音识别，得到语音识别后的文字信息；

云端对得到的文字信息进行语义分析，根据云端存储的命令词数据库匹配生成含有一个或多个命令词的结构化数据；

根据生成的结构化数据执行相应控制命令。

其中，命令词数据库用于存储录入的所有命令词。

进一步作为优选的实施方式，所述对语音命令进行语音识别，得到语音识别后的文字信息这一步骤，包括以下步骤：

车载端对用户发出的语音命令进行语音降噪；

车载端对降噪后的语音命令进行语音识别，得到语音识别后的文字信息；

车载端将语音识别后的文字信息发送给云端。

进一步作为优选的实施方式，所述云端对得到的文字信息进行语义分析，根据云端存储的命令词数据库匹配生成含有一个或多个命令词的结构化数据这一步骤，包括以下步骤：

云端对得到的文字信息进行命令词模式匹配操作；

云端根据命令词模式匹配操作的结果，生成含有一个或多个命令词的结构化数据。

进一步作为优选的实施方式，所述云端对得到的文字信息进行命令词模式匹配操作这一步骤，包括以下步骤：

根据命令词数据库，云端对得到的文字信息进行核心命令词匹配，得到文字信息中的一个或多个命令词；

根据得到的一个或多个命令词，云端对得到的文字信息进行命令词前后缀匹配，并对匹配得到的命令词前后缀进行规则匹配处理；

根据得到的一个或多个命令词，云端对得到的文字信息进行命令词幅度匹配，并对匹配得到的命令词幅度进行格式化处理。

其中，核心命令词是指在文字信息中出现且存在于命令词数据库中的命令词；命令词的前后缀包括名词或动词的前缀以及语气助词后缀等，通过识别命令词前后缀，能够更好地匹配用户的语言习惯。

进一步作为优选的实施方式，所述对匹配得到的命令词前后缀进行规则匹配处理这一步骤，包括以下步骤：

例如，若判断得到命令词的前缀是否定词(例如“不要打开空调”)，则根据文字信息中的具体语义，将该命令词判定为非命令执行指令，结束对该命令词的后续语义分析操作，直接生成对应非命令执行指令的结构化数据并发送给车载端进行处理。但是，若判断得到的文字信息为“空调不够冷”，结合具体语义后判断应该继续执行后续语义分析操作，并将该文字信息解析成“调低空调温度”。因此，对前后缀的具体匹配处理过程中，需要根据文字信息的具体语义进行智能解析。

进一步作为优选的实施方式，所述对匹配得到的命令词幅度进行格式化处理这一步骤，包括以下步骤：

将文字信息中的命令词幅度表述统一转换为阿拉伯数字表述；

根据转换后的命令词幅度表述，对命令词幅度的计量单位进行标准化处理。

其中，将命令词幅度表述统一转换为阿拉伯数字表述这一步骤具体是指：将中文表述转换为阿拉伯数字表述(例如，将“二十五”转换为“25”)；对命令词幅度的计量单位进行标准化处理这一步骤具体是指：将命令词幅度的计量单位统一转换为车载端能识别并执行的国际计量单位(例如，将“2分米”转换为“20厘米”)。

进一步作为优选的实施方式，所述根据生成的结构化数据执行相应控制命令这一步骤，包括以下步骤：

车载端从云端生成的结构化数据中解析出命令执行码和相应的动作幅度，并根据解析的结果执行相应控制命令；

车载端从云端生成的结构化数据中解析出响应话语，并将解析出的响应话语合成相应的响应语音。

参照图3，进一步作为优选的实施方式，还包括云端对命令词数据库进行存储和实时更新的步骤，所述云端对命令词数据库进行存储和实时更新的步骤包括以下步骤：

用户通过云端录入新的命令词；

云端根据新的命令词，对命令词数据库进行存储和实时更新；

云端根据命令词数据库进行存储和实时更新的结果，对命令词的语义分析规则进行更新。

同时，本发明还提供了基于云端和多命令词的汽车语音控制系统，包括：

车载接口模块，用于对语音命令进行语音识别，得到语音识别后的文字信息；

云端处理模块，用于云端对得到的文字信息进行语义分析，根据云端存储的命令词数据库匹配生成含有一个或多个命令词的结构化数据；

车载主控模块，用于根据生成的结构化数据执行相应控制命令。

此外，本发明还提供了基于云端和多命令词的汽车语音控制装置，包括：

存储器，用于存储程序；

下面结合说明书附图和具体实施例对本发明作进一步解释和说明。

实施例一

由于现有车载语音控制系统的命令词数据库大小有限且不方便实时更新，而且现有车载语音控制系统无法同时识别用户的多个动作指令以及无法识别用户语音命令中的否定词，本发明提出了一种基于云端和多命令词的汽车语音控制方法、系统及装置。本发明对用户语音命令的采集是通过车载端进行的，经过语音识别等处理之后，车载端将生成的文字信息发送到云端，进而通过语义分析得到用户语音中的多个命令词，同时还能识别命令词前后缀中的否定词并将命令词的动作幅度进行统一标准化，然后车载端根据生成的结构化数据执行相应的控制命令。另外，本发明还能够通过云端收录大量命令词并实现了对命令词数据库的实时更新。

本发明的基于云端和多命令词的汽车语音控制方法具体包括以下步骤：

步骤一：对语音命令进行语音识别，得到语音识别后的文字信息。

此步骤的具体工作过程为：用户发出语音命令，车载端对语音命令进行降噪之后进行语音识别，将语音命令转换为文字信息，然后车载端把语音识别后的文字信息发送到云端；或者车载端直接将语音命令压缩后发送至云端，由云端进行语音识别并转化为文字信息。

步骤二：云端对得到的文字信息进行语义分析，根据云端存储的命令词数据库匹配生成含有一个或多个命令词的结构化数据，具体包括以下步骤：

根据命令词数据库，云端对得到的文字信息进行核心命令词匹配，得到文字信息中的一个或多个命令词；

根据得到的一个或多个命令词，云端对得到的文字信息进行命令词前后缀匹配，并对匹配得到的命令词前后缀进行规则匹配处理；

根据得到的一个或多个命令词，云端对得到的文字信息进行命令词幅度匹配，并对匹配得到的命令词幅度进行格式化处理；

根据得到的文字信息，生成相应的动作执行响应话语。

其中，所有结构化数据是指上述语义分析的各个具体步骤中产生的处理结果的整体，还包括对应命令词的响应语音代码。

另外，还包括云端对命令词数据库进行存储和实时更新这一步骤，具体包括：

管理员通过云端，录入新定义的命令词；

云端对录入的命令词进行持久化存储；

管理员通过管理后台，发送命令词更新通知到云端的语义分析服务；

云端的语义分析服务根据收到的消息通知对命令词以及命令词解释规则进行更新，至此，命令词实时生效。

步骤三：参照图2，车载端接收到语义解析后的结构化命令词数据，按照约定的协议执行相应命令。

其中，车载端执行相应命令的步骤具体为：

1)解析出结构化数据中的命令词，并生成执行命令词动作后对应的响应话语；

2)把命令词传递给命令词执行引擎；

3)把命令词对应的响应话语传递给语音合成引擎进行语音合成，生成对应的响应语音；

4)完成命令词执行并播放响应语音。

若云端返回的结构化数据中没有解析出命令词，则直接解析出结构化数据中的响应话语，并根据响应话语合成响应语音进行播报。

参照图4，以语音命令“打开空调和远光灯”为例，本发明同时识别多个命令词的具体流程为：

云端获取文字命令“打开空调和远光灯”；

云端分析出文字命令中含有一个命令动作“打开”；

云端分析出命令动作后含有两个实体“空调”和“远光灯”；

云端生成对应两个命令的执行代码以及响应语音代码；

云端将生成的所有结构化数据发送至车载主控端。

其中，对于语音命令“打开空调和远光灯”，本发明还能识别以下相同效果的表达方式：1)打开空调和远光灯；2)打开空调还有打开远光灯；3)先打开空调再打开远光灯；4)打开空调打开远光灯；5)空调和远光灯都打开。

参照图5，以语音命令“把温度调高到二十五度吧”为例，本发明对命令词的前后缀以及动作幅度进行处理的具体流程为：

云端获取文字命令“把温度调高到二十五度吧”；

云端分析出文字命令中含有一个命令动作“温度调高”并将其转换为相应的执行代码；

云端分析出命令动作前含有前缀词“把”以及后缀语气助词“吧”；

云端分析出文字命令含有一个动作幅度描述“二十五”并将其转换为数字表述“25”；

云端将动作幅度对应的计量单位标准化处理为“degree”；

云端合并所有结构化数据并将其发送至车载主控端。

参照图6，以语音命令“不要打开空调”为例，本发明正确区分否定词前缀的具体流程为：

云端获取文字命令“不要打开空调”；

云端分析出文字命令中含有一个命令动作“打开空调”；

云端分析出命令动作前含有前缀词“不要”；

判断得出该前缀词为否定词，将该文字命令作为非命令执行指令并生成相应的结构化数据；

云端将生成的结构化数据发送至车载主控端。

综上所述，本发明对用户语音命令中仅存在一个命令词或存在多个命令词的情况均能进行处理。

与现有技术相比，本发明具有以下优点：

1、本发明通过云端对文字信息进行核心命令词匹配，能够一次性识别用户指令中的多个命令词，提高了执行效率。

2、本发明通过云端对文字信息进行命令词前后缀匹配，并对匹配得到的命令词前后缀进行规则匹配处理，能够识别用户语音命令中的否定命令词和肯定命令词，提高了执行准确率并使得系统与用户的交互更加自然顺畅。

3、本发明通过云端录入新的命令词，使命令词的存储数量不受限制，可拓展性强。

4、本发明采用消息通知技术，通过发送命令词更新通知到云端的语义分析服务进行命令词规则更新，能够保证云端语义分析服务实时更新命令词的解释规则。

5、本发明同时支持以动作和实体为整体的命令词识别方式以及将动作和实体分开识别的命令词识别方式，灵活的识别方式使系统更好地匹配用户的语言习惯。

6、本发明通过云端的命令词数据库存储命令词，使得命令词的更新对车载端透明，即仅需要对云端进行更新而无需更新车载端程序，保证了更新能实时生效且降低了更新成本，更新周期短，方便用户使用。

以上是对本发明的较佳实施进行了具体说明，但本发明并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：钟鸿飞;黄荣海;夏珩
技术所有人：广州小鹏汽车科技有限公司
我是此专利的发明人

上一篇：一种在直播过程中处理声音的方法及终端设备与流程
上一篇：游戏数据的获取方法及装置与流程