语音控制方法、装置、车辆、电子设备和存储介质与流程

文档序号：35576793发布日期：2023-09-24 18:45阅读：49来源：国知局

本公开涉及人工智能，尤其涉及语音识别以及文本匹配领域，具体涉及一种语音控制方法、装置、车辆、电子设备和存储介质。

背景技术：

1、语音触控屏技术，是用户向语音触控屏提供触控语音，语音触控屏对触控语音进行识别，得到触控指令，并根据触控指令在语音触控屏的触控界面中的对应的控件进行触控操作。简而言之，语音触控屏技术是指通过语音代替用户的手来触控屏幕，从而实现对设备的控制。

技术实现思路

1、本公开提供了一种语音控制方法、装置、车辆、电子设备和存储介质。

2、根据本公开的一方面，提供了一种语音控制方法，包括：

3、基于触控语音，得到语音识别文本；

4、基于预设的多个文本匹配策略，以及文本匹配的终止条件，在第一控件文本集中对所述语音识别文本进行文本匹配，得到第二控件文本集；

5、基于所述第二控件文本集，确定目标控件文本；

6、基于所述目标控件文本对应的触控指令，对所述目标控件文本对应的目标控件进行触控操作。

7、根据本公开的另一方面，提供了一种语音控制装置，包括：

8、语音识别模块，用于基于触控语音，得到语音识别文本；

9、文本匹配模块，用于基于预设的多个文本匹配策略，以及文本匹配的终止条件，在第一控件文本集中对所述语音识别文本进行文本匹配，得到第二控件文本集；

10、文本筛选模块，用于基于所述第二控件文本集，确定目标控件文本；

11、触控操作模块，用于基于所述目标控件文本对应的触控指令，对所述目标控件文本对应的目标控件进行触控操作。

12、根据本公开的另一方面，提供了一种电子设备，包括：

13、至少一个处理器；以及

14、与该至少一个处理器通信连接的存储器；其中，

15、该存储器存储有可被该至少一个处理器执行的指令，该指令被该至少一个处理器执行，以使该至少一个处理器能够执行本公开实施例中任一语音控制方法。

16、根据本公开的另一方面，提供了一种车辆，包括本公开实施例中任一电子设备。

17、根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，该计算机指令用于使该计算机执行根据本公开实施例中任一语音控制方法。

18、根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，该计算机程序在被处理器执行时实现根据本公开实施例中任一语音控制方法。

19、根据本公开的技术，采用文本匹配的方式对触控语音进行语音指令的识别，不必经过自然语音理解(natural language understanding，nlu)模块来对触控语音进行语义理解，可以提高识别速度，进而提高语音指令的响应速度。并且，本公开利用多个文本匹配策略对触控语音对应的语音识别文本进行文本匹配，可以提高命中率。通过设置文本匹配的终止条件，避免在采用部分策略得到满意的匹配结果后仍然采用其他的策略来继续匹配，进一步降低语音控制的耗时。

20、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种语音控制方法，包括：

2.根据权利要求1所述的方法，其中，所述基于预设的多个文本匹配策略，以及文本匹配的终止条件，在第一控件文本集中对所述语音识别文本进行文本匹配，得到第二控件文本集，包括：

3.根据权利要求2所述的方法，其中，所述第一操作还包括：设置所述第一文本匹配策略为已执行策略，所述方法还包括：

4.根据权利要求2或3所述的方法，其中，所述基于所述第一文本匹配策略，在第一控件文本集中对所述语音识别文本进行文本匹配，得到第四控件文本集，包括：

5.根据权利要求4所述的方法，其中，所述基于所述目标控件文本对应的触控指令，对所述目标控件文本对应的目标控件进行触控操作，包括：

6.根据权利要求4或5所述的方法，其中，所述第一文本匹配策略为所述多个文本匹配策略中优先级最高的策略。

7.根据权利要求2或3所述的方法，其中，所述基于所述第一文本匹配策略，在第一控件文本集中对所述语音识别文本进行文本匹配，得到第四控件文本集，包括：

8.根据权利要求7所述的方法，其中，所述基于所述第一控件文本集中的各控件文本的文本类型和长度，以及所述语音识别文本的长度，确定各控件文本的评分，包括：

9.根据权利要求7所述的方法，其中，所述基于所述第一控件文本集中的各控件文本的文本类型和长度，以及所述语音识别文本的长度，确定各控件文本的评分，包括：

10.根据权利要求7所述的方法，其中，所述基于所述第一控件文本集中的各控件文本的文本类型和评分，在所述第一控件文本集中筛选控件文本，得到所述第四控件文本集，包括：

11.根据权利要求10所述的方法，其中，所述基于所述第五控件文本集中的各控件文本的文本类型，在所述第五控件文本集中筛选控件文本，得到所述第四控件文本集，包括：

12.根据权利要求11所述的方法，其中，还包括：

13.根据权利要求7-12中任一项所述的方法，其中，所述第一文本匹配策略为所述多个文本匹配策略中优先级排列第二的策略。

14.根据权利要求2或3所述的方法，其中，所述基于第一文本匹配策略，在第一控件文本集中对所述语音识别文本进行文本匹配，得到第四控件文本集，包括：

15.根据权利要求14所述的方法，还包括：

16.根据权利要求14或15所述的方法，其中，所述第一文本匹配策略为所述多个文本匹配策略中优先级排列第三的策略。

17.根据权利要求2或3所述的方法，其中，所述基于第一文本匹配策略，在第一控件文本集中对所述语音识别文本进行文本匹配，得到第四控件文本集，包括：

18.根据权利要求17所述的方法，其中，所述第六控件文本集中的控件文本的字数与所述语音识别文本的字数相同，所述第四控件文本集中的控件文本中各字的拼音与对应在所述语音识别文本中的字的拼音相同。

19.根据权利要求17或18所述的方法，其中，所述第一文本匹配策略为所述多个文本匹配策略中优先级排列第四的策略。

20.根据权利要求4-6和14-16中任一项所述的方法，其中，所述基于第四控件文本集，更新所述第三控件文本集，包括：

21.根据权利要求7-13和17-19中任一项所述的方法，其中，所述基于所述第四控件文本集，更新所述第三控件文本集，包括：

22.根据权利要求4-6和14-19中任一项所述的方法，还包括：

23.根据权利要求7-13中任一项所述的方法，还包括：

24.根据权利要求1-23中任一项所述的方法，其中，所述基于所述第二控件文本集，确定目标控件文本，包括：

25.根据权利要求1-3中任一项所述的方法，还包括：

26.根据权利要求25所述的方法，其中，所述获取所述第一控件的控件信息，包括以下之一：

27.根据权利要求25或26所述的方法，其中，所述基于所述第一控件的控件信息，确定所述第一控件的控件文本，包括：

28.根据权利要求25-27中任一项所述的方法，还包括：

29.一种语音控制装置，包括：

30.根据权利要求29所述的装置，其中，所述文本匹配模块，包括：

31.根据权利要求30所述的装置，其中，所述策略执行单元还用于设置所述第一文本匹配策略为已执行策略，所述装置还包括：

32.一种电子设备，包括：

33.一种车辆，包括权利要求32所述的电子设备。

34.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-28中任一项所述的方法。

35.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-28中任一项所述的方法。

技术总结
本公开提供了一种语音控制方法、装置、电子设备、车辆和存储介质，涉及人工智能技术领域，尤其涉及语音识别以及文本匹配领域。具体实现方案为：基于触控语音，得到语音识别文本；基于预设的多个文本匹配策略，以及文本匹配的终止条件，在第一控件文本集中对所述语音识别文本进行文本匹配，得到第二控件文本集；基于所述第二控件文本集，确定目标控件文本；基于所述目标控件文本对应的触控指令，对所述目标控件文本对应的控件进行触控操作。采用本公开的技术方案，可以采用文本匹配的方式对语音进行识别，提高语音指令的响应速度。

技术研发人员：刘嵘,欧阳能钧,华鲸州,刘卫
受保护的技术使用者：阿波罗智能技术（北京）有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘嵘欧阳能钧华鲸州刘卫
技术所有人：阿波罗智能技术（北京）有限公司
我是此专利的发明人

上一篇：基于变分自动编码器超前预警电表故障方法及相关装置与流程
上一篇：一种用于MBE的智能生长系统及其使用方法