一种语音控制方法、装置及车辆与流程

文档序号：37541076发布日期：2024-04-08 13:40阅读：6来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明涉及车辆智能控制，尤其涉及一种语音控制方法、装置及车辆。

背景技术：

1、当前，随着人工智能技术的发展，语音控制技术被广泛应用于车辆上。

2、语音控制技术可以识别用户的语音输入，并生成相应的操作指令，代替用户操作车辆的中控显示屏等设备，给用户提供了方便。

3、但是，现有的语音控制功能只支持有限的几个指令，导致许多操作不能通过语音控制实现，使得用户不得不通过手动完成，容易给用户带来不便。

技术实现思路

1、本发明实施例提供一种语音控制方法、装置及车辆，以解决现有语音控制方式无法有效实现可见即可说的问题。

2、第一方面，本发明实施例提供一种语音控制方法，所述方法包括：

3、识别车机系统的界面图像，以获取界面内容；

4、接收第一语音信息；

5、根据所述第一语音信息及所述界面内容，生成控制指令。

6、可选地，在生成控制指令之后，所述方法还包括：

7、播放针对所述控制指令反馈的第二语音信息。

8、可选地，所述的语音控制方法中，所述界面内容包括识别区块及识别区块在车机系统界面上的第一位置信息，所述识别区块包括文字区块、颜色区块及形状区块中的至少一种。

9、可选地，所述的语音控制方法中，在所述识别区块包括文字区块的情况下，识别车机系统的界面图像，以获取界面内容，包括：

10、对所述界面图像进行文字内容识别，获得每个文字对应的文字块；

11、在相邻所述文字块之间的界面横向距离大于第一阈值的情况下，或者相邻所述文字块存在字体大小区别的情况下，将相邻所述文字块分别作为所述文字区块；

12、在相邻所述文字块之间的界面横向距离小于等于所述第一阈值，且相邻所述文字块之间无字体大小区别的情况下，将相邻所述文字块合并为所述文字区块。

13、可选地，所述的语音控制方法中，在所述识别区块包括颜色区块的情况下，识别车机系统的界面图像，以获取界面内容，包括：

14、对所述界面图像进行颜色识别，并将颜色相同的连通区域识别为一个颜色区块。

15、可选地，所述的语音控制方法中，在所述识别区块包括形状区块的情况下，识别车机系统的界面图像，以获取界面内容，包括：

16、对所述界面图像进行形状识别，并将封闭图形识别为一个形状区块。

17、可选地，所述的语音控制方法中，根据所述第一语音信息及所述界面内容，生成控制指令，包括：

18、根据所述第一语音信息，确定目标识别区块及用户操作意图；

19、根据所述目标识别区块及所述用户操作意图，生成所述控制指令。

20、可选地，根据所述第一语音信息，确定目标识别区块及用户操作意图，包括：

21、对所述第一语音信息进行语音识别，得到识别文本；

22、对所述识别文本进行语义理解，得到用户操作意图以及用户操作对象；

23、将所述用户操作对象与各个所述识别区块进行匹配，将与所述用户操作对象相匹配的识别区块作为所述目标识别区块。

24、可选地，在根据所述目标识别区块及所述用户操作意图，生成所述控制指令之前，所述方法还包括：

25、确定所述第一语音信息的发声对象；

26、确定所述发声对象在所述车机系统界面上的视线落点区域；

27、所述根据所述目标识别区块及所述用户操作意图，生成所述控制指令，包括：

28、根据所述视线落点区域，从所述界面内容中获取第一界面内容；

29、在所述第一界面内容中查询所述目标识别区块；

30、在查询到所述目标识别区块的情况下，将所述目标识别区块的位置信息确定为所述目标位置信息；

31、根据所述目标位置信息及所述用户操作意图，生成所述控制指令。

32、可选地，所述的语音控制方法中，根据所述目标识别区块及所述用户操作意图，生成所述控制指令，包括：

33、根据所述用户操作意图，模拟触控所述目标识别区块，生成所述控制指令。

34、可选地，所述的语音控制方法中，在识别车机系统的界面图像，以获取界面内容之前，所述方法还包括：

35、将所述界面图像与前一次所获取的界面图像进行比对；

36、在所述界面图像与前一次所获取的界面图像不同的情况下，执行识别车机系统的界面图像，以获取界面内容。

37、第二方面，本发明实施例提供一种语音控制装置，所述装置包括：

38、第一识别模块，用于识别车机系统的界面图像，以获取界面内容；

39、接收模块，用于接收第一语音信息；

40、指令生成模块，用于根据所述第一语音信息及所述界面内容，生成控制指令。

41、第三方面，本发明实施例提供一种电子设备，包括：处理器、通信接口、存储器和通信总线；其中，处理器、通信接口以及存储器通过通信总线完成相互间的通信；

42、存储器，用于存放计算机程序；

43、处理器，用于执行存储器上所存放的程序时，实现上述第一方面所述的语音控制方法中的步骤。

44、第四方面，本发明实施例提供一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述第一方面所述的语音控制方法中的步骤。

45、第五方面，本发明实施例提供一种车辆，所述车辆包括行车记录仪，所述车辆还包括如上述第二方面所述的语音控制装置。

46、针对在先技术，本发明具备如下优点：

47、本发明实施例中，通过车机系统的界面图像识别出车机系统的实时界面内容，结合用户发出的第一语音信息，模拟用户操作生成控制指令，然后基于该控制指令控制目标控制执行相应的动作，可以通过实时页面的情况来实现语音控制。本发明实施例从系统整体层面定义语音控制功能，不仅可以有效实现可见即可说的语音控制，还将语音控制功能和应用程序解耦，不需要依赖应用程序编译以及深度层次接入，因而可以兼容各种系统，便于功能的移植。

48、上述说明仅是本发明技术方案的概述，为了能够更清楚了解本发明的技术手段，而可依照说明书的内容予以实施，并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂，以下特举本发明的具体实施方式。

技术特征：

1.一种语音控制方法，其特征在于，所述方法包括：

2.根据权利要求1所述的语音控制方法，其特征在于，所述界面内容包括识别区块，所述识别区块包括文字区块、颜色区块及形状区块中的至少一种。

3.根据权利要求2所述的语音控制方法，其特征在于，在所述识别区块包括文字区块的情况下，识别车机系统的界面图像，以获取界面内容，包括：

4.根据权利要求2所述的语音控制方法，其特征在于，在所述识别区块包括颜色区块的情况下，识别车机系统的界面图像，以获取界面内容，包括：

5.根据权利要求2所述的语音控制方法，其特征在于，在所述识别区块包括形状区块的情况下，识别车机系统的界面图像，以获取界面内容，包括：

6.根据权利要求2所述的语音控制方法，其特征在于，根据所述第一语音信息及所述界面内容，生成控制指令，包括：

7.根据权利要求6所述的语音控制方法，其特征在于，根据所述第一语音信息，确定目标识别区块及用户操作意图，包括：

8.根据权利要求6所述的语音控制方法，其特征在于，在根据所述目标识别区块及所述用户操作意图，生成所述控制指令之前，所述方法还包括：

9.根据权利要求6所述的语音控制方法，其特征在于，根据所述目标识别区块及所述用户操作意图，生成所述控制指令，包括：

10.根据权利要求1所述的语音控制方法，其特征在于，在识别车机系统的界面图像，以获取界面内容之前，所述方法还包括：

11.根据权利要求1～10任一所述的语音控制方法，其特征在于，在生成控制指令之后，所述方法还包括：

12.一种语音控制装置，其特征在于，所述装置包括：

13.一种电子设备，其特征在于，包括：处理器、通信接口、存储器和通信总线；其中，处理器、通信接口以及存储器通过通信总线完成相互间的通信；

14.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1至11任一项所述的语音控制方法中的步骤。

15.一种车辆，其特征在于，所述车辆包括如权利要求12所述的语音控制装置。

技术总结
本发明提供一种语音控制方法、装置及车辆，其中，所述方法包括：识别车机系统的界面图像，以获取界面内容；接收第一语音信息；根据所述第一语音信息及所述界面内容，生成控制指令。本发明实施例从系统整体层面定义语音控制功能，不仅可以有效实现可见即可说的语音控制，还将语音控制功能和应用程序解耦，不需要依赖应用程序编译以及深度层次接入，因而可以兼容各种系统，便于功能的移植。

技术研发人员：叶将涛,阮洲,章建德
受保护的技术使用者：比亚迪股份有限公司
技术研发日：
技术公布日：2024/4/7

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶将涛,阮洲,章建德
技术所有人：比亚迪股份有限公司
我是此专利的发明人

上一篇：一种基于有限傅里叶级数分析的周期性时间序列预测方法及系统与流程
上一篇：燃料电池数据管理系统的制作方法