语音交互系统唤醒方法、装置、设备、存储介质及车辆与流程

文档序号：39164685发布日期：2024-08-27 18:32阅读：109来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本公开涉及智能车辆，尤其涉及一种语音交互系统唤醒方法、装置、设备、存储介质及车辆。

背景技术：

1、随着智能技术的发展，智能语音交互技术已广泛应用于各个领域，尤其是汽车领域。当用户使用车载语音交互系统时，需要先唤醒车载语音交互系统。

2、相关技术中，用户通过输入语音唤醒词唤醒车载语音交互系统，并通过语音控制指令控制车载语音交互系统执行相应操作。

3、但是，当用户与其他用户交谈过程中谈及到唤醒词时，车载语音交互系统也会基于唤醒词被唤醒，并与用户进行交互，导致车载语音交互系统具有较高的误唤醒率，影响用户体验。

技术实现思路

1、为了解决上述技术问题，本公开提供了一种语音交互系统唤醒方法、装置、设备、存储介质及车辆。

2、第一方面，本公开实施例提供一种语音交互系统唤醒方法，所述方法包括：

3、采集当前语音信号以及车内用户的图像信息；

4、对所述车内用户的图像信息进行特征提取，得到目标用户的特征信息，所述特征信息包括脸部特征信息、头部特征信息；

5、基于所述目标用户的特征信息判断会话对象是否为车载终端；

6、若所述会话对象是车载终端，则判断所述当前语音信号是否为唤醒信号；

7、若所述当前语音信号是唤醒信号，则对所述车载终端的语音交互系统进行唤醒。

8、在一些实施例中，所述对所述车内用户的图像信息进行特征提取，得到车内用户的特征信息，包括：

9、基于视觉检测技术从所述车内用户的图像信息检测出车内用户的数量；

10、对所述车内用户的图像信息进行特征提取，得到所述车内用户的纹理特征以及关键点特征；

11、利用所述车内用户的纹理特征以及关键点特征计算出所述车内用户中的每个用户的会话概率，将所述每个用户的会话概率进行比较，将会话概率最高的用户确定为目标用户；

12、对所述目标用户的纹理特征以及关键点特征进行聚合处理，得到所述目标用户的特征信息。

13、在一些实施例中，所述基于所述目标用户的特征信息判断会话对象是否为车载终端，包括：

14、根据所述目标用户的特征信息计算所述目标用户的头部姿态、视线信息、唇动信息；

15、基于所述目标用户的头部姿态、视线信息、唇动信息，判断所述目标用户的会话对象是否为车载终端。

16、在一些实施例中，所述基于所述目标用户的头部姿态、视线信息、唇动信息，判断所述目标用户的会话对象是否为车载终端，包括：

17、基于所述目标用户的头部姿态、视线信息、唇动信息，计算所述目标用户的对话朝向以及视线区域；

18、根据所述目标用户的对话朝向以及视线区域，判断所述目标用户的会话对象是否为车载终端。

19、在一些实施例中，所述根据所述目标用户的对话朝向以及视线区域，判断所述目标用户的会话对象是否为车载终端，包括：

20、若所述目标用户的对话朝向为所述车载终端的方向、且所述目标用户的视线区域覆盖所述车载终端，则所述目标用户的会话对象为车载终端；

21、若所述目标用户的对话朝向为车内其他用户、且所述目标用户的视线区域覆盖所述车内其他用户，则所述目标用户的会话对象不为车载终端。

22、在一些实施例中，所述判断所述当前语音信号是否为唤醒信号，包括：

23、判断所述当前语音信号是否为人声信号；

24、若所述当前语音信号为人声信号，则判断所述当前语音信号中是否包含唤醒词；

25、若所述当前语音信号中包含唤醒词，则确定所述当前语音信号为唤醒信号。

26、在一些实施例中，所述对所述车载终端的语音交互系统进行唤醒之后，所述方法还包括：

27、基于所述目标用户的特征信息计算所述目标用户的面部表情及唇动信息；

28、基于所述目标用户的面部表情及唇动信息判断所述目标用户是否已完成当前语音输入；

29、若所述目标用户已完成当前语音输入，则控制语音交互系统执行与所述当前语音输入对应的操作；

30、若所述目标用户未完成当前语音输入，则等待所述目标用户继续进行当前语音输入。

31、在一些实施例中，所述基于所述目标用户的面部表情及唇动信息判断所述目标用户是否已完成当前语音输入，包括：

32、确定与所述目标用户的面部表情及唇动信息对应的所述目标用户的状态；

33、若所述目标用户的状态为目标状态，则确定所述目标用户未完成当前语音输入，所述目标状态为用于表征所述目标用户未完成当前会话的状态；

34、若所述目标用户的状态不为目标状态，则确定所述目标用户已完成当前语音输入。

35、第二方面，本公开实施例提供一种语音交互系统唤醒装置，所述装置包括：

36、采集模块，用于采集当前语音信号以及车内用户的图像信息；

37、得到模块，用于对所述车内用户的图像信息进行特征提取，得到目标用户的特征信息，所述特征信息包括脸部特征信息、头部特征信息；

38、第一判断模块，用于基于所述目标用户的特征信息判断会话对象是否为车载终端；

39、第二判断模块，用于当会话对象为车载终端时，判断所述当前语音信号是否为唤醒信号；

40、唤醒模块，用于当所述当前语音信号是否为唤醒信号时，对所述车载终端的语音交互系统进行唤醒。

41、第三方面，本公开实施例提供一种电子设备，包括：

42、存储器；

43、处理器；以及

44、计算机程序；

45、其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如第一方面所述的方法。

46、第四方面，本公开实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行以实现第一方面所述的方法。

47、第五方面，本公开实施例还提供了一种计算机程序产品，该计算机程序产品包括计算机程序或指令，该计算机程序或指令被处理器执行时实现如上所述的语音交互系统唤醒方法。

48、第六方面，本公开实施例还提供了一种车辆，包括：

49、存储器；

50、处理器；以及

51、计算机程序；

52、其中，所述计算机程序存储在所述存储器中，并被配置为由所述处理器执行以实现如上所述的语音交互系统唤醒方法。

53、本公开实施例提供的语音交互系统唤醒方法、装置、设备、存储介质及车辆，通过采集当前语音信号以及车内用户的图像信息，对所述车内用户的图像信息进行特征提取，得到目标用户的特征信息，所述特征信息包括脸部特征信息、头部特征信息，基于所述目标用户的特征信息判断会话对象是否为车载终端，若所述会话对象是车载终端，则判断所述当前语音信号是否为唤醒信号。若所述当前语音信号是唤醒信号，则对所述车载终端的语音交互系统进行唤醒。由于根据目标用户的特征信息判断会话对象是否为车载终端，当会话对象为车载终端时，进一步判断当前语音信号是否为唤醒信号，若是，则根据语音信号中的唤醒词唤醒车载语音系统；当会话对象不为车载终端时，不进行唤醒，从而降低车载语音系统的误唤醒率，提高车载语音系统的唤醒准确性，提高用户体验。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈伟
技术所有人：北京罗克维尔斯科技有限公司
我是此专利的发明人

上一篇：一种光模块的制作方法
下一篇：伽马曲线生成方法、对比度调整方法、装置、设备和介质与流程

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！