一种语音交互方法、装置及终端与流程

文档序号:37430992发布日期:2024-03-25 19:23阅读:20来源:国知局
一种语音交互方法、装置及终端与流程

本技术属于人机交互,尤其涉及一种语音交互方法、装置及终端。


背景技术:

1、语音交互是基于语音输入的新一代交互模式,基于用户向终端输入的语音信息,就可以得到与输入的语音信息对应的反馈结果。

2、在与终端进行语音交互之前,首先要唤醒终端上的语音交互系统(例如语音助手),例如,可以通过特定的唤醒词唤醒语音助手。语音助手被唤醒后,用户可以与终端进行语音交互。在用户与终端语音交互的过程中,一般用户说完一条语音后,终端输出与这条语音对应的反馈结果,接着,用户可以说下一条语音,这样就实现了与终端的连续对话。

3、但是,目前终端的连续对话功能,是通过延长终端的收音时间来实现的。例如,终端输出与第一条语音对应的反馈结果后,终端继续收音一段时间,比如10s。如果10s内没有收到任何语音信号,此时终端再结束收音;如果10s内有收到语音信号,则终端会继续输出针对收到的语音信息的反馈结果。这样,在终端延长收音的这段时间内,如果用户没有发出任何声音,但是,周围有其他人在说话,终端也会继续针对其他人说的话进行反馈,这样会给用户带来困扰和反感,影响用户体验。


技术实现思路

1、本技术提供一种语音交互方法、装置及终端,能够解决在终端延长收音的这段时间内,如果用户没有发出任何声音,但是,周围有其他人在说话,终端也会继续针对其他人说的话进行反馈,这样会给用户带来困扰和反感,影响用户体验的问题。

2、第一方面,本技术提供一种语音交互方法,所述方法包括:检测到发起语音交互的唤醒指示;响应于所述唤醒指示,进入语音交互的工作状态;检测到第一语音信息;输出针对所述第一语音信息的反馈结果;如果在预设时长内检测到第二语音信息,则检测用户气息;如果检测到用户气息,则输出针对所述第二语音信息的反馈结果。

3、这样,能够通过用户气息检测,大概率识别到是用户本人有继续语音交互的意图,有效降低终端对于其他人或者周围其他噪声的错误响应,提升语音交互的准确性和用户体验。

4、在一种可实现方式中,在输出针对所述第一语音信息的反馈结果之后,还包括:确定所述终端是否靠近用户的嘴部;如果确定所述终端靠近所述用户的嘴部,则将所述语音交互的工作状态延长所述预设时长;如果确定所述终端不靠近所述用户的嘴部,则结束语音交互的工作状态。

5、这样,在进行用户气息检测之前,先确定所述终端是否靠近用户的嘴部,如果确定所述终端靠近所述用户的嘴部,再延长收音时间,如果确定所述终端不靠近所述用户的嘴部,则直接结束收音。这样可以很大程度上降低收音带来的能耗问题。

6、在一种可实现方式中,所述如果在预设时长内检测到第二语音信息,还包括:确定终端是否靠近用户的嘴部;如果确定所述终端靠近所述用户的嘴部,则检测用户气息;如果确定所述终端不靠近用户的嘴部,则结束语音交互的工作状态。

7、这样,在检测到第二语音信息的情况下,先判断终端是否靠近用户的嘴部,再确定要不要检测用户气息。如果终端不靠近用户的嘴部,则认为第二语音信息不会是用户发出的声音,也就无需检测用户气息了。

8、在一种可实现方式中,如果所述唤醒指示为用户气息,则所述确定所述终端是否靠近用户的嘴部,包括:识别在所述语音交互的工作状态下,所述用户的手势;如果所述用户的手势为第一手势,则确定所述终端靠近用户的嘴部,所述第一手势用于表征所述用户手持所述终端处于静止状态;如果所述用户的手势为第二手势,则确定所述终端不靠近用户的嘴部,所述第二手势用于表征所述用户手持所述终端向所述用户的嘴部方向远离。

9、这样,如果语音交互的工作状态是通过气息唤醒的方式唤醒的,说明在唤醒终端时,终端是在用户嘴边的。因此,在输出针对第一语音信息的反馈结果之后,可以通过判断用户是否手持终端100向用户的嘴部方向远离,确定终端100是否依然在用户嘴边。

10、在一种可实现方式中,如果所述唤醒指示为除用户气息以外的其他方式,则在确定所述终端是否靠近用户的嘴部之前,包括:确定在输出针对所述第一语音信息的反馈结果之前,是否识别到第三手势,所述第三手势用于表征所述用户手持所述终端向所述用户的嘴部方向靠近;如果识别到所述第三手势,则确定在输出针对所述第一语音信息的反馈结果之后,所述终端是否仍然靠近用户的嘴部;如果没有识别到所述第三手势,则结束语音交互的工作状态。

11、这样,如果语音交互的工作状态不是通过气息唤醒的方式唤醒的,说明在唤醒终端时,终端不在用户嘴边。这种情况下,本技术可以在进入语音交互的工作状态之后,先确定在输出针对所述第一语音信息的反馈结果之前,用户是否手持终端向用户的嘴部方向靠近。如果确定在输出针对所述第一语音信息的反馈结果之前,用户手持终端向用户的嘴部方向靠近,则再确定在输出针对第一语音信息的反馈结果之后,终端是否仍然在用户嘴边。

12、在一种可实现方式中,所述识别在所述语音交互的工作状态下,所述用户的手势,包括:获取在所述语音交互的工作状态下,不同时刻的角速度和加速度;利用所述不同时刻的角速度、加速度、以及手势识别模块,确定用户的手势;其中,所述手势识别模块用于识别用户手持终端向用户的嘴部方向靠近、用户手持终端向用户的嘴部方向远离、或者用户手持所述终端处于静止状态。

13、这样,可以利用手势识别模块,基于不同时刻的角速度和加速度数据,确定用户的手势。

14、在一种可实现方式中,所述检测用户气息,包括:将所述第二语音信息输入气息识别模块,所述气息识别模块用于识别所述第二语音信息是否为所述用户的嘴部距离所述终端预设距离内发出的声音;如果所述气息识别模块识别到所述第二语音信息为所述用户的嘴部距离所述终端预设距离内发出的声音,则确定检测到用户气息;如果所述气息识别模块识别到所述第二语音信息不是所述用户的嘴部距离所述终端预设距离内发出的声音,则确定没有检测到用户气息。

15、这样,可以利用气息识别模块,对第二语音信息进行特征识别,以确定第二语音信息是否为用户的嘴部靠近终端发出的声音。

16、在一种可实现方式中,所述终端包括压力传感器,所述检测用户气息,包括:获取采集到所述第二语音信息时,所述压力传感器对应的压力值;如果所述压力值大于预设压力阈值,则确定检测到用户气息;如果所述压力值小于或等于预设压力阈值,则确定没有检测到用户气息;

17、在一种可实现方式中,所述终端包括温度传感器,所述检测用户气息,包括:获取第一温度和第二温度,其中,所述第一温度为采集到所述第二语音信息之前,所述温度传感器对应的温度,所述第二温度为采集到所述第二语音信息时,所述温度传感器对应的温度;如果所述第二温度大于所述第一温度,则确定检测到用户气息;如果所述第二温度小于或等于所述第一温度,则确定没有检测到用户气息。

18、在一种可实现方式中,所述终端包括湿度传感器,所述检测用户气息,包括:获取采集到所述第二语音信息时,所述湿度传感器对应的湿度;如果所述湿度大于预设湿度阈值,则确定检测到用户气息;如果所述湿度小于或等于预设湿度阈值,则确定没有检测到用户气息;

19、在一种可实现方式中,所述终端包括二氧化碳传感器,所述检测用户气息,包括:获取采集到所述第二语音信息时,所述二氧化碳传感器对应的二氧化碳浓度;如果所述二氧化碳浓度大于预设二氧化碳浓度阈值,则确定检测到用户气息;如果所述二氧化碳浓度小于或等于预设二氧化碳浓度阈值,则确定没有检测到用户气息。

20、这样,如果用户的嘴部靠近终端说话,则说话产生的气流对对终端产生一定的压力,以及在终端附近的温度、湿度、二氧化碳浓度也会有一定的变化,这样本技术可以利用压力传感器、温度传感器、湿度传感器或二氧化碳传感器,检测用户气息。

21、第二方面,本技术提供一种语音交互方法,所述方法包括:检测到发起语音交互的唤醒指示;响应于所述唤醒指示,进入语音交互的工作状态;检测到第一语音信息;输出针对所述第一语音信息的反馈结果;确定终端是否靠近用户的嘴部;如果确定所述终端靠近用户的嘴部,则将语音交互的工作状态延长预设时长;如果在预设时长内检测到第二语音信息,则输出针对所述第二语音信息的反馈结果。

22、第三方面,本技术提供一种语音交互方法,所述方法包括:检测到发起语音交互的唤醒指示;响应于所述唤醒指示,进入语音交互的工作状态;检测到第一语音信息;输出针对所述第一语音信息的反馈结果;如果在预设时长内检测到第二语音信息,则确定终端是否靠近用户的嘴部;如果确定所述终端靠近用户的嘴部,则输出针对所述第二语音信息的反馈结果。

23、第四方面,本技术提供一种语音交互装置,所述装置包括处理器;所述处理器,用于检测到发起语音交互的唤醒指示;响应于所述唤醒指示,进入语音交互的工作状态;检测到第一语音信息;输出针对所述第一语音信息的反馈结果;如果在预设时长内检测到第二语音信息,则检测用户气息;如果检测到用户气息,则输出针对所述第二语音信息的反馈结果。

24、在一种可实现方式中,所述处理器,还用于在输出针对所述第一语音信息的反馈结果之后,确定所述终端是否靠近用户的嘴部;如果确定所述终端靠近所述用户的嘴部,则将所述语音交互的工作状态延长所述预设时长;如果确定所述终端不靠近所述用户的嘴部,则结束语音交互的工作状态。

25、在一种可实现方式中,所述处理器,还用于确定终端是否靠近用户的嘴部;如果确定所述终端靠近所述用户的嘴部,则检测用户气息;如果确定所述终端不靠近用户的嘴部,则结束语音交互的工作状态。

26、在一种可实现方式中,所述处理器,还用于识别在所述语音交互的工作状态下,所述用户的手势;如果所述用户的手势为第一手势,则确定所述终端靠近用户的嘴部,所述第一手势用于表征所述用户手持所述终端处于静止状态;如果所述用户的手势为第二手势,则确定所述终端不靠近用户的嘴部,所述第二手势用于表征所述用户手持所述终端向所述用户的嘴部方向远离。

27、在一种可实现方式中,如果所述唤醒指示为除用户气息以外的其他方式,则在确定所述终端是否靠近用户的嘴部之前,所述处理器,还用于确定在输出针对所述第一语音信息的反馈结果之前,是否识别到第三手势,所述第三手势用于表征所述用户手持所述终端向所述用户的嘴部方向靠近;如果识别到所述第三手势,则确定在输出针对所述第一语音信息的反馈结果之后,所述终端是否仍然靠近用户的嘴部;如果没有识别到所述第三手势,则结束语音交互的工作状态。

28、在一种可实现方式中,所述处理器,还用于获取在所述语音交互的工作状态下,不同时刻的角速度和加速度;利用所述不同时刻的角速度、加速度、以及手势识别模块,确定用户的手势;其中,所述手势识别模块用于识别用户手持终端向用户的嘴部方向靠近、用户手持终端向用户的嘴部方向远离、或者用户手持所述终端处于静止状态。

29、在一种可实现方式中,所述处理器,还用于将所述第二语音信息输入气息识别模块,所述气息识别模块用于识别所述第二语音信息是否为所述用户的嘴部距离所述终端预设距离内发出的声音;如果所述气息识别模块识别到所述第二语音信息为所述用户的嘴部距离所述终端预设距离内发出的声音,则确定检测到用户气息;如果所述气息识别模块识别到所述第二语音信息不是所述用户的嘴部距离所述终端预设距离内发出的声音,则确定没有检测到用户气息。

30、在一种可实现方式中,所述终端包括压力传感器,所述处理器,还用于获取采集到所述第二语音信息时,所述压力传感器对应的压力值;如果所述压力值大于预设压力阈值,则确定检测到用户气息;如果所述压力值小于或等于预设压力阈值,则确定没有检测到用户气息。

31、在一种可实现方式中,所述终端包括温度传感器,所述处理器,还用于获取第一温度和第二温度,其中,所述第一温度为采集到所述第二语音信息之前,所述温度传感器对应的温度,所述第二温度为采集到所述第二语音信息时,所述温度传感器对应的温度;如果所述第二温度大于所述第一温度,则确定检测到用户气息;如果所述第二温度小于或等于所述第一温度,则确定没有检测到用户气息。

32、在一种可实现方式中,所述终端包括湿度传感器,所述处理器,还用于获取采集到所述第二语音信息时,所述湿度传感器对应的湿度;如果所述湿度大于预设湿度阈值,则确定检测到用户气息;如果所述湿度小于或等于预设湿度阈值,则确定没有检测到用户气息。

33、在一种可实现方式中,所述终端包括二氧化碳传感器,所述处理器,还用于获取采集到所述第二语音信息时,所述二氧化碳传感器对应的二氧化碳浓度;如果所述二氧化碳浓度大于预设二氧化碳浓度阈值,则确定检测到用户气息;如果所述二氧化碳浓度小于或等于预设二氧化碳浓度阈值,则确定没有检测到用户气息。

34、第五方面,本技术提供一种语音交互装置,所述装置包括处理器;所述处理器,用于检测到发起语音交互的唤醒指示;响应于所述唤醒指示,进入语音交互的工作状态;检测到第一语音信息;输出针对所述第一语音信息的反馈结果;确定终端是否靠近用户的嘴部;如果确定所述终端靠近用户的嘴部,则将语音交互的工作状态延长预设时长;如果确定所述终端不靠近用户的嘴部,则结束语音交互的工作状态。

35、第六方面,本技术提供一种语音交互装置,所述装置包括处理器;所述处理器,用于检测到发起语音交互的唤醒指示;响应于所述唤醒指示,进入语音交互的工作状态;检测到第一语音信息;输出针对所述第一语音信息的反馈结果;如果在预设时长内检测到第二语音信息,则确定终端是否靠近用户的嘴部;如果确定所述终端靠近用户的嘴部,则输出针对所述第二语音信息的反馈结果。

36、第七方面,本技术提供一种终端,所述终端包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,当所述处理器执行所述计算机指令时,使所述电子设备执行如第一方面至第三方面中任一所述的方法。

37、第八方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序或指令,当所述计算机程序或指令被执行时,如第一方面至第三方面中任一所述的方法被执行。

38、第九方面,本技术提供一种计算机程序产品,所述计算机程序产品包括计算机程序或指令,当所述计算机程序或指令在计算机上运行时,使得计算机执行如第一方面至第三方面中任一所述的方法。

39、综上,本技术提供的语音交互方法、装置及终端,能够通过检测用户气息和/或确定终端是否靠近用户的嘴部,大概率识别到是用户本人有继续语音交互的意图,有效降低终端对于其他人或者周围其他噪声的错误响应,提升语音交互的准确性和用户体验。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1