设备唤醒方法、电子设备和存储介质与流程

文档序号:34844341发布日期:2023-07-22 10:03阅读:70来源:国知局
设备唤醒方法、电子设备和存储介质与流程

本申请实施例涉及语音识别,特别是涉及一种设备唤醒方法、电子设备和存储介质。


背景技术:

1、随着智能语音技术的飞速发展,成套化的语音产品给用户的生活带来极大便利。然而相同品牌的成套设备唤醒指令基本相同,用户在唤醒这些带有语音功能的设备时,可能会出现多台设备被同时唤醒,产生“一呼百应”的现象,给用户带来较差的语音功能体验。分析用户对语音设备的交互习惯,用户更倾向于通过语音唤醒直面且距离更近的设备,进而控制家居环境内的其他终端。

2、现有技术中,复杂家居场景下常见的目标设备选择方案包括:

3、基于语音能量值或归一化语音能量值的设备就近唤醒方法:当用户唤醒设备时,计算并且对比当前设备和其他设备的语音能量值或归一化语音能量值,确定数值最大的设备为目标唤醒设备。一般而言,不同麦克风类型或者不同设备品类,其语音能量值不具备可比性,可先量化参考幅值,确定调整增益,再比较语音能量值,一般语音能量值越大,设备距离用户越近。缺陷是由于麦克风类型的不同或者是设备类型的不同,多款语音设备决策选取最优设备进行应答时,可能语音能量值并不具备可比性,导致目标设备唤醒的准确率较低,即使是采用归一化的语音能量值进行校准,也无法做到所有终端的一致性。此外,在一些复杂的家居场景下,如多人同时说话、终端播放音频等场景下,基于语音能量值或者归一化语音能量值的方法,容易受到干扰声或者环境噪声的影响,设备间决策的准确率会大打折扣。

4、基于语音信噪比的设备就近唤醒方法:终端设备接收到用户的唤醒词后,首先截取一定长度的唤醒音频片段,片段中需要包含无人声片段和唤醒词片段,分别计算两者的噪声信号功率和语音信号功率,从而得到唤醒语音信噪比,多个唤醒设备根据语音信噪比选择数字最大的作为目标设备。缺陷是终端设备接收到用户的唤醒指令后,分别计算无人声片段的噪声信号功率和唤醒词片段的语音信号功率,从而得到语音信噪比。在截取音频片段时一般采用经验长度,计算的噪声功率和语音功率存在一定误差。此外,无人声片段容易受到环境噪声的干扰,无法区分是麦克风自身的设备底噪还是环境干扰引起的,方案适应性不够全面。

5、基于探测传感器的设备就近唤醒方案:基于探测传感器的就近唤醒方案。传统的距离探测传感器包括红外、超声波、雷达、图像传感器等探测技术。当设备被用户唤醒时,触发距离传感器检测附近说话人的距离,通过判断距离的远近以唤醒离用户最近的那台设备,进而实现后续的语音交互。缺陷是距离探测传感器的基本原理是利用波的传播和反射,计算传播延时从而估算设备到人的距离,然而人体表面的不规则性会影响波的反射从而导致距离的测量存在误差。使用这类距离传感器并未用到麦克风的语音信息,还会带来额外的硬件成本,此外由于终端处理器性能的限制,该方案不适用于一些低功耗设备或者是低性能设备,方案通用型较差。


技术实现思路

1、本发明实施例提供了一种设备唤醒方法、电子设备以及存储介质,用于至少解决上述技术问题之一。

2、第一方面,本发明实施例提供了一种设备唤醒方法,用于当前设备,包括:计算获取多个基于语音算法的距离指标和设备朝向指标,进行多算法指标融合得到第一融合指标,其中,每个指标中包含多个子算法指标;将所述第一融合指标发送至其他设备,并接收经由其他设备发送的第二融合指标;基于所述第一融合指标和所述第二融合指标判断是否唤醒所述当前设备;若是,响应用户的唤醒需求,持续监听所述用户的后续指令。

3、第二方面,本发明实施例提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明上述任一项设备唤醒方法。

4、第三方面,本发明实施例提供一种存储介质,所述存储介质中存储有一个或多个包括执行指令的程序,所述执行指令能够被电子设备(包括但不限于计算机,服务器,或者网络设备等)读取并执行,以用于执行本发明上述任一项设备唤醒方法。

5、第四方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任一项设备唤醒方法。

6、本申请的方法通过融合多种距离检测指标,包括语音声压级、语音分段信噪比、直混比等距离参数,从而改善了单一指标带来的距离波动问题,然后结合语音特性中高频的指向性,融合麦克风幅度平方相干性、双耳幅度谱标准差、波达方向、直混比等算法指标,确定设备是否处在用户唤醒时的可视区域,更加符合用户实际使用时的交互习惯,之后通过融合更优的决策方案,在数据的支撑下可以更好地适用用户的使用习惯,进一步地,通过分布式组网可以有效的降低设备崩溃、掉线带来的无响应问题。



技术特征:

1.一种设备唤醒方法,用于当前设备,包括:

2.根据权利要求1所述的方法,其中,在所述基于所述第一融合指标和所述第二融合指标判断是否唤醒所述当前设备之前,还包括:

3.根据权利要求2所述的方法,其中,所述判断是否到达预设窗口期时间长度,包括:

4.根据权利要求1所述的方法,其中,在所述计算获取多个基于语音算法的距离指标和设备朝向指标之前,还包括:

5.根据权利要求4所述的方法,其中,在所述响应于获取到包含唤醒词的唤醒音频,对所述当前设备和所述其他设备的音频进行校准之后,还包括:

6.根据权利要求5所述的方法,其中,在所述基于所述唤醒音频与所述唤醒角度,计算所述用户与设备的距离指标之后,还包括:

7.根据权利要求4所述的方法,其中,在所述响应于获取到包含唤醒词的唤醒音频之前,还包括:

8.根据权利要求7所述的方法,其中,在所述经由用户对所述当前设备和所述其他设备接入同一个互联网络,交换每一设备的指标数据之后,还包括:

9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8任一项所述方法的步骤。

10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。


技术总结
本发明公开设备唤醒方法、电子设备和存储介质,其中,一种设备唤醒方法,包括:计算获取多个基于语音算法的距离指标和设备朝向指标,进行多算法指标融合得到第一融合指标;将所述第一融合指标发送至其他设备,并接收经由其他设备发送的第二融合指标;基于所述第一融合指标和所述第二融合指标判断是否唤醒所述当前设备;若是,响应用户的唤醒需求,持续监听所述用户的后续指令。通过计算获取多个基于语音算法的距离指标和设备朝向指标,进行多算法指标融合得到第一融合指标,然后将第一融合指标发送至其他设备,并接收经由其他设备发送的第二融合指标,从而可以实现准确的选择出符合用户交互习惯的最佳设备响应用户的交互需求。

技术研发人员:费超,陶勇
受保护的技术使用者:思必驰科技股份有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1