一种语音唤醒方法、智能设备以及芯片与流程

文档序号：34734517发布日期：2023-07-12 18:14阅读：29来源：国知局

本申请涉及语音处理，具体涉及一种语音唤醒方法、智能设备以及芯片。

背景技术：

1、语音交互前，设备或者语音交互功能模块需要先被唤醒，从休眠状态进入工作状态，才能正常地处理用户的指令。把设备或者功能模块从休眠状态叫醒到工作状态就叫唤醒，常见的有触摸唤醒（锁屏键），定时唤醒（闹钟），被动唤醒（电话）等，而语音唤醒（key-word-spot, kws）是通过语音的方式将设备或者功能模块从休眠状态切换到工作状态，其基本工作原理是在连续语流中实时检测出说话人特定片段。语音唤醒已经是一项成熟的技术，但是目前的语音唤醒技术的功耗仍然较大，不利于采用电池供电的终端设备的续航。

2、例如，公布号为cn115547312a的发明专利公开的一种带活动检测的预处理器、芯片和电子设备，在预处理前端进行活动检测，尤其是在预处理前端的并行通道前检测是否有需要的输入信号，以控制并行通道及后续的神经网络处理器是否进行处理，目的是最大限度地降低语音唤醒的功耗。在该专利中，带活动检测的预处理器可以只在有输入信号的时候控制神经网络处理器进行工作，这在一定程度上降低了功耗。然而，所述带活动检测的预处理器只能够判断是否有声音，无法判断该声音是人声还是其他背景声。在这种情况下，仍然存在较大的虚警率，如果输入信号是背景声，那么调用神经网络处理器就会消耗不必要的功率，从而影响智能终端的续航。

技术实现思路

1、本申请提供了一种语音唤醒方法、智能设备以及芯片，具体技术方案如下：

2、一种语音唤醒方法，所述方法具体包括：步骤s1，智能设备采集声音信号并传输给第一语音活动检测单元，当所述第一语音活动检测单元判断所述声音信号满足预设条件时，进入步骤s2；步骤s2，智能设备将所述声音信号传输给第二语音活动检测单元，当所述第二语音活动检测单元判断所述声音信号是语音信号时，进入步骤s3；步骤s3，智能设备将所述语音信号传输给唤醒单元，如果唤醒单元检测到唤醒信息，则根据唤醒信息唤醒智能设备的相应功能。

3、本申请所述的语音唤醒方法，通过第一语音活动检测单元排除不符合条件的声音信号，只在声音信号满足预设条件时，才使用第二语音活动检测单元判断声音信号是否为人声，降低了智能设备的功耗。然后，只在声音信号是人声时，使用唤醒单元进行语音识别，进一步降低了智能设备的功耗。其中，第一语音活动检测单元和第二语音活动检测单元的功耗极低，它们使得功耗较大的唤醒单元只在必要时刻启动，从而使得所述语音唤醒方法可以跑在超低功耗的芯片中，提高了使用该芯片的智能设备的续航。

4、进一步地，所述步骤s1中，第一语音活动检测单元判断所述声音信号是否满足预设条件的方法具体包括：步骤s11，基于第一预设长度，第一语音活动检测单元将获取的声音信号进行切片，并计算每一片声音信号的平均振幅；步骤s12，基于阈值，第一语音活动检测单元比较每一片声音信号的平均振幅与阈值的大小，如果存在连续预设片数的声音信号的平均振幅大于等于阈值，则所述声音信号满足预设条件。确保所述声音信号是属于当前应用场景中的声音，且所述声音信号是连续的而非瞬时噪声。

5、进一步地，所述步骤s12中，第一语音活动检测单元持续比较每一片声音信号的平均振幅与阈值的大小，如果存在连续预设片数的声音信号的平均振幅小于阈值，则所述声音信号不满足预设条件。不是无条件地将声音信号传输给后续单元，有利于降低功耗。

6、进一步地，所述步骤s2中，第二语音活动检测单元判断所述声音信号是否是语音信号的方法具体包括：基于第二预设长度，第二语音活动检测单元将获取的声音信号进行切片，然后输入深度神经网络进行判断，如果存在连续预设片数的声音信号是语音信号时，则判定所述声音信号是语音信号，进入步骤s3；其中，所述深度神经网络用于分辨声音信号是否为语音信号。只在所述声音信号是语音信号时才传输给唤醒单元，有利于降低功耗。

7、进一步地，所述步骤s2中，当深度神经网络判断连续预设片数的声音信号不是语音信号时，则判定所述声音信号不是语音信号，返回步骤s1。过短的语音信号对于语音唤醒的场景来说没有意义，比如语气词，不是无条件地将声音信号传输给后续单元，有利于降低功耗。

8、进一步地，所述步骤s3具体包括：智能设备将所述语音信号传输给唤醒单元后，唤醒单元进行语音识别，如果识别到唤醒信息，则将智能设备从休眠状态唤醒至工作状态，否则返回步骤s1。

9、一种智能设备，所述智能设备用于实现所述的语音唤醒方法，所述智能设备包括：声音采集单元，用于采集声音信号；第一语音活动检测单元，用于判断声音信号是否满足预设条件；第二语音活动检测单元，用于判断满足预设条件的声音信号是否为语音信号；唤醒单元，用于识别语音信号中的唤醒信息以及在识别出唤醒信息后将智能设备从休眠状态唤醒至工作状态。所述智能设备通过第一语音活动检测单元排除不符合条件的声音信号，只在声音信号满足预设条件时，才使用第二语音活动检测单元判断声音信号是否为人声，降低了智能设备的功耗。然后，只在声音信号是人声时，使用唤醒单元进行语音识别，进一步降低了智能设备的功耗。

10、进一步地，所述第二语音活动检测单元包括一深度神经网络，该深度神经网络用于分辨声音信号是否为语音信号。所述深度神经网络不识别声音信号的具体内容，功耗较低。

11、进一步地，所述唤醒单元包括一语音识别神经网络，该语音识别神经网络用于识别语音信号中的唤醒信息。

12、一种芯片，该芯片储存有计算机程序代码，所述计算机程序代码被执行时实现所述的语音唤醒方法的步骤。

技术特征：

1.一种语音唤醒方法，其特征在于，所述方法具体包括：

2.根据权利要求1所述的一种语音唤醒方法，其特征在于，所述步骤s1中，第一语音活动检测单元判断所述声音信号是否满足预设条件的方法具体包括：

3.根据权利要求2所述的一种语音唤醒方法，其特征在于，所述步骤s12中，第一语音活动检测单元持续比较每一片声音信号的平均振幅与阈值的大小，如果存在连续预设片数的声音信号的平均振幅小于阈值，则所述声音信号不满足预设条件。

4.根据权利要求2所述的一种语音唤醒方法，其特征在于，所述步骤s2中，第二语音活动检测单元判断所述声音信号是否是语音信号的方法具体包括：

5.根据权利要求4所述的一种语音唤醒方法，其特征在于，所述步骤s2中，当深度神经网络判断连续预设片数的声音信号不是语音信号时，则判定所述声音信号不是语音信号，返回步骤s1。

6.根据权利要求4所述的一种语音唤醒方法，其特征在于，所述步骤s3具体包括：智能设备将所述语音信号传输给唤醒单元后，唤醒单元进行语音识别，如果识别到唤醒信息，则将智能设备从休眠状态唤醒至工作状态，否则返回步骤s1。

7.一种智能设备，其特征在于，所述智能设备用于实现权利要求1至6任一项所述的语音唤醒方法，所述智能设备包括：

8.根据权利要求7所述的一种智能设备，其特征在于，所述第二语音活动检测单元包括一深度神经网络，该深度神经网络用于分辨声音信号是否为语音信号。

9.根据权利要求7所述的一种智能设备，其特征在于，所述唤醒单元包括一语音识别神经网络，该语音识别神经网络用于识别语音信号中的唤醒信息。

10.一种芯片，该芯片储存有计算机程序代码，其特征在于，所述计算机程序代码被执行时实现权利要求1至6任一项所述的语音唤醒方法的步骤。

技术总结
本申请公开了一种语音唤醒方法、智能设备以及芯片，所述方法具体包括：步骤S1，智能设备采集声音信号并传输给第一语音活动检测单元，当所述第一语音活动检测单元判断所述声音信号满足预设条件时，进入步骤S2；步骤S2，智能设备将所述声音信号传输给第二语音活动检测单元，当所述第二语音活动检测单元判断所述声音信号是语音信号时，进入步骤S3；步骤S3，智能设备将所述语音信号传输给唤醒单元，如果唤醒单元检测到唤醒信息，则根据唤醒信息唤醒智能设备的相应功能。其中，第一语音活动检测单元和第二语音活动检测单元的功耗极低，它们使得功耗较大的唤醒单元只在必要时刻启动，从而使得所述语音唤醒方法可以跑在超低功耗的芯片中，提高了使用该芯片的智能设备的续航。

技术研发人员：严勇显,赖钦伟
受保护的技术使用者：珠海一微半导体股份有限公司
技术研发日：
技术公布日：2024/1/13

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：严勇显赖钦伟
技术所有人：珠海一微半导体股份有限公司
我是此专利的发明人