语音唤醒方法、装置、电子设备及存储介质与流程

文档序号：36338202发布日期：2023-12-13 15:12阅读：51来源：国知局

本申请属于音频，具体涉及一种语音唤醒方法、装置、电子设备及存储介质。

背景技术：

1、目前，用户在使用电子设备时，电子设备可以通过麦克风采集用户的音频信息，然后电子设备可以基于该音频信息，进行语音唤醒。相关技术中，在电子设备获取到音频信息之后，电子设备可以将该音频信息输入语音唤醒算法中，以确定音频信息中是否包含唤醒词，从而在该音频信息中包含唤醒词的情况下，电子设备可以进行语音唤醒处理。

2、然而，由于电子设备在开启语音唤醒功能之后，电子设备会一直通过麦克风采集用户的音频信息，以达到实时唤醒的目的，若用户在使用电子设备的过程中误说了唤醒词或近似词，则电子设备接收到该唤醒词后，会进行语音唤醒处理，导致电子设备出现了误唤醒现象，如此，电子设备进行语音唤醒的准确性较差。

技术实现思路

1、本申请实施例的目的是提供一种语音唤醒方法、装置、电子设备及存储介质，能够提高电子设备进行语音唤醒的准确性。

2、第一方面，本申请实施例提供了一种语音唤醒方法，该语音唤醒方法包括：对语音音频进行音频端点检测，得到n组人声音频端点组，该人声音频端点组包括音频起始点和音频结束点，n为正整数；在语音音频的唤醒词检测通过的情况下，获取第一唤醒词音频的唤醒词起始点，该第一唤醒词音频为语音音频中的包含唤醒词的音频；在根据人声音频端点组和唤醒词起始点确定第一唤醒词音频前存在停顿的情况下，进行语音唤醒。

3、第二方面，本申请实施例提供了一种语音唤醒装置，该语音唤醒装置包括：检测模块、获取模块和处理模块；检测模块，用于对语音音频进行音频端点检测，得到n组人声音频端点组，该人声音频端点组包括音频起始点和音频结束点，n为正整数。获取模块，用于在语音音频的唤醒词检测通过的情况下，获取第一唤醒词音频的唤醒词起始点，该第一唤醒词音频为语音音频中的包含唤醒词的音频。处理模块，用于在根据人声音频端点组和唤醒词起始点确定第一唤醒词音频前存在停顿的情况下，进行语音唤醒。

4、第三方面，本申请实施例提供了一种电子设备，该电子设备包括处理器和存储器，所述存储器存储可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

5、第四方面，本申请实施例提供了一种可读存储介质，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

6、第五方面，本申请实施例提供了一种芯片，所述芯片包括处理器和通信接口，所述通信接口和所述处理器耦合，所述处理器用于运行程序或指令，实现如第一方面所述的方法。

7、第六方面，本申请实施例提供一种计算机程序产品，该程序产品被存储在存储介质中，该程序产品被至少一个处理器执行以实现如第一方面所述的方法。

8、在本申请实施例中，电子设备可以对语音音频进行音频端点检测，得到n组人声音频端点组，该每组人声音频端点组包括音频起始点和音频结束点，n为正整数；在语音音频的唤醒词检测通过的情况下，获取第一唤醒词音频的唤醒词起始点，该第一唤醒词音频为所述语音音频中的包含唤醒词的音频；从而在根据所述人声音频端点组和所述唤醒词起始点确定所述第一唤醒词音频前存在停顿的情况下，进行语音唤醒。在用户日常使用电子设备的过程中，用户一般在说出唤醒词之前，均是停顿一下，然后再说出唤醒词；本方案中，电子设备在从第一唤醒音频中确定目标唤醒词之后，电子设备可以基于人声音频端点组和唤醒词起始点确定第一起始音频前是否存在停顿，从而在存在停顿的前提下，电子设备可以基于该目标唤醒词，进行唤醒处理，也就是说，电子设备可以通过检测目标唤醒词前是否存在停顿，从而在目标唤醒词前存在停顿的情况下，再进行唤醒，进而达到降低电子设备出现误唤醒现象，如此，提升了电子设备进行语音唤醒的准确性。

技术特征：

1.一种语音唤醒方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述n组人声音频端点组中包括：第一音频的音频起始点，所述第一音频为所述语音音频中的包含第一人声信号的音频，所述第一音频包括所述第一唤醒词音频；

3.根据权利要求1所述的方法，其特征在于，所述n组人声音频端点组中包括：第二音频的音频终止点，所述第二音频为所述语音音频中的包含第二人声信号的音频，所述第二音频为第三音频的前一音频，所述第三音频包括所述第一唤醒词音频；

4.根据权利要求1所述的方法，其特征在于，所述n组人声音频端点组中包括：第四音频的音频起始点和音频终止点，所述第四音频包括所述第一唤醒词音频；

5.根据权利要求1所述的方法，其特征在于，所述n组人声音频端点组包括第五音频的音频起始点和音频结束点，所述第五音频包括所述第一唤醒词音频；

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1至6中任一项所述的方法，其特征在于，所述在根据所述人声音频端点组和所述唤醒词起始点确定所述第一唤醒词音频前存在停顿的情况下，进行语音唤醒之前，所述方法还包括：

8.一种语音唤醒装置，其特征在于，所述装置包括：检测模块、获取模块和处理模块；

9.根据权利要求8所述的装置，其特征在于，所述n组人声音频端点组中包括：第一音频的音频起始点，所述第一音频为所述语音音频中的包含第一人声信号的音频，所述第一音频包括所述第一唤醒词音频；

10.根据权利要求8所述的装置，其特征在于，所述n组人声音频端点组中包括：第二音频的音频终止点，所述第二音频为所述语音音频中的包含第二人声信号的音频，所述第二音频为第三音频的前一音频，所述第三音频包括所述第一唤醒词音频；

11.根据权利要求8所述的装置，其特征在于，所述n组人声音频端点组中包括：第四音频的音频起始点和音频终止点，所述第四音频包括所述第一唤醒词音频；所述语音唤醒装置还包括：确定模块；

12.根据权利要求8所述的装置，其特征在于，所述n组人声音频端点组包括第五音频的音频起始点和音频结束点，所述第五音频包括所述第一唤醒词音频；所述获取模块，还用于所述处理模块在根据所述人声音频端点组和所述唤醒词起始点确定所述第一唤醒词音频前存在停顿的情况下，进行语音唤醒之前，获取所述第一唤醒词音频对应的第一人声音频能量值以及所述第五音频对应的第二人声音频能量值；

13.一种电子设备，其特征在于，包括处理器，存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令，所述程序或指令被所述处理器执行时实现如权利要求1至7中任一项所述的语音唤醒方法的步骤。

14.一种可读存储介质，其特征在于，所述可读存储介质上存储程序或指令，所述程序或指令被处理器执行时实现如权利要求1至7中任一项所述的语音唤醒方法的步骤。

技术总结
本申请公开了一种语音唤醒方法、装置、电子设备及存储介质，属于音频技术领域。该方法包括：对语音音频进行音频端点检测，得到N组人声音频端点组，人声音频端点组包括音频起始点和音频结束点，N为正整数；在语音音频的唤醒词检测通过的情况下，获取第一唤醒词音频的唤醒词起始点，第一唤醒词音频为语音音频中的包含唤醒词的音频；在根据人声音频端点组和唤醒词起始点确定第一唤醒词音频前存在停顿的情况下，进行语音唤醒。

技术研发人员：刘隽涵
受保护的技术使用者：维沃移动通信有限公司
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘隽涵
技术所有人：维沃移动通信有限公司
我是此专利的发明人