一种语音识别、语音唤醒装置、方法及智能终端设备与流程

文档序号:39599883发布日期:2024-10-11 13:06阅读:125来源:国知局

本申请涉及语音处理,尤其涉及一种语音识别、语音唤醒装置、方法及智能终端设备。


背景技术:

1、语音识别技术是一种将人类语音信号转换为文本信息的技术。在人工智能、语音交互、语音搜索、语音唤醒等领域具有重要的应用价值。随着技术的不断发展,语音识别技术也在不断发展和进步。

2、然而,为了支持语音识别功能,智能终端设备需要持续采集人声以及识别语音,消耗的功耗较高,会缩短设备的待机时长。但若为了降低功耗,使用少量的麦克风(microphone,mic)采集人声,则会导致语音识别的范围缩小。


技术实现思路

1、为克服相关技术中存在的问题,本申请提供了一种语音识别、语音唤醒装置、方法及智能终端设备。

2、根据本申请任一实施例的第一方面,提供了一种语音唤醒装置,所述装置包括:

3、多个麦克风,包括第一麦克风和至少一个第二麦克风,分别用于采集语音信号;

4、数字信号处理器,用于识别所述语音信号;

5、模数转换器,用于将所述语音信号转换为数字音频信号;以及,

6、应用处理器,用于识别所述模数转换器转换得到的数字音频信号;

7、其中,所述第一麦克风和所述数字信号处理器形成第一通路,用于在待机状态下采集和识别所述语音信号;

8、所述至少一个第二麦克风、所述模数转换器和所述应用处理器形成第二通路,用于在非待机状态下采集和识别所述语音信号。

9、根据本申请任一实施例的第二方面,提供了一种语音唤醒装置,所述装置包括:

10、本申请任一实施例所述的语音识别装置;以及,

11、控制模块,用于在所述待机状态下,使用所述第一通路,识别预设的唤醒词,并在所述非待机状态下,使用所述第二通路,识别所述唤醒词。

12、根据本申请任一实施例的第三方面,提供了一种语音识别方法,所述方法包括:

13、在待机状态下,通过第一麦克风采集语音信号,数字信号处理器识别所述语音信号;

14、在非待机状态下,通过至少一个第二麦克风采集所述语音信号,模数转换器将所述语音信号转换为数字音频信号,应用处理器识别所述数字音频信号。

15、根据本申请任一实施例的第四方面,提供了一种语音唤醒方法,所述方法包括:

16、在所述待机状态下,通过本申请任一实施例所述的语音识别方法,使用所述数字信号处理器,识别所述语音信号中的预设的唤醒词;

17、在所述非待机状态下,通过本申请任一实施例所述的语音识别方法,使用所述应用处理器,识别所述唤醒词。

18、根据本申请任一实施例的第五方面,提供了一种智能终端设备,所述智能终端设备包括本申请任一实施例中所述的装置。

19、本申请提供的技术方案可以包括以下有益效果:

20、根据上述实施例可知,通过在待机状态下由第一通路中的第一麦克风采集语音信号,数字信号处理器识别语音信号,可以降低识别语音信号的功耗;在非待机状态下由第二通路中的至少一个第二麦克风采集语音信号,模数转换器和应用处理器对语音信号进行转换和识别,可以扩大语音信号的采集和识别距离,根据待机状态使用不同的通路采集和识别语音,发挥各自通路的优势,实现在保持高待机时长的同时,扩大非待机状态下的识别范围。

21、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。



技术特征:

1.一种语音识别装置,其特征在于,所述装置包括:

2.根据权利要求1所述的语音识别装置,其特征在于,所述第二通路还包括所述第一麦克风。

3.根据权利要求1所述的语音识别装置,其特征在于,所述模数转换器与所述数字信号处理器并联工作。

4.一种语音唤醒装置,其特征在于,所述装置包括:

5.根据权利要求4所述的语音唤醒装置,其特征在于,所述语音唤醒装置还包括切换模块,所述切换模块用于:

6.根据权利要求4所述的语音唤醒装置,其特征在于,所述语音唤醒装置还包括延迟切换模块,所述延迟切换模块用于:

7.根据权利要求4所述的语音唤醒装置,其特征在于,所述第一通路还包括所述应用处理器;

8.一种语音识别方法,其特征在于,所述方法包括:

9.一种语音唤醒方法,其特征在于,所述方法包括:

10.一种智能终端设备,其特征在于,所述智能终端设备包括权利要求1-7中任一项所述的装置。


技术总结
本申请提供一种语音识别、语音唤醒装置、方法及智能终端设备。根据本申请的一个示例,该装置可以包括:多个麦克风,包括第一麦克风和至少一个第二麦克风,分别用于采集语音信号;数字信号处理器,用于识别语音信号;模数转换器,用于将语音信号转换为数字音频信号;以及,应用处理器,用于识别模数转换器转换得到的数字音频信号;其中,第一麦克风和数字信号处理器形成第一通路,用于在待机状态下采集和识别语音信号;至少一个第二麦克风、模数转换器和应用处理器形成第二通路,用于在非待机状态下采集和识别语音信号。

技术研发人员:薛俊斌,苏瑞雪
受保护的技术使用者:北京雪地软件开发有限公司
技术研发日:
技术公布日:2024/10/10
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!