语音增强处理方法、语音增强处理装置及存储介质与流程

文档序号:34308596发布日期:2023-05-31 19:55阅读:39来源:国知局
语音增强处理方法、语音增强处理装置及存储介质与流程

本公开涉及可穿戴语音设备的语音增强处理,尤其涉及语音增强处理方法、语音增强处理装置及存储介质。


背景技术:

1、为保证用户在使用可穿戴语音设备时,减少外部环境的干扰,获得良好体验,需要使可穿戴语音设备的麦克风阵列的波束指向信号声源(即用户的嘴),增强针对信号声源的信号获取,并抑制来自其他方向的噪声。

2、相关技术中,一般使用语音采集阵列,基于语音到达阵元间相对时延差,结合阵列几何结构的声源定位算法,对目标声源的范围进行估计。此方法计算量少,易于实现。但要求系统有较高采样率,且算法复杂度高,定位效果也不够精确。


技术实现思路

1、为克服相关技术中存在的问题,本公开提供一种语音增强处理方法、语音增强处理装置及存储介质。

2、根据本公开实施例的第一方面,提供一种语音增强处理方法,应用于可穿戴语音设备,所述方法包括:响应于检测到语音输入,采集当前语音信号,并获取所述可穿戴语音设备中姿态传感器输出的当前传感参数;基于所述当前传感参数,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向;基于所述当前波束图方向和所述当前语音信号进行音源聚焦,以对所述当前语音信号进行增强。

3、一种实施方式中,所述基于所述当前传感参数,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向,包括:获取预先存储的基准传感参数以及基准波束图方向;基于所述当前传感参数、所述基准传感参数以及基准波束图方向,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向。

4、一种实施方式中,所述基于所述当前传感参数、所述基准传感参数以及基准波束图方向,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向,包括:基于所述当前传感参数,确定所述可穿戴语音设备的当前姿态矩阵,并基于所述基准传感参数,确定基准姿态矩阵;基于所述当前姿态矩阵和所述基准姿态矩阵,确定所述可穿戴语音设备当前波束角度相对基准角度之间的角度变化量;基于所述基准传感参数与基准波束图方向具有对应关系;将所述角度变化量与基准波束图方向进行角度映射,得到所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向。

5、一种实施方式中,所述基准传感参数以及基准波束图方向基于所述可穿戴语音设备首次被穿戴时采集的声音信号确定。

6、一种实施方式中,所述基准传感参数以及基准波束图方向采用如下方式基于所述可穿戴语音设备首次被穿戴时采集的声音信号确定:响应于确定所述可穿戴语音设备首次被穿戴,发出第一提示信息,所述提示信息用于提示用户发出语音;采集用户发出的语音信号,使用多个不同波束图方向,对采集到的语音信号进行音源聚焦,以对采集到的语音信号进行增强;响应于完成对采集到的语音信号进行增强,发出第二提示信息,所述第二提示信息用于提示用户选择语音质量最高的增强后语音;将与用户选择的增强后语音对应的波束图方向作为基准波束图方向,并获取所述可穿戴语音设备首次被穿戴时所述姿态传感器输出的传感参数,作为基准传感参数。

7、根据本公开实施例的第二方面,提供一种语音增强处理装置,应用于可穿戴语音设备,所述装置包括:采集单元,用于响应于检测到语音输入,采集当前语音信号,并获取所述可穿戴语音设备中姿态传感器输出的当前传感参数;计算单元,基于所述当前传感参数,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向;波束形成单元,基于所述当前波束图方向和所述当前语音信号进行音源聚焦,以对所述当前语音信号进行增强。

8、一种实施方式中,所述计算单元采用如下方式基于所述当前传感参数,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向:获取预先存储的基准传感参数以及基准波束图方向;基于所述当前传感参数、所述基准传感参数以及基准波束图方向,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向。

9、一种实施方式中,所述计算单元采用如下方式基于所述当前传感参数、所述基准传感参数以及基准波束图方向,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向:基于所述当前传感参数,确定所述可穿戴语音设备的当前姿态矩阵,并基于所述基准传感参数,确定基准姿态矩阵;基于所述当前姿态矩阵和所述基准姿态矩阵,确定所述可穿戴语音设备当前波束角度相对基准角度之间的角度变化量;基于所述基准传感参数与基准波束图方向具有对应关系;将所述角度变化量与基准波束图方向进行角度映射,得到所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向。

10、一种实施方式中,所述基准传感参数以及基准波束图方向基于所述可穿戴语音设备首次被穿戴时采集的声音信号确定。

11、一种实施方式中,所述基准传感参数以及基准波束图方向采用如下方式基于所述可穿戴语音设备首次被穿戴时采集的声音信号确定:响应于确定所述可穿戴语音设备首次被穿戴,发出第一提示信息,所述提示信息用于提示用户发出语音;采集用户发出的语音信号,使用多个不同波束图方向,对采集到的语音信号进行音源聚焦,以对采集到的语音信号进行增强;响应于完成对采集到的语音信号进行增强,发出第二提示信息,所述第二提示信息用于提示用户选择语音质量最高的增强后语音;将与用户选择的增强后语音对应的波束图方向作为基准波束图方向,并获取所述可穿戴语音设备首次被穿戴时所述姿态传感器输出的传感参数,作为基准传感参数。

12、根据本公开实施例的第三方面,提供一种语音增强处理装置,其特征在于,包括:处理器:用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行上述任一项所述的语音增强处理方法。

13、根据本公开实施例的第四方面,提供一种存储介质,所述存储介质中存储有指令,当所述存储介质中的指令由可穿戴语音设备的处理器执行时,使得可穿戴语音设备能够执行上述任一项所述的语音增强处理方法。

14、本公开的实施例提供的技术方案可以包括以下有益效果:通过可穿戴语音设备内置的传感器确定可穿戴语音设备佩戴时的波束图方向,并进行语音信号增强,只依靠传感器的参数进行波束图方向确定,不完全依赖于语音信号,波束图方向的确定不受声场环境、麦克风个数、采样率等限制。通过本公开能够解决在可穿戴语音设备实际的使用过程中由于用户不同的佩戴习惯,佩戴姿态变化以及用户耳朵形状大小的不同使得耳机的阵列增强方位与实际不匹配的问题,提高语音信号增强精度。

15、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。



技术特征:

1.一种语音增强处理方法,其特征在于,应用于可穿戴语音设备,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述当前传感参数,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述当前传感参数、所述基准传感参数以及基准波束图方向,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向,包括:

4.根据权利要求2或3所述的方法,其特征在于,所述基准传感参数以及基准波束图方向基于所述可穿戴语音设备首次被穿戴时采集的声音信号确定。

5.根据权利要求4所述的方法,其特征在于,所述基准传感参数以及基准波束图方向采用如下方式基于所述可穿戴语音设备首次被穿戴时采集的声音信号确定:

6.一种语音增强处理装置,其特征在于,应用于可穿戴语音设备,所述装置包括:

7.根据权利要求6所述的装置,其特征在于,所述计算单元采用如下方式基于所述当前传感参数,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向:

8.根据权利要求7所述的装置,其特征在于,所述计算单元采用如下方式基于所述当前传感参数、所述基准传感参数以及基准波束图方向,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向:

9.根据权利要求7或8所述的装置,其特征在于,所述基准传感参数以及基准波束图方向基于所述可穿戴语音设备首次被穿戴时采集的声音信号确定。

10.根据权利要求9所述的装置,其特征在于,所述基准传感参数以及基准波束图方向采用如下方式基于所述可穿戴语音设备首次被穿戴时采集的声音信号确定:

11.一种语音增强处理装置,其特征在于,包括:

12.一种存储介质,其特征在于,所述存储介质中存储有指令,当所述存储介质中的指令由可穿戴语音设备的处理器执行时,使得可穿戴语音设备能够执行权利要求1至5中任一项所述的语音增强处理方法。


技术总结
本公开涉及一种语音增强处理方法、装置及存储介质。语音增强处理方法,应用于终端,包括:响应于检测到语音输入,采集当前语音信号,并获取所述可穿戴语音设备中姿态传感器输出的当前传感参数;基于所述当前传感参数,确定所述可穿戴语音设备在当前佩戴姿态下对应的当前波束图方向;基于所述当前波束图方向和所述当前语音信号进行音源聚焦,以对所述当前语音信号进行增强。通过本公开可以使可穿戴语音设备的波束图方向精准指向声源,增强语音信号,保证降噪效果。

技术研发人员:钟双莲,史润宇,刘念
受保护的技术使用者:北京小米移动软件有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1