语音增强方法、装置、设备、介质及程序产品与流程

文档序号:41797386发布日期:2025-05-06 16:53阅读:32来源:国知局

本申请涉及语音处理,特别涉及一种语音增强方法、装置、设备、介质及程序产品。


背景技术:

1、扩音器主要用于说话人语音放大,然而由于说话人音量大小、所处环境与设备差异,通过扩音器播放信号往往会受到环境噪声、房间混响、以及扩音器反馈语音影响,导致通过扩音设备播放语音质量变差、容易发生啸叫。目前,扩音环境中啸叫发生概率较高。


技术实现思路

1、本申请提供了一种语音增强方法、装置、设备、介质及程序产品,用以降低扩音环境中啸叫发生概率。

2、根据本申请实施例的第一方面,提供了一种语音增强方法,包括:

3、对麦克风接收信号进行语音增强,获得第一增强信号;

4、对所述第一增强信号中低频段的信号进行语音增强,获得第二增强信号;

5、基于所述第一增强信号和所述第二增强信号,确定目标增强信号;

6、对所述目标增强信号进行扩音,得到扩音后的信号。

7、可选地,所述对麦克风接收信号进行语音增强,获得第一增强信号,包括:

8、对麦克风接收信号进行傅里叶变换,获得频域特征;

9、基于所述频域特征,获得功率谱特征和复数谱特征;

10、基于所述功率谱特征和所述复数谱特征,预测时频域掩码;

11、基于所述频域特征和所述时频域掩码,获得第一增强信号。

12、可选地,所述对所述第一增强信号中低频段的信号进行语音增强,获得第二增强信号,包括:

13、基于所述功率谱特征和所述复数谱特征,获得低频段对应的滤波器估计复数系数;

14、基于低频段对应的滤波器估计复数系数,以及所述第一增强信号中低频段的信号,获得第二增强信号。

15、可选地,一个滤波阶数、一个目标帧和一个频率对应一个滤波器估计复数系数;在所述频域特征中,所述目标帧的采集时刻大于或等于当前帧的采集时刻;

16、所述基于低频段对应的滤波器估计复数系数,以及所述第一增强信号中低频段的信号,获得第二增强信号,包括:

17、基于任意一个滤波阶数和低频段对应的滤波器估计复数系数中各个目标帧对应的滤波器估计复数系数,以及所述第一增强信号中低频段的信号,确定所述任意一个滤波阶数和所述低频段对应的中间增强信号;

18、基于各个滤波阶数和所述低频段对应的中间增强信号,获得第二增强信号。

19、可选地,所述基于所述第一增强信号和所述第二增强信号,确定目标增强信号,包括:

20、基于所述功率谱特征和所述复数谱特征,确定加权系数;

21、基于所述第一增强信号、所述第二增强信号和所述加权系数,确定第三增强信号;

22、将第三增强信号进行傅里叶逆变换,获得第四增强信号;

23、基于所述第四增强信号,确定目标增强信号。

24、可选地,所述基于所述第四增强信号,确定目标增强信号,包括:

25、对所述第四增强信号中的反馈信号进行移频调相和半波整流,去除所述第四增强信号中的反馈信号和目标语音信号之间的相关性,获得第五增强信号;

26、基于所述第五增强信号,确定目标增强信号;

27、其中,所述反馈信号是指扬声器播放回传至麦克风的信号;所述目标语音信号是指麦克风接收的用户语音信号。

28、可选地,所述基于所述第五增强信号,确定目标增强信号,包括:

29、基于所述第五增强信号,确定扬声器输出信号;

30、将所述扬声器输出信号的动态范围映射至预设动态范围,获得调整后的扬声器输出信号;

31、基于所述调整后的扬声器输出信号,确定目标增强信号。

32、根据本申请实施例的第二方面,提供了一种语音增强装置,包括:

33、第一增强单元,用于对麦克风接收信号进行语音增强,获得第一增强信号;

34、第二增强单元,用于对所述第一增强信号中低频段的信号进行语音增强,获得第二增强信号;

35、处理单元,用于基于所述第一增强信号和所述第二增强信号,确定目标增强信号;

36、扩音单元,用于对所述目标增强信号进行扩音,得到扩音后的信号。

37、根据本申请实施例的第三方面,提供了一种电子设备,包括存储器和处理器;

38、所述存储器与所述处理器连接,用于存储程序;

39、所述处理器用于通过运行所述存储器中的程序,实现如第一方面所述的语音增强方法。

40、根据本申请实施例的第四方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时,实现如第一方面所述的语音增强方法。

41、根据本申请实施例的第五方面,提供了一种计算机程序产品,包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如第一方面所述的语音增强方法。

42、本申请中,对麦克风接收信号进行语音增强,获得第一增强信号,对第一增强信号中低频段的信号进行语音增强,获得第二增强信号,基于第一增强信号和第二增强信号,确定目标增强信号,对目标增强信号进行扩音,得到扩音后的信号。对麦克风接收信号进行了两次语音增强,第一次语音增强是对麦克风接收信号进行全频带的语音增强,能够降低啸叫发生概率,第二次语音增强是对第一次语音增强后的第一增强信号中低频段的信号进行语音增强,由于低频段的信号能量较强,更容易产生反馈啸叫,对第一增强信号中低频段的信号进行语音增强,获得第二增强信号,能够进一步降低啸叫发生概率,基于第一增强信号和第二增强信号,确定目标增强信号,对目标增强信号进行扩音,得到扩音后的信号,能够进一步降低扩音环境中啸叫发生概率。



技术特征:

1.一种语音增强方法,其特征在于,包括:

2.根据权利要求1所述的语音增强方法,其特征在于,所述对麦克风接收信号进行语音增强,获得第一增强信号,包括:

3.根据权利要求2所述的语音增强方法,其特征在于,所述对所述第一增强信号中低频段的信号进行语音增强,获得第二增强信号,包括:

4.根据权利要求3所述的语音增强方法,其特征在于,一个滤波阶数、一个目标帧和一个频率对应一个滤波器估计复数系数;在所述频域特征中,所述目标帧的采集时刻大于或等于当前帧的采集时刻;

5.根据权利要求2所述的语音增强方法,其特征在于,所述基于所述第一增强信号和所述第二增强信号,确定目标增强信号,包括:

6.根据权利要求5所述的语音增强方法,其特征在于,所述基于所述第四增强信号,确定目标增强信号,包括:

7.根据权利要求6所述的语音增强方法,其特征在于,所述基于所述第五增强信号,确定目标增强信号,包括:

8.一种语音增强装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括存储器和处理器;

10.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时,实现如权利要求1至7中任意一项所述的语音增强方法。

11.一种计算机程序产品,其特征在于,包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行如权利要求1至7中任意一项所述的语音增强方法。


技术总结
本申请提供一种语音增强方法、装置、设备、介质及程序产品,该语音增强方法包括:对麦克风接收信号进行语音增强,获得第一增强信号;对第一增强信号中低频段的信号进行语音增强,获得第二增强信号;基于第一增强信号和第二增强信号,确定目标增强信号;对目标增强信号进行扩音,得到扩音后的信号。本申请能够降低扩音环境中啸叫发生概率。

技术研发人员:闵锐,马峰,高建清
受保护的技术使用者:科大讯飞股份有限公司
技术研发日:
技术公布日:2025/5/5
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!
1