噪声抑制方法、设备、装置及存储介质与流程

文档序号:24690247发布日期:2021-04-16 10:31阅读:126来源:国知局
噪声抑制方法、设备、装置及存储介质与流程

1.本发明涉及语音信号处理领域,尤其涉及一种噪声抑制方法、设备、装置及存储介质。


背景技术:

2.随着语音通信设备,比如:耳机、音箱等的应用场景的多样化,语音信号的噪声类型也越来越多,这其中存在大量的非相干噪声。目前,抑制语音信号中的非相干噪声通常采用单通道噪声抑制算法执行,但单通道噪声抑制算法仅以一路目标语音波束输出作为依据,噪声估计存在局限性,仅对平稳噪声有较强的抑制能力,在信噪比较低和噪声非平稳程度较大的场景中噪声估计不够准确,导致不能有效抑制语音信号中的非相干噪声。


技术实现要素:

3.本申请实施例提供一种噪声抑制方法、设备、装置及存储介质,能够有效抑制语音信号中的非相干噪声。
4.为了解决上述技术问题,第一方面,本申请实施例提供一种噪声抑制方法,所述方法包括:
5.获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号;
6.根据所述干扰信号和所述期望语音信号,确定第一波束与参考信号瞬态比tbrr,并估计得到所述期望语音信号中的噪声功率;
7.根据更新参数集合,更新所述期望语音信号中的噪声功率;所述更新参数集合包括所述第一tbrr;
8.根据更新后的噪声功率,执行对所述期望语音信号中的非相干噪声的抑制处理。
9.第二方面,本申请实施例提供一种噪声抑制设备,所述噪声抑制设备包括:存储装置和处理器,
10.所述存储装置,用于存储程序代码;
11.所述处理器,在调用所述存储代码时,用于执行如第一方面所述的噪声抑制方法。
12.第三方面,本申请实施例提供一种噪声抑制装置,所述噪声抑制装置包括:
13.获取模块,用于获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号;
14.确定模块,用于根据所述干扰信号和所述期望语音信号,确定第一波束与参考信号瞬态比tbrr,并估计得到所述期望语音信号中的噪声功率;
15.更新模块,用于根据更新参数集合,更新所述期望语音信号中的噪声功率;所述更新参数集合包括所述第一tbrr;
16.抑制模块,用于根据更新后的噪声功率,执行对所述期望语音信号中的非相干噪声的抑制处理。
17.第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介
质用于存储计算机程序,所述计算机程序使得计算机执行第一方面所述的噪声抑制方法。
18.实施本申请实施例,具有如下有益效果:
19.根据干扰信号和对应的期望语音信号,确定第一tbrr,并估计得到期望语音信号中的噪声功率;根据包括有第一tbrr的更新参数集合,更新期望语音信号中的噪声功率,根据更新后的噪声功率,执行对期望语音信号中的非相干噪声的抑制处理,能够有效抑制语音信号中的非相干噪声。
附图说明
20.为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
21.图1为本申请实施例提供的一种噪声抑制方法的场景图;
22.图2为本申请实施例提供的一种降低噪声的流程示意图;
23.图3为本申请实施例提供的一种噪声抑制方法的流程示意图;
24.图4为本申请实施例提供的另一种噪声抑制方法的流程示意图;
25.图5为本申请实施例提供的一种确定期望语音信号的先验语音不存在概率的流程示意图;
26.图6为本申请实施例提供的一种噪声抑制设备的结构示意图;
27.图7为本申请实施例提供的一种噪声抑制装置的结构示意图。
具体实施方式
28.下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
29.需要说明的是,本申请的说明书和权利要求书中及上述附图中的属于“第一”、“第二”、“第三”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述以外的顺序实施。此外,术语“包括”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
30.请参阅图1,图1为本申请实施例提供的一种噪声抑制方法的场景图,具体如图1所示,在该场景中,电子设备10设置有第一语音采集器101和第二语音采集器102,其中,所述第一语音采集器101和所述第二语音采集器102的安装位置不同;第一语音采集器101的安装位置相对于第二语音采集器102的位置更接近期望声源11,比如:用户的嘴部。第一语音采集器101采集第一语音信号,比如:第一用户在佩戴耳机时,将嘴部靠近第一语音采集器101与第二用户进行语音通话;且第二语音采集器102采集第二语音信号。
31.请参阅图2,图2为本申请实施例提供的一种降低噪声的流程示意图,具体如图2所示,电子设备10对第一语音信号和第二语音信号分别进行空间滤波,得到第一期望语音信号和干扰信号;电子设备10基于干扰信号,消除第一期望语音信号的相干噪声,得到消除相干噪声的第二期望语音信号;电子设备10结合干扰信号,抑制第二期望语音信号中的非相干噪声,得到目标语音信号。所述目标语音信号是指消除了相干噪声并抑制了非相干噪声的干净语音信号。
32.本申请实施例中,可采用fbf(fixed beamforming,固定波束形成)滤波器对第一语音信号进行空间滤波,采用bm(block matrix,阻塞矩阵)滤波器对第二语音信号进行空间滤波;也可采用fbf滤波器对第二语音信号进行空间滤波,采用bm对第一语音信号进行空间滤波。
33.本申请实施例中,电子设备10对第一语音信号和第二语音信号分别进行空间滤波,得到第一期望语音信号和干扰信号,可包括:
34.确定第一语音信号在频域上的第一频域信号,以及第二语音信号在频域上的第二频域信号;对第一频域信号与第二频域信号进行空间滤波,得到第一期望语音信号和与第一期望语音信号对应的干扰信号。
35.需要说明的是,还可采用其他的方式对第一语音信号和第二语音信号进行空间滤波,以得到第一期望语音信号和干扰信号,在此不做限定。
36.本申请实施例中,第一语音采集器101和第二语音采集器102可以为全指向的麦克风阵列,在采集语音的过程中,对于距离麦克风阵列较近的噪声源,其噪声的传播路径以直达路径为主,可以看成是点源噪声,比如:周围的人说话产生的干扰等,可视为近场干扰;而距离较远的噪声源,其传播路径以多径反射和混响为主,可以看成是扩散噪声,比如:人群的噪声、车辆的噪声等,可视为远场噪声。其中,近场的点源噪声具有较强的指向性,即麦克风阵列接收到特定方向的噪声能量远远大于其他方向的噪声能量。远场的扩散场噪声,不具有明显的指向性,即从各个方向到达麦克风阵列的噪声能量差别不大。
37.本申请实施例中,麦克风阵列的期望方向是固定的,在第一语音采集器101处于靠近期望声源的位置时,对应近场的点源噪声,可以利用麦克风阵列的指向性,对第一语音信号与第二语音信号进行空间滤波,增强第一语音信号中来自期望方向的声音信号,衰减其他方向的声音信号,得到第一期望语音信号,以及衰减第二语音信号中来自期望方向的声音信号,增强其他方向的声音信号,得到干扰信号。
38.本申请实施例中,电子设备10可以包括智能手机、平板电脑、智能手表等移动终端,也可以包括耳机、音箱、智能电视、车载终端等具备声音采集功能的设备,在此不做限定。
39.请参阅图3,图3为本申请实施例提供的一种噪声抑制方法的流程示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的终端或者存储介质产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。具体如图3所示,所述方法包括:
40.s301:获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号。
41.步骤s301中的消除相干噪声的期望语音信号与图2中涉及的第二期望语音信号对应,与期望语音信号对应的干扰信号与图2中涉及的干扰信号对应。
42.步骤s301的具体内容可参见图1和图2描述的内容,在此不做赘述。
43.s302:根据所述干扰信号和所述期望语音信号,确定第一tbrr(transient beam

to

reference ratio,波束与参考信号瞬态比),并估计得到所述期望语音信号中的噪声功率;
44.本申请实施例中,可采用单通道噪声估计算法,比如:imcra(improved minima controlled recursive averaging,改进的最小控制递归平均)算法,根据干扰信号和期望语音信号,估计得到期望语音信号中的噪声功率。
45.s303:根据更新参数集合,更新所述期望语音信号中的噪声功率。
46.所述更新参数集合包括所述第一tbrr。
47.本申请实施例中,所述更新参数集合包含有更新参数,更新参数用于更新步骤s302估计得到的所述期望语音信号中的噪声功率,所述更新参数包括所述第一tbrr。
48.s304:根据更新后的噪声功率,执行对所述期望语音信号中的非相干噪声的抑制处理。
49.在本申请实施例中,根据干扰信号和对应的期望语音信号,确定第一tbrr,并估计得到期望语音信号中的噪声功率;根据包括有第一tbrr的更新参数集合,更新期望语音信号中的噪声功率,根据更新后的噪声功率,执行对期望语音信号中的非相干噪声的抑制处理,能够有效抑制语音信号中的非相干噪声。
50.请参阅图4,图4为本申请实施例提供的另一种噪声抑制方法的流程示意图,本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的劳动可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的终端或者存储介质产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行。具体如图4所示,所述方法可应用于设置有第一语音采集器和第二语音采集器的电子设备中,所述第一语音采集器相对于所述第二语音采集器更接近期望声源,所述方法包括:
51.s41:获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号。
52.本申请实施例中,所述获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号包括:
53.s411:采集第一语音信号和第二语音信号。
54.本申请实施例中,可通过第一语音采集器采集第一语音信号,可通过第二语音采集器采集第二语音信号。
55.s412:根据所述第一语音信号和所述第二语音信号,获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号。
56.步骤s411和s412中的消除相干噪声的期望语音信号与图2中涉及的第二期望语音信号对应,与期望语音信号对应的干扰信号与图2中涉及的干扰信号对应。
57.步骤s411和s412的具体内容可参见图1和图2的描述,在此不做赘述。
58.s42:根据所述干扰信号和所述期望语音信号,获取所述期望语音信号的功率、所述干扰信号的功率、所述期望语音信号的平稳噪声功率以及所述干扰信号的平稳噪声功
率。
59.本申请实施例中,可直接计算得到期望语音信号的功率和干扰信号的功率;可通过单通道噪声估计算法估计得到所述期望语音信号的平稳噪声功率和所述干扰信号的平稳噪声功率。
60.s43:根据所述干扰信号和所述期望语音信号,确定第一波束与参考信号瞬态比tbrr,并估计得到所述期望语音信号中的噪声功率。
61.本申请实施例中,可采用单通道噪声估计算法,比如:imcra,根据干扰信号和期望语音信号,估计得到期望语音信号中的噪声功率。还可采用单通道噪声估计算法,比如:imcra,根据干扰信号和期望语音信号,估计得到干扰信号中的噪声功率。
62.本申请实施例中,所述确定第一波束与参考信号瞬态比tbrr包括:获取期望语音信号帧中各频带对应的第二tbrr均值;根据所述第二tbrr均值,确定所述期望语音信号帧对应的第一tbrr。
63.所述期望语音信号包括多个期望语音信号帧,每个期望语音信号帧中包括多个频段,比如:频率值依次减小的高频带、中频带和低频带等三个频带,所述高频带的频率范围可以为2000hz

3500hz,所述中频带的频率范围可以为500hz

2000hz,所述低频带的频率范围可以为100hz

500hz;每个频带中可包含多个采样频点,在同一期望语音信号帧中相邻采样频点之间的采样间隔相同。
64.需要说明的是,所述获取期望语音信号帧中各频带对应的第二tbrr均值是指获取任一期望语音信号帧中各频带对应的第二tbrr均值,比如:获取第m个期望语音信号帧中各频带对应的第二tbrr均值,m为期望语音信号帧的索引,m为正整数。
65.本申请实施例中,所述获取期望语音信号帧中各频带对应的第二tbrr均值包括:获取期望语音信号帧的目标频带中各采样频点对应的第二tbrr;根据所述目标频带中各采样频点对应的第二tbrr,确定所述目标频带的第二tbrr均值。
66.所述目标频带是指所述期望语音信号帧中的任一频带,比如:第m个期望语音信号帧中高频带、中频带、低频带中的任一项。
67.所述根据所述目标频带中各采样频点对应的第二tbrr,确定所述目标频带的第二tbrr均值包括:将所述目标频带中各采样频点对应的第二tbrr的平均值,确定为所述目标频带的第二tbrr均值。
68.本申请实施例中,所述获取期望语音信号帧的目标频带中各采样频点对应的第二tbrr包括:
69.根据所述目标频带中目标采样频点对应的所述期望语音信号的功率、所述干扰信号的功率、所述期望语音信号的平稳噪声功率以及所述干扰信号的平稳噪声功率,获取所述目标采样频点的第二tbrr。
70.所述目标采样频点是指所述目标频带中的任一采样频点。
71.具体地,可通过如下公式计算第二tbrr:
[0072][0073]
其中,ω
tbrr
(m,k)为第m个期望语音信号帧中第k个采样频点对应的第二tbrr,|y
f
(m,k)|2为第m个期望语音信号帧中第k个采样频点的期望语音信号的功率,|y
b
(m,k)|2为第
m个干扰信号帧中第k个采样频点的干扰信号的功率,为第m个期望语音信号帧中第k个采样频点的期望语音信号的平稳噪声功率,为第m个干扰信号帧中第k个采样频点的干扰信号的平稳噪声功率,m为期望语音信号帧的索引或干扰信号帧的索引,k为采样频点的索引,m、k为正整数。第m个期望语音信号帧与第m个干扰信号帧对应。
[0074]
本申请实施例中,所述根据所述第二tbrr均值,确定所述期望语音信号帧对应的第一tbrr包括:获取所述期望语音信号帧中各频带对应的第二tbrr均值中的最大值;若所述最大值大于tbrr阈值,则将所述期望语音信号帧中目标采样频点的第一tbrr确定为所述目标采样频点的第二tbrr;若所述最大值小于或等于所述tbrr阈值,则确定所述期望语音信号帧中各采样频点的第一tbrr均为tbrr
min
;所述tbrr
min
为非负数。
[0075]
其中,所述tbrr
min
可以为0,也可以为接近0的常数,该常数为非负数。
[0076]
需要说明的是,期望语音信号帧可能为带噪语音帧,也可能为纯噪声帧;所述带噪语音帧含有期望语音信息,比如:期望声源发出的语音信息;所述纯噪声帧不含期望语音信息。
[0077]
比如:第m个期望语音信号中高频带、中频带、低频带对应的第二tbrr均值中最大值是中频带对应的第二tbrr均值,则判断该中频带对应的第二tbrr均值是否大于tbrr阈值;若该中频带对应的第二tbrr均值大于tbrr阈值,则可确定第m个期望语音信号帧为带噪语音帧,将第m个期望语音信号帧中各采样频点的第一tbrr确定为对应的第二tbrr,也就是tbrr值保持不变;若该中频带对应的第二tbrr均值小于或等于tbrr阈值,则可确定第m个期望语音信号帧为纯噪声帧,将第m个期望语音信号帧中各采样频点的第一tbrr均确定为tbrr
min

[0078]
在本申请实施例中,根据期望语音信号帧中各频带对应第二tbrr均值,确定该期望语音信号帧对应的第一tbrr,可以有效抑制非语音段的噪声残留,提高后续执行对期望语音信号中的非相干噪声抑制处理的准确性。
[0079]
s44:根据更新参数集合,更新所述期望语音信号中的噪声功率。
[0080]
所述更新参数集合包括所述第一tbrr。
[0081]
本申请实施例中,所述更新参数集合包含有更新参数,更新参数用于更新步骤s43估计得到的所述期望语音信号中的噪声功率,所述更新参数包括所述第一tbrr。
[0082]
本申请实施例中,所述更新参数集合还包括所述期望语音信号的后验信噪比、所述期望语音信号的平滑的后验信噪比以及所述干扰信号的平滑的后验信噪比中的至少一项更新参数。
[0083]
本申请实施例中,在更新所述期望语音信号中的噪声功率之前,需要确定所述期望语音信号的后验信噪比、所述期望语音信号的平滑的后验信噪比以及所述干扰信号的平滑的后验信噪比中的至少一项。
[0084]
本申请实施例中,将所述期望语音信号的功率与(步骤s43)估计得到的所述期望语音信号中的噪声功率之比,确定为所述期望语音信号的后验信噪比。
[0085]
所述期望语音信号的后验信噪比可通过如下公式计算:
[0086]
[0087]
其中,γ
f
(m,k)为第m个期望语音信号帧中第k个采样频点的期望语音信号的后验信噪比;|y
f
(m,k)|2为第m个期望语音信号帧中第k个采样频点的期望语音信号的功率;为第m个期望语音信号帧中第k个采样频点的期望语音信号中的噪声功率,在步骤s43中估计得到。
[0088]
本申请实施例中,执行对所述期望语音信号的功率的平滑处理;将平滑处理后的期望语音信号的功率与估计得到的所述期望语音信号中的噪声功率之比,确定为所述期望语音信号的平滑的后验信噪比。
[0089]
可通过如下公式执行对所述期望语音信号的功率的平滑处理:
[0090][0091]
其中,为第m个期望语音信号帧中第k个采样频点的平滑处理后的期望语音信号的功率;为第m

1个期望语音信号帧中第k个采样频点的平滑处理后的期望语音信号的功率;|y
f
(m,k)|2为第m个期望语音信号帧中第k个采样频点的期望语音信号的功率;为第一平滑系数,的取值范围为0.8~0.95。
[0092]
所述期望语音信号的平滑的后验信噪比可通过如下公式计算:
[0093][0094]
其中,为第m个期望语音信号帧中第k个采样频点的期望语音信号的平滑的后验信噪比;为第m个期望语音信号帧中第k个采样频点的平滑处理后的期望语音信号的功率;为第m个期望语音信号帧中第k个采样频点的期望语音信号中的噪声功率,在步骤s43中估计得到。
[0095]
本申请实施例中,执行对所述干扰信号的功率的平滑处理;将平滑处理后的干扰信号的功率与干扰信号中的噪声功率之比,确定为所述干扰信号的平滑的后验信噪比。
[0096]
可通过如下公式执行对所述干扰信号的功率的平滑处理:
[0097][0098]
其中,为第m个干扰信号帧中第k个采样频点的平滑处理后的干扰信号的功率;为第m

1个干扰信号帧中第k个采样频点的平滑处理后的干扰信号的功率;|y
b
(m,k)|2为第m个干扰信号帧中第k个采样频点对应的干扰信号的功率;为第二平滑系数,的取值范围为0.8~0.95。
[0099]
所述干扰信号的平滑的后验信噪比可通过如下公式计算:
[0100][0101]
其中,为第m个干扰信号帧中第k个采样频点的干扰信号的平滑的后验信噪比;为第m个干扰信号帧中第k个采样频点的平滑处理后的干扰信号的功率;为第m个干扰信号帧中第k个采样频点的干扰信号中的噪声功率,可在步骤s43中通过单通道噪声估计算法估计得到。
[0102]
需要说明的是,与的取值可根据历史执行平滑处理的统计数据分析获取,或者,根据行业经验进行设置,与的取值可以相同,也可以不同,在此不做限定。以每个期望语音信号帧或干扰信号帧为对象,执行对所述期望语音信号的功率和所述干扰信号的功率的平滑处理,可以有效减少孤立的采样频点存在峰值的现象,避免期望语音信号的实时功率谱和干扰信号的实时功率谱的最小值会出现奇异值并且数值小等现象,提高了期望语音信号的先验语音不存在概率计算的准确性。
[0103]
本申请实施例中,所述根据更新参数集合,更新所述期望语音信号中的噪声功率包括:
[0104]
s441:根据所述更新参数集合,确定所述期望语音信号的先验语音不存在概率;
[0105]
s442:根据所述先验语音不存在概率,确定所述期望语音信号的后验语音存在概率;
[0106]
s443:根据所述后验语音存在概率,更新(步骤s43估计得到的)所述期望语音信号中的噪声功率。
[0107]
本申请实施例中,所述根据所述更新参数集合,确定所述期望语音信号的先验语音不存在概率,即步骤s441包括:根据所述更新参数集合中的至少一项更新参数,确定所述期望语音信号的先验语音不存在概率。
[0108]
请参与图5,图5为本申请实施例提供的一种确定期望语音信号的先验语音不存在概率的流程示意图,具体如图5所示,所述根据所述更新参数集合中的至少一项更新参数,确定所述期望语音信号的先验语音不存在概率,包括:
[0109]
s4411:确定所述期望语音信号的平滑的后验信噪比是否大于第一后验信噪比阈值γ0。
[0110]
若确定所述期望语音信号的平滑的后验信噪比小于或等于第一后验信噪比阈值γ0,即则执行步骤s4412。
[0111]
其中,所述第一后验信噪比阈值γ0是指期望语音信号的平滑的后验信噪比阈值,用于判断期望语音信号中是否包含语音信号。
[0112]
若确定所述期望语音信号的平滑的后验信噪比大于第一后验信噪比阈值,即则执行步骤s4413。
[0113]
s4412:确定所述期望语音信号对应的先验语音不存在概率为1。
[0114]
s4413:根据所述干扰信号的平滑的后验信噪比,确定所述期望语音信号的先验语音不存在概率,即确定所述干扰信号的平滑的后验信噪比是否大于第二后验信噪比阈值γ1。
[0115]
若确定所述干扰信号的平滑的后验信噪比小于或等于第二后验信噪比阈值γ1,即则执行步骤s4414。
[0116]
其中,所述第二后验信噪比阈值γ1是指干扰信号的平滑的后验信噪比阈值,第二后验信噪比阈值γ1与期望语音信号的平滑的后验信噪比阈值γ0结合,用于判断期望语音信号中是否包含语音信号。
[0117]
若确定所述干扰信号的平滑的后验信噪比大于第二后验信噪比阈值,比如:则执行步骤s4415。
[0118]
s4414:确定所述期望语音信号的先验语音不存在概率为0。
[0119]
s4415:根据所述期望语音信号对应的第一tbrr,和/或,所述期望语音信号的后验信噪比,确定所述期望语音信号的先验语音不存在概率,即确定所述期望语音信号对应的第一tbrr是否小于tbrr的下限阈值ω
low
,和/或,所述期望语音信号的后验信噪比是否小于第三后验信噪比阈值γ2。
[0120]
若所述期望语音信号对应的第一tbrr小于tbrr的下限阈值,即ω
tbrr
(m,k)<ω
low
,和/或,所述期望语音信号的后验信噪比小于第三后验信噪比阈值γ2,即γ
f
(m,k)<γ2,则执行步骤s4412。
[0121]
其中,所述第三后验信噪比阈值γ2的取值范围为[1,3],比如:所述第三后验信噪比阈值γ2可以设为1。
[0122]
在所述期望语音信号对应的第一tbrr大于或等于tbrr的下限阈值时,即在ω
tbrr
(m,k)≥ω
low
,且所述期望语音信号的后验信噪比大于或等于第三后验信噪比阈值时,即γ
f
(m,k)≥γ2时,执行步骤s4416。
[0123]
s4416:确定所述期望语音信号对应的第一tbrr是否大于tbrr的上限阈值ω
high
,且所述期望语音信号的后验信噪比是否大于第四后验信噪比阈值γ3。
[0124]
若所述期望语音信号对应的第一tbrr大于tbrr的上限阈值,即ω
tbrr
(m,k)>ω
high
,且所述期望语音信号的后验信噪比大于第四后验信噪比阈值γ3,即γ
f
(m,k)>γ3,则执行步骤s4414。
[0125]
其中,第四后验信噪比阈值γ3是指期望语音信号的后验信噪比阈值,第四后验信噪比阈值γ3与期望语音信号的平滑的后验信噪比阈值γ0、干扰信号的平滑的后验信噪比阈值γ1以及第三后验信噪比阈值γ2结合,用于判断期望语音信号中是否包含语音信号;所述第四后验信噪比阈值γ3>所述第三后验信噪比阈值γ2;所述tbrr的上限阈值大于所述tbrr的下限阈值。
[0126]
若所述期望语音信号对应的第一tbrr小于或等于tbrr的上限阈值,即ω
tbrr
(m,k)≤ω
high
,和/或,所述期望语音信号的后验信噪比小于或等于第四后验信噪比阈值,即γ
f
(m,k)≤γ3,则执行步骤s4417。
[0127]
s4417:根据所述第四后验信噪比阈值、所述期望语音信号的后验信噪比、所述期望语音信号对应的第一tbrr、所述tbrr的上限阈值以及所述tbrr的下限阈值,确定所述期望语音信号的先验语音不存在概率。
[0128]
本申请实施例中,步骤s4417中可通过如下公式确定所述期望语音信号的先验语音不存在概率:
[0129][0130]
其中,为第m个期望语音信号帧中第k个采样频点的期望语音信号的先验语音不存在概率;表示取与两项中取值最大的一项。
[0131]
在本申请实施例中,结合期望语音信号对应的第一tbrr、期望语音信号的后验信
噪比、期望语音信号的平滑的后验信噪比以及干扰信号的平滑的后验信噪比,确定期望语音信号的先验语音不存在概率,提高了期望语音信号的先验语音不存在概率计算的准确性。
[0132]
本申请实施例中,步骤s442中可通过如下公式确定所述期望语音信号的后验语音存在概率:
[0133][0134]
其中,p(m,k)为第m个期望语音信号帧中第k个采样频点的期望语音信号的后验语音存在概率;q(m,k)为第m个期望语音信号帧中第k个采样频点的期望语音信号的先验语音不存在概率;υ(m,k)=γ
f
(m,k)
·
ξ1(m,k)/[1+ξ1(m,k)];γ
f
(m,k)为第m个期望语音信号帧中第k个采样频点的期望语音信号的后验信噪比,|y
f
(m,k)|2为第m个期望语音信号帧中第k个采样频点的期望语音信号的功率,是估计得到的第m个期望语音信号帧中第k个采样频点的期望语音信号中的噪声功率;ξ1(m,k)为第m个期望语音信号帧中第k个采样频点的期望语音信号的第一先验信噪比,ξ1(m,k)使用传统的判决引导法计算得到。
[0135]
本申请实施例中,所述根据所述后验语音存在概率,更新所述期望语音信号中的噪声功率,即步骤s443包括:若所述期望语音信号的后验语音存在概率大于后验语音存在概率阈值,则根据所述干扰信号的功率,更新所述期望语音信号中的噪声功率;若所述期望语音信号的后验语音存在概率小于或等于后验语音存在概率阈值,则根据所述期望语音信号的功率,更新所述期望语音信号中的噪声功率。
[0136]
其中,所述后验语音存在概率阈值用于确定期望语音信号帧包含较多语音信号或期望语音信号帧包含较少语音信号。比如:在期望语音信号帧为语音帧时,该期望语音信号帧可能包含较多的语音信号,在期望语音信号帧为非语音帧时,该期望语音信号帧可能包含较少的语音信号。
[0137]
若(任一)期望语音信号帧的期望语音信号的后验语音存在概率大于后验语音存在概率阈值,则可确定该期望语音信号帧中包含较多的语音信号,进而使用干扰信号的功率,更新所述期望语音信号中的噪声功率;若(任一)期望语音信号帧的期望语音信号的后验语音存在概率小于或等于后验语音存在概率阈值,则可确定该期望语音信号帧中包含较多的噪声信号,进而使用期望语音信号的功率,更新所述期望语音信号中的噪声功率;从而能够使用更具参考性的期望语音信号或干扰信号,更加准确地更新期望语音信号中的噪声功率。
[0138]
需要说明的是,可根据相邻两个期望语音信号帧中前一期望语音信号帧对应的期望语音信号的功率或干扰信号的功率,并结合用于更新期望语音信号中的噪声功率的平滑因子,更新后一期望语音信号帧对应的期望语音信号中的噪声功率;所述用于更新期望语音信号中的噪声功率的平滑因子是固定的,并不会随期望语音信号帧的变化而变化。
[0139]
s45:根据更新后的噪声功率,执行对所述期望语音信号中的非相干噪声的抑制处理。
[0140]
其中,执行对所述期望语音信号中的非相干噪声的抑制处理,可得到目标语音信号;所述目标语音信号是消除了相干噪声且抑制了非相干噪声的干净语音信号。
[0141]
本申请实施例中,所述根据更新后的噪声功率,执行对所述期望语音信号中的非相干噪声的抑制处理包括:
[0142]
s451:根据所述更新后的噪声功率,更新所述期望语音信号的后验信噪比,和/或,确定所述期望语音信号的先验信噪比;
[0143]
s452:根据更新后的所述期望语音信号的后验信噪比,和/或,所述期望语音信号的先验信噪比,获取用于抑制所述期望语音信号中的非相干噪声的增益;
[0144]
s453:根据所述增益,抑制所述期望语音信号中的非相干噪声。
[0145]
本申请实施例中,步骤s451中所述根据所述更新后的噪声功率,更新所述期望语音信号的后验信噪比包括:将所述期望语音信号的功率与更新后的噪声功率之比,确定为更新后的所述期望语音信号的后验信噪比。
[0146]
可通过如下公式计算更新后的所述期望语音信号的后验信噪比:
[0147][0148]
其中,γ
d
(m,k)为第m个期望语音信号帧中第k个采样频点的更新后的所述期望语音信号的后验信噪比;|y
f
(m,k)|2为第m个期望语音信号帧中第k个采样频点的期望语音信号的功率;为第m个期望语音信号帧中第k个采样频点的更新后的期望语音信号中的噪声功率。
[0149]
本申请实施例中,步骤s451中所述根据所述更新后的噪声功率,确定所述期望语音信号的先验信噪比包括:根据更新后的噪声功率以及目标语音信号的功率,确定目标语音信号的能量占比;根据所述目标语音信号的能量占比,确定(用于确定所述期望语音信号的(第二)先验信噪比的)平滑因子;根据所述平滑因子,确定所述期望语音信号的(第二)先验信噪比。
[0150]
可通过如下公式确定(用于确定所述期望语音信号的(第二)先验信噪比的)平滑因子:
[0151][0152]
其中,γ
d
为(用于确定所述期望语音信号的(第二)先验信噪比的)平滑因子,a,b为常数;为第m个期望语音信号帧中第k个采样频点的更新后的期望语音信号中的噪声功率;为上一期望语音信号帧,即第m

1个期望语音信号帧的第k个采样频点对应的目标语音信号的平滑功率;为第m个期望语音信号帧对应的目标语音信号的能量占比。所述目标语音信号是指消除了相干噪声并抑制了非相干噪声的干净语音信号。
[0153]
可通过如下公式计算:
[0154][0155]
其中,为第m

2个期望语音信号帧中第k个采样频点对应的目标语音信号的平滑功率;为第三平滑系数,是预设常数,取值范围为0~1;s(m

1,k)为对第m

1个期望语音信号帧的第k个采样频点的期望语音信号执行非相干噪声的抑制处理后得到的目标语音信号的功率。
[0156]
可通过如下公式计算期望语音信号的(第二)先验信噪比:
[0157]
ξ2(m,k)=max{γ
d
*ξ2(m

1,k)+(1

γ
d
)*max[ξ2(m,k)

1,0],ξ
min
}
[0158]
其中,ξ2(m,k)为第m个期望语音信号帧中第k个采样频点的期望语音信号的(第二)先验信噪比;γ
d
为(用于确定所述期望语音信号的(第二)先验信噪比的)平滑因子;ξ2(m

1,k)为第m

1个期望语音信号帧中第k个采样频点的期望语音信号的(第二)先验信噪比;ξ
min
为ξ2(m,k)所允许的最小值,可为根据经验设定的常数;max{γ
d
*ξ2(m

1,k)+(1

γ
d
)*max[ξ2(m,k)

1,0|,ξ
min
}表示取γ
d
*ξ2(m

1,k)+(1

γ
d
)*max[ξ2(m,k)

1,0]与ξ
min
两项中值最大的一项;max[ξ2(m,k)

1,0]表示取ξ2(m,k)

1与0两项中值最大的一项。
[0159]
需要说明的是,ξ1(m,k)与ξ2(m,k)都是期望语音信号的先验信噪比,只是平滑因子的获取方式不同;其中,用于获取ξ1(m,k)的平滑因子是固定,用于获取ξ2(m,k)的平滑因子是动态变化的。
[0160]
在本申请实施例中,可根据更新后的期望语音信号的噪声功率以及目标语音信号的功率,确定目标语音信号的能量占比,根据目标语音信号的能量占比,动态调整用于确定期望语音信号的(第二)先验信噪比的平滑因子,从而能够根据期望语音信号的噪声情况控制期望语音信号的先验信噪比的更新速率,减少单通道噪声估计算法过估计影响,减少语音失真。
[0161]
本申请实施例中,步骤s452中所述根据更新后的所述期望语音信号的后验信噪比,和/或,所述期望语音信号的先验信噪比,获取用于抑制所述期望语音信号中的非相干噪声的增益包括:根据所述期望语音信号的后验信噪比和所述期望语音信号的先验信噪比中的一项或两项,获取用于抑制所述期望语音信号中的非相干噪声的增益。
[0162]
增益的计算方式有多种,比如:维纳增益和omlsa(optimally modified log

spectral amplitude estimator,最优修正对数谱幅度估计)算法等;其中,维纳增益算法和omlsa均需要获取期望语音信号的后验信噪比和先验信噪比。
[0163]
在本申请实施例中,可简化omlsa算法,在结合期望语音信号的后验信噪比和先验信噪比的同时,使用由步骤s442确定后验语音存在概率替换omlsa算法中语音存在概率以计算增益,从而可在保证非相干噪声抑制效果的同时,减少运算开销。
[0164]
在本申请实施例中,根据干扰信号和对应的期望语音信号,确定第一tbrr,并估计得到期望语音信号中的噪声功率;根据包括有第一tbrr的更新参数集合,更新期望语音信号中的噪声功率,根据更新后的噪声功率,执行对期望语音信号中的非相干噪声的抑制处理,能够有效抑制语音信号中的非相干噪声。
[0165]
请参阅图6,图6为本申请实施例提供的一种噪声抑制设备的结构示意图,具体如图6所示,所述噪声抑制设备,包括:存储装置601和处理器602;并且所述噪声抑制设备还可以包括数据接口603、用户接口604。各个硬件之间还可以通过各种类型的总线建立连接。
[0166]
通过所述数据接口603,所述噪声抑制设备可以和其他终端、服务器等设备之间交互数据;所述用户接口604用于实现用户与所述噪声抑制设备之间的人机交互;所述用户接口604可提供触摸显示屏、物理按键等实现用户与所述噪声抑制设备之间的人机交互。
[0167]
所述存储装置601可以包括易失性存储器(volatile memory),例如随机存取存储器(random

access memory,ram);存储装置601也可以包括非易失性存储器(non

volatile memory),例如快闪存储器(flash memory),固态硬盘(solid

state drive,ssd)等;存储装
置601还可以包括上述种类的存储器的组合。
[0168]
所述处理器602可以是中央处理器(central processing unit,cpu)。所述处理器602还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application

specific integrated circuit,asic),可编程逻辑器件(programmable logic device,pld)等。上述pld可以是现场可编程逻辑门阵列(field

programmable gate array,fpga),通用阵列逻辑(generic array logic,gal)等。
[0169]
所述存储装置601,用于存储程序代码;
[0170]
所述处理器602,在调用所述存储代码时,用于获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号;
[0171]
根据所述干扰信号和所述期望语音信号,确定第一波束与参考信号瞬态比tbrr,并估计得到所述期望语音信号中的噪声功率;
[0172]
根据更新参数集合,更新所述期望语音信号中的噪声功率;所述更新参数集合包括所述第一tbrr;
[0173]
根据更新后的噪声功率,执行对所述期望语音信号中的非相干噪声的抑制处理。
[0174]
在一个实施例中,所述处理器602,具体用于获取期望语音信号帧中各频带对应的第二tbrr均值;
[0175]
根据所述第二tbrr均值,确定所述期望语音信号帧对应的第一tbrr。
[0176]
在一个实施例中,所述处理器602,具体用于获取期望语音信号帧的目标频带中各采样频点对应的第二tbrr;
[0177]
根据所述目标频带中各采样频点对应的第二tbrr,确定所述目标频带的第二tbrr均值。
[0178]
在一个实施例中,所述处理器602,具体用于根据所述目标频带中目标采样频点对应的所述期望语音信号的功率、所述干扰信号的功率、所述期望语音信号的平稳噪声功率以及所述干扰信号的平稳噪声功率,获取所述目标采样频点的第二tbrr。
[0179]
在一个实施例中,所述处理器602,具体用于获取所述期望语音信号帧中各频带对应的第二tbrr均值中的最大值;
[0180]
若所述最大值大于tbrr阈值,则将所述期望语音信号帧中目标采样频点的第一tbrr确定为所述目标采样频点的第二tbrr;
[0181]
若所述最大值小于或等于所述tbrr阈值,则确定所述期望语音信号帧中各采样频点的第一tbrr均为tbrr
min
;所述tbrr
min
为非负数。
[0182]
在一个实施例中,所述处理器602,具体用于根据所述更新参数集合,确定所述期望语音信号的先验语音不存在概率;
[0183]
根据所述先验语音不存在概率,确定所述期望语音信号的后验语音存在概率;
[0184]
根据所述后验语音存在概率,更新所述期望语音信号中的噪声功率。
[0185]
在一个实施例中,所述处理器602,具体用于若所述期望语音信号的后验语音存在概率大于后验语音存在概率阈值,则根据所述干扰信号的功率,更新所述期望语音信号中的噪声功率;
[0186]
若所述期望语音信号的后验语音存在概率小于或等于后验语音存在概率阈值,则根据所述期望语音信号的功率,更新所述期望语音信号中的噪声功率。
[0187]
在一个实施例中,所述更新参数集合还包括所述期望语音信号的后验信噪比、所述期望语音信号的平滑的后验信噪比以及所述干扰信号的平滑的后验信噪比中的至少一项更新参数;
[0188]
所述处理器602,具体用于根据所述更新参数集合中的至少一项更新参数,确定所述期望语音信号的先验语音不存在概率。
[0189]
在一个实施例中,所述处理器602,还用于在所述根据所述更新参数集合中的至少一项更新参数,确定所述期望语音信号的先验语音不存在概率之前,将所述期望语音信号的功率与估计得到的所述期望语音信号中的噪声功率之比,确定为所述期望语音信号的后验信噪比。
[0190]
在一个实施例中,所述处理器602,还用于在所述根据所述更新参数集合中的至少一项更新参数,确定所述期望语音信号的先验语音不存在概率之前,执行对所述期望语音信号的功率的平滑处理;
[0191]
将平滑处理后的期望语音信号的功率与估计得到的所述期望语音信号中的噪声功率之比,确定为所述期望语音信号的平滑的后验信噪比。
[0192]
在一个实施例中,所述处理器602,还用于在所述根据所述更新参数集合中的至少一项更新参数,确定所述期望语音信号的先验语音不存在概率之前,执行对所述干扰信号的功率的平滑处理;
[0193]
将平滑处理后的干扰信号的功率与干扰信号中的噪声功率之比,确定为所述干扰信号的平滑的后验信噪比。
[0194]
在一个实施例中,所述处理器602,具体用于根据所述更新后的噪声功率,更新所述期望语音信号的后验信噪比,和/或,确定所述期望语音信号的先验信噪比;
[0195]
根据更新后的所述期望语音信号的后验信噪比,和/或,所述期望语音信号的先验信噪比,获取用于抑制所述期望语音信号中的非相干噪声的增益;
[0196]
根据所述增益,抑制所述期望语音信号中的非相干噪声。
[0197]
在一个实施例中,所述处理器602,具体用于将所述期望语音信号的功率与更新后的噪声功率之比,确定为更新后的所述期望语音信号的后验信噪比。
[0198]
在一个实施例中,所述处理器602,具体用于根据更新后的噪声功率以及目标语音信号的功率,确定目标语音信号的能量占比;根据所述目标语音信号的能量占比,确定平滑因子;
[0199]
根据所述平滑因子,确定所述期望语音信号的先验信噪比。
[0200]
在一个实施例中,所述处理器602,具体用于采集第一语音信号和第二语音信号;
[0201]
根据所述第一语音信号和所述第二语音信号,获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号。
[0202]
请参阅图7,图7为本申请实施例提供的一种噪声抑制装置的结构示意图;具体如图7所示,所述噪声抑制装置包括:
[0203]
获取模块701,用于获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号;
[0204]
确定模块702,用于根据所述干扰信号和所述期望语音信号,确定第一波束与参考信号瞬态比tbrr,并估计得到所述期望语音信号中的噪声功率;
[0205]
更新模块703,用于根据更新参数集合,更新所述期望语音信号中的噪声功率;所述更新参数集合包括所述第一tbrr;
[0206]
抑制模块704,用于根据更新后的噪声功率,执行对所述期望语音信号中的非相干噪声的抑制处理。
[0207]
在一个实施例中,所述确定模块702,具体用于获取期望语音信号帧中各频带对应的第二tbrr均值;
[0208]
根据所述第二tbrr均值,确定所述期望语音信号帧对应的第一tbrr。
[0209]
在一个实施例中,所述确定模块702,具体用于获取期望语音信号帧的目标频带中各采样频点对应的第二tbrr;
[0210]
根据所述目标频带中各采样频点对应的第二tbrr,确定所述目标频带的第二tbrr均值。
[0211]
在一个实施例中,所述确定模块702,具体用于根据所述目标频带中目标采样频点对应的所述期望语音信号的功率、所述干扰信号的功率、所述期望语音信号的平稳噪声功率以及所述干扰信号的平稳噪声功率,获取所述目标采样频点的第二tbrr。
[0212]
在一个实施例中,所述确定模块702,具体用于获取所述期望语音信号帧中各频带对应的第二tbrr均值中的最大值;
[0213]
若所述最大值大于tbrr阈值,则将所述期望语音信号帧中目标采样频点的第一tbrr确定为所述目标采样频点的第二tbrr;
[0214]
若所述最大值小于或等于所述tbrr阈值,则确定所述期望语音信号帧中各采样频点的第一tbrr均为tbrr
min
;所述tbrr
min
为非负数。
[0215]
在一个实施例中,所述更新模块703,具体用于根据所述更新参数集合,确定所述期望语音信号的先验语音不存在概率;
[0216]
根据所述先验语音不存在概率,确定所述期望语音信号的后验语音存在概率;
[0217]
根据所述后验语音存在概率,更新所述期望语音信号中的噪声功率。
[0218]
在一个实施例中,所述更新模块703,具体用于若所述期望语音信号的后验语音存在概率大于后验语音存在概率阈值,则根据所述干扰信号的功率,更新所述期望语音信号中的噪声功率;
[0219]
若所述期望语音信号的后验语音存在概率小于或等于后验语音存在概率阈值,则根据所述期望语音信号的功率,更新所述期望语音信号中的噪声功率。
[0220]
在一个实施例中,所述更新参数集合还包括所述期望语音信号的后验信噪比、所述期望语音信号的平滑的后验信噪比以及所述干扰信号的平滑的后验信噪比中的至少一项更新参数;
[0221]
所述更新模块703,具体用于根据所述更新参数集合中的至少一项更新参数,确定所述期望语音信号的先验语音不存在概率。
[0222]
在一个实施例中,所述更新模块703,还用于在所述根据所述更新参数集合中的至少一项更新参数,确定所述期望语音信号的先验语音不存在概率之前,将所述期望语音信号的功率与估计得到的所述期望语音信号中的噪声功率之比,确定为所述期望语音信号的后验信噪比。
[0223]
在一个实施例中,所述更新模块703,还用于在所述根据所述更新参数集合中的至
少一项更新参数,确定所述期望语音信号的先验语音不存在概率之前,执行对所述期望语音信号的功率的平滑处理;
[0224]
将平滑处理后的期望语音信号的功率与估计得到的所述期望语音信号中的噪声功率之比,确定为所述期望语音信号的平滑的后验信噪比。
[0225]
在一个实施例中,所述更新模块703,还用于在所述根据所述更新参数集合中的至少一项更新参数,确定所述期望语音信号的先验语音不存在概率之前,执行对所述干扰信号的功率的平滑处理;
[0226]
将平滑处理后的干扰信号的功率与干扰信号中的噪声功率之比,确定为所述干扰信号的平滑的后验信噪比。
[0227]
在一个实施例中,所述抑制模块704,具体用于根据所述更新后的噪声功率,更新所述期望语音信号的后验信噪比,和/或,确定所述期望语音信号的先验信噪比;
[0228]
根据更新后的所述期望语音信号的后验信噪比,和/或,所述期望语音信号的先验信噪比,获取用于抑制所述期望语音信号中的非相干噪声的增益;
[0229]
根据所述增益,抑制所述期望语音信号中的非相干噪声。
[0230]
在一个实施例中,所述抑制模块704,具体用于将所述期望语音信号的功率与更新后的噪声功率之比,确定为更新后的所述期望语音信号的后验信噪比。
[0231]
在一个实施例中,所述抑制模块704,具体用于根据更新后的噪声功率以及目标语音信号的功率,确定目标语音信号的能量占比;根据所述目标语音信号的能量占比,确定平滑因子;
[0232]
根据所述平滑因子,确定所述期望语音信号的先验信噪比。
[0233]
在一个实施例中,所述获取模块701,具体用于所述获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号包括:
[0234]
采集第一语音信号和第二语音信号;
[0235]
根据所述第一语音信号和所述第二语音信号,获取消除相干噪声的期望语音信号和与所述期望语音信号对应的干扰信号。
[0236]
相应地,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序使得计算机执行图3、图4以及图5中任意实施例描述的方法。可以理解的是,此处的计算机存储介质既可以包括智能终端中的内置存储介质,当然也可以包括智能终端所支持的扩展存储介质。计算机存储介质提供存储空间,该存储空间存储了智能终端的操作系统。并且,在该存储空间中还存放了适于被处理器加载并执行的一条或一条以上的指令,这些指令可以是一个或一个以上的计算机程序(包括程序代码)。需要说明的是,此处的计算机存储介质可以是高速ram存储器,也可以是非不稳定的存储器(non

volatile memory),例如至少一个磁盘存储器;可选的还可以是至少一个位于远离前述处理器的计算机存储介质。
[0237]
以上所揭露的仅为本发明的部分实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1