用于抑制噪声的方法、设备和计算机程序的制作方法

文档序号:2836955阅读:378来源:国知局
专利名称:用于抑制噪声的方法、设备和计算机程序的制作方法
技术领域
本发明涉及一种噪声抑制方法、 一种用于抑制叠加在所需语音信 号上的噪声的噪声抑制设备、以及一种用于抑制所述噪声的计算机程序。
背景技术
噪声抑制器(噪声抑制系统)是一种用于抑制叠加在所需语音信 号上的噪声的系统,通常通过以下操作来抑制混合在所需语音信号中 的噪声通过将输入信号转换到频域来估计噪声分量的功率谱;以及 从输入信号中扣除所估计出的功率谱。噪声抑制器也可以用于通过连 续估计噪声分量的功率谱来抑制不规则噪声。例如,噪声抑制器可以 是一种北美便携式电话标准所采用的方法,可参见非专利文献1 (技 术要求(TR45) . ENHANCED VARIABLE RATE CODEC, SPEECH SERVICE OPTION 3 FOR WIDEBAND SPREAD SPECTRUM DIGITAL SYSTEMS)和专利 文献1 (日本未审公开专利申请No. 2002-204175)。
通常,将通过对用于收集声波的麦克风的输出信号进行模拟-数 字(AD)转换而得到的数字信号作为输入信号传送至噪声抑制器。通 常,将高通滤波器放置在AD转换器和噪声抑制器之间,主要用于抑制 在麦克风中收集声音时和在对该声音进行AD转换时所引入的低频范 围内的分量。例如,在专利文献2 (美国专利No.5,659,622)中公开 了上述结构示例。
图1示出了将专利文献1的噪声抑制器与专利文献2的高通滤波 器进行组合的结构。
将含噪声的话音信号(其中所需语音信号与噪声相混合的信号) 作为采样值序列传送至输入端11。将含噪声的话音信号采样传送至高通滤波器17,并在对其低频范围内的分量进行抑制之后,将其传送至
分帧器(frame divider) 1。对于保持输入含噪声话音的线性以及实 现充分的信号处理性能而言,抑制低频范围内的分量是绝对必要的。 分帧器1将含噪声的话音信号采样分为其单位是特定数目的帧,并将 所述帧传送至窗口处理器2。窗口处理器2将已分为帧的、含噪声的 话音信号采样与窗口函数相乘,并将结果传送至傅立叶变换器3。
傅立叶变换器3对窗口处理过的、含噪声的话音信号釆样进行傅 立叶变换,以便将所述信号采样分为多个频率分量,并对幅度值进行 复用,以将所述多个频率分量传送至估计噪声计算器52、噪声抑制系 数发生器82和复用乘法器16。将相位传送至逆傅立叶变换器9。估计 噪声计算器52估计所传送的多个频率分量中的每一个的噪声,并将所 述噪声传送至噪声抑制系数发生器82。 一种噪声估计方法的示例是以 过去的信号噪声比对含噪声的话音进行加权以将其指定为噪声分量的 方法,在专利文献1中描述了上述方法的细节。
噪声抑制系数发生器82产生噪声抑制系数,以便通过将含噪声 的话音与估计噪声相乘来获得已针对多个频率分量中的每一个抑制了 噪声的增强语音。作为产生噪声抑制系数的示例,广泛地采用了用于 使增强语音的平均平方功率最小化的最小均方短时谱幅度方法,在专 利文献1中描述了上述方法的细节。
将针对每个频率而产生的噪声抑制系数传送至复用乘法器16。针 对每个频率,复用乘法器16将从傅立叶变换器3传送过来的含噪声的 话音与从噪声抑制系数发生器82传送过来的噪声抑制系数相乘,并将 乘积传送至逆傅立叶变换器9,作为增强语音的幅度。逆傅立叶变换 器9通过将从复用乘法器16传送过来的增强语音幅度与含噪声的话音 的相位(所述相位来自傅立叶变换器3)进行组合来执行逆傅立叶变 换,并将逆傅立叶变换后的信号传送至帧合成器10,作为增强语音信 号采样。帧合成器10通过使用相邻帧的增强语音采样来合成相应帧的 输出语音采样,以将合成后的采样传送至输出端1
发明内容
高通滤波器17抑制直流附近的频率分量。通常,其频率等于或
高于100Hz到120Hz的分量通过高通滤波器17而未被抑制。当高通滤 波器17的结构可以被归类为有限冲激响应(FIR)型或无限冲激响应 (IIR)型滤波器时,需要尖锐的通带端接特性,因此通常采用IIR 型滤波器。对于IIR型滤波器,已知的是传递函数被表达为有理函
数,且对分母系数的敏感度极高。因此,存在以下问题在将高通滤
波器17实现为有限字长计算时,需要频繁地使用双精度计算来实现足 够的精确性,因此计算量较大。另一方面,如果去除高通滤波器17
以降低计算量,则难以维持输入信号的线性,而不能实现高质量的噪 声抑制。
本发明的目的在于提供一种噪声抑制方法和一种噪声抑制设备, 其能够以较小的计算量来抑制低频范围内的分量并实现高质量的噪声 抑制。
根据本发明的噪声抑制方法将输入信号转换为频域信号,修正频 域信号的幅度以获得幅度修正信号,通过使用幅度修正信号来获得估 计噪声,通过使用估计噪声和幅度修正信号来确定抑制系数,以及以 抑制系数对幅度修正信号进行加权。
另一方面,根据本发明的噪声抑制设备具有转换器,用于将输 入信号转换为频域信号;幅度修正器,用于修正频域信号的幅度以获 得幅度修正信号;噪声估计器,用于通过使用幅度修正信号来获得估 计噪声;抑制系数发生器,用于通过使用估计噪声和幅度修正信号来 确定抑制系数;以及乘法器,用于以抑制系数对幅度修正信号进行加 权。
根据本发明的一种用于噪声抑制的信号处理计算机程序包括将 输入信号转换为频域信号的处理,修正频域信号的幅度以获得幅度修 正信号的处理,通过使用幅度修正信号来获得估计噪声的处理,通过 使用估计噪声和幅度修正信号来确定抑制系数的处理,以及以抑制系 数对幅度修正信号进行加权的处理。
具体地,根据本发明的噪声抑制方法和设备的特征在于抑制傅立 叶变换后的信号的低频范围内的分量。更具体地,所述设备的特征在于包括..幅度修正器,用于抑制傅立叶变换后的输出的幅度的低频范 围内的分量;以及相位修正器,用于修正与低频范围内的分量的幅度 调整相对应的相位,以修正傅立叶变换后的输出的相位。
根据本发明,将转换到频域的信号的幅度与一常数相乘,将一常 数与相位相加,从而能够以单一的精确计算来实现所述方法和设备, 并能够以较小的计算量来实现高质量的噪声抑制。


图1是示出了传统噪声抑制设备的结构示例的方框图; 图2是示出了本发明第一典型实施例的方框图; 图3是示出了包括在本发明第一典型实施例中的幅度修正器的结 构的方框图4是示出了包括在图3中的语音存在概率计算器的结构的方框
图5是示出了本发明第二典型实施例的方框图; 图6是示出了本发明第三典型实施例的方框图; 图7是示出了包括在本发明第三典型实施例中的复用乘法器的结 构的方框图8是示出了包括在本发明第三典型实施例中的加权噪声话音计
算器的结构的方框图9是示出了包括在图8中的频域SNR计算器的结构的方框图; 图10是示出了包括在图8中的复用非线性处理器的结构的方框
图11是示出了非线性处理器的非线性函数的示例的曲线图; 图12是示出了包括在本发明第三典型实施例中的估计噪声计算 器的结构的方框图13是示出了包括在图12中的频域估计噪声计算器的结构的方
框图14是示出了包括在图13中的更新判决器的结构的方框图; 图15是示出了包括在本发明第三典型实施例中的估计先验SNR计算器的结构的方框图16是示出了包括在图15中的多值域限制器的结构的方框图17是示出了包括在图15中的复用加权加法器的结构的方框
图18是示出了包括在图17中的加权加法器的结构的方框图19是示出了包括在本发明第三典型实施例中的噪声抑制系数 发生器的结构的方框图20是示出了包括在本发明第三典型实施例中的抑制系数修正 器的结构的方框图;以及
图21是示出了包括在图20中的频域抑制系数修正器的结构的方 框图。
符号说明
1分帧器
2、 20窗口处理器
3傅立叶变换器
4、 5049计数器
5、 52估计噪声计算器
6、 1042频域SNR计算器
7估计先验SNR计算器
8、 82噪声抑制系数发生器
9逆傅立叶变换器
10帧合成器
11输入端
12输出端
13、 16、 704、 705、 1404复用乘法器
14加权噪声话音计算器
15抑制系数修正器
17高通滤波器
18幅度修正器200680040704.5
说明书第6/23页
19相位修正器
21语音缺失概率存储器
22偏移消除器
501、 502、 1302、 1303分离器
1422、 1423、1495、1502分离器
1503、 1801、1901分离器
7013、 7072、7074分离器
503、 1304、1424、1475复用器
1504、 1803、1903复用器
7014、 7075复用器
504()至504K—,频域估计噪声计算器
520更新判决器
701多值域限制器
702后验SNR存储器
703抑制系数存储器
706权重存储器
707复用加权加法器
708、 5046、7092、7094加法器
811MMSE STSA增益函数值计算器
812广义似然比计算器
814抑制系数计算器
921瞬时估计SNR
921。至921K—,频域瞬时估计SNR
922以往估计SNR
922 至922K—,以往频域估计SNR
923权重
924估计先验SNR
924。至924k一,频域估计先验SNR
1301。至1301K-l乘法器
1597、 7091、7093乘法器1401、 5042估计噪声存储器
1405复用非线性处理器
14210至1421K—,、 5048除法器
1485。至1485h非线性处理器
1501()至1501K—,频域抑制系数修正器
1591、 7012。至7012k—最大值选择器
1592抑制系数下限值存储器
1593、 5204、 5206阈值存储器
1594、 5203、 5205比较器
1595、 5044开关
1596修正值存储器
18020至1802K—,加权处理器
19020至1902K-,相位旋转器
5041寄存器长度存储器
5045移位寄存器
5047最小值选择器
5201逻辑或计算器
5207阈值计算器
7011常数存储器
7071。至7071k—,加权加法器
7095常数乘法器
具体实施例方式
图2是示出了本发明第一典型实施例的方框图。除了高通滤波器 17、幅度修正器18、相位修正器19和窗口处理器20以外,图2所示 结构与图l所示结构(传统示例)相同。以下的详细讨论将集中在这 些不同点上。
在图2中,删除了图l所示的高通滤波器17,而代替地设置了幅 度修正器18、相位修正器19和窗口处理器20。设置幅度修正器18 和相位修正器19,以将高通滤波器的频率响应施加于被转换至频域的信号上。将函数/的绝对值(幅度频率响应)在幅度修正器18中施加 于输入信号,以及将函数/的相位(相位频率响应)在相位修正器19 中施加于输入信号,其中通过将z-exp(,2;r/)施加于高通滤波器17的 传递函数来获得所述函数/。
通过上述操作,可以获得与将高通滤波器17施加于输入信号相 同的效果。也就是说,代替在时域上将高通滤波器17的传递函数与输 入信号进行巻积,在傅立叶变换器3中被转换为频域信号之后,将所 述函数与频率响应相乘。
将幅度修正器18的输出传送至估计噪声计算器52、噪声抑制系 数发生器82和复用乘法器16。将相位修正器19的输出传送至逆傅立 叶变换器9。
随后的操作与参照图1所描述的操作相同。如专利文献3 (曰本 未审公开专利申请No. 2003-131689)所公开的那样,设置窗口处理器 20以抑制帧边界处的间断声音。
图3示出了幅度修正器18的结构示例。将来自傅立叶变换器3 的复用噪声话音幅度谱传送至分离器1801。分离器1801将复用噪声 话音幅度谱分解为各个频率分量,并将所述频率分量传送至加权处理 器匿()至1802K—,。加权处理器1802。至1802K-,以相应的幅度频率响应
对被分解为各个频率分量的每个噪声话音幅度谱进行加权,并将所述 谱传送至复用器1803。复用器1803对来自加权处理器1802(>至1802K-, 的信号进行复用,以输出复用信号,作为修正噪声话音幅度谱。
图4示出了相位修正器19的结构示例。将从傅立叶变换器3传 送过来的复用噪声话音相位谱传送至分离器1901。分离器1901将复 用噪声话音相位谱分解为各个频率分量,并将各个频率分量传送至相 位旋转器1902。至1902K—,。每个相位旋转器1902。至1902k-,根据相皮的
相位频率响应对被分解为各个频率分量的噪声话音相位谱进行旋转, 并将所述谱传送至复用器1903。复用器1903对来自相位旋转器1902。 至1902K—,的信号进行复用,以输出复用信号,作为修正噪声话音相位 谱。相位修芷器19的存在并不如幅度修正器18那样重要,因此可以 省略相位修正器19。原因在于己知相位修正器19的存在仅影响输出信号的相位,而对于理解语音内容而言,相位信息比幅度信息次要 得多。
图5是示出了本发明第二典型实施例的方框图。图5所示结构与
作为第一典型实施例的图2所示结构的区别在于偏移消除器22。偏移 消除器22消除窗口处理后的噪声话音的偏移,以输出语音。最简单的 偏移消除方法是针对每一帧获得噪声话音的平均值,以将所述平均值 指定为偏移,将从对应帧中的所有采样中扣除此偏移。或者,针对多 个帧,对每一帧的平均值进行平均,并将所获得的数值作为偏移从采 样中扣除。通过消除偏移,可以在傅立叶变换器3中提高转换精度, 并能够改善将要输出的增强语音的声音质量。
图6是示出了本发明第三典型实施例的方框图。将含噪声的话音 信号(所需语音信号与噪声相混合的信号)作为采样值序列传送至输 入端ll。将含噪声的话音信号采样传送至分帧器l,并以K/2个采样 为单位分割成帧。这里,假设K是偶数。将被分割成帧的噪声话音信 号采样传送至窗口处理器2,并与窗口函数w(/)相乘。通过对第n帧的 输入信号凡W (, = 0,1,...,尺/2-1)进行窗口处理而获得的信号7 (/)可以 如下等式表示。
此外,在将要进行窗口处理的、两个连续帧彼此交叠的部分中广泛执 行上述操作。如果假设交叠长度是帧长度的50%,对于"0,l,…,尺/2-l, [等式2]
<formula>formula see original document page 12</formula>
通过上述等式获得的K(/)(^0,l,…,f/2-1)作为窗口处理器2的输出。 将左右对称的窗口函数用于实数信号。设计窗口函数,从而使输入信 号和输出信号彼此对应,以排除当抑制系数被设置为"1"时所导致的
计算误差。这意味着W(f) + M^ + K/2)-l。
下面,将继续作为示例来描述其中要进行窗口处理的两个连续帧 的50%彼此交叠的情况。例如,可以将以如下等式表示的汉宁窗(Harming Window)用作w(O。 [等式3]
<formula>formula see original document page 13</formula>
除了上述等式外,诸如汉明窗(Hamming Window)、凯瑟窗(Kayser Window)和布莱克曼窗(Blackman Window)等多种窗口函数是己知的。 将窗口处理后的输出K(/)传送至偏移消除器22,并对偏移进行消除。 偏移消除的细节与参照图5所描述的内容相同。
将已经消除了偏移的信号传送至傅立叶变换器3,并转换为噪声 话音谱i:ot)。将噪声话音谱KOt)分离为相位和幅度,将噪声话音相位
谱arg]^(Q通过相位修正器19传送至逆傅立叶变换器9,以及将噪声话
音幅度谱li;wl通过幅度修正器i8传送至复用乘法器i3和复用乘法器
16。相位修正器19和幅度修正器18的操作与参照图2所描述的内容 相同。
复用乘法器13通过使用其幅度已被修正的噪声话音幅度谱来计 算噪声话音功率谱,并将所述噪声话音功率谱传送至估计噪声计算器 5、频域SNR (信号噪声比)计算器6和加权噪声话音计算器14。加权 噪声话音计算器14通过使用从复用乘法器13传送过来的噪声话音功 率谱来计算加权噪声话音功率谱,并将所述加权噪声话音功率谱传送 至估计噪声计算器5。
估计噪声计算器5通过使用噪声话音功率谱、加权噪声话音功率 谱和来自计数器4的计数值来估计噪声的功率谱,并噪声的功率谱作 为估计噪声功率谱传送至频域SNR计算器6。频域SNR计算器6通过 使用输入的噪声话音功率谱和输入的估计噪声功率谱来计算每个频率 的SNR,并将所述SNR作为后验SNR传送至估计先验SNR计算器7和 噪声抑制系数发生器8。
估计先验SNR计算器7通过使用输入的后验SNR和来自抑制系数 修正器15的修正抑制系数来估计先验SNR,并将先验SNR作为估计先 验SNR传送至噪声抑制系数发生器8。噪声抑制系数发生器8通过使用作为输入而传送过来的后验SNR和估计先验SNR、以及通过使用从 语音缺失概率存储器21传送过来的语音缺失概率来产生噪声抑制系 数,并将噪声抑制系数作为抑制系数传送至抑制系数修正器15。抑制 系数修正器15通过使用输入的估计先验SNR和抑制系数来修正抑制系 数,并将修正后的抑制系数作为修正抑制系数&W传送至复用乘法器 16。复用乘法器16通过以从抑制系数修正器15传送过来的修正抑制 系数5(W对从傅立叶变换器3通过幅度修正器18传送过来的修正噪
声话音幅度谱进行加权来获得增强语音幅度谱l足ot)l ,并将增强语音
幅度谱传送至逆傅立叶变换器9。 IK^I可以由以下等式表示。 [等式4]
|^("| = & | (4) 这里,//"("是幅度修正器18中的修正增益,并作为图l所示的高通 滤波器的幅度频率响应而获得。
逆傅立叶变换器9通过将从复用乘法器16传送过来的增强语音 幅度谱l&Wl与从傅立叶变换器3通过相位修正器19传送过来的修正 噪声话音相位谱argi;W + arg/^W相乘来获得增强语音^^)。即,执行
以下等式。 [等式5]
^^HAW卜(argi;W + arg/^(W (5) 这里,arg7/"0t)是相位修正器19中的修正相位,并作为图l所示的高 通滤波器的相位频率响应而获得。
逆傅立叶变换器9对所获得的增强语音^W进行逆傅立叶变换, 并将增强语音足W传送至窗口处理器20,作为时域采样序列&(0 (/ = 0,1,...,/:-1),所述时域采样序列&W的帧配置有K个采样。窗口 处理器20将从逆傅立叶变换器9传送过来的时域采样序列与窗口 函数<0相乘。以如下等式表示信号&(r),通过以w(,)对第n帧的输入 信号x力)(,=0,1,...,《/2-1)进行窗口处理来获得信号3f力)。 [等式6]<formula>formula see original document page 14</formula>此外,在将要进行窗口处理的、两个连续帧彼此交叠的部分中广泛执 行上述操作。如果假设交叠长度是帧长度的50%,对于^0,l,…,/2-l, [等式7]
W) = 2)
i 0+a:/2) = w(,+/:/2)x (,) ( j
通过上述等式获得的y,,(/) (,-o,i,…,尺-1)作为窗口处理器20的输出, 并传送至帧合成器io。
帧合成器10从两个相邻的帧^(0的每一个中取出《/2个采样,以 对这些采样进行交叠,并通过使用以下等式来获得增强语音&(0。
"+《/2) + &(/) (8) 将所获得的增强语音A(/)传送至输出端12,作为帧合成器10的输出。 图7是示出了图6所示的复用乘法器13的结构的方框图。复用 乘法器13包括乘法器1301(,至1301K—,、分离器1302和1303以及复用 器1304。在分离器1302和1303中,将从图6的幅度修正器18传送 过来的、已被复用的修正噪声话音幅度谱分解为每个频率K个采样, 并将其分别传送至乘法器1301。至130V,。乘法器1301 至1301w分别 对输入信号进行平方运算,并分别将平方信号传送至复用器1304。复 用器1304对输入信号进行复用,以输出复用信号,作为噪声话音功率 谱。
图8是示出了加权噪声话音计算器14的结构的方框图。加权噪 声话音计算器14包括估计噪声存储器1401、频域SNR计算器1402、 复用非线性处理器1405和复用乘法器1404。估计噪声存储器1401存 储从图6的估计噪声计算器5传送过来的估计噪声功率谱,并将前一 帧的估计噪声功率谱输出至频域SNR计算器1402。
频域SNR计算器1402通过使用从估计噪声存储器1401传送过来 的估计噪声功率谱和从图6的复用乘法器13传送过来的噪声话音功率 谱,来获得每个频率的SNR,并将SNR输出至复用非线性处理器1405。 复用非线性处理器1405通过使用从频域SNR计算器1402传送过来的 SNR,来计算权重系数矢量,并将权重系数矢量输出至复用乘法器1404。
针对每一频率,复用乘法器1404计算从图6的复用乘法器13传 送过来的噪声话音功率谱和从复用非线性处理器1405传送过来的权 重系数矢量的乘积,并将加权噪声话音功率谱输出至图6的估计噪声 计算器5。复用乘法器1404的结构与参照图7所描述的复用乘法器13 的结构相同,所以将省略对其的详细描述。
图9是示出了包括在图8中的频域SNR计算器1402的结构的方 框图。频域SNR计算器1402包括除法器1421。至1421^、分离器1422 和1423以及复用器1424。将从图6的复用乘法器13传送过来的噪声 话音功率谱传送至分离器1422。将从图8的估计噪声存储器1401传 送过来的估计噪声功率谱传送至分离器1423。在分离器1422和1423 中,将噪声话音功率谱和估计噪声功率谱分别分解为与频率分量相对 应的K个采样,并分别将其传送至除法器1421。至1421K-,。
在除法器1421。至1421h中,根据以下等式,通过将传送过来的 噪声话音功率谱除以估计噪声功率谱,获得频域SNR厶(",并将其传 送至复用器1424。<formula>formula see original document page 16</formula>(9)
这里,义"一,Ot)是前一帧中的估计噪声功率谱。复用器1424对传送过来 的K个频域SNR进行复用,并将复用SNR传送至图8的复用非线性处 理器1405。
接下来,将参照图10,对图8的复用非线性处理器1405的结构 和操作进行详细描述。图10是示出了包括在加权噪声话音计算器14 中的复用非线性处理器1405的结构的方框图。复用非线性处理器1405 包括分离器1495、非线性处理器1485 至1485h和夏用器1475。分离 器1495将从图8的频域SNR计算器1402传送过来的SNR分解为频域 SNR,并将分解后的SNR传送至非线性处理器1485。至1485K-,。非线性 处理器1485。至1485K-,分别包括用于根据输入值而输出实数值的非线 性函数。图11示出了非线性函数的示例。如果乂是输入值,则可以通过以 下等式获得图11所示的非线性函数的输出值/2。 [等式10]<formula>formula see original document page 17</formula>(10)
这里,"和6是任意实数。
回到图10,非线性处理器1485 至1485K-,利用非线性函数来处理 从分离器1495传送过来的频域SNR,以获得加权系数,并将加权系数 输出至复用器1475。即,非线性处理器1485。至1485H根据SNR来输 出加权系数"1"至"0"。当SNR较小时,输出"1",而当SNR较大时, 输出"0"。复用器1475对从非线性处理器1485。至1485K—,输出的加权 系数进行复用,并将复用加权系数作为加权系数矢量输出至复用乘法 器1404。
在图8复用乘法器1404中与噪声话音功率谱相乘的加权系数是 与SNR对应的值,当SNR较大,即包含在含噪声的话音中的语音分量 较大时,加权系数的值较小。虽然通常将噪声话音功率谱用于更新估 计噪声,但是通过根据SNR,对用于更新估计噪声的噪声话音功率谱 进行加权,可以使包含在噪声话音功率谱中的语音分量的影响较小, 并能够实现更为精确的噪声估计。同时,虽然描述了利用非线性函数 来计算加权系数的示例,但是也可以使用除非线性函数以外的SNR的 其他函数,该函数可以表示为另一等式,如线性函数或高阶多项式等。
图12是示出了图6所示的估计噪声计算器5的结构的方框图。 估计噪声计算器5包括分离器501和502、复用器503和频域估计噪 声计算器504。至504h。
在图12中,分离器501将从图6的加权噪声话音计算器14传送 过来的加权噪声话音功率谱分解为每个频率的加权噪声话音功率谱, 并将这些功率谱分别传送至频域估计噪声计算器504(,至504h。分离 器502将从图6的复用乘法器13传送过来的噪声话音功率谱分解为每个频率的噪声话音功率谱,并将这些功率谱分别输出至频域估计噪声
计算器504。至504K—,。
频域估计噪声计算器504 至504H根据从分离器501传送过来的 频域加权噪声话音功率谱、从分离器502传送过来的频域噪声话音功 率谱和从图6的计数器4传送过来的计数值,计算频域估计噪声功率 谱,并这些功率谱输出至复用器503。复用器503对从频域估计噪声 计算器504 至504H传送过来的频域估计噪声功率谱进行复用,并将 估计噪声功率谱输出至图6的频域S服计算器6以及加权噪声话音计 算器14。将参照图13,对频域估计噪声计算器504(,至504K—,的结构和
操作进行详细描述。
图13是示出了图12所示的频域估计噪声计算器504。至504^的 结构的方框图。频域估计噪声计算器504包括更新判决器520、寄存 器长度存储器5041、估计噪声存储器5042、开关5044、移位寄存器 5045、加法器5046、最小值选择器5047、除法器5048和计数器5049。
将频域加权噪声话音功率谱从图12的分离器501传送至开关 5044。当开关5044闭合时,将频域加权噪声话音功率谱传送至移位寄 存器5045。移位寄存器5045响应于从更新判决器520传送过来的控 制信号,年个内部寄存器的存储值移位至相邻的寄存器。寄存器长度 与稍后描述的寄存器长度存储器5041中所存储的数值相同。将移位寄 存器5045的所有寄存器输出传送至加法器5046。加法器5046对传送 过来的所有寄存器输出进行求和,并将求和结果传送至除法器5048。
另一方面,向更新判决器520传送计数值、频域噪声话音功率谱 和频域估计噪声功率谱。在计数值达到预定值之前,更新判决器520 总是输出"1",在计数值达到预定值之后,当更新判决器520确定输 入噪声话音信号是噪声时,更新判决器520输出"1",而在其他情况 下,更新判决器520输出"0"。将更新判决器520的输出传送至计数 器5049、开关5044和移位寄存器5045。
当从更新判决器520传送过来的信号是"1"时,开关5044闭合, 而当该信号为"0"时,开关5044断开。当从更新判决器520传送过 来的信号是"l"时,计数器5049增加计数值,而当该信号为"0"时,计数器5049不改变计数值。当从更新判决器520传送过来的信号是"1 " 时,移位寄存器5045输入从开关5044传送过来的一个信号采样,与 此同时,将内部寄存器的存储值移位至相邻的寄存器。向最小值选择 器5047传送计数器5049的输出和寄存器长度存储器5041的输出。
最小值选择器5047选择传送过来的计数值或寄存器长度(二者 中较小的一个),并将所选择的数值传送至除法器5048。除法器5048 将从加法器5046传送过来的频域噪声话音功率谱的求和值除以计数 值或寄存器长度(二者中较小的一个),并输出所得的商,作为频域估 计噪声功率谱人W。如果5 (" (" = 0,l,...,iV-l)是存储在移位寄存器 5045中的噪声话音功率谱的采样值,则可以通过以下等式获得A("
(11)
在以上等式中,JV是计数值或寄存器长度(二者中较小的一个)。 由于计数值从"0"开始单调递增,所以首先使用计数值来执行除法操 作,然后才使用寄存器长度来执行除法操作。针对以寄存器长度为除 数的除法,.需要获得存储在移位寄存器中的数值的平均值。首先,由 于在移位寄存器5045中并未存储足够多的数值,所以使用实际存储有 数值的寄存器的数目来执行除法操作。当计数值小于寄存器长度时, 实际存储有数值的寄存器的数目等于计数值,而当计数值变得大于寄 存器长度时,实际存储有数值的寄存器的数目等于寄存器长度。
图14是示出了图13所示的更新判决器520的结构的方框图。更 新判决器520包括逻辑或计算器5201、比较器5203和5205、阈值存 储器5204和5206以及阈值计算器5207。
将从图6的计数器4传送过来的计数值传送至比较器5203。同时, 还将阈值(阈值存储器5204的输出)传送至比较器5203。比较器5203 将传送过来的计数值与阈值进行比较,并在计数值小于阈值时,向逻 辑或计算器5201传送"1",而在计数值大于阈值时,向逻辑或计算器 5201传送"0"。另一方面,阈值计算器5207根据从图13的估计噪声 存储器5042传送过来的频域估计噪声功率谱来计算阈值,并将计算值 作为阈值输出至阈值存储器5206。最简单的阈值计算方法是将频域估计噪声功率谱与常数相乘。作为另一方法,也可以使用高阶多项式和 非线性函数来计算阈值。
阈值存储器5206存储从阈值计算器5207输出的阈值,并将一帧 前已存储的阈值输出至比较器5205。比较器5205将从阈值存储器5206 传送过来的阈值与从图12的分离器502传送过来的频域噪声话音功率 谱进行比较,并在频域噪声话音功率谱小于阈值时,向逻辑或计算器 5201传送"1",而在频域噪声话音功率谱大于阈值时,向逻辑或计算 器5201传送"0"。即,根据估计噪声功率谱的幅度来确定含噪声的话 音信号是否是噪声。逻辑或计算器5201计算比较器5203的输出值和 比较器5205的输出值的逻辑或,并将计算结果输出至图13的开关 5044、移位寄存器5045和计数器5049。
如上所述,在初始状态或静音间隔中以及当非静音间隔中含噪声 的话音功率较小时,更新判决器520输出"1"。 g卩,对估计噪声进行 更新。由于针对每一频率来计算阈值,可以针对每一频率来更新估计 噪声。
图15是示出了图6所示的估计先验SNR计算器7的结构的方框 图。估计先验SNR计算器7包括多值域限制器701、后验SNR存储器 702、抑制系数存储器703、复用乘法器704和705、权重存储器706、 复用加权加法器707以及加法器708。
将从图6的频域SNR计算器6传送过来的后验SNR y (" ("0,1,…,《-1)传送至后验SNR存储器702和加法器708。后验SNR 存储器702存储第n帧的后验SNR ^W,并将第n-1帧的后验SNR L""传送至复用乘法器705。将从图6的抑制系数修正器15传送过 来的修正抑制系数5W U = 0,1,...,《-1)传送至抑制系数存储器703。 抑制系数存储器703存储第n帧的修正抑制系数5W ,并将第n-l帧 的修正抑制系数5一,0t)传送至复用乘法器704。
复用乘法器704对传送过来的5("进行平方,以获得《(W,并 将&U"传送至复用乘法器705。复用乘法器705将《_|("与^—1(^ ("0,1,…,尺-1)相乘以获得^(yt)^州,并将所获得的结果作为以 往估计SNR 922传送至复用加权加法器707。由于复用乘法器704和705的结构与参照图7所描述的复用乘法器13的结构相同,所以将省 略对其的详细描述。
向加法器708的另一端传送"-1",并将求和结果r"("-l传送至 多值域限制器701。多值域限制器701对从加法器708传送过来的求
和结果^W-l施加值域限制运算符斗]的运算,并将结果户[h("-l]作 为瞬时估计SNR 921传送至复用加权加法器707。户[;<|由以下等式定义。
还向复用加权加法器707传送来自权重存储器706的权重923。复用 加权加法器707通过使用传送过来的瞬时估计SNR921、以往估计SNR 922和权重923,来获得估计先验SNR 924。如果假设权重923为a, 4W为估计先验SNR,则可以通过以下等式来计算&(W。 [等式13]
! W = d (《,("+ (1 -")尸[h (" -1] (13)
这里,假设5—2,(的^—,W = l。
图16是示出了图15所示的多值域限制器701的结构的方框图。 多值域限制器701包括常数存储器7011、最大值选择器7012()至 7012K-,、分离器7013和复用器7014。向分离器7013传送来自图15 的加法器708的^("-l。分离器7013将传送过来的r"W-l分解为K 个频域分量,并将这些频域分量传送至最大值选择器7012 至7012k, 向最大值选择器7012 至7012k—的另一输入传送来自常数存储器7011 的"0"。最大值选择器7012。至7012KH将^(yfc)-l与"0"进行比较,以 将较大的数值传送至复用器7014。此最大选择计算对应于以上等式 12。复用器7014对这些数值进行复用和输出。
图17是示出了图15所示的复用加权加法器707的结构的方框图。 复用加权加法器707包括加权加法器7071 至7071K-,、分离器7072和 7074以及复用器7075。向分离器7072传送来自图15的多值域限制器 701的、作为瞬时估计SNR921的P[^W-1]。分离器7072将P[^("-1]分解为K个频域分量,并将这些频域分量作为频域瞬时估计SNR 921 至921w传送至加权加法器7071()至7071K—,。向分离器7074传送来自 图15的复用乘法器705的、作为以往估计SNR 922的《—
分离器7074将《一^) v,(W分解为K个频域分量,并将这些频域 分量作为以往频域估计SNR 922(,至922K-,传送至加权加法器7071(>至 7071K-,。另一方面,还向加权加法器7071(,至7071K—,传送权重923。加 权加法器7071。至7071w执行由上述等式13表示的加权加法,并将频 域估计先验SNR 924。至924H传送至复用器7075。复用器7075对频 域估计先验SNR 924。至924^进行复用,并输出复用SNR,作为估计 先验SNR 924。接下来,将参照图18,对加权加法器7071。至7071k— 的操作和结构进行描述。
图18是示出了图17所示的加权加法器7071的结构的方框图。 加权加法器7071包括乘法器7091和7093以及加法器7092和7094。 作为每一输入,向加权加法器7071传送来自图16的分离器7072的频 域瞬时估计SNR921、来自图17的分离器7074的以往频域SNR 922、 和来自图15的权重存储器706的权重923。将包括数值《的权重923 传送至常数乘法器7095和乘法器7093。常数乘法器7095将通过将输 入信号与相乘所获得的-a传送至加法器7094。
向加法器7094的另一输入传送"1",因此加法器7094的输出为 1- (二者之和)。将1- 传送至乘法器7091,并与另一输入(频域瞬 时估计SNR p[,n("_i])相乘,并将乘积(1- )尸[, ("-1]传送至加法器 7092。另一方面,乘法器7093将作为权重923传送过来的"与以往估 计SNR 922相乘,并将乘积^二(^v,W传送至加法器7092。加法器 7092输出(l-a)尸[^W-l]与c^2—iW的和,作为频域估计先验SNR 904。
图19是示出了图6所示的噪声抑制系数发生器8的结构的方框 图。噪声抑制系数发生器8包括画SE STSA增益函数值计算器811、 广义似然比计算器812和抑制系数计算器814。下面,将根据在非专 利文献2 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL. 32, NO. 6,第1109 1121页,1984年12月)中所描述的计算等式,来描述抑制系数的计算方法。
假设帧数为",频率数为"K,("是从图6的频域SNR计算器6 传送过来的频域后验SNR, ^(/t)是从图6的估计先验SNR计算器7传 送过来的频域估计先验SNR,以及《是从图6的语音缺失概率存储器 21传送过来的语音缺失概率。此外,假设
<formula>formula see original document page 23</formula>
丽SE STSA增益函数值计算器811根据从图6的频域S服计算器6传 送过来的后验SNR hOt)、从图6的估计先验SNR计算器7传送过来的 估计先验SNR ^(yt)、以及从图6的语音缺失概率存储器21传送过来 的语音缺失概率g,计算每一频率的丽SE STSA增益函数值,并将丽SE STSA增益函数值输出至抑制系数计算器814。
每一频率的醒SE STSA增益函数值G。W由以下等式表示。
<formula>formula see original document page 23</formula>(14)
这里,/。W是0阶修正贝塞尔函数,以及/,(z)是1阶修正贝塞尔函数。 在非专利文献3 (MATHEMATICS DICTIONARY, IWANAMI BOOK SHOP,第 374. G页,1985年)中描述了修正贝塞尔函数。
广义似然比计算器812根据从图6的频域SNR计算器6传送过来 的后验SNR r ("、从图6的估计先验SNR计算器7传送过来的估计先 验SNR 以及从图6的语音缺失概率存储器21传送过来的语音
缺失概率《,来计算每一频率的广义似然比,并将广义似然比输出至 抑制系数计算器814。
每一频率的广义似然比八"W由以下等式表示。 [等式15]
<formula>formula see original document page 23</formula>(15)抑制系数计算器814根据从画SE STSA增益函数值计算器811传 送过来的醒SE STSA增益函数值G"W和从广义似然比计算器812传送 过来的广义似然比A"0t),计算每一频率的抑制系数,并将抑制系数输 出至图6的抑制系数修正器15。每一频率的抑制系数5("由以下等式表示。
<formula>formula see original document page 24</formula>(16)
代替计算每一频率的SNR,也可以计算和使用在包括多个频率在内的 频带内公用的SNR。
图20是示出了图6所示的抑制系数修正器15的结构的方框图。 抑制系数修正器15包括频域抑制系数修正器1501。至1501K-,、分离器 1502和1503以及复用器1504。
分离器1502将从图6的估计先验SNR计算器7传送过来的估计 先验SNR分解为频域分量,并将这些频域分量分别输出至频域抑制系 数修正器1501 至1501K—,。分离器1503将从图6的噪声抑制系数发生 器8传送过来的抑制系数分解为频域分量,并将这些频域分量分别输 出至频域抑制系数修正器1501。至認ho
频域抑制系数修正器1501 至1501h根据从分寓器1502传送过来 的频域估计先验SNR和从分离器1503传送过来的频域抑制系数,来计 算频域修正抑制系数,并将频域修正抑制系数输出至复用器1504。复 用器1504对从频域抑制系数修正器1501(,至1501K—,传送过来的频域修 正抑制系数进行复用,并将复用频域修正抑制系数作为修正抑制系数 输出至图6的复用乘法器16和估计先验SNR计算器7。
接下来,将参照图21,对频域抑制系数修正器1501()至1501k-,的 结构和操作进行详细描述。
图21是示出了包括在抑制系数修正器15中的频域抑制系数修正 器1501 至150lK-,的结构的方框图。频域抑制系数修正器1501包括最 大值选择器1591、抑制系数下限值存储器1592、阈值存储器1593、 比较器1594、开关1595、修正值存储器1596和乘法器1597。比较器1594将从阈值存储器1593传送过来的阈值与从图20的 分离器1502传送过来的频域估计先验SNR进行比较,当频域估计先验 SNR大于阈值时,比较器1594向开关1595传送"0",而当频域估计 先验SNR小于阈值时,比较器1594向开关1595传送"1"。当比较器 1594的输出值为"1"时,开关1595将从图20的分离器1503传送过 来的频域抑制系数输出至乘法器1597,以及当输出值为"0"时,将 频域抑制系数输出至最大值选择器1591。 g口,当频域估计先验SNR小 于阈值时,对抑制系数进行修正。乘法器1597计算开关1595的输出 值与修正值存储器1596的输出值的乘积,并将所述乘积输出至最大值 选择器1591。
另一方面,抑制系数下限值存储器1592向最大值选择器1591传 送所存储的抑制系数的下限值。最大值选择器1591将从图20的分离 器1503传送过来的频域抑制系数或由乘法器1597计算出的乘积与从 抑制系数下限值存储器1592传送过来的抑制系数下限值进行比较,并 将较大的数值输出至图20的复用器1504。 gfl,抑制系数必将变为比 抑制系数下限值存储器1592所存储的下限值大的数值。
在所有上述典型实施例中,虽然假设采用最小均方短时谱幅度方 法作为噪声抑制方法,但是这些实施例也可以应用于其他噪声抑制方 法。这些噪声抑制方法的示例包括在非专利文献4 (PROCEEDINGS OF THE IEEE, VOL. 67, NO. 12,第1586 1604页,1979年12月)中所 公开的维纳滤波器方法;以及在非专利文献5 (IEEE TRANSACTIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL. 27, NO. 2,第 113 120页,1979年4月)中所公开的谱扣除方法,这里省略了对上 述方法结构示例的详细描述。
上述每一典型实施例的噪声抑制设备均可以计算机设备来进行 配置,所述计算机设备包括用于蓄积程序等的存储设备、设置有按 键和开关的操作单元、诸如LCD等的显示设备、以及通过接收来自操 作单元的输入来控制每一部件的操作的控制设备。当控制设备执行存 储在存储设备中的程序时,将实现上述每一典型实施例的噪声抑制设备的操作。程序可以预先存储在存储设备中,或者可以将其写入诸如
CD-ROM等记录介质来提供给用户。也可以通过网络来提供所述程序。
权利要求
1.一种噪声抑制方法,用于抑制包括在输入信号中的噪声,其特征在于包括将所述输入信号转换为频域信号;修正所述频域信号的幅度,以获得幅度修正信号;使用所述幅度修正信号,来获得估计噪声;使用所述估计噪声和所述幅度修正信号,来确定抑制系数;以及以所述抑制系数对所述幅度修正信号进行加权。
2. 根据权利要求l所述的噪声抑制方法,其特征在于包括 修正所述频域信号的相位,以获得相位修正信号;以及 将通过以所述抑制系数对所述幅度修正信号进行加权所获得的结果和所述相位修正信号转换为时域信号。
3. 根据权利要求1或2所述的噪声抑制方法,其特征在于包括 消除所述输入信号的偏移,以获得偏移消除信号;以及 将所述偏移消除信号转换为所述频域信号。
4. 一种噪声抑制设备,用于抑制包括在输入信号中的噪声,其 特征在于包括转换器,用于将所述输入信号转换为频域信号;幅度修正器,用于修正所述频域信号的幅度,以获得幅度修正信号;噪声估计器,用于使用所述幅度修正信号,来获得估计噪声; 抑制系数发生器,用于使用所述估计噪声和所述幅度修正信号, 来确定抑制系数;以及乘法器,用于以所述抑制系数对所述幅度修正信号进行加权。
5. 根据权利要求4所述的噪声抑制设备,其特征在于包括-相位修正器,用于修正所述频域信号的相位,以获得相位修正信号;以及逆转换器,用于将通过以所述抑制系数对所述幅度修正信号进行加权所获得的结果和所述相位修正信号转换为时域信号。
6. 根据权利要求4或5所述的噪声抑制设备,其特征在于包括 偏移消除器,用于消除所述输入信号的偏移,以获得偏移消除信号;以及转换器,用于将所述偏移消除信号转换为所述频域信号。
7. —种计算机程序,用于对信号进行处理,以抑制包括在输入信号中的噪声,所述计算机程序使计算机执行以下处理.-将所述输入信号转换为频域信号; 修正所述频域信号的幅度,以获得幅度修正信号; 使用所述幅度修正信号,来获得估计噪声;使用所述估计噪声和所述幅度修正信号,来确定抑制系数;以及 以所述抑制系数对所述幅度修正信号进行加权。
8. 根据权利要求7所述的计算机程序,使计算机还执行以下处理修正所述频域信号的相位,以获得相位修正信号;以及 将通过以所述抑制系数对所述幅度修正信号进行加权所获得的 结果和所述相位修正信号转换为时域信号。
9. 根据权利要求7或8所述的计算机程序,使计算机还执行以 下处理消除所述输入信号的偏移,以获得偏移消除信号;以及 将所述偏移消除信号转换为所述频域信号。
全文摘要
本发明提出了一种方法、一种设备和一种计算机程序,能够以较小的计算量来抑制低频范围内的分量,并能够实现高质量的噪声抑制。通过以下操作来抑制输入信号中叠加在所需信号上的噪声将所述输入信号转换为频域信号;修正所述频域信号的幅度,以获得幅度修正信号;使用所述幅度修正信号,来获得估计噪声;使用所述估计噪声和所述幅度修正信号,来确定抑制系数;以及以所述抑制系数对所述幅度修正信号进行加权。
文档编号G10L21/0208GK101300623SQ200680040704
公开日2008年11月5日 申请日期2006年8月28日 优先权日2005年9月2日
发明者加藤正德, 杉山昭彦 申请人:日本电气株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1