一种利用受损听力的听阈进行降噪的方法

文档序号：2823716阅读：179来源：国知局

专利名称：一种利用受损听力的听阈进行降噪的方法
技术领域：
本发明属于语音信号处理领域，特别涉及一种利用受损听力的听阈进行降噪的方法，根据噪声级、听阈或者听觉掩蔽阈调整增益函数参数进行降噪，该方法尤其适用于数字助听器，但不限于数字助听器，也可用于其它语音信号被噪声污染的设备和领域，例如语音通信、辅助听力设备、电话等。
背景技术：
听力损失人士在有背景噪声的环境中辨别语音的能力大幅下降，且背景噪声会造成听者的听觉疲劳，并使其仅存的分辨力进一步下降，因此，在数字助听器中进行降噪处理是十分必要的，其主要目的是提高语音分辨力与聆听舒适度。降噪也常被称为语音增强，常用的方法有谱减法、统计模型法、子空间法等基于信号估计的方法。由于数字助听器要求低功耗，所以对算法复杂度有一定的限制。目前，计算复杂度低的谱减法及其改进算法的使用较为普遍。谱减法最早由S. F. Boll提出，假设语音信号和噪声不相关，语音的幅度谱可以用含噪信号和噪声的幅度谱相减得到。很快EBerouti提出基于功率谱的谱减以及广义谱减法，在增益函数中引入过减因子，并根据全带信噪比对其进行调整，可以一定程度上减小 “音乐噪声”。另外，很多研究人员在此基础上提出改进算法，例如线性谱减法、多通道广义谱减法等。由于降噪技术的特点，在抑制噪声的同时必将引起语音信号的失真，而广义谱减法的过减因子会增大语音失真，语音失真导致降噪技术在语言理解度的提高方面并没有明显的效果，而且，有的降噪技术会导致语言理解度的降低，所以，降噪技术的关键是如何在噪声抑制和语音失真之间找到平衡点，在提高聆听舒适度的同时尽量减小语音失真。很多研究人员利用人耳的掩蔽特性，对每一帧信号，先计算掩蔽阈，并据此调整增益函数的参数，只把噪声降到掩蔽阈以下即可，该类方法的一个缺点是计算复杂度较高。另外，还有方法采用直线或分段折线来表示增益函数，并根据实际噪声级对其进行调整，在信噪比相等，噪声级较小的情况下，对含噪信号的衰减较小，这就一定程度上减小了语音失真。实际的听力损失情况比较复杂，不同听力损失患者的听力阈不同，同一患者，不同频率的听力损失情况也不同，所以只根据噪声级调整增益函数缺少针对性。

发明内容
本发明的目的是提供一种利用受损听力的听阈进行降噪的方法，针对患者的听阈和环境中的噪声级调整增益函数，既能有效地抑制噪声，又能减小不必要的语音失真，在提高聆听舒适度的同时，保证言语理解度。为实现上述目的，本发明提供了一种利用受损听力的听阈进行降噪的方法，该方法将输入的语音信号分成N个子带信号，并进行听力补偿后，分别对子带信号进行降噪处理，最后，采用加权叠加滤波器组对输入的各路子带信号进行综合处理成一路输出信号；
所述的降噪处理的步骤包括1)信号预处理子步骤对经听力补偿后的各子带信号分别进行平滑、平均预处理，以降低信号功率谱估计的方差，提高输出语音质量。2)实时噪声估计子步骤采用实时噪声估计算法，利用信号的时频特点连续更新噪声，估计噪声谱，以符合数字助听器实时处理的要求。该步骤估计得到的噪声进一步用于信噪比计算及广义谱减法中参数的确定。3)广义谱减参数确定子步骤利用患者的听阈和步骤2)估计的噪声级计算广义谱减法的参数，以此控制降噪增益的大小，当降噪增益用倍数表示时，其值小于1 ；当用dB表示时，其值小于零；所述的广义谱减法的降噪增益函数为其中，|Xk(m) I2和|Nk(m) |2分别经过听力补偿后含噪信号和加性噪声的功率谱估计，m表示离散时间，k表示子带标号；式中，有四个可变参数，α是过减因子，α > 1会增加语音失真；β是最低衰减参数，β越大，残留的背景噪声越大；另外，两个参量Y和δ则决定了从Gk(m) = 1到Gk(m) =0的过渡过程；设定α = 1，β = 0，参考功率谱减，设定γ = 2，即其中，Yk(m) = |Xk(m) |2/|Nk(m)) |2是后验信噪比，δ的值待调整；在谱减法中，在含有噪声的语音段，降噪增益越小，语音失真就越大，为了尽可能减小语音失真，本发明限定噪声乘以降噪增益函数后低于患者的听阈即可，无需进一步的噪声抑制。即噪声经过降噪处理后低于患者的听阈即可，临界状态时二者相等GKn{m)\Nk{m)\ = HLk(3)表示该子带的后验信噪比为Yk时的降噪增益，如果|Nk(m) I <HLk则对信号不做抑制，这里|Nk(m) I和HLk的单位为声压单位。因为含有语音的信号段的掩蔽阈升高，一般高于听阈，所以本发明只要求纯噪声经过衰减后低于听阈。纯噪声段的后验信噪比应为I(OdB)，但是，在实际应用过程中，对后验信噪比的估计一般不为1，且后验信噪比等于1 时无法根据式(2)和(3)计算δ，所以本发明用固定值R近似表示纯噪声段后验信噪比的值，1 < R< 1.5。根据式(2)和(3)，根据本发明，噪声级越大，计算得到的δ值越小，相同信噪比的情况下降噪增益越小。4)先验信噪比估计本发明用先验信噪比代替后验信噪比参与降噪增益函数的计算，可以有效避免谱减方法中经常认为产生的“音乐噪声”。其中，先验信噪比么(m)用“decision-directed”方法进行估计。因此，降噪增益函数的公式更改为 5)广义谱减降噪用上式4)中计算得到的降噪增益与听力补偿后的含噪信号相乘，得到降噪后的子带信号本发明的利用受损听力的听阈进行降噪的方法，设x(n)是含噪语音信号，其经过 TOLA分析滤波器组进行分析处理后，把语音信号分成K个子带信号；K的取值> 32 ；各个子带的信号表示为其中，m表示离散时间，k表示子带标号，K与R是WOLA滤波器组的相关参数，h(D) 是分析原型滤波器;WK = Ρ.2"气是离散傅里叶变换因子；再通过WOLA综合滤波器组把经过听力补偿和降噪处理后的子带的信号Yk(m)合成一路输出信号为
ι K-Iy(r + mR) | = f(r)丄1| +(terms for m^m0)其中，f ( □)是综合原型滤波器。所述的听力补偿根据患者在相应子带的听阈，分别对子带信号进行加权处理，以补偿其听力损失；该听力补偿的表达式为Xk{m) = Xk(m)x Gl k ；式中，Gu为听力补偿时不同子带的加权值。作为上述方法的一种改进，为了降低估计方差，所述的步骤1)先用Welch方法估计功率谱，然后，采用对其进行一阶平滑预处理。包括11)先用Welch方法进行功率谱估计，每J帧进行一次平均处理，其中，j为帧号
7
12)对平均谱的进一步平滑，ζ为平滑参数作为上述方法的又一种改进，所述的步骤2)采用递归平均实时噪声估计算法
,其他其中，0 < μ <1，μ取接近于1的值，b是一个经验阈值。作为上述方法的再一种改进，所述的步骤4)先验信噪比估计采用的 "decision-directed，，方法为其中，P[x] =x,X^o ；P [χ] =0,χ<0 ；I足(所)|为信号预处理后的结果，之(W)是降噪后的语音信号，0< P < 1，是平滑因子。本发明的优点在于本发明结合数字助听器的特殊使用群体，发明了一种根据噪声级和听阈调整参数的广义谱减法。其中，使用先验信噪比代替后验信噪比调整增益函数，能有效地降低降噪产生的“音乐噪声”。本发明中降噪增益函数不仅与信噪比有关而且根据噪声级和患者听阈进行调整。当听阈较高时对噪声的抑制较小，同时减小语音失真；当听阈较低时，增加对噪声的抑制以提高聆听舒适度。对不同的听力损失情况及不同的噪声条件具有针对性，使噪声抑制效果和语音失真度达到相对平衡。

图1是采用本发明的降噪方法进行语音信号处理的系统框图；图2是本发明的实施例中采用的听力损失人士的听力图；图3是本发明的根据听阈计算一个子带的δ的信号处理流程图；图4是本发明的根据掩蔽阈计算一个子带的δ的信号处理流程图；图5是本发明的多个子带组成一个通道计算δ的信号处理流程图；图6是三种信噪比(a，SNR = OdB ；b, SNR = 5dB ；c, SNR = IOdB)的白噪声环境下，不同降噪方法输出信号的SII值比较图。
具体实施例方式下面结合附图和具体实施方式
对本发明进行详细说明。如图1和图3所示，发明应用于数字助听器中，对信号进行多通道处理，降噪和对患者的听力补偿串联进行处理，步骤如下i.分频带采用加权叠加滤波器组(Weighted Overlap-added,W0LA)对输入信号进行分析处理，把信号分成N个子带，其他的处理在各个子带独立进行。
设χ (η)是含噪语音信号，其经过WOLA分析滤波器组后，各个子带的信号表示为其中，m表示离散时间，k表示子带标号，K与R是WOLA滤波器组的相关参数h ( □) 是分析原型滤波器。本实施例中，K = 64，R = 16。以下步骤以其中一个子带为例。ii.听力补偿根据患者在相应子带的听阈，对子带信号进行加权，补偿其听力损失。加权后不仅信号幅度增加，其加性噪声的幅度也相应增加。 G1J为不同子带在补偿增益，根据附图2所示的听力图确定，一旦确定就不随时间变化。iii.降噪这一步骤是本发明的的重点，包括信号预处理、实时噪声估计、广义谱减参数确定、先验信噪比估计、广义谱减降噪五个步骤a)子带信号预处理该技术对经听力补偿后的子带信号进行平滑、平均预处理，以降低信号功率谱估计的方差，提高输出语音质量。为了降低估计方差，先用Welch方法估计功率谱，然后采用对其进行一阶平滑预处理。先用Welch方法进行功率谱估计，每J帧进行一次平均处理，其中j为帧号然后，对平均谱的进一步平滑，ζ为平滑参数。本实施例中，J= 5，ζ =0.7。b)实时噪声估计在基于信号估计的降噪方法中，噪声谱的估计对降噪效果有很大的影响。由于语音活性检测算法(Voice Activity Detection，VAD)计算复杂度太高，不适合应用于数字助听器中，本文采用实时噪声估计算法，利用信号的时频特点连续更新噪声，符合数字助听器实时处理的要求。该步骤估计得到的噪声进一步用于信噪比计算及广义谱减法中参数的确定。采用递归平均实时噪声估计算法 0 < μ < 1，为了防止对噪声过估计，μ —般取接近于1的值。本实施例中，μ = 0. 95，b = 1. 8。c)广义谱减参数确定该技术利用上一步骤估计的噪声级、患者的听阈计算广义谱减法的公式的参数，以此控制降噪增益(倍数小于1，或者分贝值为负)的大小。
广义谱减法的降噪增益函数表示如下 |Xk(m) I2和|Nk(m) |2分别经过听力补偿后含噪信号和加性噪声的功率谱估计，m表示离散时间，k表示子带标号，其中有四个可变参数，α是过减因子，α >1会增加语音失真；β是最低衰减(attenuation floor)参数，β越大，残留的背景噪声越大；另外两个参量Y和S则决定了从Gk(m) = 1到Gk(m) = 0的过渡过程。本发明固定α = 1，β = 0，
参考功率谱减，固定Y = 2，即其中，yk(m) = |Xk(m) |2/|Nk(m) |2是后验信噪比，δ的值待调整。在谱减法中，在含有噪声的语音段，降噪增益越小，语音失真就越大，为了尽可能减小语音失真，本发明限定噪声乘以降噪增益函数后低于患者的听阈即可，无需进一步的噪声抑制。即噪声经过降噪处理后低于患者的听阈即可，临界状态时二者相等Gkn{m)\Nk{m)\ = HLk(3)Gn(W)表示该子带的后验信噪比为Yk时的降噪增益，如果|Nk(m) I <HLk则对信号不做抑制，这里|Nk(m) I和HLk的单位为声压单位。因为含有语音的信号段的掩蔽阈升高，一般高于听阈，所以本发明只要求纯噪声经过衰减后低于听阈。纯噪声段的后验信噪比应为I(OdB)，但是，在实际应用过程中，对后验信噪比的估计一般不为1，且后验信噪比等于1 时无法根据式(2)和(3)计算δ，所以本发明用固定值R近似表示纯噪声段后验信噪比的值，1 < R< 1.5。根据式(2)和(3)，
(4)根据本发明，噪声级越大，计算得到的δ值越小，相同信噪比的情况下降噪增益越小。广义谱减法中的δ值按照式(4)计算，在本实施例R= 1.01。d)先验信噪比估计本发明用先验信噪比代替后验信噪比参与降噪增益函数的计算，可以有效避免谱减方法中经常认为产生的“音乐噪声”。其中先验信噪比么(m)用“decision-directed”方法进行估计。用“decision-directed”方法进行估计
其中，P[x] =x,x^O ；P [χ] =0,χ<0 ；|兄(肌)|为信号预处理后的结果，之休)是
降噪后的语音信号。在本实施例中，P =0.97。因此，降噪增益函数的公式更改为
Gk{m) = \ 4k{m) + \_(5)
0,其他e)广义谱减降噪用d)中用广义谱减法计算的降噪增益与听力补偿后的含噪信号相乘，得到降噪后的信号Yk (m) = Xk (m) XGk(m)iv子带信号综合采用加权叠加滤波器组(Weighted Overlap-added, W0LA)对输入信号进行综合处理，把K个子带综合成一路输出信号
1 K-Xyir + mR) \ = f(r)—y^dYk(m)Wl^bnRW-kr | +(terms for m关W0)
Kti κ Λ
W=ZW0其中，f ( □)是综合原型滤波器。由于听力损失人士的听阈高于一般人的听阈，所以本发明中的听阈是对掩蔽阈的一种近似，以避免对掩蔽阈的复杂计算。所以本发明中的听阈也可以用计算得到的掩蔽阈代替，如图4所示。另外，δ的计算也可以按照把几个子带组成一个通道的形式进行，使符合听觉感知特性的相邻的几个子带用相同的δ值，如图5所示，但是降噪处理依然在子带内进行的信号处理流程，kl与kh分别表示计算δ所以子带对应的最低与最高子带标号。本发明使用言语理解度指数(Speech Intelligibility Index, SII)对降噪方法的效果进行评估，按照美国国家标准局制定的ANSI S3-5-1997标准，选用1/3倍频程方法计算SII。本发明使用10段不同的语音信号叠加不同程度的白噪声进行测试，其信噪比有三种情况0dB、5dB和10dB。三种信噪比对应的SII值如图6所示，图中圆点表示10段语音信号的均值，竖线表示标准差，算法1、2、3分别指参考文献AMulti-bandSpectral Subtraction Method for Speech Enhancement, KAMATH S D. , Dallas ；TheUniversity ofTexas at Dallas 2001.、禾口参考文献Noise Estimation Techniques for RobustSpeech Recognition, HIRSCH H G, EHRLICHER C, proceedings of the 1995IEEEInternational Conference on Acoustics, Speech, and Signal Processing, 1995. 153-56 中公开的算法、以及本发明的方法。从图6中可以看出，几种降噪方法输出信号的SII值与降噪前信号相比或者差不多(本发明方法)，或者减小(其他两种方法)，这说明降噪算法在抑制噪声的同时引起语音失真，在语言理解度的提高方面并没有明显的效果，甚至导致语言理解度的降低。在图示的所有噪声条件下，本发明的方法输出信号的SII值最高，说明本发明方法在
11保证聆听舒适度的同时引起的语音失真最小。最后所应说明的是，以上实施例仅用以说明本发明的技术方案而非限制。尽管参照实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，对本发明的技术方案进行修改或者等同替换，都不脱离本发明技术方案的精神和范围，其均应涵盖在本发明的权利要求范围当中。
权利要求
一种利用受损听力的听阈进行降噪的方法，该方法将输入的语音信号分成N个子带信号，并进行听力补偿后，根据听力损失患者的听阈分别对子带信号进行降噪处理，最后，采用加权叠加滤波器组对输入的各路子带信号进行综合处理成一路输出信号；所述的降噪处理的步骤包括1)信号预处理子步骤对经听力补偿后的各子带信号分别进行平滑、平均预处理；2)实时噪声估计子步骤采用实时噪声估计算法，利用信号的时频特点连续更新噪声，估计噪声谱；3)广义谱减参数确定子步骤利用患者的听阈和步骤2)估计的噪声级计算广义谱减法的参数，以此控制降噪增益的大小，当降噪增益用倍数表示时，其值小于1；当用dB表示时，其值小于零；所述的广义谱减法的降噪增益函数为其中，|Xk(m)|2和|Nk(m)|2分别经过听力补偿后含噪信号和加性噪声的功率谱估计，m表示离散时间，k表示子带标号；式中，有四个可变参数，α是过减因子，α＞1会增加语音失真；β是最低衰减参数，β越大，残留的背景噪声越大；另外，两个参量γ和δ则决定了从Gk(m)＝1到Gk(m)＝0的过渡过程；设定α＝1，β＝0，参考功率谱减，设定γ＝2，即其中，γk(m)＝|Xk(m)|2/|Nk(m))|2是后验信噪比，δ的值待调整；设定噪声乘以降噪增益函数后低于患者的听阈，临界状态时二者相等 <mrow><msub> <mi>G</mi> <mrow><mi>k</mi><mo>,</mo><msub> <mi>γ</mi> <mi>k</mi></msub> </mrow></msub><mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo></mrow><mo>|</mo><msub> <mi>N</mi> <mi>k</mi></msub><mrow> <mo>(</mo> <mi>m</mi> <mo>)</mo></mrow><mo>|</mo><mo>=</mo><msub> <mi>HL</mi> <mi>k</mi></msub><mo>-</mo><mo>-</mo><mo>-</mo><mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo></mrow><mo>;</mo> </mrow>式中，表示该子带的后验信噪比为γk时的降噪增益；用固定值R近似表示纯噪声段后验信噪比的值，1＜R＜1.5，根据上式(2)和(3)，4)先验信噪比估计子步骤所述的先验信噪比用“decision directed”方法进行估计；并用先验信噪比代替后验信噪比参与降噪增益函数的计算，降噪增益函数的公式更改为5)广义谱减降噪子步骤用步骤4)中计算得到的降噪增益与听力补偿后的含噪信号相乘，得到降噪后的子带信号Yk(m)＝Xk(m)×Gk(m)。FSA00000193807200011.tif,FSA00000193807200012.tif,FSA00000193807200021.tif,FSA00000193807200022.tif,FSA00000193807200023.tif,FSA00000193807200024.tif
2.根据权利要求1所述的利用受损听力的听阈进行降噪的方法，其特征在于，设χ (η) 是含噪语音信号，其经过WOLA分析滤波器组进行分析处理后，把语音信号分成K个子带信号；K的取值> 32 ；各个子带的信号表示为其中，m表示离散时间，k表示子带标号，K与R是WOLA滤波器组的相关参数，h( □) 是分析原型滤波器= 气是离散傅里叶变换因子；再通过WOLA综合滤波器组把经过听力补偿和降噪处理后的子带的信号Yk(m)合成一路输出信号为其中，f ( □)是综合原型滤波器。
3.根据权利要求2所述的利用受损听力的听阈进行降噪的方法，其特征在于，所述的听力补偿根据患者在相应子带的听阈，分别对子带信号进行加权处理，以补偿其听力损失；该听力补偿的表达式为式中，Gu为听力补偿时不同子带的加权值。
4.根据权利要求1所述的利用受损听力的听阈进行降噪的方法，其特征在于，所述的步骤1)包括11)先用Welch方法进行功率谱估计，每J帧进行一次平均处理，其中，j为帧号 12)对平均谱的进一步平滑，ζ为平滑参数
5.根据权利要求1所述的利用受损听力的听阈进行降噪的方法，其特征在于，所述的步骤2)采用递归平均实时噪声估计算法其中，O < μ < 1，μ取接近于1的值，b是一个经验阈值。
6.根据权利要求1所述的利用受损听力的听阈进行降噪的方法，其特征在于，所述的步骤4)先验信噪比估计采用的“decision-directed”方法为其中，Ρ[χ] =χ,χ^0 ；P [χ] =0,χ<0 ；I兄(劝|为信号预处理后的结果，之(m)是降噪后的语音信号，0< P < 1，是平滑因子。
全文摘要
本发明涉及一种利用受损听力的听阈进行降噪的方法，该方法将输入的语音信号分成N个子带信号，并进行听力补偿后，分别对子带信号进行降噪处理，最后，采用加权叠加滤波器组对输入的各路子带信号进行综合处理成一路输出信号。本发明提供了一种根据噪声级和听阈调整参数的广义谱减法，其中，使用先验信噪比代替后验信噪比调整增益函数，能有效地降低降噪产生的“音乐噪声”，本发明的降噪增益函数不仅与信噪比有关而且根据噪声级和患者听阈进行调整，当听阈较高时对噪声的抑制较小，同时减小语音失真；当听阈较低时，增加对噪声的抑制以提高聆听舒适度，对不同的听力损失情况及不同的噪声条件具有针对性，使噪声抑制效果和语音失真度达到相对平衡。
文档编号G10L21/02GK101901602SQ20101022877
公开日2010年12月1日申请日期2010年7月9日优先权日2010年7月9日
发明者孟晓辉, 崔杰, 张云翼, 王玥, 肖灵申请人:中国科学院声学研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：崔杰;肖灵;张云翼;王玥;孟晓辉
技术所有人：中国科学院声学研究所
我是此专利的发明人

上一篇：一种音频数据的编码方法及装置的制作方法
上一篇：一种采样率差异估计与校正方法