一种对长时变噪声的自适应判决方法

文档序号：2833344阅读：224来源：国知局

专利名称：一种对长时变噪声的自适应判决方法
技术领域：
本发明涉及语音处理技术，特别涉及一种对具有长时变特性的带噪语音的自适应判决方法。
背景技术：
目前的许多语音处理应用中需要对背景噪声做出估计，这种估计必须建立在对输入信号是否为噪声的判决基础上，该判决的准确程度在很大程度上影响着语音处理应用的效果。对噪声判决的普遍方法是采用一种经验性的固定特征值及固定阈值，或采用噪声特征值对阈值进行更新，这些方法都会导致无法适应噪声缓变情况而导致长时间运行后的判决失效。噪声的平稳性与时间密切相关，短时间内平稳的噪声在较长的时间区间来观察具有时变特性，常用的经验阈值判决算法无法解决噪声的时变特性。另一方面，利用语音激活检测算法中的语音能量、短时平均过零率、自相关性、LPC谱包络进行多判断准则的互相校验与依赖判决，算法复杂而低效。

发明内容
针对现有噪声判决方法的上述缺陷，申请人经过研究改进，提供一种对长时变噪声的自适应判决方法，为具有长时变特性的带噪语音提供了一种自适应、高效的判决机制。本发明的技术方案如下一种对长时变噪声的自适应判决方法，包括以下步骤步骤I )，选取噪声帧特征参数集合A的特征值C和阈值Cth ；步骤2),对IOms带噪语音巾贞a」计算其特征值Cj ；步骤3)，计算Cj与C的差异值，并将其与阈值Cth比较做出判决；步骤4)，更新特征值C和阈值Cth。其进一步的技术方案为所述步骤I)的具体实施步骤为设定初始化帧数为INIT=128，对各带噪语音帧&1 (i = 1,2,……INIT)分别做如下计算(I)做256点快速傅里叶FFT变换，得到频域幅度Ai ；Ai= Σ I Ai (K) I exp (j2 n k/N), k = 0,1, . . . . , (N/2) -I ；(2)均匀划分为M个子带，计算每个子带的能量Bi(S)=E I Ai (k) I , k=fL(s), · · · · , fH(s), s = O, I, · · · · , M-1 ;其中，fL(s)和fH(s)分别为第s个子带的下界和上界，M=32 ；定义特征参数集合A= (Bi (s)}, s=0,1, , M-I,定义矢量距离Cl(BpBj)= Σ 201 (IglO (Bi (sVBjs)))，其中I(x)=x if(x>0), I (x)=0 if (x〈=0),为半波整流；(3)计算特征值C及阈值Cth C=E (C)，为INIT个初始化帧子带能量矢量Bi的数学期望；
Cth=EidiBijEic)]),! = 1,2,...., INIT，为各初始化帧和特征期望之间偏差的统计平均值。其进一步的技术方案为所述步骤2)的具体实施步骤为对IOms的带噪语音帧a」进行256点的傅里叶FFT变换后，由步骤I)中的Bi (s)计算式算出该待判决帧的子带能量矢量 Bj (s) Kj=Bj(S)0其进一步的技术方案为所述步骤3)的具体实施步骤为计算&与C的差异值d(Cj, C)=d[Bj，E(C)]，Sd(Cj，c)〈Cth，则判决该帧为噪声帧。其进一步的技术方案为所述步骤4)的具体实施步骤为若当前判决帧被判定为噪声帧，则采用滑动平均因子对特征值c进行修正C = 3C+(1 —，滑动因子a在 O.95至O. 98之间取值；阈值Cth的更新采用边缘检测更新方式，若当前帧的判决结果与上一帧的判决结果异或为真，则按下式更新修正Cth=ecth+(l-0)d(Cj，C)，边缘滑动因子Θ在O. 95至O. 98之间取值。本发明的有益技术效果是本发明对带噪语音构建动态反馈、自适应更新的特征值和判决阈值，从而对噪声帧作出高效、稳定的判决。通过提取一定长度的初始化帧，首先估算出各帧频域子带幅度能量构造特征值矢量的数学望期与判决阈值，然后计算待判决帧特征矢量距离并与判决阈值进行比较判决得出是否为噪声帧。利用快速傅里叶FFT变换，全部在频域完成所有计算与判决，计算量少、效率高，并利用边界滑动因子对特征值与判决阈值进行动态回归，实现长时间的自适应稳定判决输出。本发明附加的方面和优点将在下面具体实施方式
部分的描述中给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

图I是本发明的流程框图。
具体实施例方式下面结合附图对本发明的具体实施方式
做进一步说明。如图I所示，本发明的主要过程步骤包括步骤I )，选取噪声帧特征参数集合A的特征值C和阈值Cth ；步骤2),对IOms带噪语音巾贞a」计算其特征值Cj ；步骤3)，计算Cj与C的差异值，并将其与阈值Cth比较做出判决；步骤4)，更新特征值C和阈值Cth。步骤I)的具体实施步骤如下设定初始化帧数为INIT=128，对各带噪语音帧Bi (i = 1,2,……INIT)分别做如下计算(I)做256点快速傅里叶FFT变换，得到频域幅度Ai ；Ai= Σ I Ai (K) I exp (j2 π k/N), k = 0，1，· · · ·，(N/2)—I。(2)均匀划分为M个子带，计算每个子带的能量
Bi (s) = Σ Ai (k) I , k=fL(s), . . . . , fH(s), s = O, I, . . . . , M-I ；其中，fL(s)和fH(s)分别是第s个子带的下界和上界，M=32 ；定义特征参数集合A= (Bi (s)}, s=0,1,----, M-I,定义矢量距离Cl(BpBj)= Σ 201 (IglO (Bi (SVBj(S))),其中I (X) =x if (χ>0), I (X) =0 if (x〈=0),为半波整流。(3)计算特征值C及阈值Cth C=E (C)，是INIT个初始化帧子带能量矢量Bi的数学期望。Cth=E (d [Bi，E(C)])，i=l，2，, INIT是各初始化帧和特征期望之间偏差的统计平均值。·步骤2)的具体实施步骤如下对IOms的带噪语音帧a」进行256点的傅里叶FFT变换后，由步骤I)中的Bi(S)计算式算出该待判决帧的子带能量矢量h (S)。Cj = Bj (S)步骤3)的具体实施步骤如下计算Cj与C的差异值d(Cj, c)=d[Bj, E(c)],如果d(Cj, c) <Cth,则判决该巾贞为噪声帧。步骤4)的具体实施步骤如下·如果当前判决帧被判定为噪声帧，则采用滑动平均因子对特征值C进行修正，C = dC + (\-d)C:，滑动因子3可取值O. 95至O. 98之间。阈值Cth的更新采用边缘检测更新方式，即当前帧的判决结果与上一帧的判决结果异或为真，则按下式更新修正Cth= Θ Cth+(I- Θ )d(Cj, c)，边缘滑动因子 Θ 可在 O. 95 至 O. 98 间取值。基于上述步骤，本发明利用语音短时变及噪声的短平稳特性，通过构造高效的计算模型与算法对带噪语音中的噪声帧做出高准确度判决，具有计算快捷、性能稳定的突出特点。以上所述的仅是本发明的优选实施方式，本发明不限于以上实施例。可以理解，本领域技术人员在不脱离本发明的基本构思的前提下直接导出或联想到的其他改进和变化，均应认为包含在本发明的保护范围之内。
权利要求
1.一种对长时变噪声的自适应判决方法，其特征在于包括以下步骤步骤1 )，选取噪声帧特征参数集合A的特征值C和阈值Cth ；步骤2),对IOms带噪语音巾贞aj计算其特征值Cj ；步骤3)，计算&与C的差异值，并将其与阈值Cth比较做出判决；步骤4)，更新特征值C和阈值Cth。
2.根据权利要求I所述对长时变噪声的自适应判决方法，其特征在于所述步骤I)的具体实施步骤为设定初始化帧数为INIT=128，对各带噪语音帧ai (i=l，2，……INIT)分别做如下计算 (1)做256点快速傅里叶FFT变换，得到频域幅度Ai；Ai= Σ IAi(K) exp (j2 n k/N), k = 0,1, · ... , (N/2)_l ； (2)均匀划分为M个子带，计算每个子带的能量 Bi (s) = Σ I Ai (k) I，k=fL(s)，· · · ·，fH(s)，s = 0，1，· · · ·，M-I ；其中，fL(s)和fH(s)分别为第s个子带的下界和上界，M=32; 定义特征参数集合A={Bi(s)}, s=0,1,——,M-I,定义矢量距离 Cl(BiiBj)= Σ 201 (IglO (Bi(S)ZiBj(S))),其中I (X) =x if (x>0), I (X) =0 if (x〈=0)，为半波整流； (3)计算特征值C及阈值Cth: C=E (c)，为INIT个初始化帧子带能量矢量Bi的数学期望； ^(dtB^E^)]), i = 1,2,...., INIT，为各初始化帧和特征期望之间偏差的统计平均值。
3.根据权利要求I所述对长时变噪声的自适应判决方法，其特征在于所述步骤2)的具体实施步骤为对IOms的带噪语音帧a」进行256点的傅里叶FFT变换后，由步骤I)中的Bi (s)计算式算出该待判决帧的子带能量矢量B」(s) ;CfB^S)。
4.根据权利要求I所述对长时变噪声的自适应判决方法，其特征在于所述步骤3)的具体实施步骤为计算&与C的差异值d((^，C)=d[BpE(C)]，若d(Cp c )〈Cth，则判决该帧为噪声中贞。
5.根据权利要求I所述对长时变噪声的自适应判决方法，其特征在于所述步骤4)的具体实施步骤为若当前判决帧被判定为噪声帧，则采用滑动平均因子对特征值C进行修正=滑动因子a在O. 95至O. 98之间取值；阈值Cth的更新采用边缘检测更新方式，若当前帧的判决结果与上一帧的判决结果异或为真，则按下式更新修正=Cth= Θ Cth+(I-0)d(Cj，C)，边缘滑动因子Θ在O. 95至O. 98之间取值。
全文摘要
本发明提供一种对长时变噪声的自适应判决方法。该方法利用初始化语音帧计算噪声帧参数集合的特征值与阈值判据，对后续待判决帧的各参数矢量进行计算后对阈值进行比较判决，得出该帧是否为噪声帧，并在反馈环中利用滑动因子对特征值与判决阈值进行自适应更新，构建出高效、稳定的处理模型与算法。
文档编号G10L21/02GK102820035SQ20121030400
公开日2012年12月12日申请日期2012年8月23日优先权日2012年8月23日
发明者郑朝晖, 黄河清, 周蕾申请人:无锡思达物电子技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑朝晖;黄河清;周蕾
技术所有人：无锡思达物电子技术有限公司
我是此专利的发明人