一种功率谱密度估计方法及设备的制作方法

文档序号:7532607阅读:143来源:国知局
专利名称:一种功率谱密度估计方法及设备的制作方法
技术领域
该发明涉及一种建立在参数自回归模型基础上的带偏差补偿的谱估计方法及设备。
背景技术
该发明可应用于例如常规及蜂窝式电话系统的噪声抑制[1,2],其中根据单话筒测量采用自适应算法建立模型并增强带噪语音。
用谱减法的语音增强或明或暗地依赖于由带噪语音计算出的精确的功率谱密度估计。用于获得这种谱估计的传统方法是用基于快速傅里叶变换(FFT)的周期曲线图。然而,近来,提出了另一种称为参数功率谱密度估计的逼近方法,它给出了失真更小的语音输出,更好地降低噪声电平,而且残余噪声也没有令人恼火的人为噪声(音乐噪声)。对于参数功率谱密度估计的详细论述,参见文献[3,4]。
一般说来,由于模型误差的存在,在参数谱密度估计的谱图凹部会有偏差。在基于噪声消除器的谱减法的输出中,这个偏差将在背景噪声中导致一种并不希望的“级升”(level pumping)。
发明概述该发明的一个目的就是提出一种复杂度相对较低且无数值稳定性问题的方法和设备,用来消除或降低背景噪声中的这种“级升”。通过采用根据所附权利要求的方法和设备来实施这一目的。
该发明的关键思想是用根据参数谱模型的动态范围扩展的(或自适应的)数据来提高在基于噪音消除器的谱减法中的声频语音质量。
附图简述通过参照以下根据附图所作的描述,可以更好地理解该发明及其另外的目的与优点;其中

图1根据本发明的一种设备的实施例的原理图。
图2是根据本发明的另一种设备的实施例的原理图。
图3显示的是实际的功率谱密度曲线,实际功率谱密度的参数估计曲线和实际功率谱密度的偏差补偿估计曲线。
图4是另一组曲线,显示的是实际的功率谱密度曲线,实际功率谱密度的参数估计曲线和实际功率谱密度的偏差补偿估计曲线。
图5是图1所示实施例所使用的方法的流程图;图6是图2所示实施例所使用的方法的流程图。
优选实施例详述在所有附图中,对相应的或类似的单元使用相同的参考标号。
此外,为了简化该发明的描述,已将本发明的数学背景移到附录中。在以下描述中,正文中所提到的数字将参照附录中的相应公式。
图1显示出了根据本发明的一种设备的实施例的原理图。一帧语音数据{x(k)}送入一个LPC分析器(例如,在[5]中描述了LPC分析)。LPC分析器10确定出一组滤波器系数(LPC系数),将此系数送至PSD估计器12及逆滤波器14。PSD估计器12由LPC参数(见附录中式(11))确定输入帧{x(k)}的参数功率谱密度估计。图1中输入信号的方差不作为PSD估计器12的输入,而把一个单位信号“1”送入PSD估计器12。这样做的原因很简单。该方差只是用来改变PSD估计的比例,而且由于在最后的结果中将消去这个比例因子(见附录中式(9)),因此在PSD运算中消去此方差会使运算更简化。由PSD估计器12得到的估计将包含上述“级升”偏差。
为了补偿这种“级升”偏差,也将输入帧{x(k)}送到逆滤波器14,用于产生一个残余信号(见附录中式(7)),然后把该信号送到另一个LPC分析器16。LPC分析器16分析此残余信号,并将相应的LPC参数(方差和滤波器系数)送至一个残余PSD估计器18,它产生残余信号的参数功率谱密度估计(参见附录中式(8))。
最后输入信号与残余信号的这两种参数功率谱密度估计在一个乘法器20中分别相乘,以获得输入信号帧{x(k)}的一种偏差补偿参数功率谱密度估计(这和附录中式(9)相对应)。
实例考虑如下情况帧长N=1024,AR(自回归)模型阶次p=10。下面的实际系统是采用ARMA(自回归-移动平均)过程作为模型x(k)=1-z-1+0.9z-21-3.0z-1+4.64z-2-4.44z-3+2.62z-4-0.77z-be(k)]]>
其中e(k)为自噪声。
图3显示的是按上式计算的实际功率谱密度(实线),PSD估计器12输出的有偏差的功率谱密度估计(点-划线)和根据本发明的偏差补偿功率谱密度估计(虚线)。从图3可清楚地看出偏差补偿功率谱密度估计总体上更接近于下面的实际功率谱密度,特别是在谷点(例如w/2λ=0.17处),偏差补偿估计(以5dB)更接近于实际功率谱密度。
在本发明的优选实施例中,还可用一个设计参数γ与偏差补偿估计相乘。图3中假定γ=1。γ一般是一个接近1的正数。在优选实施例中γ的值在附录中的算法部分给出。因而,在此情况中γ随输入帧不同而不同。图4和图3相似,只是通过γ值来改变偏差补偿估计的比例。
图1的上述实施例,其特征在于它是一种频域补偿,因为实际补偿是在频域内通过两种功率谱密度估计相乘而实现的。但是这种运算过程和时域内的卷积相对应。因此本发明有一个等同的时域实现,这一实施例如图2所示。
同图1一样,图2中输入信号送至LPC分析器10。但是,没有用获得的LPC参数进行功率谱密度估计。而将来自输入信号和残余信号的的LPC分析的滤波器参数送给卷积电路22,卷积电路22将卷积得到的参数送给PSD估计器12’,PSD估计器12’产生偏差补偿估计,可将此偏差补偿估计与γ相乘。此卷积步骤可被看作一个多项式乘法,其中,由输入信号的滤波器参数所确定的多项式与由残余信号的滤波器参数所确定的多项式相乘。所得到的多项式的系数代表了偏差补偿的LPC参数。此多项式乘积将产生一个更高阶的多项式,即产生更多的系数。但是,这没有问题,因为通常习惯于对送至PSD估计器的输入“补零”(zero pad)以获得足够数量的PSD估计的样本。现在,卷积所得的更高阶多项式的结果只是使零变少而已。
在图5和图6中给出了分别对应于图1和图2的实施例的流程图。此外,在附录中给出了相应的频域和时域算法。
数值复杂度的粗略估计可如下获得。残数滤波(7)约需Np次操作(sum+add)。e(k)的LPC分析约需Np次操作以得到协方差分量,约需p2次操作以求解相应的一组方程(3)。在两种算法(时域及频域)中,时域算法的效率是最高的,因为它只需约p2次操作以完成卷积。总地说来,偏差补偿可在2p(N+p)次操作帧中完成。例如,当n=256,p=10且有50%的帧重叠时,偏差补偿算法要求大约0.5×106指令/秒。
在这一详述中,已根据语音信号对本发明进行了描述。然而,相同的思想也可用于其它那些依赖于被测信号的参数谱估计的应用中。这些应用可用在,例如雷达、声纳、经济、光干涉仪、生物医学、振动分析、图象处理、射电天文学及海洋学等中。
熟悉本技术领域的人员将可理解,在不背离本发明的精神与范围的前题下,可对这项发明作各种修正和变更,它们将由附属权利要求所确定。
参考文献S.F.Boll,"Suppression of Acoustic Noise in SpeechUsing Spectrai subtraction",IEEE Transactions onAcoustics,Speech and Signai Processing,Vol.ASSP-27,April 1979,pp 113-120.J.S.Lim and A.V.Oppenheim,"Enhancement and BandwidthCompression of Noisy Speech",Proceedings of the IEEE,Vcl.67,No.12,December 1979,pp.1586-1604.S.M.Kay,Modern Spectral estimationTheory and Appli-cation,Prentice Hall,Englewood Cliffs,NJ,1988,pp237-240.J.G.Proakis et al,Advanced Digital Signal Processing,Macmillam Publishing Company,1992,pp.498-510.J.G.Proakis,Digital Communications,MacGraw Hill,1989,pp.101-110.P.Handel et al,"Asymptotic variance of the AR spectralestimator for noisy sinusoidal data",Signal Processing,Vol.35,No.2,January 1994,pp.131-139.
附录考虑一种实信号{x(k)},k=1……N,其均值为0,N表示帧长(例如N=160)。其自回归谱估计(ARSPE)如下,见文献[3,4]φ^x(ω)=σ^x2|A^(eiω)|2---(1)]]>其中ω为角频率,ωε(0,2π)。在(1)式中

为A^(z)=1+a^1z+···+a^2zp---(2)]]>其中θ^x=(a^1···a^p)T]]>是估计的AR系数(由LPC分析得到,参见[5]),

是残余误差方差。如下可由{x(k)}计算估计的参数矢量



θ^x=-R^-1r^---(3)]]>σ^x2=r^0+r^Tθ^x]]>其中

其中r^k=1NΣt=1N-kx(t+k)x(t)r^-k=r^kk=0....,p---(5)]]>线性方程组(3)可用LevinSen-Durbin算法求解,参见文献〔3〕。我们知道,(1)式的谱估计是平滑的,文献〔6〕分别地对宽带及带噪窄带信号分析了谱估计的统计特征。
通常,由于模型误差,在谱图凹部会有一些偏差。此偏差可粗略地表示为

其中

是(1)式的估计,而

是x(k)的实际(也是未知的)功率谱密度。
为了减小出现在谱图凹部的偏差,可根据下式计算出残差ϵ(k)=A^(z-1)x(k)k=1.....N---(7)]]>对{ε(k)}进行另一个LPC分析,参照(1)式,残余功率谱密度可由下式得出φ^ϵ(ω)=σ^ϵ2|B^(eiω)|2---(8)]]>同(2)式类似,θ^ϵ=(b^1···b^q)T]]>表示估计的AR系数,

表示误差的方差。一般,模型阶次q≠p,但在这里让p=q是合理的。优选p≈N,]]>例如N可选取在10左右。
在下面提出的频域算法中,频域算法如下,根据下式对(1)进行补偿φ^x(ω)=γσ^x2·φ^ϵ(ω)·φ^x(ω)---(9)]]>其中γ(≈1)是一个设计变量。频域算法被总结到下面的算法部分和图1,图5的原理图中。
一种对应的时域算法也被总结在算法部分及附图2、6中。在此情况中,在卷积步骤中实现了补偿,其中对LPC滤波器系数

进行了补偿了。由于PSD估计被一个较不复杂的卷积代替,所以该实施例效率更高。该实施例中比例因子γ可简单地设定成一个接近或等于1的常数。但是,也可以对每一帧算出γ,如在频域算法中,通过计算由

确定的特征多项式的最靠近单位圆的特征根而得到。若这个根的角度表示为ω,则maxkφ^ϵ(k)=σ^ϵ2|B^(eiω-)|2]]>
算法输入x输入数据x=(x(1)…x(N))Tp LPC模型阶次输出

信号LPC参数θ^x=(a^1···a^p)T]]>

信号LPC残数方差

信号LPC谱φ^x=(φ^x(1)···φ^x(N/2)T]]>

补偿的LPC谱φ^x=(φ^x(1)···φ^x(N/2))T]]>ε残数ε=(ε(1)…ε(N))T

残余LPC参数θ^ϵ=(b^1···b^q)T]]>

残余LPC误差方差γ设计变量(在优选实施例中=

频域算法对每一帧执行如下步骤(功率谱密度估计)|θ^x,σ^x2|:=LPCanaivze(x,p)]]>信号的LPC分析φ^x:=SPEC(θ^x,1,N)]]>信号的谱估计,

设为1(偏差补偿)ϵ:=FILTER(θ^x,x)]]>残余滤波|θ^ϵ,σ^ϵ2|:=LPCanalyze(ϵ,p)]]>残余LPC分析φ^ϵ:=SPEC(θ^ϵ,σ^ϵ2,N)]]>残余谱估计FORk=1 TO N/2 DO谱补偿φ^x(k):=γ·φ^x(k)·φ^ϵ(k)]]>1/(maxkφ^ϵ(k))≤γ≤1]]>END FOR时域算法对每一帧执行如下步骤|θ^x,σ^x2|:=LPCanalyze(x,p)]]>信号的LPC分析ϵ:=FILTER(θ^x,x)]]>残余滤波|θ^ϵ,σ^ϵ2|:=LPCanalyze(ϵ,p)]]>残余LPC分析θ:^=CONV(θ^x,θ^ϵ)]]>LPC补偿φ^:=SPEC(θ^,σ^ϵ2,N)]]>谱估计FOR K=1 TO N/2 DOφ‾x(k):=γ·φ^(k)]]>比例调整END FOR
权利要求
1.一种功率谱密度估计方法,包括步骤有对输入信号矢量进行LPC分析以确定第一组LPC滤波器参数;根据所说第一组LPC滤波器参数确定上述输入信号的第一功率谱密度估计;通过一种由上述第一组LPC滤波器参数所确定的逆滤波器对上述输入信号向量进行滤波,得到一残余信号向量,对上述残余信号向量进行LPC分析,以确定出第二组LPC滤波器参数;根据上述第二组LPC滤波器参数,确定出上述残余信号向量的第二功率谱密度估计;产生上述输入信号向量的带偏差补偿的功率谱估计,该估计和上述第一与第二功率谱估计的乘积成比例。
2.根据权利要求1的方法,其中上述乘积还要和一个小于或等于1的正比例因子相乘。
3.根据权利要求2的方法,其中上述比例因子是上述第二功率谱密度估计的最大值的倒数值。
4.根据权利要求1、2、3的方法,其中所说的输入信号向量包括语音样本。
5.一种功率谱密度估计方法,包括步骤有对输入信号向量进行LPC分析,以确定第一组LPC滤波器参数;通过上述第一组LPC滤波器参数所确定的逆滤波器对上述输入信号向量进行滤波,得到一残余信号向量,对该残余信号向量进行LPC分析,以确定第二组LPC滤波器参数;对上述第一组LPC滤波器参数与上述第二组LPC滤波器参数进行卷积,可产生一组补偿的LPC滤波器参数;根据上述一组补偿的LPC滤波器参数可得到上述输入信号向量的偏差补偿功率谱密度估计。
6.根据权利要求5的方法,其中所说偏差补偿功率谱密度估计还要和一个小于或等于1的正比例因子相乘。
7.根据权利要求6的方法,其中所说比例因子是上述残余信号向量的功率谱密度估计的最大值的倒数值。
8.根据权利要求5、6、7的方法,其中所说的输入信号向量包括语音样本。
9.一种功率谱密度估计设备,包括装置(10),用于对输入信号向量进行LPC分析以确定出第一组LPC参数;装置(12),用于根据第一组LPC参数确定上述输入信号向量的第一功率谱密度估计;装置(14),用于通过由上述第一组LPC参数所确定的逆滤波器对上述输入信号向量进行滤波,以获得残余信号向量;装置(16),用于对上述残余信号向量进行LPC分析以确定出第二组LPC参数;装置(18)用于根据第二组LPC参数确定上述残余信号向量的第二功率谱密度估计;装置(20),用于产生上述输入信号向量的偏差补偿功率谱密度估计,该估计与第一种和第二种功率谱估计的乘积成比例。
10.一种功率谱密度估计设备,包括装置(10),用于对输入信号向量进行LPC分析,以确定出第一组LPC滤波器参数;装置(14),用于通过由上述LPC滤波器参数所确定的逆滤波器对输入信号进行滤波,以获得一残余信号向量;装置(16),用于对上述残余信号向量进行LPC分析,以确定出第二组LPC滤波器参数;装置(22),用于对上述第一组及第二组LPC滤波器参数进行卷积以产生一组补偿的LPC滤波器参数;装置(12’),用于根据上述一组补偿的LPC滤波器参数确定出上述输入信号向量的偏差补偿功率谱密度估计。
全文摘要
本文提出了一种基于残余误差的补偿器,它对自回归谱估计器的频域偏差进行补偿。对残余信号进行LPC分析(16),并由所获得的LPC参数产生参数PSD估计(18)。该残余信号的PSD估计与输入信号的PSD估计相乘(20)。
文档编号H03H21/00GK1188547SQ96194920
公开日1998年7月22日 申请日期1996年6月7日 优先权日1996年6月7日
发明者P·黑德尔 申请人:艾利森电话股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1