不稳定信号的改进型仿射投影算法的制作方法

文档序号:7597708阅读:172来源:国知局
专利名称:不稳定信号的改进型仿射投影算法的制作方法
技术领域
本发明涉及数字信号处理,特别是,涉及一种诸如语音信号的不稳定信号的处理方法,例如,用于扬声器电话技术中的回音消除。
背景技术


图1示出了典型的回音消除应用。发送的语音或者信号被反馈到接收端,成为对输入语音的回音。回音反射或者由阻抗失配(如网络应用中的阻抗失配)造成或者由声音应用中室内反射造成。回音将使输入信号和语音失真。
在电话应用中,回音是打电话的人非常烦恼的事。自适应算法总是被用来监视回音路径和它的变化,以便可以由线性滤波器复制它,然后从输入信号中减去它。对于电话应用,语音信号是不稳定信号并且具有非常大的动态范围。一种自适应算法被称之为仿射投影算法(APA),K.Ozeki和T.Umeda在日本电子和通信,Vol.67-A,No.5,1984上公开了“利用对仿射子空间的正交投影和其性质的自适应滤波算法”。这是一代公知的标准化最小均方(NLMS)自适应算法。它具有比LMS算法快得多的收敛速率并且其快速实施具有与LMS算法相似的计算复杂性。
LMS算法可以被看作投影阶为1的APA的特定情况。随着投影阶的增加,APA开始显示收敛速度的急剧增加。当投影阶超过5时,收敛速度的增加仅仅显示略微改进。当投影阶增加到滤波器尺寸的阶数,APA变成递归最小平方算法(RLS)。APA是非常有吸引力的算法,具有与LMS相同的复杂性但是却能够实现RLS性能。一般来说,收敛速度随投影阶加倍而加倍。
原始APA需要比NLMS算法更多的数据存储器,其复杂性等同于NLMS算法的N倍(这里,N是投影的阶数)。然而,由于信息和数据重新使用的原因,许多计算过程可以被节省和重用。这是快速仿射投影(FAP)算法的基本思想。然而,APA包含第N阶逆矩阵。这里存在适用于逆矩阵的不同方法,该逆矩阵用不同性能、复杂性和可靠性区别各种算法。最重要的问题是,无论采用何种方法,都存在大的逆矩阵的不稳定问题,特别是其快速操作和有限精确实施造成的不稳定的问题。奇异值分解(J.Cioffi和T.Kailath,“窗式快速横动过滤器标准化自适应算法”,IEEE Trans.on ASSP,Vol.ASSP-33,No.3,June1985)是逆矩阵的最稳定实施,它唯一问题是计算复杂性。
当处理大矩阵时,总是存在奇异性问题。利用有限精确和固定点实施,奇异矩阵的逆向将使整个系统非常不稳定,因为最小本征值支配整个逆矩阵。在APA或者FAP算法中,乘小常数的单位矩阵与逆矩阵相加,所以该矩阵决不会成为奇异的。然而,该常数将造成自适应系统的性能恶化。如果该常数太大,则性能严重恶化,并且如果该常数太小,则不可能保持系统稳定性,除非在回音消除中利用更高的数据精度。
发明概述本发明提供了一种处理不稳定数据的方法,包括对所述不稳定信号应用建立逆矩阵的自适应回音消除算法;和根据所述信号特征自适应地调整所述矩阵的条件。
自适应回音消除算法可以是仿射投影算法,该算法包含一个在所述逆矩阵中避免数值不稳定性的因子γ。在该情况下,因子γ可自适应地调整。
本发明的该方法使算法更加稳定并且更加能够跟踪具有不稳定性质的语音信号。该方法还稳定用于较高阶实施的算法。
该新的方法还可以应用于需要逆矩阵的其它自适应回音消除算法,比如PNLMS(成比例的标准化最小均方)算法。该方法还可以应用于具有接近1的忽略因子α的FAP算法。
根据本发明的方法,APA可以用于自适应地跟踪回音路径的变化,然后从输入信号中消除回音。
例如,本发明的新方法可以在数字信号处理器中实施。
试验结果表明有了自适应矩阵条件,回音消除类似于利用低阶APA的奇异值分解的回音消除,并且比常数方案好得多。对于高阶APA,自适应矩阵条件方案优于奇异值分解。
附图简要说明下面将参考附图通过实例,详细说明本发明。
图1示出了现有技术的回音消除电路;图2示出本发明第一实施例的回音消除器的实际实施的电路图;图3是图2所示的实施的简化版本(简图);
图4示出了本发明第二实施例的回音消除器的实际实施的电路图;图5示出了仿真回音语音信号和回音路径;图6示出了不同算法的收敛比较;图7示出了具有高阶APA的实例;图8示出了具有其回音路径的仿真CSS(合成源信号)回音;图9示出了投影维数N=4的回音消除性能比较;和图10示出了投影维数N=50的回音消除性能比较。
发明详细说明现有技术的仿射投影算法(APA)可以被归纳为以下情况初始化x(0)=w(0)=
T是理想的输出。
w(k)=[w0(k),w1(k),...,wL-1(k)]T是加权向量。
X(k)=[x(k),x(k-1),...,x(k-N)]x(k)=[x(k),x(k-1),...,x(k-L)]T以及x(k)是常数k的参考信号。
0≤μ≤2是收敛步长,它起到与LMS算法中相同的控制作用。γ是避免逆矩阵中数值不稳定性的小常数。在正常情况下,γ被选择为低于XT(k)X(k)的对角元素的峰值的30dB,或γ=max(x(k)*x(k)*L/1000。对于具有大振幅变换的不稳定信号诸如语音信号,γ的选择影响自适应收敛速率和最终残余误差。
详细的FAP算法在S.L.Gay和S.Tavathia的“快速仿射投影算法”(ICASSP’95 Proceedings,pp.3023-3026)和H.Ding的“适合于低成本处理器的稳定快速仿射自适应算法”(ICASSP 2000,Turkey,pp.360-363)中公开。在公式推导中,在近似快速残余回音向量计算中使用了一个假设e‾(k)≈e(k)(1-μ)e‾‾(k-1)]]>(其中,e(k-1)是向量e(k-1))的上行N-1元素。只有当以下条件满足γ<<λi,k-1,其中λi,k-1是矩阵XT(k-1)X(k-1)的第i本征向量。通常,如果γ太大,则FAP性能将受到影响,如果γ太小,则逆矩阵可能变得不稳定,尤其对于有限精确实施。
由于γ选择影响APA和FAP性能和稳定性,根据本发明的原理,可以根据信号特征自适应地调整γ的值。下面说明两个实施例。
第一实施例γ的值被设置为低于最后N信号组的平均功率的30dB。换言之,γ被设置为低于矩阵XT(k)X(k)的平均对角元素的30dB。公式可以被写作γ=11000NΣdiag(X‾T(k)X‾(k))]]>这将确保最大本征扩展将是1000N。为了避免变成零或者接近零,在此情况下,本征扩展是不确定的(0/0),上述公式可以被修改为γ=max(11000NΣdiag(X‾T(k)X‾(k)),c)]]>其中c是信号表示法中的代表最小精度的常数。对于固定点表示法,我们可以选择c=1,或者略大于1。有了XT(k)的定义,上式的主要成份可以被写为Σdiag(X‾T(k)X‾(k)=Σi=k-NkR(0,i)]]>其中R(0,k)=Σi=0Lx(k-i)x(k-i)]]>R(0,k)与R(0,k-1)之间的关系为R(0,k)=R(0,K-1)+x(k)x(k)-x(k-L-1)x(k-L-1)并且迭代关系为∑diag(XT(k)X(k))=∑diag(XT(k-1)X(k-1))+R(0,k)-R(0,k-N-1)这将提供如图2所示的实施图。输入信号x(k)在乘法器10中被自乘,并且经过延迟单元12送给加法器14,然后从加法器14送到延迟单元20和加法器30的输入。
延迟单元20的输出被馈入加法器22中与乘法器10的输出相加,并馈入到加法器14。
延迟单元20的输出经过延迟单元24,在加法器26中与延迟单元28的输出相加,该延迟单元28接收来自加法器30的输入。
加法器30的输出还馈入到乘法器16,乘法器16接收其它输入1/1000N,然后馈入到最大化单元18。最大化单元18的其它输入是常数c。单元18的输出是自适应调整的因子γ。
在大多数情况下,L>>N并且矩阵XT(k)X(k)的对角元素在抽样过程中将没有大的变化。因此,作为简化版本,γ可以被选择为γ=max(11000Σi=0Lx(k-i)x(k-i),c)]]>它提供了如图3所示的非常简化的实施。
第二实施例该实施例使用以估算的信号功率R(0)为基础,并且把γ选作低于该值的30dB。估算值R(0)为R(0)=αR(0)+(1-α)Σi=0Lx(k-i)x(k-i)]]>其中0≤α≤1是遗忘因子。γ按下列计算为γ=max(11000R(0),14000Σi=0Lx(k-i)x(k-i),c)]]>其中以上述相同方式定义c,并且当x(k)正好开始变成有意义输出时,使用第二项控制初始值。
图4示出了该实施例的实际实施。加法器14的输出被馈入到减法器40,该减法器40具有接收延迟单元42输出的一个输入。
加法器40的输出被馈入乘法器44,乘法器44的输出被馈入到加法器46的输入。
加法器14的输出还被馈入到乘法器50的输入,乘法器50的输出被馈入到最大化单元18的输入。最大化单元18的第三输入接收乘法器48的输出,乘法器48从加法器46的输出接收一个输入并且接收代表常数的另一个输入。
图5示出了仿真回音语音信号和回音路径,图6示出了具有基于APA算法的具有N=4不同算法之间的收敛比较。
第二实施例适用于修正的APA算法(仿真显示第一和第二实施例执行非常类似的算法)。从图6可以看到,APA算法仅仅优于LMS算法,而修正的APA性能则具有非常快的收敛速率和更好的ERLE。基于自适应矩阵条件估算修正的APA具有与基于SVD的APA相似的回音消除性能。但是SVD实施是非常复杂的,并且实施非常昂贵。
图7示出了具有高阶APA的实例。再一次显示常规APA算法仅仅优于LMS算法,而修正的APA具有非常快的收敛速率,并且具有比其它的更好的ERLE。
图8显示了仿真的CSS(合成源信号)回音与其回音路径。CSS信号是按ITU-T标准检验回音消除性能的伪语音信号。
图9和图10分别显示了投影维数N=4和50的回音消除性能比较。由于CSS信号具有几乎恒定的振幅,因此常规APA性能优于LMS算法。对于N=4,所有三个基于APA算法的性能非常相似。这告诉我们具有常数矩阵条件值γ的APA对稳定振幅的信号具有非常好的性能,并且基于自适应矩阵条件估算修正的APA优于具有高阶投影的其它算法。
诸如以下文件中公开的PNLMS(成比例标准化最小均方)算法S.Gay的“用于网络回音消除的有效快速收敛自适应滤波器”(Proc,Asilomar Conference on Signals,Systems and Computers,Pacific Grove,CA,1998);T.Ganaler,S.L.Gay,M.M.Sondhi和J.Benesty的“用于网络回音消除的双方同时发话强快速收敛算法”(IEEE Trans.onSpeech and Audio pROCESSING,Vol.8,No.6,Nov.2000.pp.656-663);和D.L.Duttweiler的“回音消除器中的成比例标准化最小均方自适应”(IEEE Trans.on Speech and Audio Processing,Vol8,No.5,Sept.2000.pp.508-518),这些论文所建议的方案可适用于需要逆矩阵的其它自适应回音消除算法。
当本发明应用于FAP算法时,可以实现类似的性能改进。然而,遗忘因子α应当接近1,所以γ仅仅缓慢变化。这是因为FAP使用迭代方法建立逆矩阵,并且具有正在变化的γ的矩阵的任何动态变化将影响逆矩阵的稳定性。
这里作为参考引用上述所有内容。
权利要求
1.一种处理不稳定信号的方法,所述方法包括把建立逆矩阵的自适应回音算法应用于所述的不稳定信号;和根据所述信号的特征自适应地调整所述矩阵的条件。
2.根据权利要求1所述的方法,其中所述自适应回音消除算法是包括在所述逆矩阵中避免数值不稳定性而设置的因子γ的仿射投影算法;并且,根据所述信号特征自适应地调整所述因子γ。
3.根据权利要求2所述的方法,其中所述算法是快速仿射投影算法。
4.根据权利要求1所述的方法,其中所述算法是成比例标准化最小均方(LMS)算法。
5.根据权利要求1所述的方法,其中以低于信号成份的最后N组平均功率的固定值设置所述因子γ。
6.根据权利要求5所述的方法,其中所述固定值是30dB。
7.根据权利要求6所述的方法,其中所述因子γ由以下关系式定义r=max(11000NΣdiag(X‾T(k)X‾(k),c)]]>
8.根据权利要求1所述的方法,其中所述因子γ被选择为具有低于估算信号功率的固定值。
9.根据权利要求8所述的方法,其中所述固定值是低于所述估算值的30dB。
10.根据权利要求9所述的方法,其中所述γ由以下关系式定义r=max(11000R(0),14000Σi=0Lx(k-i)x(k-i),c)]]>
11.一种处理不稳定信号的信号处理设备,所述设备包括一个自适应滤波器,对所述不稳定信号使用建立逆矩阵的自适应回音算法;和一个控制单元,用于根据所述信号的特征自适应地调整所述矩阵的条件。
12.根据权利要求11所述的信号处理设备,其中所述自适应回音消除算法是包括在所述逆矩阵中避免数值不稳定性而设置的因子γ的仿射投影算法;并根据所述信号特征自适应地调整所述因子γ。
13.根据权利要求12所述的信号处理设备,其中所述算法是快速仿射投影算法。
14.根据权利要求11所述的信号处理设备,其中所述算法是成比例标准化最小均方(LMS)算法。
15.根据权利要求11所述的信号处理设备,其中以低于信号成份的最后N组平均功率的固定值设置所述因子γ。
16.根据权利要求15所述的信号处理设备,其中所述因子γ由以下关系式定义r=max(11000NΣdiag(X‾T(k)X‾(k),c)]]>
17.根据权利要求11所述的信号处理设备,其中所述因子γ被选择为具有低于估算信号功率的固定值。
18.根据权利要求17所述的方法,其中所述γ由以下关系式定义r=max(11000R(0),14000Σi=0Lx(k-i)x(k-i),c))]]>
19.根据权利要求15所述的信号处理设备,包括多个延迟单元、加法器和乘法器,以及一个产生代表γ的输出的最大化单元,γ是两个输入的最大值,第一所述输入得自于所述多个延迟单元、加法器和乘法器,第二所述输入代表一个常数。
20.根据权利要求15所述的信号处理设备,还包括第一输入,用于接收第一输入信号x(k);第一延迟单元,用于接收所述第一输入信号;第二延迟单元,用于接收所述第一延迟单元的一个输出,该输出与所述输入信号和所述第二延迟单元一个输出之和相加;以及最大化单元,具有第一和第二输入,所述最大化单元的所述第一输入接收常数,所述最大化单元的所述第二输入接收从输入到所述第二延迟单元的一个输入。
全文摘要
本发明涉及一种用于处理不稳定信号的仿射投影算法或者类似算法,所述仿射投影算法建立逆矩阵,并且包括在逆矩阵中避免数值不稳定性的因子γ,所述因子γ根据信号的特征自适应地调整。
文档编号H04M9/08GK1607740SQ20041008014
公开日2005年4月20日 申请日期2004年9月24日 优先权日2003年9月24日
发明者靳取 申请人:卓联半导体股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1