基于鲁棒自适应盲系统辨识的多通道时延估计方法与流程

文档序号:12467402阅读:544来源:国知局
本发明属于声源定位
技术领域
:,更为具体地讲,涉及一种基于鲁棒自适应盲系统辨识的多通道时延估计方法。
背景技术
::时延估计,其目的是利用传感器阵列采集的信号估计声源与阵列间的到达时间差,在免提语音通信的声源定位和跟踪中扮演着重要角色。众多学者对这一主题进行了广泛的研究、开发了许多时延估计方法,包括著名的广义互相关方法、基于盲通道辨识的方法、多通道线性预测方法、基于信息论的方法等。在时延估计方法中,文献“Y.HuangandJ.Benesty,“Aclassoffrequency-domainadaptiveapproachestoblindmultichannelidentification,”IEEETrans.SignalProcess.,vol.51,no.1,pp.11–24,Jan.2003.”和“J.Chen,Y.Huang,andJ.Benesty,“AnadaptiveblindSIMOidentificationapproachtojointmultichanneltimedelayestimation,”inProc.IEEEInt.Conf.Acoust.,Speech,SignalProcess.(ICASSP),2004,pp.IV-53–IV-56.”中所公开的基于归一化多通道频域最小均方(NMCFLMS)自适应盲辨识算法受到极大关注,该方法的核心思想是先对声源到各传声器间的通道脉冲响应进行盲辨识,接着比较不同通道脉冲响应直达成分的到达时间差来确定时延。经验证,该算法在混响环境下获得了良好的鲁棒性,然而,它对噪声非常敏感,容易受到噪声影响而降低性能。在文献“M.A.HaqueandM.K.Hasan,“Noiserobustmultichannelfrequency-domainLMSalgorithmsforblindchannelidentification,”IEEESignalProcess.Lett.,vol.15,pp.305–308,2008.”和“H.He,J.Chen,J.Benesty,andT.Yang,“Multichanneltimedelayestimationforacousticsourcelocalizationviarobustadaptiveblindsystemidentification,”inProc.Int.WorkshopAcoust.SignalEnhancement(IWAENC),2016,toappear.”中公开了一种鲁棒归一化多通道频域最小均方(RNMCFLMS)自适应算法中,对通道脉冲响应引入了一种平坦谱约束,对NMCFLMS算法进行了改进,提高了噪声环境下的时延估计性能,但强噪声环境下的时延估计鲁棒性仍然是一个极大的挑战。而在文献“H.He,J.Lu,J.Chen,X.Qiu,andJ.Benesty,“Robustblindidentificationofroomacousticchannelsinsymmetricalphastabledistributednoiseenvironments,”J.Acoust.Soc.Amer.,vol.136,no.8,pp.693–704,Aug.2014.”和“H.He,J.Chen,J.Benesty,andT.Yang,“Multichanneltimedelayestimationforacousticsourcelocalizationviarobustadaptiveblindsystemidentification,”inProc.Int.WorkshopAcoust.SignalEnhancement(IWAENC),2016,toappear.”中公开的另一种鲁棒归一化多通道频域最小平均M估计(RNMCFLMM)算法中,利用Huber估计器构造了一种鲁棒时域代价函数,由此导出的自适应滤波器应用于声通道盲辨识对时延进行估计,获得了对非高斯和高斯噪声的鲁棒性。然而,在低信噪比(SNR)环境下,语音的非平稳和有色特性仍然对时延估计精度产生不利影响。技术实现要素:本发明的目的在于克服现有技术的不足,提供一种基于鲁棒自适应盲系统辨识的多通道时延估计方法,使用Cauchy估计器定义新的频域代价函数,利用该估计器对语音信号的脉冲谱的鲁棒性降低自适应滤波器的失调,从而提升时延估计的性能。为实现上述发明目的,本发明基于鲁棒自适应盲系统辨识的多通道时延估计方法包括以下步骤:S1:初始化自适应滤波器系数其中为长度为L的系数列向量,k=1,2,…,M,设置自适应步长μf、遗忘因子λ、Cauchy估计器的参数c;S2:M个传声器分别对声信号进行持续采集,每个传声器将采集的时域信号以每L个样本为一帧进行保存,第i个传声器的第m帧时域信号记为xi,L(m)=[xi(mL-L)xi(mL-L+1)…xi(mL-1)]T,其中i=1,2,…,M,m=1,2,…;当第1帧样本采集并保存完毕后,每当完成一帧样本采集,则进入步骤S3;S3:根据每个传声器的第m帧、第m+1帧时域信号及其对应的自适应滤波器系数迭代计算得到第m+1帧时域信号对应的自适应滤波器系数其具体步骤包括:S3.1:计算自适应滤波器系数向量的傅里叶变换向量h‾^k10(m)=F2L×2Lh^kT(m)01×LT]]>其中,k=1,2,…,M,F2L×2L表示维度为2L×2L的傅里叶矩阵,01×L表示长度为L的所有元素为0的列向量;S3.2:计算时域信号的傅里叶变换向量xi,2L(m):xi,2L(m)=F2L×2Lxi,2L(m)其中,i=1,2,…,M,xi,2L(m)=[xi(mL-L)xi(mL-L+1)…xi(mL+L-1)]T;S3.3:按照以下步骤依次计算得到时域先验误差信号的傅里叶变换向量eik(m):e‾ik(m)=F2L×2L-1e‾‾ik(m)]]>eik(m)=0L×LIL×Le‾ik(m)]]>eik(m)=FL×Leik(m)=[eik(mL)eik(mL+1)…eik(mL+L-1)]T其中,⊙表示两个向量点乘,上标-1表示矩阵求逆,0L×L是维度为L×L的零矩阵,IL×L是维度为L×L的单位矩阵,FL×L是维度为L×L的傅里叶矩阵;S3.4:计算Cauchy估计器的一阶导数ρ′[|eik(n)|]:ρ′[|e‾ik(n)|]=c2|e‾ik(n)|c2+|e‾ik(n)|2,n=mL,mL+1,...,mL+L-1]]>S3.5:计算先验误差信号的Cauchy变换向量ψ[eik(m)]及其变换向量ψ01[eik(m)]:ψ‾[e‾ik(m)]=ρ′[|e‾ik(mL)|]exp{-1arg[e‾ik(mL)]}ρ′[|e‾ik(mL+1)|]exp{-1arg[e‾ik(mL+1)]}...ρ′[|e‾ik(mL+L-1)|]exp{-1arg[e‾ik(mL+L-1)]}]]>ψ‾01[e‾ik(m)]=G2L×L01ψ‾[e‾ik(m)]]]>其中,exp{·}表示以常数e为底的指数函数,arg{·}表示求辐角主值;S3.6:计算传声器采集的信号的谱矩阵Dxi(m)=diag{F2L×2Lxi,2L(m)}]]>S3.7:计算Cauchy估计器的二阶导数ρ″[|eik(n)|]:ρ′′[|e‾ik(n)|]=c2[c2-|e‾ik(n)|2][c2+|e‾ik(n)|2]2,n=mL,mL+1,...,mL+L-1]]>S3.8:计算加权系数φik(m):φik(m)=max{ηik(mL),ηik(mL+1),…ηik(mL+L-1)}其中:η‾ik(n)=ρ′′[|e‾ik(n)|]+ρ′[|e‾ik(n)|]|e‾ik(n)|,n=mL,mL+1,...,mL+L-1]]>S3.9:计算传声器采集的信号的加权功率谱矩阵Pk(m):Pk(m)=12Σi=1,i≠kMφik(m)Dxi*(m)Dxi(m)]]>S3.10:计算递推功率谱矩阵Qk(m):Qk(m)=λQk(m-1)+(1-λ)Pk(m)其中,λ表示遗忘因子,0<λ<1;S3.11:计算第m+1帧时域信号对应的自适应滤波器系数增长向量h^k10(m+1)=h^k10(m)-F2L×2L-1[μf▿JNF,k01(m)-μfβ(m)▿JSC,k10(m)]]]>其中:▿JNF,k01(m)=Qk-1(m)Σi=1MDxi*(m)ψ‾01[e‾ik(m)]]]>β(m)=|[▿JSC10(m)]H▿JNF01(m)||▿JSC10(m)||22|]]>▿JSC10(m)=[▿JSC,110(m)]T[▿JSC,210(m)]T...[▿JSC,M10(m)]TT]]>▿JNF01(m)=[▿JNF,101(m)]T[▿JNF,201(m)]T...[▿JNF,M01(m)]TT]]>其中,表示两个长度相同的向量按元素相除,12L×1表示长度为2L的所有元素为1的向量,|·|2表示按元素进行模的平方运算,||·||2表示对向量求二范数;S3.12:计算第m+1帧时域信号对应的自适应滤波器系数向量h^k(m+1)=IL×L0L×Lh^k10(m+1)]]>S4:根据自适应滤波器系数进行当前时刻的时延估计:τ^k,k′(m+1)=argmaxl|h^k,l(m+1)|-argmaxl|h^k′,l(m+1)|]]>其中,和分别表示和中的第l个元素,l=1,2,…,L。本发明基于鲁棒自适应盲系统辨识的多通道时延估计方法,初始化各传声器对应通道的自适应滤波器系数,然后各传声器分别对声信号进行采集并分帧保存,利用各传声器在同一时间段采集的信号帧进行多通道时延估计:首先由各传声器采集的时域信号与其前一帧时域信号、前一帧时域信号对应的自适应滤波器系数以及Cauchy估计器的一阶和二阶导数计算自适应滤波器系数的更新量,利用该更新量对前一次迭代获得的自适应滤波器系数进行更新,得到当前帧对应的自适应滤波器系数,然后根据计算得到的自适应滤波器系数进行时延估计。本发明使用Cauchy估计器定义一个频域代价函数,利用该估计器对具有脉冲谱特征的声源信号的鲁棒性以降低自适应滤波器的失调。经实验证明,对于具有脉冲谱特性的语音信号,本发明可以实现较为准确的多通道时延估计。附图说明图1是频域Cauchy估计器与二次函数的比较曲线图;图2是本发明基于鲁棒自适应盲系统辨识的多通道时延估计方法的流程图;图3是本发明和四种对比算法对通道1和通道2间的时延估计结果对比图;图4是本发明和四种对比算法对通道1和通道3间的时延估计结果对比图;图5是本发明和四种对比算法对通道2和通道3间的时延估计结果对比图。具体实施方式下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。为了更好说明本发明的技术方案,对鲁棒自适应盲系统辨识的原理进行推导说明。假设一个单输入多输出声系统由一个声源和M个传声器组成,则该系统有如下输入输出关系:xk(n)=s(n)*hk+vk(n),k=1,2,…,M(1)式中,xk(n)表示第k个传声器的输出信号,s(n)表示声源信号,*表示线性卷积,hk是一个有限冲击响应滤波器,代表声源到第k个传声器间的通道脉冲响应,vk(n)是对应第k个传声器的加性噪声。如果忽略(1)式中的加性噪声项,则可获得两个传声器采集的信号和通道脉冲响应之间具有如下关系:xi(n)*hj=s(n)*hi*hj=xj(n)*hi,i,j=1,2,...,M,i≠j---(2)]]>上式可写成向量形式:xiT(n)hj-xjT(n)hi=0---(3)]]>式中xi(n)表示第i个通道长度为L的观测信号向量:xi(n)=[xi(n)xi(n-1)…xi(n-L+1)]T(4)hi是第i个通道长度为L的脉冲响应向量:hi=[hi,0hi,1…hi,L-1]T(5)其中(·)T表示向量或矩阵的转置。当噪声存在或者脉冲响应的估计值偏离真实值时,(3)式不再等于零,于是在时刻n时通道i和通道j之间便产生一先验误差信号eij(n):eij(n)=xiT(n)h^j(n)-xjT(n)h^i(n)---(6)]]>式中是hi在时刻n的一个估计值,是hj在时刻n的一个估计值。该先验误差信号可用于定义一个代价函数,通过对代价函数最小化可获得脉冲响应的最优估计。本发明将先验误差信号eij(n)变换到频域,开发一种鲁棒自适应频域盲系统辨识算法。对于典型的声通道,其脉冲响应的幅度谱具有平坦性。然而,对于语音激励信号,其幅度谱具有明显的脉冲状特性。在低信噪比(SNR)环境,通常和不能精确估计,意味着不等于0。由此,强调了语音声源信号s(n)的脉冲谱在先验误差信号eij(n)的幅度谱中的存在。结果,语音信号中的脉冲谱在基于二次函数的频域代价函数中占据主导地位,这严重影响通道辨识的精确性和鲁棒性。为提高语音激励下的声通道辨识性能,本发明在频域定义一个新的递推最小二乘代价函数如下:J(m)=(1-λ)Σr=0mλm-rJρ(r)---(7)]]>式中m表示块序号,λ表示遗忘因子,0<λ<1,Jρ(r)的表达式为:Jρ(r)=Σi=1M-1Σj=i+1MΣn=rLrL+L-1ρ[|e‾ij(n)|]---(8)]]>其中,当r=m时,n=mL,mL+1,…,mL+L-1,eij(n)表示时域先验误差块信号的傅里叶变换频域分量,其傅里叶变换向量eij(m)定义为:eij(m)=[eij(mL)eij(mL+1)…eij(mL+L-1)]T(9)根据(6)式,(9)式可进一步表示成:e‾ij(m)=GL×2L01[Dxi(m)G2L×L10h^‾j(m)-Dxj(m)G2L×L10h^‾i(m)]---(10)]]>其中:Dxi(m)=diag{F2L×2Lxi,2L(m)}---(11)]]>Dxj(m)=diag{F2L×2Lxj,2L(m)}---(12)]]>xi,2L(m)=[xi(mL-L)xi(mL-L+1)…xi(mL+L-1)]T(13)xj,2L(m)=[xj(mL-L)xj(mL-L+1)…xj(mL+L-1)]T(14)GL×2L01=FL×L0L×LIL×LF2L×2L-1---(15)]]>G2L×L10=F2L×2LIL×L0L×LTFL×L-1---(16)]]>h‾^i(m)=FL×Lh^i(m)---(17)]]>h^‾j(m)=FL×Lh^j(m)---(18)]]>FL×L和分别是维度为L×L的傅里叶矩阵和逆傅里叶矩阵,0L×L是维度为L×L的零矩阵,IL×L是维度为L×L的单位矩阵,diag{·}表示由一个向量构成的对角矩阵,ρ[·]是一个鲁棒频域M估计器。上标01表示矩阵的构建过程中有乘矩阵[0L×LIL×L]的操作,上标10表示矩阵的构建过程中有乘矩阵[IL×L0L×L]T的操作。本发明使用Cauchy估计器作为M估计器,于是通道i和通道j间的Cauchy估计器可写作:ρ[|e‾ij(n)|]=c22log[1+(|e‾ij(n)|c)2]---(19)]]>式中,参数c是一个正常数。图1是频域Cauchy估计器与二次函数的比较曲线图。如图1所示,对于平坦的语音谱导致的较小的先验误差,这两种代价函数具有类似的变化率,使得两种代价函数对这种谱产生相似的自适应能力。对于脉冲语音谱导致的较大的先验误差,图1中二次代价函数对这种较大的先验误差进行平方,产生更大的误差,然而图1中的Cauchy估计器并不强调这个大的误差。本发明正是利用频域Cauchy估计器的这种鲁棒性来提高频域自适应滤波器的性能。本发明使用牛顿迭代法推导自适应滤波算法,那么基于(7)式的代价函数,可获得该最优化问题的递推解如下:h^‾k(m+1)=h^‾k(m)-2μ(1-λ)Sk-1(m)▿Jρ(m),k=1,2,...,M---(20)]]>Sk(m)=λSk(m-1)+(1-λ)▿▿HJρ(m)---(21)]]>式中μ表示自适应步长,λ表示遗忘因子,0<λ<1,是Jρ(m)关于的梯度,表示Jρ(m)对应的Hessian矩阵,(·)H表示向量或矩阵的共轭转置,(·)-1表示求逆矩阵。为了方便进一步推导,可将eij(n)的共轭表示成:e‾ij*(n)e‾ijH(m)un-mL+1=[h^‾jH(m)(G2L×L10)HDxiH(m)-h^‾iH(m)(G2L×L10)HDxjH(m)](GL×2L10)Hun-mL+1---(22)]]>式中un-mL+1是单位矩阵IL×L的第n-mL+1列,由于n=mL,mL+1,…,mL+L-1,那么n-mL+1=1,2,…,L,(·)*表示求共轭矩阵。于是,对的偏导数可推导为:∂∂h^‾k*(m)Σi=1M-1Σj=i+1Mρ[|e‾ij(n)|]=∂∂h^‾k*(m){Σi=1k-1ρ[|e‾ik(n)|]+Σj=i+1Mρ[|e‾kj(n)|]}=Σi=1k-1ρ′[|e‾ik(n)|]·∂|e‾ik(n)|∂e‾ik*(n)·∂e‾ik*(n)∂h^‾k*(m)+Σj=i+1Mρ′[|e‾kj(n)|]·∂|e‾kj(n)|∂e‾kj*(n)·∂e‾kj*(n)∂h^‾k*(m)=12Σi=1k-1GL×2L10Dxi*(m)G2L×L10un-mL+1ρ′[|e‾ik(n)|]exp{-1arg[e‾ik(n)]}-12Σj=i+1MGL×2L10Dxj*(m)G2L×L10un-mL+1ρ′[|e‾kj(n)|]exp{-1arg[e‾kj(n)]}=12Σi=1Mρ′[|e‾ik(n)|]exp{-1arg[|e‾ik(n)|]}GL×2L10Dxi*(m)G2L×L10un-mL+1---(23)]]>式中ρ′[·]是ρ[·]的一阶导数,exp{·}表示以常数e为底的指数函数,arg{·}表示求辐角主值,GL×2L10=FL×LIL×L0L×LF2L×2L-1---(24)]]>G2L×L01=F2L×2L0L×LIL×LTFL×L-1---(25)]]>F2L×2L和分别是维度为2L×2L的傅里叶矩阵和逆傅里叶矩阵。因此,Jρ(m)关于的梯度为:▿Jρ(m)=2∂Jρ(m)∂h^‾k*(m)=2Σi=1M-1Σj=i+1MΣn=mLmL+L-1∂ρ[|e‾ij(n)|]∂h^‾k*(m)=Σi=1MΣn=mLmL+L-1GL×2L10Dxi*(m)G2L×L01un-mL+1ρ′[|e‾ik(n)|]exp{-1arg[e‾ik(n)]}=Σi=1MGL×2L10Dxi*(m)G2L×L01ψ‾[e‾ik(n)]---(26)]]>式中ψ‾[e‾ik(m)]=ρ′[|e‾ik(mL)|]exp{-1arg[e‾ik(mL)]}ρ′[|e‾ik(mL+1)|]exp{-1arg[e‾ik(mL+1)]}...ρ′[|e‾ik(mL+L-1)|]exp{-1arg[e‾ik(mL+L-1)]}---(27)]]>接着,对于Hessian矩阵,可计算如下:▿▿HJρ(m)=2∂∂h‾^k*(m)[▿Jρ(m)]H=2∂∂h‾^k*(m){Σi=1,i≠kMψ‾H[e‾ik(m)]GL×2L01DxiG2L×L10}=2Σi=1,i≠kM∂ψ‾H[e‾ik(m)]∂h‾^k*(m)GL×2L01DxiG2L×L10---(28)]]>可以推导得到:∂∂h^‾k*(m){ρ′[|e‾ik(n)|]exp{-1arg[e‾ik(n)]}}*=∂{ρ′[|e‾ik(n)|]exp{--1arg[e‾ik(n)]}}∂e‾ik*(n)·∂e‾ik*(n)∂h^‾k*(m)={ρ′′[|e‾ik(n)|]∂|e‾ik(n)|∂e‾ik*(n)exp{--1arg[e‾ik(n)]}+ρ′[|e‾ik(n)|]∂{exp{-1arg[e‾ik(n)]}}∂e‾ik*(n)}·∂e‾ik*(n)∂h^‾k*(m)=12η‾ik(n)∂e‾ik*(n)∂h^‾k*(m)---(29)]]>式中,ρ″[·]是ρ[·]的二阶导数,η‾ik(n)=ρ′′[|e‾ik(n)|]+ρ′[|e‾ik(n)|]|e‾ik(n)|---(30)]]>并由此推导得到∂ψ‾H[e‾ik(m)]∂h^k*(m)=12η‾ik(mL)∂e‾ik*(mL)∂h^k*(m)η‾ik(mL+1)∂e‾ik*(mL+1)∂h^k*(m)...η‾ik(mL+L-1)∂e‾ik*(mL+L-1)∂h^k*(m)=12η‾ik(mL)GL×2L10Dxi*(m)G2L×L10u1η‾ik(mL+1)GL×2L10Dxi*(m)G2L×L01u2...η‾ik(mL+L-1)GL×2L10Dxi*(m)G2L×L01uL=12GL×2L10Dxi*(m)G2L×L01Tik(m)---(31)]]>式中Tik(m)=diag{ηik(mL)ηik(mL+1)…ηik(mL+L-1)}(32)将(31)代入(28)可得:▿▿HJρ(m)=GL×2L10Pk(m)G2L×L10---(33)]]>式中Pk(m)表示传声器采集的信号的加权功率谱矩阵:Pk(m)=Σi=1,i≠kMDxi*(m)G2L×L01Tik(m)GL×2L01Dxi(m)---(34)]]>根据(21)式可以计算得到:Sk(m)=λSk(m-1)+(1-λ)▿▿HJρ(m)=λ(1-λ)Σi=0m-1λm-1-i▿▿HJρ(i)+(1-λ)▿▿HJρ(m)=(1-λ)Σi=0m-1λm-i▿▿HJρ(i)---(35)]]>将(33)代入(35)可得:Sk(m)=(1-λ)Σi=0mλm-iGL×2L10Pk(i)G2L×L10=GL×2L10Qk(m)G2L×L10---(36)]]>式中Qk(m)表示递推功率谱矩阵:Qk(m)=(1-λ)Σi=0mλm-iPk(i)=λQk(m-1)+(1-λ)Pk(m)---(37)]]>将(26)和(36)代入(20),并在等式两端左乘可获得多通道频域自适应滤波器的更新方程如下:G2L×L10h^‾k(m+1)=G2L×L10h^‾k(m)-2μ(1-λ)G2L×L10[GL×2L10Qk(m)G2L×L10]-1×Σi=1MG2L×L10Dxi*(m)G2L×L01ψ‾[eik(m)],k=1,2,...,M---(38)]]>根据如下等式关系:D2L×L10[DL×2L10Qk(m)D2L×L10]-1DL×2L10=D2L×2L10Qk-1(m)---(39)]]>式中:G2L×2L10=G2L×L10GL×2L10=F2L×2LIL×L0L×L0L×L0L×LF2L×2L-1---(40)]]>可获得简化的更新方程:h‾^k10(m+1)=h‾^k10(m)-μfQk-1(m)Σi=1MDxi*(m)ψ‾01[e‾ik(m)],k=1,2,...,M---(41)]]>式中μf=μ/2是新的自适应步长,h‾^k10(m)=G2L×L10h‾^k(m)---(42)]]>ψ‾01[e‾ik(m)]=G2L×L01ψ‾[e‾ik(m)]---(43)]]>当L较大时,可将(32)式近似表示成:Tik(m)≈φik(m)IL×L(44)式中φik(m)表示加权系数:φik(m)=max{ηik(mL),ηik(mL+1),…ηik(mL+L-1)}(45)注意到G2L×L01Tik(m)GL×2L01=φik(m)G2L×2L01≈12φik(m)I2L×2L---(46)]]>式中G2L×2L01=F2L×2L0L×L0L×L0L×LIL×LF2L×2L-1---(47)]]>于是,(34)式的矩阵Pk(m)可简化成:Pk(m)=12Σi=1,i≠kMφik(m)Dxi*(m)Dxi(m)---(48)]]>据上式可知,矩阵Pk(m)化简成一个对角阵,这大大降低了对Pk(m)求逆的计算复杂度。类似于鲁棒归一化多通道频域最小均方(RNMCFLMS)自适应算法,为了利用声通道脉冲响应幅度谱的平坦性,本发明引入一个谱约束到上述算法。因此本发明最终使用的鲁棒自适应滤波算法如下:h‾^k10(m+1)=h‾^k10(m)-μf▿JNF,k01(m)+μfβ(m)▿JSC,k10(m),k=1,2,...,M---(49)]]>式中▿JNF,k01(m)=Qk-1(m)Σi=1MDxi*(m)ψ‾01[e‾ik(m)]---(50)]]>β(m)=|[▿JSC10(m)]H▿JNF01(m)||▿JSC10(m)||22|---(52)]]>▿JSC10(m)=[▿JSC,110(m)]T[▿JSC,210(m)]T...[▿JSC,M10(m)]TT---(53)]]>▿JNF01(m)=[▿JNF,101(m)]T[▿JNF,201(m)]T...[▿JNF,M01(m)]TT---(54)]]>表示两个长度相同的向量按元素相除,12L×1表示长度为2L的所有元素为1的向量,|·|2表示按元素进行模的平方运算,||·||2表示对向量求二范数。根据以上推导过程,可以得到本发明基于鲁棒自适应盲系统辨识的多通道时延估计方法的具体实现过程。图2是本发明基于鲁棒自适应盲系统辨识的多通道时延估计方法的流程图。如图2所示,本发明基于鲁棒自适应盲系统辨识的多通道时延估计方法的具体步骤包括:S201:初始化参数:初始化自适应滤波器系数其中是对应通道k长度为L的滤波器系数列向量的初始值,k=1,2,…,M,设置自适应步长μf、遗忘因子λ、Cauchy估计器的参数c。本实施例中设置μf=0.8,Cauchy估计器的参数c=5.0。S202:信号采集:M个传声器分别对声源信号进行持续采集,每个传声器将采集的时域信号以每L个样本为一帧进行保存,第i个传声器的第m帧时域信号记为xi,L(m)=[xi(mL-L)xi(mL-L+1)…xi(mL-1)]T,其中i=1,2,…,M,m=1,2,…;当第1帧样本采集并保存完毕后,每当完成一帧样本采集,则进入步骤S203。也就是说,当m=2,3,…时,才能进行时延估计。S203:迭代更新自适应滤波器系数:根据每个传声器的第m帧、第m+1帧时域信号及其对应的自适应滤波器系数迭代计算得到第m+1帧时域信号对应的自适应滤波器系数根据之前的理论推导过程,其具体步骤包括:S3.1:计算自适应滤波器系数向量的傅里叶变换向量h‾^k10(m)=F2L×2Lh^kT(m)01×LT---(55)]]>其中,k=1,2,…,M,F2L×2L表示维度为2L×2L的傅里叶矩阵,01×L表示长度为L的所有元素为0的列向量。S3.2:计算传声器采集的时域信号的傅里叶变换向量xi,2L(m):xi,2L(m)=F2L×2Lxi,2L(m)(56)其中,i=1,2,…,M,xi,2L(m)=[xi(mL-L)xi(mL-L+1)…xi(mL+L-1)]T,显然xi,2L(m)是由第m帧、第m+1帧时域信号拼接而成。S3.3:计算时域先验误差信号的傅里叶变换向量eik(m):e‾ik(m)=F2L×2L-1e‾‾ik(m)---(58)]]>eik(m)=0L×LIL×Le‾ik(m)---(59)]]>eik(m)=FL×Leik(m)=[eik(mL)eik(mL+1)…eik(mL+L-1)]T(60)其中,⊙表示两个向量点乘,上标-1表示矩阵求逆,0L×L是维度为L×L的零矩阵,IL×L是维度为L×L的单位矩阵,FL×L是维度为L×L的傅里叶矩阵。S3.4:计算Cauchy估计器的一阶导数ρ′[|eik(n)|]:ρ′[|e‾ik(n)|]=c2|e‾ik(n)|c2+|e‾ik(n)|2,n=mL,mL+1,...,mL+L-1---(61)]]>S3.5:计算先验误差的Cauchy变换向量ψ[eik(m)]及其变换向量ψ01[eik(m)]:ψ‾[e‾ik(m)]=ρ′[|e‾ik(mL)|]exp{-1arg[e‾ik(mL)]}ρ′[|e‾ik(mL+1)|]exp{-1arg[e‾ik(mL+1)]}...ρ′[|e‾ik(mL+L-1)|]exp{-1arg[e‾ik(mL+L-1)]}---(62)]]>ψ‾01[e‾ik(m)]=G2L×L01ψ‾[e‾ik(m)]---(63)]]>其中,exp{·}表示以常数e为底的指数函数,arg{·}表示求辐角主值。S3.6:计算传声器采集的信号的谱矩阵Dxi(m)=diag{F2L×2Lxi,2L(m)}---(64)]]>S3.7:计算Cauchy估计器的二阶导数ρ″[|eik(n)|]:ρ′′[|e‾ik(n)|]=c2[c2-|e‾ik(n)|2][c2+|e‾ik(n)|2]2,n=mL,mL+1,...,mL+L-1---(65)]]>S3.8:计算加权系数φik(m):φik(m)=max{ηik(mL),ηik(mL+1),…ηik(mL+L-1)}(66)其中:η‾ik(n)=ρ′[|e‾ik(n)|]+ρ′[|e‾ik(n)|]|e‾ik(n)|,n=mL,mL+1,...,mL+L-1---(67)]]>S3.9:计算传声器采集的信号的加权功率谱矩阵Pk(m):Pk(m)=12Σi=1,i≠kMφik(m)Dxi*(m)Dxi(m)---(68)]]>S3.10:计算递推功率谱矩阵Qk(m):Qk(m)=λQk(m-1)+(1-λ)Pk(m)(69)其中,λ表示遗忘因子,0<λ<1。S3.11:计算第m+1帧时域信号对应的自适应滤波器系数增长向量将式(49)的等号两侧分别乘以即可得到如下计算公式:h^k10(m+1)=h^k10(m)-F2L×2L-1[μf▿JNF,k01(m)-μfβ(m)▿JSC,k10(m)]---(70)]]>S3.12:计算第m+1帧时域信号对应的自适应滤波器系数向量h^k(m+1)=IL×L0L×Lh^k10(m+1)---(71)]]>S204:时延估计:通过步骤S203实现对声源到各传声器间的通道脉冲响应进行自适应盲辨识后,则可通过比较不同通道脉冲响应直达成分间的到达时间差确定相对时延。因此,得到第m+1帧时域信号所对应时刻任意两个不同通道k,k′间的时延估计如下:τ^k,k′(m+1)=argmaxl|h^k,l(m+1)|-argmaxl|h^k′,l(m+1)|---(72)]]>其中,和分别表示和中的第l个元素,l=1,2,…,L。实施例为了说明本发明的技术效果,采用一个具体的实例对本发明进行实验验证,并将其实验效果与四种对比算法进行对比,四种对比算法分别为:经典的广义互相关-相位变换法(GCC-PHAT)(参见文献“Y.Huang,J.Benesty,andJ.Chen,AcousticMIMOSignalProcessing.Berlin,Germany:Springer,2006.”),归一化多通道频域LMS算法(NMCFLMS)(参见文献“J.Chen,Y.Huang,andJ.Benesty,“AnadaptiveblindSIMOidentificationapproachtojointmultichanneltimedelayestimation,”inProc.IEEEInt.Conf.Acoust.,Speech,SignalProcess.(ICASSP),2004,pp.IV-53–IV-56.”),鲁棒归一化多通道频域LMS算法(RNMCFLMS)(参见文献“M.A.HaqueandM.K.Hasan,“Noiserobustmultichannelfrequency-domainLMSalgorithmsforblindchannelidentification,”IEEESignalProcess.Lett.,vol.15,pp.305–308,2008.”)和鲁棒归一化多通道频域最小平均M估计算法(RNMCFLMM)(参见文献“H.He,J.Chen,J.Benesty,andT.Yang,“Multichanneltimedelayestimationforacousticsourcelocalizationviarobustadaptiveblindsystemidentification,”inProc.Int.WorkshopAcoust.SignalEnhancement(IWAENC),2016,toappear.”)。本次实验验证采用美国贝尔实验室可控混响室的测试数据对算法进行验证。该混响室长6.7m宽6.1m高2.9m。为方便表示,选择该室地面西北角作为坐标原点。使用三个全指向传声器构成的等距线性阵列采集声信号。这三个传声器的位置坐标分别为(2.437m,0.500m,1.400m),(3.137m,0.500m,1.400m),(3.837m,0.500m,1.400m)。声源位于(0.337m,3.938m,1.600m)。在打开可控混响室墙壁89%的嵌板情况下(对应的混响时间为280ms),以48kHz的采样率测量声源与传声器间的声通道传递函数。对获得的脉冲响应以16kHz采样率对其进行降采样,并截取前1024个点作为多通道盲辨识实验中声通道的真实脉冲响应。即本实施例中每帧样本长度L=1024。声源信号是采样率为16kHz长度为1分钟的语音信号,前半段是男声语音,后半段是女声语音。将声源信号和测量的通道脉冲响应相卷积,在其基础上加入给定信噪比(SNR)条件下的白高斯噪声,以获得多通道系统的输出。在实验中,相关的参数设置和文献“H.He,J.Lu,J.Chen,X.Qiu,andJ.Benesty,“Robustblindidentificationofroomacousticchannelsinsymmetricalphastabledistributednoiseenvironments,”J.Acoust.Soc.Amer.,vol.136,no.8,pp.693–704,Aug.2014.”中的相同。实验中,对传声器每拾取长度为64ms的一帧信号进行一次时延估计。使用两种性能测试准则,即畸变估计的概率和非畸变估计的根均方误差评价所提算法的性能(有关这两种准则的定义和方法参见文献“H.He,L.Wu,J.Lu,X.Qiu,andJ.Chen,“Timedifferenceofarrivalestimationexploitingmultichannelspatio-temporalprediction,”IEEETrans.AudioSpeechLang.Process.,vol.21,pp.463-475,Mar.2013.”,“J.P.Ianniello,“Timedelayestimationviacross-correlationinthepresenceoflargeestimationerrors,”IEEETrans.Acoust.,Speech,SignalProcess.,vol.ASSP-30,pp.998-1003,Dec.1982.”和“B.Champagne,S.Bedard,andA.Stephenne,“Performanceoftime-delayestimationinthepresenceofroomreverberation,”IEEETrans.SpeechAudioProcess.,vol.4,pp.148-152,Mar.1996.”)。声源到三个不同传声器对的真实时延分别是τ1,2=19个样本间隔,τ1,3=42个样本间隔,τ2,3=23个样本间隔。图3是本发明和四种对比算法对通道1和通道2间的时延估计结果对比图;图4是本发明和四种对比算法对通道1和通道3间的时延估计结果对比图;图5是本发明和四种对比算法对通道2和通道3间的时延估计结果对比图。从这三幅图可以看出,在噪声和混响环境,NMCFLMS算法优于经典的GCC-PHAT算法,这是由于NMCFLMS算法能盲辨识声通道的直达成分。尽管RNMCFLMS算法引入一个声通道脉冲响应的谱能量约束改善了NMCFLMS在噪声环境下对系统盲辨识的性能,但该算法用于时延估计时未展现明显的鲁棒性。RNMCFLMM算法的时延估计性能优于上述三种算法,这是因为该算法在时域使用Huber估计器定义了一个代价函数,由此产生的自适应滤波器在均方误差准则和平均绝对值误差准则间交替运行,对脉冲样本具有识别能力。然而,在这五种时延估计算法中,本发明获得了最好的性能,尤其是在强噪声环境。这种优越性来自于如下事实:对于一帧语音信号的脉冲谱,所提鲁棒频域自适应滤波算法能有效地利用频域Cauchy估计器对这种脉冲谱的免疫性;同时,对于同一帧语音信号的平坦谱,本发明具有与基于二次代价函数的频域自适应滤波器相似的自适应能力。尽管上面对本发明说明性的具体实施方式进行了描述,以便于本
技术领域
:的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本
技术领域
:的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1