一种双端发音鲁棒结构及其消除声学回声的方法

文档序号：7851675阅读：291来源：国知局

专利名称：一种双端发音鲁棒结构及其消除声学回声的方法
技术领域：
本发明属于移动通信语音增强技术领域，特别涉及一种移动通信系统中声学回声消除的装置及方法，具体的说，是ー种双端发音鲁棒结构及其消除声学回声的方法。
背景技术：
声学回声是指近端扬声器播放的远端语音被近端麦克风采集后又传输到远端，使得远端用户听到自己之前说话的声音。声学回声的存在严重干扰了通信质量。声学回声消除器是解决这ー问题的有效途径。因此，在移动通信系统中，回声消除器是必不可少的组成部分。为了使语音信号不受声学回声干扰，回声消除器在单端发音(single talk, ST)的情况下，加权的终端耦合损耗至少要达到46dB ;而在双端发音(double talk, DT)的情况下要大于26dB。回声消除器的原理是以远端语音作为參考信号，通过自适应滤波器来逼近从扬声器到麦克风的耦合回声路径，得到近似的回声信号，并从近端信号中减去这部分估计的回声。理想的回声消除器在保证低失配值(mi sal i gnment)的前提下，应该具有快速收敛和跟踪(应对回声路径的时变特性)能力。这两个特性都取决于滤波器所采用的自适应算法。在ST情况下，现有的自适应算法都能得到满意的回声消除效果。在DT情况下，由于受近端语音的干扰，这些自适应算法将会发散，偏离实际的回声信道，使得回声消除的性能急剧恶化。根据统计结果，在一次通话过程中，DT发生的时间约占20%左右。因此DT时回声消除器的性能很重要。常用的解决方案是引入双端发音检测器(double talk detector, DTD)。当DTD检测到双端发音吋，自适应滤波器停止更新。这种解决方案的缺点是，在DTD检测到双端发音时滤波器可能已经发散。针对这ー问题，人们提出了各种变步长自适应算法。其思路是根据远、近端的语音特性，自动调节自适应滤波器的更新步长，ST时步长较大，DT时步长较小。但是这些变步长方法在ST和回声路径发生变化时收敛速度会受到影响。

发明内容
本发明所要解决的技术问题是针对现有技术的现状，提供一种单端发音和回声路径发生变化的情况下具有快速跟踪能力从而保证全双エ通信中的语音质量，避免了双端发音情况下滤波器发散问题的ー种双端发音鲁棒结构及其消除声学回声的方法。本发明解决上述技术问题所采用的技术方案为
一种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块及接收并保存近端语音数据的近端语音数据缓存模块，其中，远端语音数据缓存模块及近端语音数据缓存模块信号连接有自回归模型，自回归模型包括有能根据估计误差进行自适应学习的自适应滤波器，自回归模型连接有能将处理后信号输出至远端的残留回声抑制模块；自适应滤波器在双端发音时进行自适应调节，降低学习速度。为优化上述技术方案，采取的措施还包括
上述的残留回声抑制模块连接有连接有均衡化处理器。上述的残留回声抑制模块连接有连接有自动增益控制处理器。
—种双端发音鲁棒结构消除声学回声的方法，其中，包括以下步骤
步骤ー通过远端语音数据缓存模块将远端语音数据缓存后作为回声估计參考信号；步骤ニ通过近端语音数据缓存模块将近端语音数据缓存后作为麦克语音估计參考信
号; 步骤三根据近端语音估计參考信号，用自回归模型估计近端语音信号，自回归模型的系数根据估计误差进行自适应学习；
步骤四根据回声估计參考信号，通过自适应滤波器估计从扬声器耦合到麦克的回声，并根据残留回声、近端语音和远端语音的能量自适应调节规则化因子，调整自适应滤波器学习速度；
步骤五将近端语音减去估计的回声得到误差信号；
步骤六将步骤五得到的误差信号作为残留回声抑制模块的输入；
步骤七将残留回声抑制模块的输出经过均衡化处理器、自动增益控制处理器的处理后，发送到远端。上述的自适应滤波器为自适应FIR滤波器。上述的自适应滤波器在单端发音或回声路径发生变化时的学习速度高于在双端发音时的学习速度。上述的残留回声抑制模块根据通信状态，对近端及远端语音进行衰減。与现有技术相比，本发明ー种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块及接收并保存近端语音数据的近端语音数据缓存模块，其中，远端语音数据缓存模块及近端语音数据缓存模块信号连接有自回归模型，自回归模型包括有能根据估计误差进行自适应学习的自适应滤波器，自回归模型连接有能将处理后信号输出至远端的残留回声抑制模块；自适应滤波器在双端发音时进行自适应调节，降低学习速度。单端发音或回声路径发生变化的情况下自适应滤波器学习速度较快，双端发音情况下学习速度较慢。由于采用了自回归模型和自适应滤波器更新技木，用白噪声通过自回归模型估计近端语音可加快收敛速度，同时根据通信场景自适应调节学习速度避免了双端发音情况下滤波器发散的问题。自适应滤波器仅能消除线性回声，对于非线性回声，还需要经过残留回声抑制模块的处理。本发明可保证全双エ通信中的语音信号质量，能广泛应用于移动通信领域中。

图I是本发明双端发音鲁棒结构示意图2为本发明声学回声消除的示意图3为本发明声学回声消除方法在单端发音情况下的ー个能量统计结果；
图4为本发明声学回声消除方法在双端发音情况下的ー个能量统计结果；
图5为本发明声学回声消除方法在回声路径发生改变情况下的ー个能量统计結果。
具体实施例方式以下结合附图实施例对本发明作进ー步详细描述。如图I至图5所示，图标号说明如下远端语音数据缓存模块I、近端语音数据缓存模块2、自回归模型3、自适应滤波器4、残留回声抑制模块5、均衡化处理器6、自动增益控制处理器7。图I至图5所示本发明的一种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块I及接收并保存近端语音数据的近端语音数据缓存模块2，其中，远端语音数据缓存模块I及近端语音数据缓存模块2信号连接有自回归模型3，自回归模型3包括有能根据估计误差进行自适应学习的自适应滤波器4，自回归模型3连接有能将处理后信号输出至远端的残留回声抑制模块5 ；自适应滤波器4在双端发音时进行自适应调节，降低学习速度。实施例中，残留回声抑制模块5连接有连接有均衡化处理器6。实施例中，残留回声抑制模块5连接有连接有自动增益控制处理器7。一种通过双端发音鲁棒消除声学回声的方法，其中，包括以下步骤
步骤ー通过远端语音数据缓存模块I将远端语音数据缓存后作为回声估计參考信
号;
步骤ニ通过近端语音数据缓存模块2将近端语音数据缓存后作为麦克语音估计參考信号;
步骤三根据近端语音估计參考信号，用自回归模型3估计近端语音信号，自回归模型3的系数根据估计误差进行自适应学习；
步骤四根据回声估计參考信号，通过自适应滤波器4估计从扬声器耦合到麦克的回声，并根据残留回声、近端语音和远端语音的能量自适应调节规则化因子，调整自适应滤波器4学习速度；
步骤五将近端语音减去估计的回声得到误差信号；
步骤六将步骤五得到的误差信号作为残留回声抑制模块5的输入；
步骤七将残留回声抑制模块5的输出经过均衡化处理器6、自动增益控制处理器7的处理后，发送到远端。实施例中，自适应滤波器4为自适应FIR滤波器。实施例中，自适应滤波器4在单端发音或回声路径发生变化时的学习速度高于在双端发音时的学习速度。实施例中，残留回声抑制模块5根据通信状态，对近端及远端语音进行衰減。单端发音或回声路径发生变化的情况下自适应滤波器4学习速度较快，双端发音情况下学习速度较慢。由于采用了自回归模型3和自适应滤波器4更新技术，用白噪声通过自回归模型3估计近端语音可加快收敛速度，同时根据通信场景自适应调节学习速度避免了双端发音情况下滤波器发散的问题。自适应滤波器4仅能消除线性回声，对于非线性回声，还需要经过残留回声抑制模块5的处理。本发明可保证全双エ通信中的语音信号质量，能广泛应用于移动通信领域中。本发明的主要构思是，利用自回归模型3将近端语音和远端语音去相关，以达到加快收敛速度的目的；同时根据近、远端信号和残留回声的能量统计特性调整自适应滤波器4的学习速度，在保证单端发音和回声路径改变情况下收敛速度的同时，避免了双端发音情况下滤波器的发散。下面结合附图及具体实施方法，对本发明采用的技术方案作进ー步详细说明。
參见图3，以I阶自回归模型为例，假设:ァ⑷为近端语音信号，xifl)为远端语音信号，hifl)表示估计的回声耦合路径冲激响应，L表示h(n)的阶数，afc)为自回归模型系数，d{n)为估计的回声，<n)表示自回归模型3对近端语音的估计误差，eifl)为y(n)减去估计回声ゴfc)得到的误差信号，ポ00、ゼ00、ゼ00和べ(》)分别表示近端语音估计误差、6( )、^( )和ァ(《)的能量估计，Jltt、禹、毛和冬分别表示计算这些能量估计时所采用的遗忘因子，Pk(H)和PI1(H)分别表示力(/7)和a(/ )的梯度矢量。
权利要求
1.一种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块(I)及接收并保存近端语音数据的近端语音数据缓存模块(2)，其特征是所述的远端语音数据缓存模块(I)及近端语音数据缓存模块(2)信号连接有自回归模型(3)，所述的自回归模型(3)包括有能根据估计误差进行自适应学习的自适应滤波器(4)，所述的自回归模型(3)连接有能将处理后信号输出至远端的残留回声抑制模块(5);所述的自适应滤波器(4)在双端发音时进行自适应调节，降低学习速度。
2.根据根据权利要求I所述的ー种双端发音鲁棒结构，其特征是所述的残留回声抑制模块(5)连接有连接有均衡化处理器(6)。
3.根据根据权利要求2所述的ー种双端发音鲁棒结构，其特征是所述的残留回声抑制模块(5)连接有连接有自动增益控制处理器(7)。
4.通过如权利要求I所述的ー种双端发音鲁棒结构消除声学回声的方法，其特征是包括以下步骤步骤ー通过远端语音数据缓存模块(I)将远端语音数据缓存后作为回声估计參考信号; 步骤ニ通过近端语音数据缓存模块(2)将近端语音数据缓存后作为麦克语音估计參考信号; 步骤三根据近端语音估计參考信号，用自回归模型(3)估计近端语音信号，自回归模型(3)的系数根据估计误差进行自适应学习；步骤四根据回声估计參考信号，通过自适应滤波器(4)估计从扬声器耦合到麦克的回声，并根据残留回声、近端语音和远端语音的能量自适应调节规则化因子，调整自适应滤波器(4)学习速度；步骤五将近端语音减去估计的回声得到误差信号；步骤六将步骤五得到的误差信号作为残留回声抑制模块(5)的输入；步骤七将残留回声抑制模块(5)的输出经过均衡化处理器(6)、自动增益控制处理器(7)的处理后，发送到远端。
5.根据权利要求4所述的ー种双端发音鲁棒结构消除声学回声的方法，其特征是所述的自适应滤波器⑷为自适应FIR滤波器。
6.根据权利要求5所述的ー种双端发音鲁棒结构消除声学回声的方法，其特征是所述的自适应滤波器(4)在单端发音或回声路径发生变化时的学习速度高于在双端发音时的学习速度。
7.根据权利要求6所述的ー种双端发音鲁棒结构消除声学回声的方法，其特征是所述的残留回声抑制模块(5)根据通信状态，对近端及远端语音进行衰減。
全文摘要
本发明一种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块及接收并保存近端语音数据的近端语音数据缓存模块，其中，远端语音数据缓存模块及近端语音数据缓存模块信号连接有自回归模型，自回归模型包括有能根据估计误差进行自适应学习的自适应滤波器，自回归模型连接有能将处理后信号输出至远端的残留回声抑制模块；自适应滤波器在双端发音时进行自适应调节，降低学习速度。本发明采用自回归模型和自适应滤波器更新技术，用白噪声通过自回归模型估计近端语音加快收敛速度，同时根据通信场景自适应调节学习速度避免了双端发音情况下滤波器发散的问题。保证全双工通信中的语音信号质量，能广泛应用于移动通信领域中。
文档编号H04M9/08GK102655558SQ201210158169
公开日2012年9月5日申请日期2012年5月21日优先权日2012年5月21日
发明者吴少群, 朱仁祥, 袁红星, 诸葛霞, 陈天申请人:宁波工程学院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：袁红星;陈天;吴少群;朱仁祥;诸葛霞
技术所有人：宁波工程学院
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。