一种双端发音鲁棒结构的制作方法

文档序号：7876234阅读：211来源：国知局

专利名称：一种双端发音鲁棒结构的制作方法
技术领域：
本实用新型属于移动通信语音增强技术领域，特别涉及一种移动通信系统中声学回声消除的装置及方法，具体的说，是一种双端发音鲁棒结构。
背景技术：
声学回声是指近端扬声器播放的远端语音被近端麦克风采集后又传输到远端，使得远端用户听到自己之前说话的声音。声学回声的存在严重干扰了通信质量。声学回声消除器是解决这一问题的有效途径。因此，在移动通信系统中，回声消除器是必不可少的组成部分。为了使语音信号不受声学回声干扰，回声消除器在单端发音(single talk, ST)的情况下，加权的终端耦合损耗至少要达到46dB ;而在双端发音(double talk, DT)的情况下要大于26dB。回声消除器的原理是以远端语音作为参考信号，通过自适应滤波器来逼近从扬声器到麦克风的耦合回声路径，得到近似的回声信号，并从近端信号中减去这部分估计的回声。理想的回声消除器在保证低失配值(misalignment)的前提下，应该具有快速收敛和跟踪(应对回声路径的时变特性)能力。这两个特性都取决于滤波器所采用的自适应算法。在ST情况下，现有的自适应算法都能得到满意的回声消除效果。在DT情况下，由于受近端语音的干扰，这些自适应算法将会发散，偏离实际的回声信道，使得回声消除的性能急剧恶化。根据统计结果，在一次通话过程中，DT发生的时间约占20%左右。因此DT时回声消除器的性能很重要。常用的解决方案是引入双端发音检测器(double talk detector, DTD)。当DTD检测到双端发音时，自适应滤波器停止更新。这种解决方案的缺点是，在DTD检测到双端发音时滤波器可能已经发散。针对这一问题，人们提出了各种变步长自适应算法。其思路是根据远、近端的语音特性，自动调节自适应滤波器的更新步长，ST时步长较大，DT时步长较小。但是这些变步长方法在ST和回声路径发生变化时收敛速度会受到影响。
发明内容本实用新型所要解决的技术问题是针对现有技术的现状，提供一种单端发音和回声路径发生变化的情况下具有快速跟踪能力从而保证全双工通信中的语音质量，避免了双端发音情况下滤波器发散问题的一种双端发音鲁棒结构。本实用新型解决上述技术问题所采用的技术方案为一种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块及接收并保存近端语音数据的近端语音数据缓存模块，其中，远端语音数据缓存模块及近端语音数据缓存模块信号连接有自回归模型，自回归模型包括有能根据估计误差进行自适应学习的自适应滤波器，自回归模型连接有能将处理后信号输出至远端的残留回声抑制模块。为优化上述技术方案，采取的措施还包括上述的残留回声抑制模块连接有均衡化处理器。上述的残留回声抑制模块连接有自动增益控制处理器。[0009]与现有技术相比，本实用新型一种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块及接收并保存近端语音数据的近端语音数据缓存模块，其中，远端语音数据缓存模块及近端语音数据缓存模块信号连接有自回归模型，自回归模型包括有能根据估计误差进行自适应学习的自适应滤波器，自回归模型连接有能将处理后信号输出至远端的残留回声抑制模块；自适应滤波器在双端发音时进行自适应调节，降低学习速度。单端发音或回声路径发生变化的情况下自适应滤波器学习速度较快，双端发音情况下学习速度较慢。由于采用了自回归模型和自适应滤波器更新技术，用白噪声通过自回归模型估计近端语音可加快收敛速度，同时根据通信场景自适应调节学习速度避免了双端发音情况下滤波器发散的问题。自适应滤波器仅能消除线性回声，对于非线性回声，还需要经过残留回声抑制模块的处理。本实用新型可保证全双工通信中的语音信号质量，能广泛应用于移动通信领域中。

图I是本实用新型双端发音鲁棒结构示意图；图2为本实用新型声学回声消除的示意图。
具体实施方式
以下结合附图实施例对本实用新型作进一步详细描述。如图I至图2所示，图标号说明如下远端语音数据缓存模块I、近端语音数据缓存模块2、自回归模型3、自适应滤波器4、残留回声抑制模块5、均衡化处理器6、自动增益控制处理器7。图I至图2所示本实用新型的一种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块I及接收并保存近端语音数据的近端语音数据缓存模块2，其中，远端语音数据缓存模块I及近端语音数据缓存模块2信号连接有自回归模型3，自回归模型3包括有能根据估计误差进行自适应学习的自适应滤波器4，自回归模型3连接有能将处理后信号输出至远端的残留回声抑制模块5 ；自适应滤波器4在双端发音时进行自适应调节，降低学习速度。实施例中，残留回声抑制模块5连接有均衡化处理器6。实施例中，残留回声抑制模块5连接有自动增益控制处理器7。一种通过本实用新型的双端发音鲁棒消除声学回声的方法，包括以下步骤步骤一通过远端语音数据缓存模块I将远端语音数据缓存后作为回声估计参考信号;步骤二通过近端语音数据缓存模块2将近端语音数据缓存后作为麦克语音估计参考信号；步骤三根据近端语音估计参考信号，用自回归模型3估计近端语音信号，自回归模型3的系数根据估计误差进行自适应学习；步骤四根据回声估计参考信号，通过自适应滤波器4估计从扬声器耦合到麦克的回声，并根据残留回声、近端语音和远端语音的能量自适应调节规则化因子，调整自适应滤波器4学习速度；[0022]步骤五将近端语音减去估计的回声得到误差信号；步骤六将步骤五得到的误差信号作为残留回声抑制模块5的输入；步骤七将残留回声抑制模块5的输出经过均衡化处理器6、自动增益控制处理器7的处理后，发送到远端。实施例中，自适应滤波器4为自适应FIR滤波器。实施例中，自适应滤波器4在单端发音或回声路径发生变化时的学习速度高于在双端发音时的学习速度。实施例中，残留回声抑制模块5根据通信状态，对近端及远端语音进行衰减。单端发音或回声路径发生变化的情况下自适应滤波器4学习速度较快，双端发音情况下学习速度较慢。由于采用了自回归模型3和自适应滤波器4更新技术，用白噪声通过自回归模型3估计近端语音可加快收敛速度，同时根据通信场景自适应调节学习速度避免了双端发音情况下滤波器发散的问题。自适应滤波器4仅能消除线性回声，对于非线性回声，还需要经过残留回声抑制模块5的处理。本实用新型可保证全双工通信中的语音信号质量，能广泛应用于移动通信领域中。本实用新型的主要构思是，利用自回归模型3将近端语音和远端语音去相关，以达到加快收敛速度的目的；同时根据近、远端信号和残留回声的能量统计特性调整自适应滤波器4的学习速度，在保证单端发音和回声路径改变情况下收敛速度的同时，避免了双端发音情况下滤波器的发散。以上实施例仅仅是对本实用新型的优选实施方式进行描述，并非对本实用新型的范围进行限定，在不脱离本实用新型涉及精神的前提下，本领域普通工程技术人员对本实用新型的技术方案做出的各种变形和改进，均应落入本实用新型的权利要求书确定的保护范围内。
权利要求1.一种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块(I)及接收并保存近端语音数据的近端语音数据缓存模块(2)，其特征是所述的远端语音数据缓存模块(I)及近端语音数据缓存模块(2)信号连接有自回归模型(3)，所述的自回归模型(3)包括有能根据估计误差进行自适应学习的自适应滤波器(4)，所述的自回归模型(3)连接有能将处理后信号输出至远端的残留回声抑制模块(5)。
2.根据根据权利要求I所述的一种双端发音鲁棒结构，其特征是所述的残留回声抑制模块(5)连接有均衡化处理器(6)。
3.根据根据权利要求2所述的一种双端发音鲁棒结构，其特征是所述的残留回声抑制模块(5)连接有自动增益控制处理器(7)。
专利摘要本实用新型一种双端发音鲁棒结构，包括有用于接收并保存远端语音数据的远端语音数据缓存模块及接收并保存近端语音数据的近端语音数据缓存模块，其中，远端语音数据缓存模块及近端语音数据缓存模块信号连接有自回归模型，自回归模型包括有能根据估计误差进行自适应学习的自适应滤波器，自回归模型连接有能将处理后信号输出至远端的残留回声抑制模块；自适应滤波器在双端发音时进行自适应调节，降低学习速度。本实用新型采用自回归模型和自适应滤波器更新技术，用白噪声通过自回归模型估计近端语音加快收敛速度，同时根据通信场景自适应调节学习速度避免了双端发音情况下滤波器发散的问题。保证全双工通信中的语音信号质量，能广泛应用于移动通信领域中。
文档编号H04M9/08GK202663468SQ201220228850
公开日2013年1月9日申请日期2012年5月21日优先权日2012年5月21日
发明者袁红星, 陈天, 吴少群, 朱仁祥, 诸葛霞申请人:宁波工程学院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：袁红星;陈天;吴少群;朱仁祥;诸葛霞
技术所有人：宁波工程学院
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。