一种对voip系统双向双工免提语音进行声学回声消除的系统和方法

文档序号：8490133阅读：424来源：国知局

一种对voip系统双向双工免提语音进行声学回声消除的系统和方法
【技术领域】
[0001] 本发明涉及通讯领域，尤其涉及一种基于VOIP双向双工免提语音进行声学回声消除的系统和方法。
【背景技术】
[0002]VoIP(VoiceoverInternetProtocol)是将模拟信号（Voice)数字化，W数据封包值ataPacket)的形式在IP网络（IPNetwork)上做实时传递。VoIP的基本原理是：通过语音的压缩算法对语音数据编码进行压缩处理，然后把该些语音数据进行打包，经过IP 网络把数据包送至接收地，再把该些语音数据包串起来，经过解压处理后，恢复成原来的语音信号，从而达到由互联网传送语音的目的。
[0003] 目前，VOIP双向双工免提语音通信的应用已十分广泛，如语音聊天系统、会议电视系统、会议电话系统、车载免提系统或移动免提电话。在语音免提通信中，声学回声消除的应用实例很多。现有的语音聊天系统、会议电视系统、车载免提或移动电话不可避免的受到声学回声的影响。
[0004] 如图1所示，在语音通话中，每个通话终端从本地麦克风采集到的语音信号，通过模数转换器进行采样，语音编码，然后进行RTP(Real-time"TransportProtocol,实时传输协议）、UDP(UserDatagramProtocol用户数据报协议）、IP(InternetProtocol因特网协议）等一系列封装，因为进行完RTP封装后，后续的UDP、IP封装是必然的过程，且与本发明无关，所W本文不对W详细论述，并将封装后的数据包通过物理承载发到对端通话终端上；接受方的通话终端通过对IP、UDP、RTP等数据包进行解包，恢复出语音编码。恢复出来的语音编码，是量化后的数字语音信息，通过数模转换后，形成模拟的语音信号，通过本地的扬声器播放出来。本地声学结构会把扬声器播放的远端声音反射回本地麦克风，形成声学回声反馈送给远端讲话者。导致对方听到自己声音的现象，该现象干扰了对方的正常呼口L]。双向双工免提通话中，因为免提通话的声音播放音量特别大，直接被本地麦克风采集为音源。声学回声极大地干扰了语音通信的质量，降低了语音的清晰度和可懂性。
[0005]AEC声学回音抵消技术是一口正在快速发展中的技术，声学回音抵消面临的难题包括：双向双工免提工作模式下，本地播放的音量比较大，直接被麦克风采集，回声路径很长（大房间可W达到几百毫砂），双端同时讲话（可能导致滤波器发散），时变路径（需要持续跟踪路径变化），说话者移动（需要快速跟踪），背景噪声干扰（配合噪声消除）等。现有技术通常采用硬件技术对回声进行抑制，对声音的收发端进行隔离，减轻回声。但是采用硬件隔离技术需要额外新增加硬件，增加了硬件的成本，而且由于音频的频率比较低，隔离的效果也很难保证。

【发明内容】

[0006] 本发明的目的在于无需在VoIP系统外新增加硬件的情况下，提供了一种对双向双工免提语音进行回声消除的系统对回声进行有效清除。
[0007] 本发明的目的在于无需在VoIP系统外新增加硬件的情况下，提供了一种对双向双工免提语音进行回声消除的方法对回声进行有效清除。
[0008] 为了解决上述技术问题，本发明通过下述技术方案得W解决：
[0009] 一种对VOIP系统双向双工免提语音进行声学回声消除的系统，包括模数转换器、包封装模块、解包模块、数模转换器，所述的模数转换器是将发送方的麦克收集到的语音信号进行采样及语音编码，所述的包封装模块将从模数转换器转换来的语音编码数据进行实时传输协议包封装；所述的解包模块将实时传输协议包解包出语音编码数据后发送给数模转换器，所述的数模转换器是将语音编码形成语音信号从而通过接收方的扬声器播放出来，还包括回声消除模块，所述回声消除模块通过对比模数转换器输出的语音编码数据与解包模块发出的语音编码数据，消除模数转换器输出的语音编码数据中与解包模块发出的语音编码数据相同的部分，对系统的回声进行消除。
[0010] 进一步的，所述回声消除模块包括建模模块、对比模块和抽离模块，所述建模模块用来对模数转换器输出的语音编码数据与解包模块发出的语音编码数据进行特征建模，所述对比模块用来将解包模块发出的语音编码数据作为对象，与模数转换器输出的语音编码数据进行比较，所述抽离模块用来消除模数转换器输出的语音编码数据中与解包模块发出的语音编码数据相同的部分。
[0011] 一种对VOIP系统双向双工免提语音进行声学回声消除的方法，通过对比模数转换器输出的语音编码数据与解包模块发出的语音编码数据，消除模数转换器输出的语音编码数据中与解包模块发出的语音编码数据相同的部分，对系统的回声进行消除。
[0012] 进一步的，包括W下步骤：
[0013] STEP1、将接收方解包出的语音编码数据同步输出到建模模块进行语音特征建模，同步将发送方经过模数转换的语音编码数据发送到建模模块进行语音特征建模；
[0014] STEP2、将接收方解包出的语音编码数据模型作为对比对象，对发送方经过模数转换的语音编码数据进行实时对比，发现相同特征的，标记时间戳；
[0015] STEP3;标记有时间戳的数据包进行回声数据抽离，抽离后的数据包发送到包封装模块进行数据封装；没有特征时间戳的数据包直接发送到包封装模块进行数据封装。
[0016] 进一步的，STEP1中进行特征建模采用的模型特征矢量Xt对应的特征似然率用K 个高斯分量表示为
【主权项】
1. 一种对VOIP系统双向双工免提语音进行声学回声消除的系统，包括模数转换器、包封装模块、解包模块、数模转换器，所述的模数转换器是将发送方的麦克收集到的语音信号进行采样及语音编码，所述的包封装模块将从模数转换器转换来的语音编码数据进行实时传输协议包封装；所述的解包模块将实时传输协议包解包出语音编码数据后发送给数模转换器，所述的数模转换器是将语音编码形成语音信号从而通过接收方的扬声器播放出来，其特征在于：还包括回声消除模块，所述回声消除模块通过对比模数转换器输出的语音编码数据与解包模块发出的语音编码数据，消除模数转换器输出的语音编码数据中与解包模块发出的语音编码数据相同的部分，对系统的回声进行消除。
2. 根据权利要求1所述的回声消除的系统，其特征在于：所述回声消除模块包括建模模块、对比模块和抽离模块，所述建模模块用来对模数转换器输出的语音编码数据与解包模块发出的语音编码数据进行特征建模，所述对比模块用来将解包模块发出的语音编码数据作为对象，与模数转换器输出的语音编码数据进行比较，所述抽离模块用来消除模数转换器输出的语音编码数据中与解包模块发出的语音编码数据相同的部分。
3. 根据权利要求2所述的回声消除的系统，其特征在于：所述建模模块进行特征建模采用的模型特征矢量Xt对应的特征似然率用K个高斯分量表示为
其中X为模型参数，表示为X={Ck，iik，Ek，}，K=l，2,… 9 K，ck是第k个高斯分量的权重，权重满足关系式
高斯混合概率密度函数
其中yk和I：k为高斯对角矩阵的均值和方差参数，D是特征矢量Tx的维数。
4. 根据权利要求3所述的回声消除的系统，其特征在于：所述对比模块将相同特征的特征矢量定义为Ts，模数转换器输出的语音编码数据被Ts对比为含有相同特征时加入时间戳标记TSs。
5. 根据权利要求4所述的回声消除的系统，其特征在于：所述抽离模块将标记有时间戳TSs的语音编码数据进行定向线性衰减，定向线性衰减的相对衰减系数为Ay: Ay=(T〇-Ts) /Ts，其中To为当前特征数据的原数据模型。
6. -种对VOIP系统双向双工免提语音进行声学回声消除的方法，其特征在于：通过对比模数转换器输出的语音编码数据与解包模块发出的语音编码数据，消除模数转换器输出的语音编码数据中与解包模块发出的语音编码数据相同的部分，对系统的回声进行消除。
7. 根据权利要求6所述的回声消除的方法，其特征在于：包括以下步骤： STEP1、将接收方解包出的语音编码数据同步输出到建模模块进行语音特征建模，同步将发送方经过模数转换的语音编码数据发送到建模模块进行语音特征建模； STEP2、将接收方解包出的语音编码数据模型作为对比对象，对发送方经过模数转换的语音编码数据进行实时对比，发现相同特征的，标记时间戳； STEP3 :标记有时间戳的数据包进行回声数据抽离，抽离后的数据包发送到包封装模块进行数据封装；没有特征时间戳的数据包直接发送到包封装模块进行数据封装。
8. 根据权利要求7所述的回声消除的方法，其特征在于：STEP1中进行特征建模采用的模型特征矢量Xt对应的特征似然率用K个高斯分量表示为
其中X为模型参数，表示为X={Ck，iik，Ek，}，K=l，2,… 9 K K，ck是第k个高斯分量的权重，权重满足关系式：2>* N(xt，yk，Ek)为高斯混合概率 k=l y 密度雨数
其中yk和Ek为高斯对角矩阵的均值和方差参数，D是特征矢量Tx的维数。
9. 根据权利要求8所述的回声消除的方法，其特征在于：STEP2中将相同特征的特征矢量定义为Ts，模数转换器输出的语音编码数据被Ts对比为含有相同特征时加入时间戳标记TSs。
10. 根据权利要求9所述的回声消除的方法，其特征在于：STEP3中将标记有时间戳TSs的语音编码数据进行定向线性衰减，定向线性衰减的相对衰减系数为Ay: Ay=(T〇-Ts) /Ts，其中To为当前特征数据的原数据模型。
【专利摘要】本发明涉及通讯领域，尤其涉及一种基于VOIP双向双工免提语音进行声学回声消除的系统和方法。本系统包括模数转换器、包封装模块、解包模块、数模转换器、回声消除模块，所述回声消除模块通过对比模数转换器输出的语音编码数据与解包模块发出的语音编码数据，消除模数转换器输出的语音编码数据中与解包模块发出的语音编码数据相同的部分，对系统的回声进行消除。本发明通过特征建模、动态对比、相同抽离，发送方的语音数据编码中与接收方的语音数据编码相同部分得以消除，有效消除回声，提高了通讯的语音质量，整个过程中发送端和接受端的麦克风和扬声器以及其工作状态和数据流都是双向全双工运行。
【IPC分类】H04M9-08
【公开号】CN104811567
【申请号】CN201310673961
【发明人】解玉乐
【申请人】杭州乐哈思智能科技有限公司
【公开日】2015年7月29日
【申请日】2014年1月23日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：解玉乐;
技术所有人：杭州乐哈思智能科技有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。