声回波消除方法和装置的制造方法

文档序号:9276955阅读:358来源:国知局
声回波消除方法和装置的制造方法
【技术领域】
[0001] 本发明涉及数据处理技术领域,尤其涉及一种声回波消除(Acoustic Echo Cancellation, AEC)方法和装置。
【背景技术】
[0002] 随着智能手机等移动设备的逐渐普及和3G/4G网络的飞速发展,大量基于移动设 备的互联网协议(Internet Protocol,IP)软电话产品越来越受到广大用户的青睐。在IP 通话系统中,声回波消除(Acoustic Echo Cancellation,AEC)模块用来消除通话过程中的 回波信号,已成为各个终端的不可或缺的音频处理算法。
[0003] 传统的AEC技术的处理流程包括:延迟估计,自适应滤波,双讲检测和非线性处理 (Non-Linear Processing, NLP)后滤波。
[0004] 但是,AEC的消除性能强烈依赖于延迟估计模块的对齐程度,而实际中延迟估计模 块难以实现严格对齐,从而会影响AEC效果。

【发明内容】

[0005] 本发明旨在至少在一定程度上解决相干技术中的技术问题之一。
[0006] 为此,本发明的一个目的在于提出一种声回波消除方法,该方法可以提高声回波 消除方法的效果。
[0007] 本发明的另一个目的在于提出一种声回波消除装置。
[0008] 为达到上述目的,本发明第一方面实施例提出的声回波消除方法,包括:对参考 信号和麦克风信号进行对齐处理,得到对齐处理后的信号;对所述对齐处理后的信号进行 自适应滤波处理,得到自适应滤波处理后的信号;根据所述自适应滤波处理后的信号进行 NLP预处理,得到NLP处理参数;根据所述NLP处理参数,对所述自适应滤波处理后的信号 进行NLP后滤波处理。
[0009] 本发明第一方面实施例提出的声回波消除方法,通过进行NLP预处理,可以在NLP 预处理时采用一些优化措施,从而提高AEC效果。
[0010] 为达到上述目的,本发明第二方面实施例提出的声回波消除装置,包括:延迟估计 模块,用于对参考信号和麦克风信号进行对齐处理,得到对齐处理后的信号;自适应滤波 模块,用于对所述对齐处理后的信号进行自适应滤波处理,得到自适应滤波处理后的信号; NLP预处理模块,用于根据所述滤波处理后的信号进行NLP预处理,得到NLP处理参数;NLP 后滤波处理模块,用于根据所述NLP处理参数,对所述自适应滤波处理后的信号进行NLP后 滤波处理
[0011] 本发明第二方面实施例提出的声回波消除装置,通过进行NLP预处理,在NLP预处 理时采用一些优化措施,从而提高AEC效果。
[0012] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0013] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变 得明显和容易理解,其中:
[0014] 图1是本发明一实施例提出的声回波消除方法的流程示意图;
[0015] 图2是本发明另一实施例提出的声回波消除方法的流程示意图;
[0016]图3是本发明实施例中最佳相干系数搜索的流程示意图;
[0017] 图4是本发明实施例中NLP等级的确定流程示意图;
[0018] 图5是本发明另一实施例提出的声回波消除装置的结构示意图;
[0019] 图6是本发明另一实施例提出的声回波消除装置的结构示意图。
【具体实施方式】
[0020] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终 相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考 附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反, 本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同 物。
[0021] 图1是本发明一实施例提出的声回波消除方法的流程示意图,该方法包括:
[0022] Sll :对参考信号和麦克风信号进行对齐处理,得到对齐处理后的信号。
[0023] 其中,参考信号是指语音通讯系统中的远端讲话人的语音信号,且这些信号是已 知的。
[0024] 麦克风信号是指近端麦克风拾取到的信号,其中包括近端语音信号、扬声器播放 的远端语音信号,和各种环境噪音等。
[0025] 在对齐处理时,先进行延迟估计,确定出最优延迟点,之后再根据最优延迟点输出 对齐处理后的参考信号和麦克风信号。
[0026]例如,采用如下公式计算参考信号与麦克风信号的相干系数:
[0028] 其中,R(tl)表示在延迟点是tl时的相干系数,spk(t-tl)是延迟了 tl延时点的 参考信号,mic(t)是麦克风信号,spkeng,miceng是能量长时平均估计,以spkeng(miceng 可以参照运算)为例,计算公式是:
[0029] spkeng (t) = aX spkeng (t~l) X (l~a) X spk (t) X spk (t),
[0030] a是预设的值,满足0〈a〈l,spkeng(t)的初始值也是预设的,例如,选为O或者初 始能量值。
[0031] 在实际实施时,可以枚举一些tl,t2,t3…这些值,之后采用上面的相干系数的计 算公式计算相应的相干系数R,最优解就是R最大时的解,例如,R(tl)最大,最优延时点可 以确定为tl。当然,可以理解的是,具体的延迟估计过程可以采用通常采用的手段实现,上 述只是简化描述,例如,在确定出上述公式的最优解后还可以进行渐变以及偏移处理等,对 最优解进行偏移后得到最优延迟点,例如,最优延迟点是tl偏移一定值后的值。另外,上述 的tl, t2, t3…可以根据选择的范围确定,例如选择的范围是500ms,假设每帧(在语音处理 时通常以帧为单位进行处理)为20ms,则可以选择1,2,"IS。
[0032] 另外,可以理解的是,在系统处理的信号通常是数字信号,因此上述的spk(t-tl) 以及mic(t)是数字信号,例如,用spk(n-nl)以及mic(n)表示。
[0033] 假设最优延迟点用ta表示,则对齐处理后的信号包括:spk(t_t a),mic(t)。
[0034] 另外,在实际运算时上述的数学期望的计算可以采用时间平滑的方式进行,例如,
[0036] 参见图2,对参考信号和麦克风信号进行对齐处理的流程可以用延迟估计(S21) 表不。
[0037] 通过延迟估计可以有效增加后续自适应滤波器估计系数的有效性,从而更好的消 除干扰信号。
[0038] 但是,由于语音通讯系统录制麦克风信号和播放参考信号会造成相应信号的时间 抖动,抖动是指信号时间点的实际值相对于理论值发生偏移。在发生抖动的情况下,严格对 齐是做不到的,由于不能严格对齐引起的偏差将在后续的NLP预处理部分予以处理。
[0039] S12 :对所述对齐处理后的信号进行自适应滤波处理,得到自适应滤波处理后的信 号。
[0040] 现有技术中,自适应滤波采用的是基于快速傅立叶变换(Fast Fourier Transformation,FFT)的频域自适应滤波器,由于FFT会造成不同频带间产生混叠,从而会 降低AEC的效果。
[0041] 为了提高AEC的效果,参见图2,本实施例中可以采用子带自适应滤波(S22)方式。
[0042] 参见图2,自适应滤波流程可以具体包括:
[0043] S221 :对所述对齐处理后的参考信号和麦克风信号进行子带分析;
[0044] S222:在每个子带内,基于该子带的参考信号和麦克风信号进行该子带的子带自 适应滤波处理。
[0045] 子带自适应滤波的输入信号有两个,一个是参考信号,一个是麦克风信号,基于以 上两个信号来完成子带自适应滤波处理,即消除远端回波信号。
[0046] 参考信号和麦克风信号是首先要经过子带分析单元,将全带划分成各个子带信 号,然后再基于子带参考信号和对应的同一子带的麦克风信号进行子带自适应滤波处理。
[0047] 划分子带信号的方式有多种,例如采用均匀子带划分方式或者非均匀子带划分方 式。具体的,本实施例中,可以采用均勾离散傅立叶变换(Discrete Fourier Transform, DFT)滤波器组实现子带划分。
[0048] 均匀DFT滤波器组在实现时存在一个原型低通滤波器,本实施例中,可以将该原 型低通滤波器的阻带衰减特性设置的非常陡峭,例如,在较短的频域范围设置较大的阻带 衰减值。
[0049] 通过设置陡峭的特性,可以有效降低不同子带之间的频率混叠问题,从而有利于 后续流程处理,例如有利于后续的相干系数估计,从而提高AEC效果。
[0050] S13 :根据所述自适应滤波处理后的信号进行NLP预处理,得到NLP处理参数。
[0051] 现有技术中,自适应滤波处理后进行双讲检测,但是,双讲检测基于自适应滤波处 理的输出,由于自适应滤波是线性处理,只能消除线性回波,而进行AEC消除的设备(如手 机)的声学非线性问题十分突出,而自适应滤波不能消除非线性回波,因此现有的线性自 适应滤波处理对于回波的消除能力有限,致使双讲检测效果较
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1