改善音频通话质量的系统及方法

文档序号:7685226阅读:558来源:国知局
专利名称:改善音频通话质量的系统及方法
技术领域
本发明涉及一种改善音频通话质量的系统及方法。
技术背景Voip目前已经广泛应用在互联网中,其语音通信质量也就成为了一个关键的因素,而回 声噪声的消除技术更是成为关注的焦点。通常,回声的产生是由于扬声器和麦克风之间存在着声学回路,即来自通话一端的信号 经过通话另一端的扬声器播放后,同时会被该端的麦克风采集传回至通话一端,由此导致通 话一端的说话者能够听到自己的回声,进而严重影响了通话质量。此外,来源于麦克风周边 环境产生的稳态或非稳态的噪声信号也对通话质量有着很大的影响。目前解决回声的最有效方法是采用自适应滤波器来构造声学回声消除系统,请参见图1, 其为通过自适应滤波器模拟声学回声路径,使其冲击响应和实际回声路径相似,从而预测出 麦克风所采集到的来自扬声器的回声信号(即远端信号),进而在将麦克风采集的音频信号 d (n)中的回声予以去除而形成无回声的音频信号e (n),由此来实现回声的消除。此外,其 还设置有一外双工检测器(Double talk detection, DTD),用于当通话双方同时说话时, 自动冻结滤波器的系数更新,从而达到既能消除回声又能保证本地输入信号的正确性和完整 性。现有常见的自适应滤波器采用的算法主要包括:最小平方准则(Least mean square, LMS) 算法及变体(Normal LMS, NLMS)算法;最小二乘法准则(Recursive Least square, RLS)算 法;仿射投影(Affine projection algorithm, APA)算法;块自适应算法(Block-adaptive algorithm)等等。其中,作为使用最为普遍的NLMS算法,具备运算量小、易于在不同嵌入式 平台实现的优点。但是其滤波器收敛速度与输入信号的协方差矩阵的特征值分布成反比,因 此收敛速度受输入信号影响较大,进而会存在滤波器自适应收敛速度慢和不稳定的问题;基 于RLS的自适应滤波器具有最优秀的回声抑制性能,但是其运算量往往是其他算法的6-20倍, 所以无法在实际应用中使用,常常只是作为测试最优效果的方法;基于BLMS(Block Least Mean Square Algorithm)的块延迟频域自适应滤波器是在LMS、 NLMS基础上扩展而来的,常见的 有MDF (Multidelay Adaptive Filters)和GMDF算法,具备良好的收敛性能和相对适中的算法复杂度,因而目前在噪音消除和回音消除中使用比较广泛。尽管如此,自适应滤波器的选 择最终还是需要根据硬件的环境和系统设计的要求来决定。虽然现有将自适应滤波器、DTD、非线性处理模块(Non-Linear Processor, NLP)等组合 能实现较好的回声消除功能,但现有的双工检测算法都会不同程度的出现误判的问题,从而 导致本地信号的失真,反而降低了语音的质量。在现有常用的回声消除方案中,无法处理一 些特殊情况包括通话双方同时说话、通话一方处于较强的背景噪音的环境中、麦克风或者 扬声器及其他因素带来的信号非线性失真等情况。在这些情况下进行通话, 一则自适应滤波 器难以正常工作,容易出现滤波器发散、系数更新错误等状况,最终导致回声不能消除再 则麦克风采集的音频信号中还会带入噪音和非线性失真的信号,如此会严重影响语音质量。因此,如何解决现有音频信号中的回声及噪音等问题,提高音频通话质量实已成为本领 域技术人员亟待解决的技术课题。发明内容本发明的目的在于提供一种改善音频通话质量的系统,以有效消除通话中的回声。 本发明的另一目的在于提供一种改善音频通话质量的系统,以有效消除通话中的噪音。 为了达到上述目的及其他目的,本发明提供的改善音频通话质量的系统,用于本地同时 设置有音频采集装置及音频播放装置的系统,其包括用于去除所述音频采集装置输出的时 域第一音频信号的当前帧中的直流偏移干扰信号的去直流偏移模块;用于将所述去直流偏移 模块输出的时域第一音频信号的当前帧以及所述音频播放装置播放的时域第二音频信号的当 前帧分别进行预加重处理以改善各时域音频信号的频谱的预加重处理模块;用于存储所述预 加重处理模块输出的时域第二音频信号的数据存储模块;用于将所述预加重模块输出的时域 第一音频信号及所述数据存储模块输出的时域第二音频信号分别进行快速傅里叶变换以得到 各频域音频信号,并根据当前帧的前一帧所获得的频域错误信号参数和频域学习速率参数修 正频域第二音频信号以使其与所述音频采集装置当前所采集的回声信号接近的回声估计模 块,其中,频域错误信号参数和频域学习速率参数的初始值都为0;用于将修正后的频域第二 音频信号进行傅里叶逆变换以转换为修正后的时域第二音频信号的傅里叶逆变换模块;用于 将所述预加重处理模块输出的时域第一音频信号及所述傅里叶逆变换模块输出的修正后的时 域第二音频信号分别进行去加重处理以还原各音频信号的频谱的去加重处理模块;用于根据 所述去加重模块输出的时域第二音频信号去除所述去加重模块输出的时域第一音频信号中的 回声信号的回声消除模块;用于根据所述傅里叶逆变换模块输出修正后的时域第二音频信号、回声估计模块输出的修正后的频域第二音频信号及所述预加重模块输出的时域第一音频信号 更新当前帧的频域错误信号参数和频域学习速率参数以供所述自适应滤波器模块处理下一帧 时采用的参数估算模块。较佳的,所述改善音频通话质量的系统还包括用于将所述音频采集装置采集的时域第 一音频信号的当前帧与所述回声消除模±央输出的时域第一音频信号的差值进行汉宁窗口化及 傅里叶变换,并根据所述参数估算模块输出的线性回归参数估算出频域残余回声信号的残余 回声估计模块;用于将所述回声消除模块输出的时域第一音频信号的单帧映射为两帧,并进 行共轭窗口平滑及傅里叶变换处理以转换为频域第一音频信号的数据缓冲及傅里叶变换模 块;用于将所述残余回声估计模块所估算出的频域残余回声信号及所述数据缓冲及傅里叶变 换模块输出的频域第一音频信号分别转换为梅尔频谱残余回声信号及梅尔频谱第一音频信号 的梅尔正向滤波模块;与所述梅尔正向滤波模块相连接,用于判断所述梅尔正向滤波模块输 出的梅尔频谱第一音频信号是否满足预设条件,并根据是否满足条件来估算所述回声消除模 块输出的时域第一音频信号中包含的噪音,并进而估算出当前帧的信噪比及当前帧的前一帧 的信噪比的噪音估计模块;用于根据所述当前帧的信噪比及当前帧的前一帧的信噪比、采用 短时频谱强度估计算法估算出第一音频信号的频谱强度,并根据所述频谱强度调节所述梅尔 正向滤波模块输出的梅尔频谱第一音频信号以去除噪音的频谱调节模块;用于将经过频谱调 节的所述梅尔频谱第一音频信号进行梅尔反向滤波及傅里叶逆变换以还原出时域音频信号的 频域时域转换模块。本发明的改善音频通话质量的方法,包括步骤1)去除音频采集装置输出的吋域第一音 频信号的当前帧中的直流偏移干扰信号;2)将去除了直流偏移干扰信号的时域第一音频信号 的当前帧以及音频播放装置播放的时域第二音频信号的当前帧分别进行预加重处理以改善各 时域音频信号的频谱;3)存储经过预加重处理的时域第二音频信号;4)将经过预加重处理 的时域第一音频信号及存储的时域第二音频信号分别进行快速傅里叶变换以得到各频域音频 信号,并根据当前帧的前一帧所获得频域错误信号参数和频域学习速率参数修正频域第二音 频信号以使其与所述音频采集装置当前所釆集的回声信号接近,其中,频域错误信号参数和 频域学习速率参数的初始值都为0: 5)将修正后得频域第二音频信号进行傅里叶逆变化以转 换为修正后的是域第二音频信号;6)将经过预加重处理的时域第一音频信号与经过傅里叶逆 变换的修正后的时域第二音频信号分别进行去加重处理;7)根据经过去加重处理的修正后的 吋域第二音频信号将经过去加重处理的时域第一音频信号中的回声去除;8)根据修正后的吋 域第二音频信号、修正后的频域第二音频信号及经过预加重处理的时域第一音频信号计算当前帧的频域错误信号参数和频域学习速率参数以供后续时刻采用。较佳的,所述的改善音频通话质量的方法还包括步骤(1)将所述音频采集装置采集的 时域第一音频信号的当前帧与去除了回声的时域第一音频信号的差值进行汉宁窗口化及傅里 叶变换,并根据所述线性回归参数估算出频域残余回声信号;(2)去除了回声的时域第一音 频信号的单帧映射为两帧,并进行共轭窗口平滑及傅里叶变换处理以转换为频域第一音频信 号;(3)将估算出的频域残余回声信号及所述数据缓冲及经过共轭窗口平滑及傅里叶变换处 理获得的频域第一音频信号分别转换为梅尔频谱残余回声信号及梅尔频谱第一音频信号;(4) 判断所述梅尔频谱第一音频信号是否满足预设条件,并根据是否满足条件来估算去除了回声 的时域第一音频信号中包含的噪音,并进而估算出当前帧的信噪比及当前帧的前一帧的信噪 比;(5)根据所述当前帧的信噪比及当前帧的前一时刻的信噪比、并采用短时频谱强度估计 算法估算出第一音频信号的频谱强度,同时根据所述频谱强度调节所述梅尔频谱第一音频信 号以去除噪音;(6)将经过频谱调节的所述梅尔频谱第一音频信号进行梅尔反向滤波及傅里 叶逆变换以还原出时域音频信号。较佳的,可根据公式signal (m-l)=signal(m)- a*signal (m-1)对时域信号进行预加重处 理,其中,a为预设常数,signal (m)为采样序号为m的待处理信号。较佳的,可根据公式^(") = /)(")-乞『(";Mroi-m)来修正所述第二音频信号,其中,是修正后的频域第二音频信号,D(")是频域第一音频信号,Z(n)是频域第二音频信号,M是 长度值,w["]-w["] +然"0[w-lKE:[w-l] + xO[w]A[;m], ss是频域学习速率参数,£1>]是频 域错误信号参数,《表示当前时刻,m表示当前采样点。= 0.7.ZJ .Z (" ["] + F2 [" +1]) + (£2 M + £2 [m +1])较佳的,可根据公式 》=° "=Q 及enw-^n)-估算当前时刻的频域错误信号参数和频域学习速率参数,其中, , Zi 是线性回归参数,^R",M)是频域错误信号参数和频域第二音频信号的互相关系数,"(",附)是频域第二音频信号的自相关系数; (1 +妙>",^是时域错误 信号参数和时域第二音频信号的互相关系数,^是时域第二音频信号的自相关系数,"时域错误信号参数的自相关系数,是时域错误信号参数;五["]是频域错误信号参数;e;rw(") 是时域错误信号参数,t/^)是所述预加重模块输出的第一音频信号;:K")是时域第二音频信号。0.54-0.46cos("^") 0SWw-l较佳的,可采用公式 较佳的,可根据K,k Presidualww<i 进行汉宁窗口化处理cNtotal和及坤=Tmpl氺max(O, RPost) + Tmp2 *R oldPresidual / Ntotal估算当前时刻的信噪比及当前时刻的前一时刻的信噪比,其中, °st 为当前时刻的信噪比,Presidual为所述梅尔正向滤波模块输出的梅尔频谱第一音频信号的当 前帧;Ntotal = Noise +res—echo, Ntotal是估算出的噪声,Noise是残余噪音,res—echo 是所述梅尔正向滤波模块输出的梅尔频谱残余回声信号, Noise =(l一l/adaptedCount)氺noise + (1/ adaptedCount)木Power, adaptedCount是己处理过的中贞的数目,noise是前一帧的残余噪音,noise的初始值为0; 为当前时刻的前一时刻的信噪 比,Tmpl =0.1 + 0, 9*( oldPresidual /(oldPresidual + Ntotal))2, oldPresidual为所 述梅尔正向滤波模块输出的梅尔频谱第一音频信号的当前帧的前一帧,Tmp2 = 1- Tmpl。"mmw 一一较佳的,可根据公式i Y及l<formula>formula see original document page 12</formula>阔,/o(昏)+呵昏)来估算频 c和^来源于贝塞尔谱强度,其中,^m,是频谱强度,函数的0阶和1阶。其中,预设条件为(Presidual [m—l]*0. 05+Presidual [m]*0. 1+Presidual [m+l]*0. 05) 〈=20、 Presidual [m] < Noise[m]、及adaptedCount 〈 10中的一者,其中,m是当前输入 数据采样点的序号。综上所述,本发明的改善音频通话质量的系统及方法通过对音频采集装置所采集的音频 信号中的回声的估计,可有效去除通话中的回声,进而再通过对去除回声的音频信号的残余 回声及噪音的估计,可有效去除音频信号中的噪声,大大改善通话质量。


图1为现有基于自适应滤波器和双工检测的回声消除系统的结构示意图(图2为本发明的改善音频通话质量的系统的基本架构示意图。图3为本发明的改善音频通话质量的系统输入的包含回声及噪声的时域第一音频信号示 意图。图4为本发明的改善音频通话质量的系统输入的时域第二音频信号示意图。 图5为本发明的改善音频通话质量的系统输出的时域第一音频信号示意图。
具体实施方式
请参阅图2,本发明的改善音频通话质量的系统用于本地同时设置有音频采集装置及音频 播放装置的系统,其中,所述音频采集装置包括麦克风等,所述音频播放装置包括扬声器等,所述改善音频通话质量的系统至少包括去直流偏移模块、预加重处理模块、数据存储模块、 回声估计模块、傅里叶逆变换模块、去加重处理模块、回声消除模块、参数估算模块、残余 回声估计模块、数据缓冲及傅里叶变换模块、梅尔正向滤波模块、噪音估计模块、频谱调节 模块、及频域时域转换模块。所述去直流偏移模块用于去除所述音频采集装置输出的时域第一音频信号当前帧中的直流偏移干扰信号,所述音频采集装置经过声卡或AD/DC芯片采集的时域第一音频信号包含通 话语音、回声及噪声信号,如图3所示,通过所述去直流偏移模块的处理可降低非线性信号 对系统的影响,从而提升后续各模块的工作稳定性。所述预加重处理模块用于将所述去直流偏移模块输出的时域第一音频信号的当前帧以及 所述音频播放装置播放的时域第二音频信号的当前帧分别进行预加重处理以改善各时域音频 信号的频谱,通过预加重信号处理,可使得处理后的信号形成在各个频带上能量相差不大的 频谱,预加重处理算法公式可为signal(m-l)=signal(m)-a*signal(m-l),其中,a为预加 重常系数,其值可取0.9587, m是当前待处理的信号帧的采样序号,所述音频播放装置播放 的时域第二音频信号如图4所示。所述数据存储模块用于存储所述预加重处理模块输出的时域第二音频信号,在本实施例 中,其用于保存固定长度的最新的时域第二音频信号,并不断更新的环形缓冲,其长度可以 设定64ms-500ms。所述回声估计模块用于将所述预加重模块输出的时域第一音频信号及所述数据存储模块 输出的时域第二音频信号分别进行快速傅里叶变换以得到各频域音频信号,并根据当前帧的 前一帧所获得的频域错误信号参数和频域学习速率参数修正频域第二音频信号以使其与所述音频采集装置当前所采集的回声信号接近,其中,频域错误信号参数和频域学习速率参数的 初始值都为0,在本实施例中,其根据公式y(w)-D(w)-^y(—X("-m)来修正所述第二音附=0频信号,其中,y(")是修正后的频域第二音频信号,D(")是频域第一音频信号,义(")是频域第二音频信号,M^长度值,wM = w["] + SS"0[m —l]*£[m —l] + x0[m]*£[m], SS是频域学习速率参数,E[w]是频域错误信号参数,"表示当前时刻,m表示当前采样点,通常,w[n]也 被称为权重值。所述傅里叶逆变换模块用于将修正后的频域第二音频信号进行傅里叶逆变换以转换为修 正后的时域第二音频信号,即将信号进行时域频域的转换。所述去加重处理模块用于将所述预加重处理模块输出的时域第一音频信号及所述傅里叶 逆变换模块输出的修正后的时域第二音频信号分别进行去加重处理以还原各音频信号的频 谱,即通过与预加重相反的计算方法去除加重信号,恢复正常的频率分布,以便输出和输入 信号一致的波形数据,去预加重处理算法公式可为signal (m-1) =signal (m) + a*signal (m-1), 其中,a为去预加重常系数,a=0.9587, m是当前待处理的信号采样序号。所述回声消除模块用于根据所述去加重模块输出的时域第二音频信号去除所述去加重模 块输出的时域第一音频信号中的回声信号,在本实施例中,即时域第一音频信号与时域第二 音频信号相减即去除了回声信号。所述参数估算模块用于根据所述傅里叶逆变换模块输出修正后的时域第二音频信号、回 声估计模块输出的修正后的频域第二音频信号及所述预加重模块输出的时域第一音频信号计 算当前帧的频域错误信号参数和频域学习速率参数以供所述自适应滤波器模块处理下一帧时<formula>formula see original document page 14</formula>采用,在本实施例中,其根据公式 "=Q "=Q及<formula>formula see original document page 14</formula>计算当前帧的频域错误信号参数和频域学习速率参数的模块,其中,<formula>formula see original document page 14</formula>是线性回归参数,ER",^)是频域错误信号参数和频域第二音频信号的互相关系数<formula>formula see original document page 14</formula>)是频域第二音频信号的自相关系数;ey是时域错误信号参数和时域第二音频信号的互相关系数,^是时域第二音频信号的自相关系数,"时域 错误信号参数的自相关系数,e〃^是时域错误信号参数五["]是频域错误信号参数;^ror(w) 是时域错误信号参数,d(")是所述预加重模块输出的第一音频信号;y(n)是时域第二音频信号。此外,计算相关性系数的公式为r-S《(附)^(w),《o), A(m)是两个时域或频域信m-0号,M是采样点个数。所述残余回声估计模块用于将所述音频采集装置当前采集的时域第一音频信号与所述回 声消除模块输出的时域第一音频信号的差值进行汉宁窗口化及傅里叶变换,并根据所述参数 估算模块输出的线性回归参数估算出频域残余回声信号,其中,可采用根据公式<formula>formula see original document page 15</formula>i进行汉宁窗口化处理。所述数据缓冲及傅里叶变换模块用于将所述回声消除模块输出的时域第一音频信号的单 帧映射为两帧,并进行共轭窗口平滑及傅里叶变换处理以转换为频域第一音频信号。所述梅尔(MEL)正向滤波模块用于将所述残余回声估计模块所估算出的频域残余回声信 号及所述数据缓冲及傅里叶变换模块输出的频域第一音频信号分别转换为梅尔频谱残余回声 信号及梅尔频谱第一音频信号,也就是说,其是用于将输入信号的能量频谱和MEL滤波频谱 之间做转化,即将频率按式变换至Mel标度域,变换公式如下melFrequency = 2595 * log(l + linearFrequency/700) 第k帧的短时信号功率谱通过耳蜗三角带通滤波器组,得到滤波器功率谱输出,Oy =2:&(/)",(/),片1,2,3,…,JVA》是第k帧,第j个滤波器的输出,^(/)是滤波器组中的第j个滤波器的传输函数,N 为滤波器的个数。MEL域滤波器组由给定数目的三角带通滤波器组成,滤波器的中心频率和带 宽在
Hz范围对应的Mel刻度频率域上均匀排列,各个三角滤波器带内,其对应线性/ -力—.频率对应的权值由式<formula>formula see original document page 15</formula> 其它其中,,为第j个滤波器的中心频率,4(/)为第J个滤波器的幅频特性。所述噪音估计模块与所述梅尔正向滤波模块相连接,用于判断所述梅尔正向滤波模块输出 的梅尔频谱第一音频信号是否满足预设条件,并根据是否满足条件来估算所述回声消除模块 输出的时域第一音频信号中包含的噪音,并进而估算出当前时刻的信噪比及当前时刻的前一 时刻的信噪比,即当满足如下三个条件之一-1> (Presidual [m_l]*0. 05+ Presidual [m]*0.1+ Presidual [m+l]*0. 05) 〈= 202> Presidual [m] 〈 Noise[m]3> adaptedCount < 10,其中,m是当前输入数据采样点的序号 则估算出的噪音Ntotal = Noise + res—echo,其中,Noise是残余噪音,res—echo是所述梅 尔正向滤波模块输出的梅尔频谱残余回声信号,Noise = (l-l/adaptedCount)*noise + (1/ adaptedCount) *Power, adaptedCount是已处理过的帧的数目,noise是前一帧的残余噪音, noise的初始值为O, Power是将当前帧的能量频谱值移位预设次数后所获得的值;相应可按照Rp。st二 presidual / Ntotal和及一=Tmpl * max(0, rp°s') + Tmp2氺oldPresidual / Ntotal估算当前帧的信噪比及当前帧的前一帧的信噪比的模块,其中,K一为当前帧的信噪比,Presidual为所述梅尔正向滤波模块输出的梅尔频谱第一音频信号的当前帧;^"。为当前帧的 前一帧的信噪比,Tmpl = 0.1 + 0.9*( oldPresidual /(oldPresidual + Ntotal))2, oldPresidual为所述梅尔正向滤波模块输出的梅尔频谱第一音频信号的当前帧的前一帧, Tmp2 = 1 - Tmpl 。所述频谱调节模块用于根据所述当前帧的信噪比及当前帧的前一帧的信噪比,并采用短 时频谱强度估计算法(Minimum Mean-Square Error, MMSE)估算出第一音频信号的频谱强度, 同时根据所述频谱强度调节所述梅尔正向滤波模块输出的梅尔频谱第一音频信号以去除噪音,其可根据公式.丁11 + / 乂1 + R1 +来估算频谱强度(崎/。(争+呵争/()和71来源于贝塞尔的模块,其中,^M目是频谱强度,函数的o阶和1阶。所述频域时域转换模块用于将经过频谱调节的所述梅尔频谱第一音频信号进行梅尔反向滤波及傅里叶逆变换以还原出时域音频信号,经过转换后的时域音频信号如图5所示。本发明的改善音频通话质量的方法主要包括以下步骤 第一步去除音频采集装置输出的时域第一音频信号当前帧中的直流偏移干扰信号。 第二步将去除了直流偏移干扰信号的时域第一音频信号当前帧以及音频播放装置播放的时 域第二音频信号的当前帧分别进行预加重处理以改善各时域音频信号的频谱,预加重处理采 用的算法如前所述。第三步存储经过预加重处理的时域第二音频信号,如此可供以后时刻采用。第四步将经过预加重处理的时域第一音频信号及存储的时域第二音频信号分别进行快速傅里叶变换以得到各频域音频信号,并根据当前帧的前一帧所获得频域错误信号参数和频域学习速率参数(ss)修正频域第二音频信号以使其与所述音频采集装置当前所采集的回声信号接近,其中,频域错误信号参数和频域学习速率参数的初始值都为0,同样,其采用的修正算 法也如前所述,故在此不再重述。第五步将修正后得频域第二音频信号进行傅里叶逆变化以转换为修正后的是域第二音频信 号。第六步将经过预加重处理的时域第一音频信号与经过傅里叶逆变换的修正后的时域第二音 频信号分别进行去加重处理,即预加重处理的逆过程,其采用signal (m-l)=signal(m) + a*signal (m_l)进行去加重处理。第七步根据经过去加重处理的修正后的时域第二音频信号将经过去加重处理的时域第一音 频信号中的回声去除,即将经过去加重处理的时域第一音频信号与修正后的时域第二音频信 号相减。第八步根据修正后的时域第二音频信号、修正后的频域第二音频信号及经过预加重处理的时域第一音频信号计算当前帧的频域错误信号参数和频域学习速率参数以供处理下一帧时采w-1 w-iffl = 0.7.丄i .J] (y2 ["] + [ +1]) + 0.3." (£2 ["] + £2 [" +1])用,即根据公式 "-Q 及enw*="(")—w")估算当前帧的频域错误信号参数和频域学习速率参数。第九步将所述音频采集装置采集的时域第一音频信号当前帧与去除了回声的时域第一音频信号的差值进行汉宁窗口化及傅里叶变换,并根据所述线性回归参数估算出频域残余回声信 号,汉宁窗口化处理的公式如前所述。第十步将去除了回声的时域第一音频信号的单帧映射为两帧,并进行共轭窗口平滑及傅里 叶变换处理以转换为频域第一音频信号。第十一歩将估算出的频域残余回声信号及所述数据缓冲及经过共轭窗口平滑及傅里叶变换 处理获得的频域第一音频信号分别转换为梅尔频谱残余回声信号及梅尔频谱第一音频信号, 即通过由心理学实验得到了类似耳蜗作用的一组滤波器将各信号的能量频谱转化为MEL滤波 频谱值,其转换方法如前所述。第十二步判断所述梅尔频谱第一音频信号是否满足预设条件,并根据是否满足条件来估算 去除了回声的时域第一音频信号中包含的噪音,并进而估算出当前帧的信噪比Kp。s'及当前帧的前一帧的信噪比^"。,所述预设条件包括3个即1、 (Presidual [m-l]*0.05+ Presidual [m]*0. 1+ Presidual [m+l]*0.05) <= 202、 Presidual [m] 〈 Noise[m]3、 adaptedCount < 10,其中,m是当前输入数据采样点的序号 只要其中一个条件成立,则估算出的噪音Ntotal等于残佘噪音和所述梅尔正向滤波模块输出的梅尔频谱残余回声信号之和,进而可估算出Kp。a和^"。。第十三步根据所述当前帧的信噪比KpMt及当前帧的前一帧的信噪比Wp"。,并采用短时频谱强度估计算法估算出第一音频信号的频谱强度^"^ ,同时根据所述频谱强度调节所述梅尔频 谱第一音频信号以去除噪音。第十四步将经过频谱调节的所述梅尔频谱第一音频信号进行梅尔反向滤波及傅里叶逆变换 以还原出时域音频信号(如图5所示)。综上所述,本发明的改善音频通话质量的系统及方法采用了无双工检测模块的回声消除, 并结合了基于匪SE的噪音消除,如此可将回声消除的处理过程和噪音消除过程紧密结合起来,使得噪音消除不仅具备消除噪音的能力,同时还具备了消除残余回声的能力,相比于现有技 术,本发明具备更优的消除性能和更小的信号失真。更详细而言,本发明的优点在于-1、 独特无双工检测模块的参数估算,能自适应估算回声,使回声消除更加可靠和稳 定。2、 将回声消除和噪声消除有效结合,通过系统优化,可使硬件资源分配更为合理, 和现有的回声噪声消除系统相比,可节约大量数据内存空间,并明显降低CPU的 运算量,由此可在低成本低功耗的嵌入式平台上可以稳定运行。3、 具备500ms的残余回声处理能力,具备比基于双工检测的回声消除系统更高的性 噪比。4、支持采样率不受限制,支持CD级别(22khz)的音频信号输入。
权利要求
1.一种改善音频通话质量的系统,用于本地同时设置有音频采集装置及音频播放装置的系统,其特征在于包括去直流偏移模块,用于去除所述音频采集装置输出的时域第一音频信号的当前帧中的直流偏移干扰信号;预加重处理模块,用于将所述去直流偏移模块输出的时域第一音频信号的当前帧以及所述音频播放装置的播放时域第二音频信号的当前帧分别进行预加重处理以改善各时域音频信号的频谱;数据存储模块,用于存储所述预加重处理模块输出的时域第二音频信号;回声估计模块,用于将所述预加重模块输出的时域第一音频信号及所述数据存储模块输出的时域第二音频信号分别进行快速傅里叶变换以得到各频域音频信号,并根据当前帧的前一帧所获得的频域错误信号参数和频域学习速率参数修正频域第二音频信号以使其与所述音频采集装置当前所采集的回声信号接近,其中,频域错误信号参数和频域学习速率参数的初始值都为0;傅里叶逆变换模块,用于将修正后的频域第二音频信号进行傅里叶逆变换以转换为修正后的时域第二音频信号;去加重处理模块,用于将所述预加重处理模块输出的时域第一音频信号及所述傅里叶逆变换模块输出的修正后的时域第二音频信号分别进行去加重处理以还原各音频信号的频谱;回声消除模块,用于根据所述去加重模块输出的时域第二音频信号去除所述去加重模块输出的时域第一音频信号中的回声信号;参数估算模块,用于根据所述傅里叶逆变换模块输出修正后的时域第二音频信号、回声估计模块输出的修正后的频域第二音频信号及所述预加重模块输出的时域第一音频信号计算当前帧的频域错误信号参数和频域学习速率参数以供所述自适应滤波器模块处理下一帧时采用。
2. 如权利要求1所述的改善音频通话质量的系统,其特征在于所述预加重模块为根据 公式signal (m-l)=signal(ra)- a*signal (m-1)对时域信号进行预处理的模块,其中, a为预设常数,signal (m)为采样序号为m的待处理信号。
3. 如权利要求1所述的改善音频通话质量的系统,其特征在于所述回声估计模块为根M-l据公式= - J]『(">Z(" - m)来修正所述第二音频信号的模块,其中,是修正后的频域第二音频信号,"(")是频域第一音频信号,X(w)是频域第二音频信号, M是长度值,w[w] = w["] + SS.xO[w-l].£[/ -l] + x0[m].£[m], SS是频域学习速率参数,E[w]是频域错误信号参数,w表示当前帧,m表示当前采样点。
4. 如权利要求3所述的改善音频通话质量的系统,其特征在于所述参数估算模块为根 据公式 <formula>formula see original document page 3</formula>及<formula>formula see original document page 3</formula>计算当前帧的频域错误信号参数和频域学习速率参数的模块,其中, " ,Zi 是线性回归参数,^^",M)是频域错误信号参数和频域第二音频信号的互相关系数,^"^是频域第二音频信号的自相关系数;(l + ^)'", W是时域错误信号参数和时域第二音频信号的互相关系数,^是时 域第二音频信号的自相关系数,ee时域错误信号参数的自相关系数,e^7W是时域错误信号参数;五[w]是频域错误信号参数;^roK")是时域错误信号参数,^")是所述预加重模块输出的第一音频信号;y(")是时域第二音频信号。
5. 如权利要求4所述的改善音频通话质量的系统,其特征在于还包括 残余回声估计模块,用于将所述音频采集装置采集的时域第一音频信号的当前帧与所 述回声消除模块输出的时域第一音频信号的差值进行汉宁窗口化及傅里叶变换,并根 据所述参数估算模块输出的线性回归参数估算出频域残余回声信号; 数据缓冲及傅里叶变换模块,用于将所述回声消除模块输出的时域第一音频信号的单 帧映射为两帧,并进行共轭窗口平滑及傅里叶变换处理以转换为频域第一音频信号; 梅尔正向滤波模块,用于将所述残余回声估计模块所估算出的频域残余回声信号及所 述数据缓冲及傅里叶变换模块输出的频域第一音频信号分别转换为梅尔频谱残余回 声信号及梅尔频谱第一音频信号;噪音估计模块,与所述梅尔正向滤波模块相连接,用于判断所述梅尔正向滤波模块输 出的梅尔频谱第一音频信号是否满足预设条件,并根据是否满足条件来估算所述回声 消除模块输出的时域第一音频信号中包含的噪音,并进而估算出当前帧的信噪比及当前帧的前一帧的信噪比;频谱调节模块,用于根据所述当前帧的信噪比及当前帧的前一帧的信噪比,并釆用短 时频谱强度估计算法估算出第一音频信号的频谱强度,同^根据所述频谱强度调节所 述梅尔正向滤波模块输出的梅尔频谱第一音频信号以去除噪音;频域时域转换模块,用于将经过频谱调节的所述梅尔频谱第一音频信号进行梅尔反向 滤波及傅里叶逆变换以还原出时域音频信号。
6.如权利要求5所述的改善音频通话质量的系统,其特征在于所述残余回声估计模块0.54-0.46cos(^ ") 0S衡-1为一根据公式'vv L 0 WW<1进行汉宁窗口化处理的模块。
7. 如权利要求5所述的改善音频通话质量的系统,其特征在于所述噪音估计模块为根据 p。a= Presidual / Ntotal和—=Tmpl * max(O, p。" + Tmp2 * oldPresidual/Ntotal估算当前帧的信噪比及当前帧的前一帧的信噪比的模块,其中,K一为当 前时刻的信噪比;Presidual为所述梅尔正向滤波模块输出的梅尔频谱第一音频信号 的当前帧;Ntotal = Noise+res_echo, Ntotal是估算出的噪声,Noise是残余噪音, res一echo是所述梅尔正向滤波模块输出的梅尔频谱残余回声信号, Noise = (1—1/adaptedCount)氺noise + (1/ adaptedCount)氺Power, adaptedCount 是已处理过的帧的数目,noise是前一帧的残余噪音,Power是将当前帧的能量频谱值移位预设次数后所获得的值,noise的初始值为0; Ap"》为当前时刻的前一时刻的 信噪比, Tmpl =0.1+0.9* (oldPresidual/(oldPresidual + Ntotal) )2,oldPresidual为所述梅尔正向滤波模块输出的梅尔频谱第一音频信号的当前帧的前 一帧, Tmp2 = 1 - Tmpl。
8. 如权利要求7所述的改善音频通话质量的系统,其特征在于所述频谱调节模块为根据公式 11 + Rpost 乂1+及「1 + R/ 由1 + / 来估算频谱强度的M(6 )=模块,其中,^M,是频谱强度, 贝塞尔函数的0阶和1阶。
9.一种改善音频通话质量的方法,i特征在于包括步骤(l +崎鲁)+呵昏)c和^来源于41) 去除音频采集装置输出的时域第一音频信号的当前帧中的直流偏移干扰信号;2) 将去除了直流偏移干扰信号的时域第一音频信号的当前帧以及音频播放装置播放 的时域第二音频信号的当前帧分别进行预加重处理以改善各时域音频信号的频 谱;3) 存储经过预加重处理的时域第二音频信号;4) 将经过预加重处理的时域第一音频信号及存储的时域第二音频信号分别进行快速 傅里叶变换以得到各频域音频信号,并根据当前帧的前一帧所获得频域错误信号 参数和频域学习速率参数修正频域第二音频信号以使其与所述音频采集装置当前 所采集的回声信号接近,其中,频域错误信号参数和频域学习速率参数的初始值 都为0;5) 将修正后得频域第二音频信号进行傅里叶逆变化以转换为修正后的是域第二音频 信号;6) 将经过预加重处理的时域第一音频信号与经过傅里叶逆变换的修正后的时域第二 音频信号分别进行去加重处理;7) 根据经过去加重处理的修正后的时域第二音频信号将经过去加重处理的时域第一 音频信号中的回声去除;8) 根据修正后的时域第二音频信号、修正后的频域第二音频信号及经过预加重处理 的时域第一音频信号计算当前帧的频域错误信号参数和频域学习速率参数以供处 理后一帧时采用。
10. 如权利要求9所述的改善音频通话质量的方法,其特征在于步骤2)根据公式 signal (m-1)-signal (m)-a氺signal(m-l)对时域信号进行预加重处理,其中,a为预 设常数,signal (m)为采样序号为n的待处理信号。
11. 如权利要求9所述的改善音频通话质量的方法,其特征在于步骤4)根据公式i;『(")j(n-w)来修正所述第二音频信号,其中,y(")是修正后的频域第二音频信号,Z)(w)是频域第一音频信号,Z(n)是频域第二音频信号,M是长度 值,w["]-n("〗+ SS,xO[m-l].五[m-1] + x0[m]A[附],SS是频域学习速率参数,五[附]是频域错误信号参数,w表示当前帧,m表示当前采样点。
12. 如权利要求9所述的改善音频通话质量的方法,其特征在于步骤8)根据公式."=0= 0.7*ZJ *5] (72 ["] + 72 [" +1]) + (£2 ["] + £2 [w +1])算当前帧的频域错误信号参数和频域学习速率参数,其中, " ,zi 是 线性回归参数,^w",w)是频域错误信号参数和频域第二音频信号的互相关系数,1T(",w)是频域第二音频信号的自相关系数; (l + w)'", ^是时域错误信号参数和时域第二音频信号的互相关系数,^是时域第二音频信号的自相关系数,"时 域错误信号参数的自相关系数,^"^是时域错误信号参数;£[ ]是频域错误信号参数;enw(w)是时域错误信号参数,d(M)是所述预加重模块输出的第一音频信号;Kw)是时域第二音频信号。 13.如权利要求12所述的改善音频通话质量的方法,其特征在于还包括步骤(1) 将所述音频采集装置采集的时域第一音频信号的当前帧与去除了回声的 时域第一音频信号的差值进行汉宁窗口化及傅里叶变换,并根据所述线性 回归参数估算出频域残余回声信号;(2) 将去除了回声的时域第一音频信号的单帧映射为两帧,并进行共轭窗口平 滑及傅里叶变换处理以转换为频域第一音频信号;(3) 将估算出的频域残余回声信号及所述数据缓冲及经过共轭窗口平滑及傅 里叶变换处理获得的频域第一音频信号分别转换为梅尔频谱残余回声信 号及梅尔频谱第一音频信号;(4) 判断所述梅尔频谱第一音频信号是否满足预设条件,并根据是否满足条件 来估算去除了回声的时域第一音频信号中包含的噪音,并进而估算出当前 帧的信噪比及当前帧的前一时刻的信噪比;(5) 根据所述当前帧的信噪比及当前帧的前一帧的信噪比,并采用短时频谱强 度估计算法估算出第一音频信号的频谱强度,同时根据所述频谱强度调节 所述梅尔频谱第一音輝信号以去除噪音;(6) 将经过频谱调节的所述梅尔频谱第一音频信号进行梅尔反向滤波及傅里 叶逆变换以还原出时域音频信号。航信息传输与共享给其他用户,尤其在共享数据是多媒体数据时,可使终端上 的导航信息交互性能更加强大,提高了导航数据共享的实用性,促使导航功能 和多媒体业务紧密结合使用和壮大。不具备导航功能的移动终端依然能够通过 共享的导航数据信息而达到实现导航功能的效果。请参照图3所示,对于多士某体共享数据,由于终端的显示分辨率有高j氐之 分,如果将高分辨率的图片发送给低分辨率的终端,该终端显示图片的效果会 有所影响;同样高清的影像发送给低分辨率的终端也会出现显示效果受影响的 情形,这是因为终端只能向下兼容,而不能向上兼容导致的。为了综合充分符 合大众终端的通用使用数据,本实施例中还包括模式匹配单元4,连接在导航数 据生成单元1和多媒体数据生成单元22之间,用于在多媒体数据生成单元22 采集数据前进行显示分辨率的模式匹配,选择合理的位图显示大小,使大众都 能够使用此多媒体文件,以使数据能有效交流与共享。如果不进行模式匹配, 对于高分辨率的终端提取的数据过大,所生成的多^某体数据传输给对方终端时, 仍然无法有效显示,失去共享的意义。再请参照图4所示,本实施例中,多媒体数据生成单元22还包括合成单元 223,连接在采样单元221和存储单元222之间,用于将采样单元221生成的视 频数据与音频数据合成为具有语音、图像的多媒体数据。因此,实际应用中, 可根据不同场景和需要,选用共享单独的图片、音频、视频,也可以选择共享 合成在一起的具有语音、图像的多媒体数据,拓展了应用的便利性和多样性。请结合图5、图6所示,本发明实施例三实现导航数据共享的方法,包括以 下步骤步骤一,根据导航设置或者实际路径记录生成导航数据。 移动终端的导航系统启动后,用户可在其电子地图界面中设置行程起始地、 目的地,选择路径搜索条件,如系统推荐、高速道路优先、最短距离优先等, 还可选设置途经点、回避路段等条件。导航单元根据上述设置,自动计算出一 条最佳的行车路线。导航数据生成单元1则根据导航单元查询出的路线进行模
全文摘要
一种改善音频通话质量的系统及方法,其先对音频采集装置输出的时域第一音频信号当前帧及音频播放装置播放的时域第二音频信号当前帧分别进行预加重及傅里叶变换处理,再根据当前帧的前一帧所获得频域错误信号参数和频域学习速率参数修正频域第二音频信号,由此再将第一音频信号和第二音频信号进行去加重处理并相减即可消除第一音频信号中的回声,同时再根据修正后的时域第二音频信号、修正后的频域第二音频信号及经过预加重处理的时域第一音频信号计算当前帧的频域错误信号参数和频域学习速率参数以供处理下一帧时采用,由此可有效去除通话中的回声,此外,再通过对去除回声的音频信号的残余回声及噪音的估计,可有效去除音频信号中的噪声,大大改善通话质量。
文档编号H04M9/08GK101222555SQ200810033120
公开日2008年7月16日 申请日期2008年1月25日 优先权日2008年1月25日
发明者睿 刘, 刘晓露, 熊模昌 申请人:上海华平信息技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1