适用于小型移动通信设备的双麦克语音增强方法及系统的制作方法

文档序号：2829298阅读：291来源：国知局

专利名称：适用于小型移动通信设备的双麦克语音增强方法及系统的制作方法
技术领域：
本发明涉及小型移动通信设备(如手机、PDA等)，尤其涉及小型移动通信设备的语音增强技术。
背景技术：
近年来，移动通信技术得到飞速的发展和普及，“随时随地传信息”即将成为现实。同时随着工业社会的发展和人口的增长，环境噪声对移动通信质量的影响也日益突出在诸如车站、商业中心、机场、工地、餐馆和舞厅等地点使用手机时，环境噪声会和语音一起传到远端，因此为了使对方能较为清楚地听到自己的声音，说话者需要尽可能地提高音量，这样双方都容易觉得烦躁和疲劳。
目前，为了减少环境噪声对语音的影响，主要采取的方法是使用指向性麦克，或采用单麦克语音增强技术。其中指向性好的指向性麦克比无指向麦克价格昂贵，增加了产品的成本。而且当噪声源和信号源相距较近或者噪声幅度很大时，即使使用指向性麦克，采集到的语音信号中噪声幅度仍然很高。单MIC语音增强技术主要利用语音信号和噪声信号在时频域特性上的差异去噪一般认为与语音信号相比，噪声的幅度、周期的变化速度较慢。单MIC语音增强技术使用一个MIC，实现简单。但其存在的主要缺点是在降低噪声成分强度的同时也损害了语音的清晰度和自然度，当输入信号的信噪比较低时表现得尤为突出；如果噪声具有和语音相似的特性(如背景人声和背景音乐声)，则基本没有去噪效果；当信噪比特别低时(如低于0dB)，也没有去噪效果。
另一方面，为了获得更加安全和舒适的通信，移动通信设备的免提功能也日益受到人们的重视，不少国家已立法规定开车时只能使用免提移动电话。此外，带有视频聊天功能的移动通信设备最好也要具有免提功能。但由于免提移动通信设备通常距离使用者有一定的距离，因此其内置麦克具有较高的灵敏性，扬声器也有看较大的输出功率。所以，在免提移动通信设备中，噪声、回声问题同样突出。为了消除免提功能引入的回声，目前多是采用配置车载免提电话配件等方法。但独立的车载免提电话配件一般价格较贵，应用场景单一。
现有的多麦克语音增强技术中，有一种方案是采用两个相距较近的麦克采集信号。然后采用结合VAD(voice activity detector)的自适应滤波(adaptivefiltering)技术进行信号分离，得到以语音成分为主的信号s(k)和主要是噪声成分的信号n(k)，达到语音增强的目的。如图1A和1B所示，图1A给出了利用此方案分离出s(k)的示意图；图1B给出了利用此方案分离出n(k)的示意图。图1B中的控制信号Adapt_B直接取为图1A中控制信号Adapt_M的反相信号，因此图1B中无VAD模块。由于两者的基本思路是一致的，这里仅以图1A为例进行说明。
如图1A所示，麦克MIC A采集到的信号x1(k)延时一段时间后作为自适应滤波器的一路参考信号，麦克MIC B采集到的信号x2(k)作为自适应滤波器的另一路输入信号。自适应滤波器的输出x2′(k)与x1(k)的延时信号x1′(k)之和作为输出s(k)(为了平衡幅度有时需加上增益控制模块)。受控自适应滤波器模块是该方案中的核心模块当VAD模块检测到MIC采集到的信号中含有语音成分的概率较大时，Adapt_M使能自适应滤波器进行系数更新，否则停止系数更新。对含噪语音进行VAD的一种实施方法参见“R.Martin，An EfficientAlgorithm to Estimate the Instantaneous SNR of Speech Signals，Proc.EUROSPEECH‘93，pp.1093-1096，Berlin，September21-23，1993”。既可以只对x1(k)和x2(k)中的一路信号进行VAD检测以获得Adapt_M使能信息，也可以同时对两路信号进行VAD检测后综合两个检测结果得到使能信息Adapt_M。自适应滤波器系数的更新可以采用NLMS和BNLMS等算法，详见“Simon Haykin，Adaptive Filter Theory，Fourth Edition，Prentice Hall 2003”。由于自适应滤波器是在语音成分较强时进行系数更新，因此x2′(k)中主要含语音信号，因此与输入信号x1(k)(或x2(k)相比)，s(k)的信噪比得到提高。
上述方法的主要缺点是当信号的信噪比较低时，VAD模块的准确性一般较差，无法保证自适应滤波器的输出x2′(k)主要为语音信号。当噪声信号中含有背景人声或背景音乐时，该方法完全失效。而且由于延时信号x1′(k)的信噪比没有得到提高，因此与自适应滤波器输出x2′(k)相比，输出信号s(k)的信噪比更低。此外，该方法过于简单，难以取得好的去噪效果，而且基本没有回声抑制效果。

发明内容
本发明的目的是提供一种适用于小型移动通信设备的双麦克语音增强方法，其能够有效地消除环境噪声和回声。
为实现本发明的上述目的，根据本发明的一个方面，提供一种适用于小型移动通信设备的双麦克语音增强方法，其用于对小型移动通信设备的双麦克所采集的输入信号x1(k)和x2(k)进行处理，其包括1)采用波束形成技术，利用目标语音信号源和噪声信号源在空间域上的差异进行信号分离，得到语音信号为主的信号s(k)和噪音信号为主的信号n(k)；2)利用两路信号中同类信号间存在的相关性，去除s(k)中的噪声成分和n(k)中的语音成分，分别得到s′(k)和n′(k)，或只对s(k)进行去除噪声成分处理，得到s′(k)。
根据本发明的另一方面，提供一种适用于小型移动通信设备的双麦克语音增强装置，其用于对小型移动通信设备的两个麦克采集的输入信号x1(k)和x2(k)进行处理，其包括信号分离模块，其接收信号x1(k)和x2(k)，采用波束形成技术，利用语音信号源和噪声信号源在空间域上的差异进行信号分离，得到语音信号为主的信号s(k)和噪音信号为主的信号n(k)；线性后滤波模块，其利用两路信号中同类信号间存在的相关性，去除s(k)中的噪声成分和n(k)中的语音成分，分别得到s′(k)和n′(k)，或只对s(k)进行去除噪声成分处理，得到s′(k)。
本发明能有效地消除环境噪声和回声，符合移动设备小型化的要求，并具有低成本，低功耗等优点。

图1A给出了利用结合VAD的自适应滤波方案分离出含噪语音s(k)的示意图；
图1B给出了利用结合VAD的自适应滤波方案分离出主要是噪声成分n(k)的示意图；图2A给出了本发明的双麦克语音增强装置的一个实施例的示意图；图2B给出了图2A中所示的实施例改进的示意图；图3A和3B给出了本发明一种实现麦克校正的方法示意图；图3C给出了本发明另一种实现麦克校正的方法示意图；图4给出了双麦克信号分离模块的信号流图；图5给出了本发明实现双麦克信号分离模块的一种方法示意图；图6给出了本发明分数延时模块的示意图；图7给出了本发明的一种线性后滤波模块对应单通道非线性语音增强模块的示意图；图8给出了本发明的一种线性后滤波模块对应双通道非线性语音增强模块的示意图；图9A给出了本发明的双麦克语音增强方法的一个实施例的示意图；图9B给出了图9A中所示的实施例的改进的示意图；图10给出了本发明实现分数延时的方法示意图。
具体实施例方式
下面结合附图详细描述本发明的具体实施方式
，但这些具体实施方式
并不是对本发明的限制。
在使用两个相距很近的普通无指向性MIC组成的麦克对采集信号时，每个麦克采集到的信号中，既包含目标说话人的语音信号，也包含需要消除的背景噪声信号。如果设备处于免提状态，则还包含远端说话人的回声信号。而各种信号成分的幅度与声源到麦克对的距离和发声能量有关。本发明利用数字信号处理技术增强接收到的信号，输出的信号中主要成分为目标语音信号，去除了大部分的噪声和回声信号。该技术适用于手持(handset)和免提(hands-free)两种应用场合，可以应用到诸如手机等无线移动通信设备中。
图2A给出了本发明双麦克语音增强的系统的一个实施例的示意图。如图2A所示，适用于小型移动通信设备的双麦克语音增强装置包括麦克校正模块、信号分离模块、线性后滤波模块、非线性语音增强模块。所述小型移动通信设备采用两个相距很近的以背靠背模式(endfire-type)摆放的普通无指向性麦克采集信号，当然也可以一个是指向性麦克，一个是无指向性麦克(不过，这时可以不用麦克校正模块)，麦克的组合方式也可以是肩并肩模式的。采集到的输入信号x1(k)和x2(k)首先经过麦克校正模块，该模块根据两个麦克接收到的信号之间的差异对两路信号进行增益调整，保证即使在两个麦克的特性由于价格因素而不是十分匹配的情况下，后端的信号分离模块仍能取得较好的效果。信号分离模块采用波束形成技术，利用目标语音信号源和噪声信号源在空间域上的差异(相对于MIC阵列，噪声信号源和目标语音信号源处于不同的方向，且目标语音信号源距MIC阵列距离较近)进行信号分离。其中s(k)主要由来自麦克正前方的声源发出，因此以有效语音信号为主要成分；n(k)主要由来自麦克正后方的声源发出，因此以噪声信号为主要成分，这里假设目标说话人位于麦克正前方，这在一般情况下都是成立的。而后，s(k)和n(k)送入线性后滤波模块，该模块利用两路信号中同类信号间存在一定的相关性，进一步去除s(k)中的噪声成分和n(k)中的语音成分，提高信号的分离度，同时起到消除回声信号的作用。线性后滤波模块的输出s′(k)和n′(k)送入非线性语音增强模块，该模块利用语音信号和噪声信号在时频域上的区别进一步去除s′(k)中的噪声成分，得到与输入信号相比，信噪比有极大提高的输出信号y(k)。
利用本发明的上述双麦克语音增强系统，可以去除背景人声和背景音乐等用单通道语音增强算法难以去除的噪声信号，在信噪比极低的通话条件下仍能取得很好的去噪效果。而且使用两个靠得很近的普通无指向性MIC可以节约实现成本，符合移动设备小型化的要求。图2A中的各个信号处理模块都可以根据质量和功耗等方面的要求采取多种实现方式，以实现最佳的性价比组合。而且根据需要还可增加残余回波抑制(Residual echo suppression)模块和自动增益控制(Automatic gain control)模块，如图2B所示。由于语音输出设备(如扬声器)的非线性失真等原因，线性后滤波模块不可能将回声完全消除。残余回波抑制模块用来抑制线性后滤波模块输出信号中的残余回波。一般需要由短时能量包络估计回波能量基底(energy floor)，如当前信号的短时能量在该基底以下，则削弱当前信号，否则不改变地通过该模块。为了进一步提高输出的语音质量，非线性语音增强模块的输出信号z(k)在输出给输出放大器的同时，也送入自动增益控制模块，自动增益控制模块分析信号z(k)，输出控制信息，根据信号z(k)的幅度值自适应地调整输出放大器的增益，保证即使信号z(k)的能量忽强忽弱，输出放大器的输出信号z′(k)的能量总是比较平稳。
下面分别具体说明图2A中的各个模块。
(一)麦克校正模块理论上，信号分离模块采用的波束形成技术要求MIC A和MIC B有着完全一致的幅频响应特性。但在现实中，高度匹配、特性稳定的麦克对价格昂贵，不适合手机这种大众化消费品。为了保证在使用普通麦克时信号分离模块的效果，麦克校正模块自动地校正两个麦克的特性差异。下面给出麦克校正模块的两种实现方式(1)采用固定自适应滤波器的方式如图3A所示，自适应滤波器h的两路输入信号分别为两个麦克MIC A和MIC B接收到的信号x1(k)和x2(k)。如果自适应滤波器的输出e(k)的能量低于一个设定的阈值，则将此时自适应滤波器h(k)的系数作为补偿滤波器的系数。
校正过程如图3B所示，经补偿滤波器H1(k)校正后的信号x1′(k)送入信号分离模块。
其中，图3A中的自适应滤波器的系数更新算法可以采用NLMS(Normalized Least Mean Squares)和BNLMS(Block NLMS)等算法。
这种方法实现简单，可以根据需要随时修正补偿滤波器系数。
(2)基于能量的自适应增益均衡方式如图3C所示，两个麦克MIC A和MIC B接收到的信号x1(k)和x2(k)分别送入平均能量比较器。平均能量比较器计算两路信号的短时平均能量E1(k)和E2(k)，根据两者之间的差异得到增益调整因子G1(k)。信号x1(k)乘上增益因子G1(k)后得到的修正信号x1′(k)，x1′(k)和x2(k)送入信号分离模块。
计算短时平均能量和增益调整因子可以采取以下计算公式Ei(k)=1LΣn=k-L+1kx2i(n),(i=1,2)---(1.1)]]>
G1(k)=sqrt(E2(k)E1(k))---(1.2)]]>x1′(k)=G1(k)x1(k)---(1.3)]]>其中L表示计算短时平均能量时使用的块长。
自适应增益调整既可以只对一路信号进行，也可以对两路信号都进行，这时增益因子的计算方法为Esum(k)＝E1(k)+E2(k)(1.4)G1(k)=sqrt(Esum(k)E1(k))---(1.5)]]>G2(k)=sqrt(Esum(k)E2(k))---(1.6)]]>x1′(k)=G1(k)x1(k)---(1.7)]]>x2′(k)=G2(k)x2(k)---(1.8)]]>上式中，sqrt表示求平方根运算。
(二)信号分离模块如图4所示，该模块的输入信号为麦克对MIC A和MIC B采集到的含噪语音信号经麦克校正模块进行麦克校正后得到的含噪语音信号x1′(k)和x2′(k)。该信号分离模块的输出为s(k)和n(k)，其中，s(k)主要包含来自麦克正前方的有效语音信号，n(k)主要包含来自麦克后方和侧面的噪声信号。
信号分离模块的核心是波束形成(beamforming)技术。该技术是麦克阵列信号处理(Microphone array signal processing)理论的重要一环。它是一种空间滤波方法，是利用信号源的不同位置来区分不同类型的信号，这种技术在“B.Michael，W.Darren，Microphone Arrays-signal processing techniques andapplications，Springer-Verlag publishing group，2001”中公开。
下面以使用两个背靠背模式(back-to-back mode)的无指向性麦克实现一阶差分麦克阵列技术为例说明该信号分离模块。
如图5所示，f(k)为前置麦克采集的信号，b(k)为后置麦克采集的信号。以下重点说明一阶差分麦克阵列技术，这里假设麦克具有足够好的匹配性，或者已做过麦克校正。f(k)减去b(k)的延时信号得到s(k)，b(k)减去f(k)的延时信号得到n(k)。即s(k)＝f(k)-b(k-t0) (2.1)n(k)＝b(k)-f(k-t1) (2.2)
设麦克之间的距离为d，声速为c。
则声音到达两个麦克之间的最大时差(声音从正前或正后方入射时产生的)为τ=dc---(2.3)]]>取t0和t1为0～τ之间的数值，可以实现不同的麦克指向性(polar-type)这在“Brian Csermak，A Primer on a Dual Microphone Directional System”，TheHearing Review，January 2000，Vol.7，No.1，pages 56，58 & 60公开。如t0和t1均取为τ，则构成了两个背靠背的心形指向性麦克。即s(k)主要包含来自MIC正前方的信号，n(k)主要包含来自MIC正后方的信号。以下均以此为例说明，但t0和t1也可取其它值，实现诸如超心形等不同指向性。
如前所述，手机等移动通信设备的工业设计方案要求两个麦克之间的距离应非常近，以符合设备小型化的要求。而在d很小时，d/c会小于采样周期，引入分数延时的问题。如采样率为8k时，与一个样本点的采样时间对应的声音传输距离为d′=cT=340m/s·18000s=42.5mm---(3)]]>因此当d为1cm左右时，如果信号的采样率为语音通信中通常使用的采样率8k、16k，则将信号延时意味着需要将信号延时分数个(＜1，如0.3个)样本点。
分数延时的基本概念和常见的实现方法在V.Valimaki and T.I.Laakso，Principles o fractional delay filters.ICASSP 2000中有记载。
本发明利用”P.P.Vaidyanathan，Multirate systems and filter banks，PrenticHall”中公开的多抽样率信号处理技术实现分数延时，其不同于普通的插值滤波器方法，信号采样率较低时该方法仍具有实用性，且运算量也较小。下面具体说明分数延时方法设信号的采样率为f0Hz，则采样周期为T=1f0(s)---(4.1)]]>图6给出了采用将信号f(k)延时的分数延时模块的框图，其中N、M均为自然数，且M＜N。首先通过N倍上采样器对信号f(k)的任意两点之间插入N-1个零，得到N倍上采样后的信号f1(k)；而后经过低通滤波器H2(k)，滤去因上采样引入的镜像频率成分，将信号的带宽限制在输入信号带宽f0/2之内；而后经延时器将低通滤波器的输出信号w1(k)延时M点得到信号w2(k)；最后经N倍下采样器对信号w2(k)进行N倍抽取，得到输出信号f′(k)。在低通滤波器H2(k)是理想的情况下，忽略其引入的延迟，可得f′(k)=f(k-MN)---(4.2)]]>即f′(k)为信号f(k)延时点后得到的信号。利用图6所示的分数延时模块可以由f(k)得到经延长分数时间t1后的f(k-t1)，以及由b(k)得到经延长分数时间t0后的b(k-t0)，从而经图5所示的信号分离模块可以得到s(k)和n(k)。
(三)线性后滤波模块图4中，信号分离模块的输出s(k)的主要成分为来自正前方的语音信号，但同时也含有来自侧面和后面的噪音信号，只是它们的幅度有所衰减。另一路输出n(k)也同样含有语音信号。
该线性后滤波模块利用s(k)中含有的噪音信号与n(k)中含有的噪音信号的相关性进一步去除s(k)中的噪声成分，显然两个麦克中采集到的回声信号也具有相关性，因此该模块同时能起到消除回声的作用。(此技术和现有技术是否相同呢？如果相同为什么本发明可以将回声去掉而现有技术中则无法使用呢？)传统方案中，线性后滤波模块多采用一阶自适应滤波，目的并不是为了利用噪声信号间的相关性去噪，而是为了实现不同的等效延时，取得自适应指向性麦克的效果，参见Luo，J.Yang，C.Pavlovic and A.Nehorai，Adaptivenull-forming scheme in digital hearing aids，IEEE Trans.on Signal Processing，Vol.SP-50，pp.1583-1590，July 2002。传统方案也可应用于本发明。但是本发明的线性后滤波模块不仅同样可以达到传统方案的效果，另外，还能有效提高输出信号的信噪比，且采用受控多阶自适应滤波器，避免错误的滤除语音信号。
图7给出了与单通道非线性语音增强模块对应的线性后滤波模块的示意图。信号分离模块的输出s(k)和n(k)送入能量比较器。该能量比较器比较二者的能量值，生成自适应滤波器H3(k)的使能控制信号Adapt_en。该控制信号Adapt_en用来控制该自适应滤波器是否进行系数更新。自适应滤波器的两路输入信号分别为n(k)，s(k)的延时信号s′(k)。使用Adapt_en信号的目的是为了保证自适应滤波器系数的调整是针对噪声信号而非语音信号，即只有当麦克接收到的信号中噪声成分为主时才更新自适应滤波器系数。一种简单的产生Adapt_en控制信号的方法描述如下利用一阶递推系统计算得到x1(k)和x2(k)的能量包络之比X1_env(k)＝α·X1_env(k-1)+(1-α)·x12(k)(5.1)X2_env(k)＝α·X2_env(k-1)+(1-α)·x22(k)(5.2)ratio=X1_env(k)X2_env(k)---(5.3)]]>上式中，X1_env(k)和X2_env(k)分别为k时刻信号x1和信号x2的能量包络，α是小于1的平滑因子。
Adapt_en通过比较ratio(k)与阈值R0得到。
由于信号s(k)主要包含前方的目标语音信号，n(k)主要包含来自后方的噪声信号，因此上述方法能保证自适应滤波器的更新主要针对噪声信号进行。
图7中，将信号s(k)延时T是为了保证自适应滤波器的因果性。为了准确地控制延时T的取值，达到既保证自适应滤波系统的因果性，又不引入不必要的系统延时的目的，本发明中自适应滤波器采用L(L＞1)阶线性相位自适应滤波器，对应的延时T取为L/2点(参考C.F.N.Cowan and P.M.Grant，Adaptive filters，Prentice Hall，1985)。
图7中，自适应滤波器的输出只有一路信号以目标语音信号为主要成分的信号e_s(k)，e_s(k)经过非线性语音增强模块后得到最终的输出。而双通道非线性语音增强模块需要两路输入信号(参考I.Cohen，Two-channel signaldetection and speech enhancement based on the transient beam-to-reference ratio，ICASSP 2003)，与此对应，线性后滤波模块采用图8所示的双通道输出模式。两路输出中，e_s(k)中主要含目标语音信号，e_n(k)中主要含噪声信号。其中两个通路的自适应滤波器结构一致，只是输入信号和参考信号互换，控制信号互为反相信号，即某一时刻只有一个自适应滤波器进行系数更新。
(四)非线性语音增强模块非线性语音增强模块利用语音信号与普通噪声信号在时频域上的区别进行语音增强。它的基本理论基础是谱减法，该方法在I.Cohen and B.Berdugo，Speech enhancement for non-stationary noise environments，signal processing，vol.81，No.11，pp 2403-2418，2001中有记载。
一般的非线性语音增强模块中都含有语音出现概率判决模块，用于判定当前含噪语音信号中语音信号出现的概率。非线性语音增强模块包括单通道非线性语音增强模块和双通道非线性语音增强模块。单通道非线性语音增强模块采用单通道非线性语音增强算法，其根据一路输入信号e_s(k)作出概率判决。双通道非线性语音增强模块采用双通道非线性语音增强算法，其需要两路输入信号，一路以目标目标语音信号成分为主，一路以噪声成分为主。由于该模块位于线性后滤波器模块之后，所以要求线性后滤波模块采用图8的双通道模式。
当非线性语音增强模块采用单通道非线性语音增强模块时，当该通道中信号信噪比较低或噪声信号为非平稳信号且能量与语音信号能量近似时，语音出现概率判决模块很难做出正确的判决，从而在减少噪声幅度的同时损害了语音的自然度。而使用双通道非线性语音增强模块时，由于一个通道以目标语音信号为主，另一个通道以噪声信号为主，则直接比较两个通道的能量强弱，可以更为准确的判断语音出现概率，从而能够克服单通道非线性语音增强模块的缺点，但系统的复杂度有所增加。
图9A给出了本发明实现语音增强的方法的一个具体实施例的流程图。如图9A所示，该方法用于对小型移动通信设备的麦克A和麦克B分别采集的输入信号x1(k)和x2(k)进行处理，包括如下步骤1)信号分离采用波束形成技术，利用目标语音信号源和噪声信号源在空间域上的差异进行信号分离，得到语音信号为主的信号s(k)和噪音信号为主的信号n(k)；2)线性后滤波利用两路信号中同类信号间存在的相关性，去除s(k)中的噪声成分和n(k)中的语音成分，分别得到s′(k)和n′(k)。
上述步骤2)中的线性后滤波处理可以由线性相位或非线性相位自适应滤波器来进行，当然，优选是受控的线性相位或非线性相位自适应滤波器。
为了使得到质量更好的语音信号，在对信号x1(k)和x2(k)进行信号分离前先进行麦克校正，即根据两个麦克接收到的信号x1(k)和x2(k)之间的差异对两路信号进行增益调整。下面给出两种麦克校正方法(1)采用固定自适应滤波器的方法如图3A所示，自适应滤波器h(k)的两路输入信号分别为两个麦克MICA和MIC B接收到的信号x1(k)和x2(k)。如果自适应滤波器的输出e(k)的能量低于一个设定的阈值，则将此时自适应滤波器h(k)的系数作为补偿滤波器的系数。
校正过程如图3B所示，经补偿滤波器H1(k)校正后，得到信号x1′(k)。
其中，图3A中的自适应滤波器的系数更新算法可以采用NLMS和BNLMS等算法。
这种方法实现简单，可以根据需要随时修正补偿滤波器系数。
(2)基于能量的自适应增益均衡方法如图3C所示，计算两个麦克MIC A和MIC B接收到的信号x1(k)和x2(k)的短时平均能量E1(k)和E2(k)，根据两者之间的差异得到增益调整因子G1(k)。信号x1(k)乘上增益调整因子G1(k)后得到的校正信号x1′(k)。
计算短时平均能量和增益调整因子可以采取以下计算公式Ei(k)=1LΣn=k-L+1kx2i(n),(i=1,2)---(1.1)]]>G1(k)=sqrt(E2(k)E1(k))---(1.2)]]>x1′(k)=G1(k)x1(k)---(1.3)]]>其中L表示计算短时平均能量时使用的块长。
自适应增益调整既可以只对一路信号进行，也可以对两路信号都进行，这时增益因子的计算方法为Esum(k)＝E1(k)+E2(k) (1.4)G1(k)=sqrt(Esum(k)E1(k))---(1.5)]]>G2(k)=sqrt(Esum(k)E2(k))---(1.6)]]>x1′(k)=G1(k)x1(k)---(1.7)]]>
x2′(k)=G2(k)x2(k)---(1.8)]]>上式中，sqrt表示求平方根运算。
为了进一步使输出语音信号的质量得到提高，对上述经线性后滤波后所输出的信号s′(k)和n′(k)进行非线性语音增强处理，即利用语音信号和噪声信号在时频域上的区别去除带噪语音信号中的噪声成分。其中，当采用双通道非线性语音增强处理时，则相应地在线性后滤波步骤中采用两个自适应滤波器进行滤波输出s′(k)和n′(k)；当采用单通道非线性语音增强处理时，则相应地在线性后滤波步骤中采用单个自适应滤波器进行滤波输出s′(k)。
在上述信号分离步骤中，可以采用带分数延时的一阶差分麦克在空间域进行信号分离，所述分数延时采用多抽样率信号处理技术来实现。具体地，如图10所示，首先对信号f(k)的任意两点之间插入N-1个零，得到N倍上采样后的信号f1(k)；而后经过低通滤波，滤去因上采样引入的镜像频率成分，将信号的带宽限制在输入信号的有效带宽之内；而后将经低通滤波后的输出信号w1(k)延时M点得到信号w2(k)；最后对信号w2(k)进行N倍抽取，得到输出信号f′(k)。在低通滤波为理想的情况下，忽略其引入的延迟，可得f′(k)=f(k-MN)---(4.2)]]>即f′(k)为信号f(k)延时点后得到的信号，其中N、M均为自然数，且M＜N。
另外，为了进一步提高输出的语音质量，对经线性后滤波处理后的输出信号s′(k)和n′(k)进行抑制残余回波的处理，输出信号y(k)，如图9B所示。
还有，为了进一步提高输出的语音质量，对经非线性语音增强处理后的输出信号z(k)，根据其幅度值自动调整输出放大器的增益，保证即使输出信号z(k)的能量忽强忽弱，经自动增益调整后的输出信号z′(k)的能量保持比较平稳，如图9B所示。其中，利用本发明的上述方法，可以去除背景人声和背景音乐等用单通道语音增强算法难以去除的噪声信号，在信噪比极低的通话条件下仍能取得很好的去噪效果。而且使用两个靠得很近的普通无指向性MIC可以节约实现成本，符合移动设备小型化的要求。
工业应用性本发明可以应用于手机等小型移动通信设备上，能有效地消除环境噪声和回声，降低成本，减少功耗。
上述内容并非用来限制本发明，凡根据本发明的主要构思而进行的修改和变动或组合，均应属于本发明所要求的保护范围。
权利要求
1.一种适用于小型移动通信设备的双麦克语音增强方法，其用于对小型移动通信设备的双麦克所采集的输入信号x1(k)和x2(k)进行处理，其特征在于，1)采用波束形成技术，利用目标语音信号源和噪声信号源在空间域上的差异进行信号分离，得到语音信号为主的信号s(k)和噪音信号为主的信号n(k)；2)利用两路信号中同类信号间存在的相关性，去除s(k)中的噪声成分和n(k)中的语音成分，分别得到s′(k)和n′(k)，或只对s(k)进行去除噪声成分处理，得到s′(k)。
2.根据权利要求1所述的方法，其特征在于，在所述步骤1)之前还有一步骤1A)，根据两个麦克接收到的信号x1(k)和x2(k)之间的差异对两路信号进行增益调整。
3.根据权利要求2所述的方法，其特征在于，在所述步骤1A)，将信号x1(k)和x2(k)输入自适应滤波器，当自适应滤波器输出的能量低于一设定的阈值时，将这时的自适应滤波器的系数作为补偿滤波器的系数，信号x1(k)经补偿滤波器处理后得到x1′(k)。
4.根据权利要求3所述的方法，其特征在于，在所述步骤1A)，所述自适应滤波器的系数更新采用NLMS或BNLMS等算法。
5.根据权利要求2所述的方法，其特征在于，在所述步骤1A)，计算两路信号x1(k)和x2(k)的短时平均能量E1(k)和E2(k)，根据两者之间的差异得到增益调整因子，来对信号x1(k)和x2(k)或二者中之一进行修正。
6.根据权利要求1所述的方法，其特征在于，在所述步骤2)，利用自适应滤波器消除s(k)中的噪声，噪声n(k)中的语音。
7.根据权利要求6所述的方法，其特征在于，在所述步骤2)，所述自适应滤波器是线性相位或非线性相位自适应滤波器。
8.根据权利要求6或7所述的方法，其特征在于，在所述步骤2)，所述自适应滤波器是受控自适应滤波器。
9.根据权利要求1-8中之一所述的方法，其特征在于，还包括如下步骤3)利用语音信号和噪声信号在时频域上的区别去除带噪语音信号中的噪声成分，并输出给输出放大器。
10.根据根据权利要求9所述的方法，其特征在于，当在步骤3)中采用双通道输出时，相应地，在步骤2)中采用两个自适应滤波器分别对s(k)和n(k)进行滤波。
11.根据根据权利要求9所述的方法，其特征在于，当在步骤3)中采用单通道输出时，相应地，在步骤2)中采用单个自适应滤波器对s(k)进行滤波。
12.根据权利要求1-11中之一所述的方法，其特征在于，所用的麦克为普通无指向性麦克。
13.根据权利要求1-12中之一所述的方法，其特征在于，在所述步骤1)，利用带分数延时的一阶差分麦克在空间域进行信号分离，所述分数延时采用多抽样率信号处理技术来实现。
14.根据权利要求13所述的方法，其特征在于，在所述步骤1)，对信号f(k)的任意两点之间插入N-1个零，得到N倍上采样后的信号f1(k)；经低通滤波滤去因上采样引入的镜像频率成分；将低通滤波的输出信号w1(k)延时M点得到信号w2(k)；对信号w2(k)进行N倍抽取，得到信号f(k)延时点后得到的信号f′(k)，其中N，M为正整数，且M＜N。
15.根据权利要求14所述的方法，其特征在于，在低通滤波为理想的情况下，忽略其引入的延迟，得到f′(k)=f(k-MN)]]>
16.根据权利要求1-15中之一所述的方法，其特征在于，在步骤2)之后还有一步骤2A)对在步骤2)中的输出信号进行抑制残余回波的处理。
17.根据权利要求9-11中之一所述的方法，其特征在于，还包括如下步骤4)根据步骤3)中的输出信号的幅度值自动调整输出放大器的增益，保证即使步骤3)中的输出信号的能量忽强忽弱，经输出放大器的输出信号的能量也能保持比较平稳。
18.一种适用于小型移动通信设备的双麦克语音增强装置，其用于对小型移动通信设备的两个麦克采集的输入信号x1(k)和x2(k)进行处理，其特征在于，包括信号分离模块，其接收信号x1(k)和x2(k)，采用波束形成技术，利用语音信号源和噪声信号源在空间域上的差异进行信号分离，得到语音信号为主的信号s(k)和噪音信号为主的信号n(k)；线性后滤波模块，其利用两路信号中同类信号间存在的相关性，去除s(k)中的噪声成分和n(k)中的语音成分，分别得到s′(k)和n′(k)，或只对s(k)进行去除噪声成分处理，得到s′(k)。
19.根据权利要求18所述的装置，其特征在于，所述线性后滤波模块为线性相位或非线性相位自适应滤波器。
20.根据权利要求19所述的装置，其特征在于，所述线性后滤波模块为受控自适应滤波器。
21.根据权利要求18所述的装置，其特征在于，还包括麦克校正模块，用于根据两个麦克接收到的信号x1(k)和x2(k)之间的差异对两路信号进行增益调整。
22.根据权利要求21所述的装置，其特征在于，所述麦克校正模块包括自适应滤波器，其对两个麦克接收到的信号x1(k)和x2(k)进行自适应处理，自适应滤波器的输出e(k)的能量低于一个设定的阈值；补偿滤波器，其对麦克所接收到的信号进行校正，然后将信号输出给信号分离模块，其中补偿滤波器的系数为自适应滤波器的输出e(k)的能量低于一个设定的阈值时该自适应滤波器的系数。
23.根据权利要求21所述的装置，其特征在于，所述麦克校正模块包括平均能量计算器，其接收来自两个麦克的信号x1(k)和x2(k)，计算两路信号的短时平均能量E1(k)和E2(k)，根据两者之间的差异得到增益调整因子；第一乘法器，其将两麦克中一麦克的信号乘上增益因子后得到修正信号。
24.根据权利要求21所述的装置，其特征在于，所述麦克校正模块包括平均能量计算器，其接收来自两个麦克的信号x1(k)和x2(k)，计算两路信号的短时平均能量E1(k)和E2(k)，根据两者之间的差异得到增益调整因子；第一乘法器，其将一麦克的信号乘上增益调整因子后得到修正信号；第二乘法器，其将另一麦克的信号乘上增益调整因子后得到修正信号。
25.根据权利要求18-24中之一所述的装置，其特征在于，还包括非线性语音增强模块，其接收线性后滤波模块的输出信号，利用语音信号和噪声信号在时频域上的区别去除s′(k)中的噪声成分，并输出给输出放大器。
26.根据权利要求25所述的装置，其特征在于，当所述非线性语音增强模块为单通道语音增强模块时，所述线性后滤波模块采用单个自适应滤波器，对s(k)进行去除噪声成分处理，得到s′(k)。
27.根据权利要求25所述的装置，其特征在于，当所述非线性语音增强模块为双通道语音增强模块时，所述线性后滤波模块采用两个自适应滤波器，分别用来去除s(k)中的噪声成分和n(k)中的语音成分，分别得到s′(k)和n′(k)。
28.根据权利要求18-27中之一所述的装置，其特征在于，还包括残余回波抑制模块，用于抑制所述线性后滤波模块输出信号中的残余回波，然后将信号输出给非线性语音增强模块。
29.根据权利要求25-28中之一所述的装置，其特征在于，还包括自动增益控制模块，其接收非线性语音增强模块输出的信号，根据所接收到的信号的幅度值自动调整输出放大器的增益，保证即使非线性语音增强模块输出信号的能量忽强忽弱，输出放大器的输出信号的能量也能保持比较平稳。
30.根据权利要求18所述的装置，其特征在于，所述信号分离模块利用带分数延时的一阶差分麦克在空间域进行信号分离。
31.根据权利要求30所述装置，其特征在于，所述信号分离模块包括分数延时模块，该分数延时模块对信号f(k)延时其中N、M均为自然数，且M＜N，该分数延时模块包括N倍上采样器，其对信号f(k)的任意两点之间插入N-1个零，得到N倍上采样后的信号f1(k)；低通滤波器，其滤去因上采样引入的镜像频率成分；延时器，其将低通滤波器的输出信号w1(k)延时M点得到信号w2(k)；N倍下采样器，其对信号w2(k)进行N倍抽取，得到输出信号f′(k)。
32.根据权利要求31所述装置，其特征在于，在低通滤波器是理想的情况下，忽略其引入的延迟，得到f′(k)=f(k-MN).]]>
全文摘要
本发明提供一种适用于小型移动通信设备的双麦克语音增强方法及装置，其用于对小型移动通信设备的双麦克所采集的输入信号x
文档编号G10L21/02GK1809105SQ200610001158
公开日2006年7月26日申请日期2006年1月13日优先权日2006年1月13日
发明者邓昊, 冯宇红, 林中松申请人:北京中星微电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邓昊;冯宇红;林中松
技术所有人：北京中星微电子有限公司
我是此专利的发明人

上一篇：噪声电平推定方法及其装置的制作方法
上一篇：弦乐器琴桥以及弦乐器的制作方法