一种非平稳噪声环境下传声器阵列的语音增强方法

文档序号：2819026阅读：391来源：国知局

专利名称：一种非平稳噪声环境下传声器阵列的语音增强方法
技术领域：
本发明涉及传声器阵列语音增强领域，特别涉及一种在非平稳噪声环境下传声器阵列的语音增强方法。
背景技术：
在视频会议系统、车载免提系统、语音识别系统等应用场合，通常需要在较远距离拾取目标语音。然而，由于背景噪声、干扰噪声及回声的存在，拾取的语音信噪比通常较低，而基于传声器阵列的语音增强技术是提高接收语音信噪比的常用手段之一。目前，传声器阵列语音增强技术主要有两类，一类是基于常规波束形成的方法，这种方法的波束形状是固定的，不会随着干扰声信号的变化而变化，其对非方向性噪声如混响声有较好的抑制效果，语音增强性能随着传声器数量增多而提高，但是，对方向性干扰噪声，其抑制效果有限；另一类是基于自适应波束形成算法，其波束形状会随着干扰语音的变化而发生改变，自适应波束形成算法能够有效的抑制方向性干扰噪声但在弱相关噪声场或在散射噪声场中，性能不如传统波束形成算法。上述两种算法通常均需要干扰噪声是平稳过程，然而在实际使用环境下，干扰噪声通常是突发非平稳的，如语音干扰，在这种情况下，目前大部分的语音增强技术性能有限。

发明内容
本发明的目的在于，针对现有技术中存在的不足局限性，从而提供一种在非平稳噪声环境下传声器阵列的语音增强方法。为实现上述发明目的，本发明提供的一种在非平稳噪声环境下传声器阵列的语音增强方法，通过利用通道之间的相位信息，准确判断有效信号的概率，以提高抗非平稳噪声干扰的性能。该方法的步骤包括:(I)根据传声器阵列的输入信号估计出噪声参考信号r (η)；(2)采用自适应算法初步滤除各通道的输入信号中所含的噪声信号；(3)对各通道中自适应滤波器的输出信号进行分帧加窗，再采用快速傅立叶变换变换至频域；(4)估计背景噪声功率谱η(ω)，并由此得到当前帧的信噪比SNR(n，ω)；(5)利用各通道之间的相位信息，再进一步根据和值与预定义门限T1的关系得到有效语音信号存在概率P1 (η，ω);(6)估计出当前帧是有效语音帧的概率Pf (η)；(7)计算出输出信号在各个频率点增益G(η，ω)；(8)把处理后的频谱信号通过反傅里叶变换变换到时间域，作为输出信号；所述步骤(5)中的估计出有效信号存在概率具体包括如下步骤:(51)根据所需波束宽度计算门限T1 = NL sin(0)/Fs，其中N表示帧长，L表示传声器单元间距，Θ表示波束宽度，Fs为采样频率；(52)计算各通道输入信号在各频率点相位差ω的和值pd(n，ω)；(53)当pd(n，ω) > ω (M-1)T1时，该频率点存在有效信号概率P1 (η，ω) = 1，否则？1(1!，ω) = 0，其中，M表示传声器个数。作为上述技术方案的一种改进，所述的步骤￠)中的估计当前帧是有效语音帧的概率具体包括如下步骤:(61)当前帧能量
权利要求
1.一种非平稳噪声环境下传声器阵列的语音增强方法，该方法包括的步骤如下: (1)根据传声器阵列的输入信号估计出噪声参考信号r(η)； (2)采用自适应算法初步滤除各通道的输入信号中所含的噪声信号； (3)对各通道中自适应滤波器的输出信号进行分帧加窗，再采用快速傅立叶变换变换至频域； (4)估计背景噪声功率谱η(ω)，并由此得到当前帧的信噪比SNR(η，ω)； (5)利用各通道之间的相位信息，再进一步根据和值与预定义门限T1的关系得到有效语音信号存在概率P1Oi, ω)； (6)估计出当前帧是有效语音帧的概率Pf(η)； (7)计算出输出信号在各个频率点增益G(η，ω)； (8)把处理后的频谱信号通过反傅里叶变换变换到时间域，作为输出信号；所述步骤(5)中的估计出有效信号存在概率具体包括如下步骤: (51)根据所需波束宽度计算门限T1= NL sin(0)/Fs，其中N表示帧长，L表示传声器单元间距，Θ表示波束宽度，Fs为采样频率； (52)计算各通道输入信号在各频率点相位差ω的和值pd(η，ω)； (53)当pd(n，ω)> ω (M_l)T1时，该频率点存在有效信号概率P1 (η，ω) = 1，否则Pi (η, ω) = O,其中，M表示传声器个数。
2.根据权利要求1所述的非平稳噪声环境下传声器阵列的语音增强方法，其特征在于，所述的步骤出)中的估计当前帧是有效语音帧的概率具体包括如下步骤: (61)当前帧能量
3.根据权利要求1或2所述的非平稳噪声环境下传声器阵列的语音增强方法，其特征在于，所述的传声器阵列为两个传声器单元，该方法的具体步骤包括: (1)根据两个传声器输入信号计算参考背景噪声信号: r (n) = X1 (η) -χ2 (η)；其中，Xi (η)表不第i个传声器在时刻η的输入信号； (2)以背景噪声信号作为参考信号对传声器信号进行自适应滤波初步去除传声器输入信号中的噪声，所述的自适应滤波算法采用NLMS算法，具体描述如下: Wi (k, n) = Wi (k, η-1) - μ (n) ej (η) η (η) k = 0...K-1 ；
全文摘要
本发明涉及一种在非平稳噪声环境下传声器阵列的语音增强方法，通过利用通道之间的相位信息，准确判断有效信号的概率，以提高抗非平稳噪声干扰的性能。该方法估计出有效信号存在概率具体包括如下步骤(51)根据所需波束宽度计算门限T1＝NL sin(θ)/Fs，其中N表示帧长，L表示传声器单元间距，θ表示波束宽度，Fs为采样频率；(52)计算各通道输入信号在各频率点相位差ω的和值pd(n，ω)；(53)当pd(n，ω)＞ω(M-1)T1时，该频率点存在有效信号概率p1(n，ω)＝1，否则p1(n，ω)＝0，其中，M表示传声器个数。本发明由于利用了通道之间的相位信息，使得对有效信号的概率判断更加准确，提高了拾取语音的信噪比，提高了整体性能，特别是抗非平稳噪声干扰性能。
文档编号G10L21/0208GK103165137SQ201110427329
公开日2013年6月19日申请日期2011年12月19日优先权日2011年12月19日
发明者吴鸣, 杨飞然, 杨军申请人:中国科学院声学研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴鸣;杨飞然;杨军
技术所有人：中国科学院声学研究所
我是此专利的发明人