一种麦克风阵列语音增强的优化方法

文档序号：2819066阅读：862来源：国知局

专利名称：一种麦克风阵列语音增强的优化方法
技术领域：
本发明涉及语音增强技术，特别涉及麦克风阵列语音增強，属于语音信号处理技术领域。
背景技术：
语音增强一直是语音信号处理领域的研究热点，麦克风阵列处理的引入提供了一条新的途径来进行语音增强。麦克风阵列不仅提供了信号在时域和频域上的信息，还提供了一个空间域，对来自空间不同方向的信号进行空时频联合处理，它以天线阵列的算法为理论依据，结合单通道语音处理的方法，用空间滤波器的方式，提供声源信号空间位置，达到滤取声源信号的同时抑制干扰信号的目的。语音增强的目标是在保证在不损坏目标语音结构的前提下，减少甚至消除接受信号中存在的噪声，从而提高语音的清晰度。麦克风阵列语音增强的实现可以分为声源定位阶段和语音增强阶段。在声源定位阶段，系统获取说话人的空间上的方位信息；在语音增强阶段，利用已获得的方位信息，采用阵列信号处理方法，滤取声源方向的信息，抑制其他方向上的干扰信息，实现语音增强。麦克风阵列语音增强结合阵列处理技术，经过大量的研究，目前主要形成了三种主流算法固定波束形成法、自适应波束形成法和后置滤波器的波束形成法。其中GSC(Generalized Sidelobe Canceller,广义旁瓣抵消器)结构的自适应波束形成法凭借低计算量高性能，因此广为应用。但是采用阵列处理最容易出现的问题是，当出现目标信号方向估计误差时，容易造成目标信号的泄漏，严重影响语音增强的性能。在GSC结构中，主要构造模块为BM (Blocking Matrix,阻塞矩阵)模块,它能够利用估计出的方向信息,滤除目标方向信号，所以对麦克风阵列语音增强算法的优化重点在于阻塞矩阵的优化。

发明内容
本发明的目的在于提供ー种麦克风阵列语音增强算法的优化方法，提高阻塞矩阵的适应能力，使阻塞矩阵泄漏的语音减小，提高语音增强的鲁棒性。实现本发明目的的技术解决方案为一种麦克风阵列语音增强的优化方法，步骤如下
第一歩，前期处理，即完成对输入阵列语音信号进行预加重、分帧和加窗处理后，利用时延估计方法得到声源的方向信息，利用方向信息得到信号的导向矢量；
第二歩，利用麦克风阵列搭建GSC结构模型，首先实现固定波束形成算法，有别于常规的GSC结构处理，它将FBF分成两部分信号对齐和波束形成，首先利用前期处理得到的方向信息进行信号对齐，信号对齐是利用前述中得到的导向矢量，将有方向时延的麦克风阵列信号变为从阵列法线方向输入信号，这样在理论上，麦克风阵列将从0°方向入射,将对齐后的信号分为两路，一路继续进行固定波束形成过程，进行累加求平均；另一路进入阻塞矩阵模块对目标信号进行阻塞；第三步，实现阻塞矩阵模块，由于通过在第二步进行信号对齐，理论上信号方向为 0°，在采用直线均匀阵时，阻塞矩阵采用如下形式；
权利要求
1.一种麦克风阵列语音增强的优化方法，其特征在于包含以下步骤第一歩，前期处理，即完成对输入阵列语音信号进行预加重、分帧和加窗处理后，利用时延估计方法得到声源的方向信息，利用方向信息得到信号的导向矢量；第二歩，利用麦克风阵列搭建GSC结构模型，首先实现固定波束形成算法，有别于常规的GSC结构处理，它将FBF分成两部分信号对齐和波束形成，首先利用前期处理得到的方向信息进行信号对齐，信号对齐是利用第一歩中得到的导向矢量，将有方向时延的麦克风阵列信号变为从阵列法线方向输入信号，这样在理论上，麦克风阵列将从0°方向入射，将对齐后的信号分为两路，一路继续进行固定波束形成过程，累加求平均；另一路进入阻塞矩阵模块对目标信号进行阻塞；第三步，实现阻塞矩阵模块，由于通过在第二步进行信号对齐，理论上信号方向为0°，在采用直线均匀阵时，阻塞矩阵采用如下形式
2.根据权利要求I所述的麦克风阵列语音增强的优化方法，其特征在于前期处理，具体过程如下第一歩，对语音信号进行预处理，预加重系数为O. 96，以16kHz采样，按512采样点分帧，帧移为50%，之后使用汉明窗进行加窗处理；第二歩，利用麦克风阵列接收信号，估计出信号方向信息，生成信号导向矢量。
3.根据权利要求I所述的麦克风阵列语音增强的优化方法，其特征在于搭建GSC模型，具体过程如下第一歩，将FBF过程拆分为两个步骤，首先进行前期处理，利用所得到的信号导向矢量，对信号进行对齐补偿，使阵列接收的信号变为阵列法线方向，然后将对齐后的信号分为两路，一路输入BM模块，另一路继续进行固定波束形成过程，进行累加求平均，得到FBF输出；第二步，根据阻塞矩阵设置，输入为所述对齐后的信号，经过信号与矩阵相乘，使阻塞矩阵阻塞估计目标方向上的信号，最后输出为除了目标方向的其他方向上的信号，将输出的M-I路信号合成为I路信号；第三步，实现MC模块，将FBF输出减去BM的输出，即用包含目标信号与干扰的一路信号减去只含干扰的一路信号，最后只输出目标信号，在这里MC中采用自适应滤波器进ー步減少其中存在的目标语音。
全文摘要
本发明公开了一种麦克风阵列语音增强的优化方法，涉及语音增强技术，特别涉及麦克风阵列语音增强，属于语音信号处理技术领域。该方法首先采用广义旁瓣抵消器结构，针对广义旁瓣抵消器因信号到达方向错误而导致语音泄漏的问题，利用GSC的输出与阻塞矩阵输出存在相关性的特点，对阻塞矩阵进行自适应调整，使阻塞矩阵趋近于目标语音方向，以减少阻塞矩阵中目标语音的泄漏，增强系统的鲁棒性。
文档编号G10L21/02GK102664023SQ20121012775
公开日2012年9月12日申请日期2012年4月26日优先权日2012年4月26日
发明者张玲华, 王辉申请人:南京邮电大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王辉;张玲华
技术所有人：南京邮电大学
我是此专利的发明人

上一篇：多层实木复合音板的制作方法
上一篇：基于径向基函数统计模型的演唱评分方法