用于语音增强系统的背景噪声估计方法

文档序号：2826391阅读：181来源：国知局

用于语音增强系统的背景噪声估计方法
【专利摘要】本发明公开一种用于语音增强系统的背景噪声估计方法，包括如下步骤：对目标信号利用窗函数分成相互叠加的帧并对每帧进行短时傅立叶变换，得到目标信号的频域表示：Y(k,l)=X(k,l)+D(k,l)；将所述目标信号根据语音出现与否划分为语音出现状态H1(k,l)和语音缺失状态H0(k,l)，并按照如下公式分别估计噪声上述方法中，引入了残差噪声In(k,l)，残差噪声In(k,l)的本质是在噪声估计算法中引入反馈机制对估计的噪声进行自适应调节，因此解决了在语音出现状态下的噪声估计不准确的问题。
【专利说明】用于语音增强系统的背景噪声估计方法
【技术领域】
[0001]本发明涉及语音增强处理【技术领域】，特别是涉及一种用于语音增强系统的背景噪声估计方法。
【背景技术】
[0002]在语音增强处理的过程中，比较关键的一步就是对背景噪声的估计。噪声估计过高，在滤除噪声时微弱语音将被去掉，使得经过增强处理的语音产生大的失真；而噪声估计过低，在滤除噪声后会残留过多的背景噪声。当背景噪声为平稳噪声时，通过对静音段的噪声功率谱取均值可得噪声的估计值。当背景噪声为非平稳噪声时，由于噪声随时间快速变化，噪声的估计就比较困难，要克服这个问题，需要对噪声进行连续跟踪与修正。
[0003]传统的噪声估计法是基于语音活动检测(Voice Activity Detector, VAD)的噪声估计方法。该方法在信噪比较高的情况下可以得到较好的噪声估计，但是在低信噪比的情况下，对语音信号的检测变得比较难，VAD的误检率很高，噪声估计不准确。
[0004]实际噪声通常是非平稳的，在语音存在期间噪声也可能发生变化，要想取得好的语音增强效果，就必须随时跟踪噪声的变化，及时更新噪声估计。Doblinger通过比较前帧带噪语音子带平滑功率谱最小值和后帧带噪语音子带平滑功率谱之间大小，对带噪语音子带平滑功率谱最小值每帧进行追踪和更新，并将其作为估计的噪声谱，该噪声谱估计方法计算效率高，能快速适应背景噪声的变化，但它直接把带噪语音子带平滑功率谱最小值作为估计的噪声谱，使得估计的噪声谱准确度不高，同时它会将带噪语音中语音电平的突然上升当作噪声电平突变的情况来处理，造成噪声的过估计。
[0005]Martin提出了基于最优平滑和最小统计的噪声估计算法，它依据带噪语音能量可以衰减到噪声能量级的思想，通过对平滑后的带噪语音的短时功率谱取最小值来获得噪声功率估计。然而，该方法在估计噪声时，当搜索窗较小时会削弱语音能量，当搜索窗太大时，其噪声估计更新较慢难以实时估计噪声。
[0006]Israel Cohen 提出了改进的最小受控递归平均(Improved Minima ControlledRecursive Average, IMCRA)噪声估计法,其可以进行连续的噪声估计。算法使用一个时变频率依赖的平滑因子对过去信号帧的功率谱进行平均后估计噪声，该平滑因子依据语音信号存在概率调整。语音出现概率的估计基于高斯统计模型，但受平滑周期图的最小值控制控制。该算法包括两次平滑和最小值跟踪过程。第一次平滑过程对每个频带语音出现情况做粗略的估计，然后在第二次平滑过程中通过最小值跟踪剔除强语音分量，对噪声谱进行平滑。但是，现有的IMCRA噪声估计方法是在语音缺失段对噪声进行递归平滑而在语音段则对噪声的估计保持不变。然而，在实际情况中，噪声通常是非平稳的，即使在语音信号存在期间，噪声也可能会发生变化。

【发明内容】

[0007]基于此，有必要提供一种能够实时跟踪带噪语音中的噪声变化的背景噪声估计方法。
[0008]一种语音噪声估计方法，包括如下步骤:
[0009]对目标信号利用窗函数分成相互叠加的帧并对每帧进行短时傅立叶变换，得到目标信号的频域表示:Y(k，l)=X(k, 1)+D(k, I);其中Y(k，I)是带噪语音信号进行快速傅立叶变换变换后的频谱，X(k，I)是纯语音信号进行快速傅立叶变换变换后的频谱，D(k，I)是与语音信号无关的加性噪声进行快速傅立叶变换变换后的频谱4表示频谱序号，I表示帧序号;
[0010]将所述目标信号根据语音出现与否划分为语音出现状态H1 (k，I)和语音缺失状态Htl (k，I)，并按照如下公式估计噪声:
【权利要求】
1.一种用于语音增强系统的背景噪声估计方法，包括如下步骤: 对目标信号利用窗函数分成相互叠加的帧并对每帧进行短时傅立叶变换，得到目标信号的频域表示:Y(k，l)=X(k, 1)+D(k, I);其中Y(k，I)是带噪语音信号进行快速傅立叶变换变换后的频谱，x(k，I)是纯语音信号进行快速傅立叶变换后的频谱，D(k，I)是与语音信号无关的加性噪声进行快速傅立叶变换后的频谱4表示频谱序号，I表示帧序号；将所述目标信号根据语音出现与否划分为语音出现状态H1 (k，I)和语音缺失状态Htl (k，I)，并按照如下公式估计噪声:
2.根据权利要求1所述的用于语音增强系统的背景噪声估计方法，其特征在于，所述短时傅立叶变换基于假定变换系数为复高斯分布的前提下。
3.根据权利要求2所述的用于语音增强系统的背景噪声估计方法，其特征在于，进一步包括: 利用条件语音出现概率对噪声估计进行递归平均得到:
4.根据权利要求3所述的用于语音增强系统的背景噪声估计方法，其特征在于，进一步地，
5.根据权利要求3所述的用于语音增强系统的背景噪声估计方法，其特征在于，进一步对噪声估计进行偏差补偿: 其中β为补偿因子，其定义为:
6.根据权利要求1所述的用于语音增强系统的背景噪声估计方法，其特征在于，进一步包括最小受控估计的步骤，所述最小受控估计的步骤用于估计先验语音不存在概率q (k, I),且 P (k, I) +q (k, I) =1。
7.根据权利要求1所述的用于语音增强系统的背景噪声估计方法，其特征在于，所述噪声估计方法基于采用维纳滤波法的语音增强系统，所述谱增益函数G(k，I)为:

8.根据权利要求1所述的用于语音增强系统的背景噪声估计方法，其特征在于，所述噪声估计方法基于采用谱减法的语音增强系统，所述谱增益函数G (k，I)为:

9.根据权利要求1所述的用于语音增强系统的背景噪声估计方法，其特征在于，所述噪声估计方法基于采用MMSE-LSA估计法的语音增强系统，所述谱增益函数G (k，I)为:
【文档编号】G10L21/0216GK103559887SQ201310538432
【公开日】2014年2月5日申请日期:2013年11月4日优先权日:2013年11月4日
【发明者】张勇, 刘轶申请人:深港产学研基地

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张勇;刘轶
技术所有人：深港产学研基地
我是此专利的发明人

上一篇：一种语音线性预测模型的非线性量化方法
上一篇：音乐系统管理方法