语音增强方法及应用该方法的装置的制作方法

文档序号：2823705阅读：123来源：国知局

专利名称：语音增强方法及应用该方法的装置的制作方法
语音增强方法及应用该方法的装置
技术领域：
本发明涉及一种语音增强方法。背景技术：
由于大量环境噪声的存在，手机等通讯设备的麦克风采集到的语音信号普遍信噪比不够高，特别是在街道汽车等高噪声环境中，需要提高音量才能使对方听清。所以需要通过语音增强的方法来提升输入语音的信噪比，改善通讯质量。然而相关技术的谱减法语音增强方法降噪效果有限，并且会对语音造成较大失真。因此，有必要研究一种新的语音增强的方法，以达到良好的降噪效果。

发明内容本发明需解决的技术问题是提供一种降噪效果好的语音增强方法。根据上述的技术问题，设计了一种语音增强的方法，其包括以下步骤一种语音增强的方法，其特征在于，该方法包括以下步骤步骤(1)将声音采集装置采集到的带噪语音信号用芯片进行分帧、预加重处理、再经过短时傅里叶变换到频域得到频域信号；步骤(2)将频域信号划分为若干频带，计算各个频带的能量；步骤(3)根据各个频带的能量利用计算器计算各个频带的后验信噪比，再根据各频带的能量和后验信噪比利用计算器计算各个频带的先验信噪比估计值；步骤(4)利用修正器对各个频带的先验信噪比估计值进行修正，得到各个频带的先验信噪比修正值；步骤(5)根据当前帧先验信噪比修正值，利用判断器判断当前帧是否为纯噪音并记录判断结果，如果当前帧是纯噪音且该当前帧的前若干帧均为纯噪音，执行步骤6，反之执行步骤7 ；步骤(6)首先，根据各个频带的先验信噪比修正值利用计算器计算各个频带的衰减增益；其次，利用调整器对增益系数进行调整得到衰减增益调整值；再次，利用乘法器将频域信号与衰减增益调整值相乘，得到处理后的频域信号；步骤(7)增强语音信号，其包括如下步骤步骤001 利用计算器计算LPC参数、增益因子和信号功率谱；其次，构造因果维纳滤波器，再利用乘法器将频域信号与因果维纳滤波器相乘，得到当前帧处理后的语音信号和后一帧处理后的语音信号；步骤002 利用比较器比较当前帧处理后的语音信号和后一帧处理后的语音信号是否小于某一阈值，如果小于，得到处理后的频域信号；如果不小于，重复步骤001和步骤 002 ；步骤(8)对各频带的噪音能量进行更新，得到更新后的噪音能量做为下一帧计算后验信噪比的基础；
步骤(9)将处理后的频域信号变换到时间域，进行去加重处理并得到输出信号。优选的，所述判断器采用先验信噪比的语音激活检测方法判断纯噪音。优选的，所述该装置包括声音采集装置和集成如权利要求1所述语音增强的方法的芯片。与相关技术比较，本发明实时语音增强的方法在改进的谱减算法基础上，采用了基于语音生成模型的增强算法，抑制各种类型的背景噪声，提高语音清晰度。本发明的语音增强的方法，大大提高了对残余噪声的衰减，保证了语音可懂度。

图1为本发明语音增强方法的流程示意图。图2为本发明语音增强方法步骤(6)的示意图。图3为本发明语音增强方法步骤(7)的示意图。图4为本发明语音增强方法中非线性计权曲线。
具体实施方式
下面结合附图和实施方式对本发明作进一步说明。本发明的主要思想是，通过将一种语音增强方法集成在专用的芯片中，并通过该芯片与相应的声音采集装置的接口数据传输，形成一个语音增强装置。带噪语音信号通过声音采集装置采集，再经过由芯片处理，得到信噪比增强后的信号，输出供次级使用。本发明提供的语音增强装置包括声音采集装置、集成本发明语音增强方法的芯片，所述芯片集成在该声音采集装置内。如图1、图2和图3所示，本发明语音增强方法，其包括以下步骤步骤(1)将声音采集装置采集到的带噪语音信号用芯片进行分帧、预加重处理、再经过短时傅里叶变换到频域得到频域信号；步骤(2)将频域信号划分为若干频带，计算各个频带的能量；步骤(3)根据各个频带的能量利用计算器计算各个频带的后验信噪比，再根据各频带的能量和后验信噪比利用计算器计算各个频带的先验信噪比估计值；步骤(4)利用修正器对各个频带的先验信噪比估计值进行修正，得到各个频带的先验信噪比修正值；步骤(5)根据当前帧先验信噪比修正值，利用判断器判断当前帧是否为纯噪音并记录判断结果，如果当前帧是纯噪音且该当前帧的前若干帧均为纯噪音，执行步骤6，反之执行步骤7 ；步骤(6)首先，根据各个频带的先验信噪比修正值利用计算器计算各个频带的衰减增益；其次，利用调整器对增益系数进行调整得到衰减增益调整值；再次，利用乘法器将频域信号与衰减增益调整值相乘，得到处理后的频域信号；步骤(7)增强语音信号，其包括如下步骤步骤001 利用计算器计算LPC参数、增益因子和信号功率谱；其次，构造因果维纳滤波器，再利用乘法器将频域信号与因果维纳滤波器相乘，得到当前帧处理后的语音信号和后一帧处理后的语音信号；
4
步骤002 利用比较器比较当前帧处理后的语音信号和后一帧处理后的语音信号是否小于某一阈值，如果小于，得到处理后的频域信号；如果不小于，重复步骤001和步骤 002 ；步骤(8)对各频带的能量进行更新，供下一帧使用；步骤(9)将处理后的频域信号变换到时间域，进行去加重处理并得到输出信号。下面通过具体的实施例再详细介绍上述方法，该语音增强方法输入的带噪语音信号的采样率为8kHZ，精度为16位。首先，对在时域中的带噪语音信号进行分帧，是将带噪语音信号以帧为单位等分成若干带噪信号单元。所述带噪信号单元由采样点组成，本发明中选取了 8KHz的采样频率，根据短时谱分析的需要，帧长一般设定成10 35ms之间，本实施方式以32ms分帧，即一帧带噪信号单元设有256个采样点，自然地，任意一帧带噪信号单元具有一定的帧长，本发明中任意帧的帧长为256。为了防止相邻两帧的带噪信号单元间的块效应，在分帧时要使相邻两帧的带噪信号单元之间有一定的混叠部分，即，本帧数据中有D个数据为前一帧数据的部分数据，其中混叠部分描述如下si (n) = di (m, D+n)0 彡 n < L，i = 1，2其中si表示输入带噪语音信号，i取1和2分别表示两路信号d(m，n) = d(m-l，L+n)0 ^ n < D其中，di表示当前帧的256点采样信号，因为任意一帧的长度为256，重叠率为 75%，所以重叠部分的采样点个数D = 192。相邻帧的带噪信号单元的第一个采样点相隔的距离 L = 256-192 = 64。本发明相邻两帧的带噪信号单元之间可以具有50% 75%的重叠率。本实施方式选取相邻两帧的带噪信号单元之间具有75%的重叠率，即以本帧的前75% (192点)的带噪信号单元和前一帧后75% (192点)的带噪语音信号单元一致。分帧后的带噪语音信号，先经过一个高通滤波器，作为预加重处理。由于语音信号中背景噪声在低频部分能量一般较大，所以使用所述高通滤波器可以衰减低频部分的分量，使增强效果更好。其形式如下H(z)=l_az-1a 一般取值在0. 75-0. 95之间，这里a = 0. 9，可以取得较好的效果。由于语音信号是短时平稳的，所以可以对信号进行分帧处理，但分帧又会带来帧信号边界处的不连续造成的频率泄露。所以这里要进行短时傅里叶变换(STFT)。短时傅里叶变换可以理解为对帧信号先加窗再做傅里叶变换。加窗函数的目的就是为了在做短时傅里叶变换时，减少帧信号边界处的不连续造成的频率泄露，从而减少“块效应”。这里使用了一个长度等于帧长256点的汉明窗，它可以有效的降低吉布斯效应的震荡程度。汉明窗函数定义如下win(n) = {0. 54-0. 46cos (2* n *n/M)0 彡 n 彡 M_10其余 n}
短时傅里叶变换如下
权利要求
一种语音增强的方法，其特征在于，该方法包括以下步骤步骤(1)将声音采集装置采集到的带噪语音信号用芯片进行分帧、预加重处理、再经过短时傅里叶变换到频域得到频域信号；步骤(2)将频域信号划分为若干频带，计算各个频带的能量；步骤(3)根据各个频带的能量利用计算器计算各个频带的后验信噪比，再根据各频带的能量和后验信噪比利用计算器计算各个频带的先验信噪比估计值；步骤(4)利用修正器对各个频带的先验信噪比估计值进行修正，得到各个频带的先验信噪比修正值；步骤(5)根据当前帧先验信噪比修正值，利用判断器判断当前帧是否为纯噪音并记录判断结果，如果当前帧是纯噪音且该当前帧的前若干帧均为纯噪音，执行步骤6，反之执行步骤7；步骤(6)首先，根据各个频带的先验信噪比修正值利用计算器计算各个频带的衰减增益；其次，利用调整器对增益系数进行调整得到衰减增益调整值；再次，利用乘法器将频域信号与衰减增益调整值相乘，得到处理后的频域信号；步骤(7)增强语音信号，其包括如下步骤步骤001利用计算器计算LPC参数、增益因子和信号功率谱；其次，构造因果维纳滤波器，再利用乘法器将频域信号与因果维纳滤波器相乘，得到当前帧处理后的语音信号和后一帧处理后的语音信号；步骤002利用比较器比较当前帧处理后的语音信号和后一帧处理后的语音信号是否小于某一阈值，如果小于，得到处理后的频域信号；如果不小于，重复步骤001和步骤002；步骤(8)对各频带的噪音能量进行更新，得到更新后的噪音能量做为下一帧计算后验信噪比的基础；步骤(9)将处理后的频域信号变换到时间域，进行去加重处理并得到输出信号。
2.根据权利要求1所述的语音增强的方法，其特征在于所述判断器采用先验信噪比的语音激活检测方法判断纯噪音。
3.一种语音增强装置，其特征在于所述该装置包括声音采集装置和集成如权利要求 1所述语音增强的方法的芯片。
全文摘要
本发明提供了一种语音增强的方法，该方法包括如下步骤利用判断器判断当前帧是否为纯噪音，如果当前帧是纯噪音且该当前帧的前若干帧均为纯噪音，利用改进谱减法的语音增强算法改进频域信号，反之语音生成模型的增强算法改进频域信号；将处理后的频域信号变换到时间域，进行去加重处理并得到输出信号。本发明另提供一种应用该方法的装置。本发明的语音增强的方法，大大提高了对残余噪声的衰减，保证了语音可懂度。
文档编号G10L21/02GK101976566SQ20101022430
公开日2011年2月16日申请日期2010年7月9日优先权日2010年7月9日
发明者叶利剑申请人:瑞声声学科技(深圳)有限公司;瑞声光电科技(常州)有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：叶利剑
技术所有人：瑞声声学科技（深圳）有限公司;瑞声光电科技（常州）有限公司
我是此专利的发明人