一种语音中瞬态噪声抑制的方法

文档序号:2826171阅读:276来源:国知局
一种语音中瞬态噪声抑制的方法
【专利摘要】本发明公开了一种语音中瞬态噪声抑制的方法,属于信号处理【技术领域】。一种语音中瞬态噪声抑制的方法,其特征在于:包括三个模块:伽马通频率倒谱系数提取模块、瞬态噪声检测模块、语音信号重建模块;所述的伽马通频率倒谱系数提取模块输入端接收含噪的语音信号,输出端与瞬态噪声检测模块输入端相连,所述的瞬态噪声检测模块输出端与语音信号重建模块的输入端相连,所述的语音信号重建模块的输入端初接收含噪的语音信号外,还与所述的瞬态噪声检测模块输出端相连,语音信号重建模块输出为去噪后的语音。
【专利说明】一种语音中瞬态噪声抑制的方法
【技术领域】
[0001]本发明涉及一种语音中瞬态噪声抑制的方法,属于信号处理【技术领域】。
【背景技术】
[0002]瞬态噪声存在于很多应用场合中,如助听器、免提组件、手机及视讯会议设备等语音通信终端设备中。瞬态噪声的存在严重影响语音质量,使语音信号清晰度和可懂度下降,引起听觉疲劳。语音中的瞬态噪声通常是加性噪声,也称为暂态噪声。瞬态噪声在时域中通常具有突发性、脉冲性等特点,其能量通常集中在较短的时域区间内,而在频域分布则很宽。典型的瞬态信号通常由一个初始的峰值和一段持续时间约为10-50ms衰减的短时振荡过程构成,如敲门、鼠标点击、节拍器、键盘敲击、锤子击打声等都属于瞬态噪声。多数情况下,瞬态噪声的消除比较困难,因为多数瞬态噪声与语音信号在时频域完全混叠,且具有非连续性等特点。目前的语音噪声抑制算法绝大多数是针对稳态噪声和连续噪声的,如谱减方法、自适应滤波方法、维纳滤波方法等,此类算法对瞬态噪声抑制效果很差。因此,有必要发明对瞬态噪声环境下的语音噪声抑制技术。
[0003]因为语音噪声抑制效果的最终度量是人的主观感受,因此有必要考虑人耳的听觉感知特性对语音噪声抑制性能的影响。在听觉感知形成的过程中,人耳基底膜发挥了重要的作用,基底膜具有良好的频率选择和分辨特性。基于这一特性,可以通过设计带通滤波器组来实现耳蜗基底膜的分频作用,这种滤波器组就称为人耳听觉滤波器。Johannesma于1972年提出了伽马通(Ga_atone,GT)滤波器模型,它是基于听觉模型中的耳蜗基底膜模型实现的,最先用于描述猫的听觉神经的生理学冲激响应的特性。该滤波器能够较好地模拟人耳听觉的频率响应,符合人耳的听觉感知特性。其冲激响应函数的时域表达式为
[0004]g(t) = [Bntn-1e-2ltetCos (2 n fjt+ Φ) ]u (t)
[0005]B = Id1.ERB (fj)
[0006]其中,参数Bn为滤波器增益;n为滤波器阶数;n = 4的伽马通滤波器就能很好地模拟基底膜的滤波特性#为初始相位,u (t)为单位阶跃函数A为中心频率;ERB(fi)为伽马通滤波器的等价矩形带宽,其与中心频率fi的关系为:
[0007]ERB (fi) = 24.7+0.1OSfi
[0008]伽马通滤波器的中心频率决定了滤波器的等价带宽、频率响应等特性,而由人耳感知特性可知,各伽马通滤波器的中心频率满足对数均匀分布,中心频率可通过下式确
【权利要求】
1.一种语音中瞬态噪声抑制的方法,其特征在于:包括三个模块:伽马通频率倒谱系数提取模块、瞬态噪声检测模块、语音信号重建模块;所述的伽马通频率倒谱系数提取模块输入端接收含噪的语音信号,输出端与瞬态噪声检测模块输入端相连,所述的瞬态噪声检测模块输出端与语音信号重建模块的输入端相连,所述的语音信号重建模块的输入端初接收含噪的语音信号外,还与所述的瞬态噪声检测模块输出端相连,语音信号重建模块输出为去噪后的语音;所述的伽马通频率倒谱系数提取模块从输入可能含噪的语音信号中提取伽马通频率倒谱系数,所述的瞬态噪声检测模块根据相邻帧伽马通频率倒谱系数的差别来判决当前语音帧中是否含有瞬态噪声,若含有瞬态噪声,则使用语音信号重建模块重建当前语音帧,并用该重建语音帧替换当前语音帧,并输出;若不含有瞬态噪声,则对当前语音帧不做处理,直接输出。
2.根据权利要求1所述的一种语音中瞬态噪声抑制的方法,其特征在于:伽马通频率倒谱系数提取模块的处理步骤如下:(a)对原始含噪语音x(n)预加重,增强高频分量;定义原始含噪语音信号为χ(η),预加重后的语音信号为(η),xe (η) = χ (n) _ax (η_1),其中,a为预加重系数,α取值为0.97 ;(b)伽马通滤波器组滤波,使用如下伽马通滤波器组滤波,
3.根据权利要求1所述的一种语音中瞬态噪声抑制的方法,其特征在于:瞬态噪声检测模块的检测过程如下: 计算当前帧,即第P帧,信号的伽马通频率倒谱系数矢量c(p) (I)与前一帧,即第P-1帧,信号的平滑伽马通频率倒谱系数矢量(1=(/)的欧式距离Dis,
4.根据权利要求1所述的一种语音中瞬态噪声抑制的方法,其特征在于:语音信号重建模块的处理方法如下: 根据相邻语音的波形,采用插值重建算法生成被噪声污染的语音帧,首先对含噪语音帧的前后帧进行双向线性预测,并根据线性预测系数设计逆滤波器,计算残差信号;再将残差信号通过基音周期检测算法计算基音周期,根据相邻帧的残差信号及基音周期,产生当前含噪帧的激励信号,根据激励信号及前一帧的线性预测系数,重建当前帧语音信号,并与相邻帧信号进行淡入、淡出方式的数据平滑,达到抑制语音中瞬态噪声的目的;设D表示输出信号的延时,用于当前帧信号与相邻帧进行边界融合,D的取值范围是16 < D < 48,Lev表示线性预测滤波器的阶数,Lev的取值范围是10 < D < 30 ;基于双向线性预测的语音信号重建方法通过相邻帧的采样点产生当前帧的估计值,故需要存储与当前帧最近的B个样点作为历史数据,用于估计前向线性预测系数及前向激励信号,记为
【文档编号】G10L21/003GK103440871SQ201310369986
【公开日】2013年12月11日 申请日期:2013年8月21日 优先权日:2013年8月21日
【发明者】陈喆, 殷福亮, 张兆伟 申请人:大连理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1