一种语音中瞬态噪声抑制的方法

文档序号:8340783阅读:506来源:国知局
一种语音中瞬态噪声抑制的方法
【技术领域】
[0001] 本发明涉及一种语音中瞬态噪声抑制的方法,属于信号处理技术领域。
【背景技术】
[0002] 瞬态噪声存在于很多应用场合中,如助听器、免提组件、手机及视讯会议设备等语 音通信终端设备中。瞬态噪声的存在严重影响语音质量,使语音信号清晰度和可懂度下降, 引起听觉疲劳。语音中的瞬态噪声通常是加性噪声,也称为暂态噪声。瞬态噪声在时域中 通常具有突发性、脉冲性等特点,其能量通常集中在较短的时域区间内,而在频域分布则很 宽。典型的瞬态信号通常由一个初始的峰值和一段持续时间约为10~50ms衰减的短时振 荡过程构成,如敲门、鼠标点击、节拍器、键盘敲击、锤子击打声等都属于瞬态噪声。多数情 况下,瞬态噪声的消除比较困难,因为多数瞬态噪声与语音信号在时频域完全混叠,且具有 非连续性等特点。目前的语音噪声抑制算法绝大多数是针对稳态噪声和连续噪声的,如谱 减方法、自适应滤波方法、维纳滤波方法等,此类算法对瞬态噪声抑制效果很差。因此,有必 要发明对瞬态噪声环境下的语音噪声抑制技术。
[0003] 因为语音噪声抑制效果的最终度量是人的主观感受,因此有必要考虑人耳的听觉 感知特性对语音噪声抑制性能的影响。在听觉感知形成的过程中,人耳基底膜发挥了重要 的作用,基底膜具有良好的频率选择和分辨特性。基于这一特性,可以通过设计带通滤波 器组来实现耳蜗基底膜的分频作用,这种滤波器组就称为人耳听觉滤波器。Johannesma于 1972年提出了伽马通(Ga_atone,GT)滤波器模型,它是基于听觉模型中的耳蜗基底膜模 型实现的,最先用于描述猫的听觉神经的生理学冲激响应的特性。该滤波器能够较好地模 拟人耳听觉的频率响应,符合人耳的听觉感知特性。其冲激响应函数的时域表达式为
[0004] g(t) = [Bntn-1e-2ltetCos (2 π fjt+Φ) ]u (t)
[0005] B = Id1 · ERB (fj
[0006] 其中,参数Bn为滤波器增益;n为滤波器阶数;n=4的伽马通滤波器就能很好地模 拟基底膜的滤波特性#为初始相位,u(t)为单位阶跃函数A为中心频率;ERB(A)为伽马 通滤波器的等价矩形带宽,其与中心频率A的关系为:
[0007] ERB (fj) = 24. 7+0.1 OSfi
[0008] 伽马通滤波器的中心频率决定了滤波器的等价带宽、频率响应等特性,而由人耳
【主权项】
1. 一种语音中瞬态噪声抑制的方法,其特征在于:包括三个模块:伽马通频率倒谱系 数提取模块、瞬态噪声检测模块、语音信号重建模块;所述的伽马通频率倒谱系数提取模块 输入端接收含噪的语音信号,输出端与瞬态噪声检测模块输入端相连,所述的瞬态噪声检 测模块输出端与语音信号重建模块的输入端相连,所述的语音信号重建模块的输入端初接 收含噪的语音信号外,还与所述的瞬态噪声检测模块输出端相连,语音信号重建模块输出 为去噪后的语音;所述的伽马通频率倒谱系数提取模块从输入可能含噪的语音信号中提取 伽马通频率倒谱系数,所述的瞬态噪声检测模块根据相邻帧伽马通频率倒谱系数的差别来 判决当前语音帧中是否含有瞬态噪声,若含有瞬态噪声,则使用语音信号重建模块重建当 前语音帧,并用该重建语音帧替换当前语音帧,并输出;若不含有瞬态噪声,则对当前语音 帧不做处理,直接输出。
2. 根据权利要求1所述的一种语音中瞬态噪声抑制的方法,其特征在于:伽马通频率 倒谱系数提取模块的处理步骤如下: (a) 对原始含噪语音X (η)预加重,增强高频分量;定义原始含噪语音信号为X (η),预加 重后的语音信号为Xe (η), xe (η) =x (n) -ax (η-1), 其中,a为预加重系数,α取值为〇. 97 ; (b) 伽马通滤波器组滤波,使用如下伽马通滤波器组滤波,
^Gli(Z)-G2i(Z)-GV(Z)-G4j(Z) B1 = cos (ω Js), I < i < CH, a2 = sin (ω Js), I ^ i ^ CH, a、=e Μ.', ω? = 2 π fj, I ^ i ^ CH, /,={/"+ 228.7) exp(/ χ ν〇 - 228.7
其中,Ts为采样周期,CH表示伽马通滤波器组的通道数,CH=64 ;参数ν为各滤波器之 间的重叠因子,用来表示各滤波器之间的重叠程度,fH为滤波器组的截止频率,其取值是输 入信号的采样率,而fL的取值范围为10~100Hz,&取50Hz ;将Xw (η)分别通过64个滤波 器,得到滤波后输出Yi (η); Yi (η) = Xw (n) *g1; i (n) *g2, i (n) *g3, i (n) *g4, i (η),i=0, 1,...,63 ; 其中,表示数字信号处理领域中的卷积操作; (c) 求各通道频域信号的能量,对GT滤波器组输出信号进行分帧,帧长为N,N的取值 范围是240彡N彡960, N取为480,在采样频率为48KHz时,其等效时间长度为10毫秒,计 算当前帧中各通道滤波器输出分量的对数能量和;
其中,strat表示当前帧在信号X (η)中的开始位置; (d) 用离散余弦变换对各通道倒谱能量进行压缩,得到伽马通频率倒谱系数;
其中,L为伽马通频率倒谱系数的阶数,L的取值范围是16彡L彡64, L取32。
3. 根据权利要求1所述的一种语音中瞬态噪声抑制的方法,其特征在于:瞬态噪声检 测模块的检测过程如下: 计算当前帧,即第P帧,信号的伽马通频率倒谱系数矢量C(p) (1)与前一帧,即第p-1帧, 信号的平滑伽马通频率倒谱系数矢量(6^).(/)的欧式距离Dis,
平滑伽马通频率倒谱系数矢量??).(ο的更新过程为 C!;jtxi) = β+ (\~β)-Cip''(!). 其中,β是伽马通频率倒谱系数的平滑因子,其β =0.6;采用基于噪声能量的软阈值 判决方法对噪声帧进行检测,首先计算当前帧与前一帧输入信号能量E (ρ)、Ε (p-1),根据信 号能量设定阈值thres=q[E(p)+E(p_l)]/2, q取0. 25,当伽马通频率倒谱系数矢量距离值 Dis大于阈值thres时,即判定当前帧存在瞬态噪声。
4. 根据权利要求1所述的一种语音中瞬态噪声抑制的方法,其特征在于:语音信号重 建模块的处理方法如
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1