用于检测及抑制瞬态噪声的方法

文档序号:2827733阅读:215来源:国知局
用于检测及抑制瞬态噪声的方法
【专利摘要】一种用于检测及抑制瞬态噪声的方法,涉及声信号处理【技术领域】,所解决的是现有方法实时性差,及对瞬态噪声的抑制效果差的技术问题。该方法先利用传声器拾取声信号,再对声信号进行预处理,并忽略平稳态噪声残留,得到预处理后的声信号x(n),再通过快速傅里叶变换计算x(n)每一帧的短时谱,再采用基于高采样或基于自谱相干的瞬态噪声检测方法对x(n)进行瞬态噪声检测,再采用基于语音谐波及基于语音和音频时频连续性的保护方法进行瞬态噪声的鲁棒抑制,然后再计算各个帧的最终瞬态噪声抑制增益,最后再通过时域重叠相加重构各个帧。本发明提供的方法,适用于语音和音频信号,既可应用于实时语音和音频通信系统,也可以应用非实时的语音和音频信号增强中。
【专利说明】用于检测及抑制瞬态噪声的方法

【技术领域】
[0001] 本发明涉及声信号处理技术,特别是涉及一种用于检测及抑制瞬态噪声的方法的 技术。

【背景技术】
[0002] 当前,绝大多数的单通道语音增强方法都假定噪声的平稳特性,即噪声相对于语 音信号更加平稳,可以通过噪声估计方法对平稳态噪声进行估计,最后进行平稳态噪声的 抑制。多通道语音增强方法都利用目标语音和干扰噪声的空间分离度,通过波束形成等手 段进行空域滤波,实现平稳态和非平稳态噪声抑制。
[0003] 现有方法都采用基于监督学习的瞬态噪声抑制方法,需要通过在线或者离线监督 学习瞬态噪声特性,以实现瞬态噪声的检测,最终实现瞬态噪声抑制,因此无法做到实时 性,也无法适用于所有类型的瞬态噪声,对瞬态噪声的抑制效果较差,导致声信号失真严 重,无法应用于实时语音通信系统中,同时该方法也不具普遍适用性。


【发明内容】

[0004] 针对上述现有技术中存在的缺陷,本发明所要解决的技术问题是提供一种实时性 好,且对瞬态噪声的抑制效果好,能有效减少声信号失真的用于检测及抑制瞬态噪声的方 法。
[0005] 为了解决上述技术问题,本发明所提供的一种用于检测及抑制瞬态噪声的方法, 其特征在于,具体步骤如下:
[0006] 1)利用单传声器或多传声器拾取声信号;
[0007] 2)对传声器所拾取的声信号进行预处理,并忽略平稳态噪声残留,得到预处理后 的声信号为:
[0008] X (n) = s (n) +dt (η);
[0009] 其中,χ(η)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分, dt(η)为预处理后的声信号中的瞬态噪声成分;
[0010] 如果声信号是采用单传声器拾取的,其预处理方式为采用谱减法来抑制声信号的 平稳态噪声;
[0011] 如果声信号是采用多传声器拾取的,其预处理方式为先采用波束形成法来抑制方 向性干扰噪声,再采用多通道后滤波法来抑制环境噪声;
[0012] 3)通过快速傅里叶变换计算X (η)每一帧的短时谱,具体计算公式为:
[0013] X(k, 1) = S(k, 1)+Dt(k, 1);
[0014] 其中,X(k, 1)为x(n)中的第1帧的第k个频带短时谱,S(k, 1)为s(n)中的第1 中贞的第k个频带短时谱,Dt(k, 1)为dt (η)中的第1巾贞的第k个频带短时谱;
[0015] 4)采用基于高采样的瞬态噪声检测方法对X(η)进行瞬态噪声检测,或采用基于 自谱相干的瞬态噪声检测方法对x(n)进行瞬态噪声检测,从而得到各个帧的初步瞬态噪 声抑制增益;
[0016] 5)采用基于语音谐波的保护方法进行瞬态噪声的鲁棒抑制,得出各个帧的基频及 谐频对应频带的第一种增益保护函数,并采用基于语音和音频时频连续性的保护方法进行 瞬态噪声的鲁棒抑制,得出语音和音频时频连续性对应频带的第二种增益保护函数;
[0017] 6)计算各个帧的最终瞬态噪声抑制增益,具体计算公式为:
[0018] G (k, 1) = max {〇! (k, 1), Gp;! (k, 1), Gp;2 (k, 1), Gmin};
[0019] 其中,G(k,1)为第1帧第k个频带的最终瞬态噪声抑制增益,Gi(k,1)为第1帧第 k个频带的初步瞬态噪声抑制增益,GRl(k,1)为第1帧第k个频带的第一种增益保护函数, GR2(k,1)为第1帧第k个频带的第二种增益保护函数,Gmin为最大瞬态噪声抑制量,G min的 取值在-30dB到-20dB之间,对G(k,1)进行进一步约束如下:
[0020] G(k, 1) = min{G(k, 1), 1};
[0021] 7)通过时域重叠相加重构各个帧,重构公式为:
[0022]

【权利要求】
1. 一种用于检测及抑制瞬态噪声的方法,其特征在于,具体步骤如下: 1) 利用单传声器或多传声器拾取声信号; 2) 对传声器所拾取的声信号进行预处理,并忽略平稳态噪声残留,得到预处理后的声 信号为: X (n) = s (n) +dt (η); 其中,x(n)为预处理后的声信号,s(n)为预处理后的声信号中的目标语音成分,dt(η) 为预处理后的声信号中的瞬态噪声成分; 如果声信号是采用单传声器拾取的,其预处理方式为采用谱减法来抑制声信号的平稳 态噪声; 如果声信号是采用多传声器拾取的,其预处理方式为先采用波束形成法来抑制方向性 干扰噪声,再采用多通道后滤波法来抑制环境噪声; 3) 通过快速傅里叶变换计算X (η)每一帧的短时谱,具体计算公式为: X(k, 1) = S(k, 1)+Dt(k, 1); 其中,X(k, 1)为χ (η)中的第1帧的第k个频带短时谱,S(k, 1)为s (η)中的第1帧的 第k个频带短时谱,Dt(k, 1)为dt (η)中的第1巾贞的第k个频带短时谱; 4) 采用基于高采样的瞬态噪声检测方法对x(n)进行瞬态噪声检测,或采用基于自谱 相干的瞬态噪声检测方法对χ (η)进行瞬态噪声检测,从而得到各个帧的初步瞬态噪声抑 制增益; 5) 采用基于语音谐波的保护方法进行瞬态噪声的鲁棒抑制,得出各个帧的基频及谐频 对应频带的第一种增益保护函数,并采用基于语音和音频时频连续性的保护方法进行瞬态 噪声的鲁棒抑制,得出语音和音频时频连续性对应频带的第二种增益保护函数; 6) 计算各个帧的最终瞬态噪声抑制增益,具体计算公式为: G (k, 1) = max {〇! (k, 1), Gp;! (k, 1), Gp; 2 (k, 1), Gmin}; 其中,G(k,1)为第1帧第k个频带的最终瞬态噪声抑制增益,Gjk,1)为第1帧第k 个频带的初步瞬态噪声抑制增益,GR1 (k,1)为第1帧第k个频带的第一种增益保护函数, GR2(k,1)为第1帧第k个频带的第二种增益保护函数,Gmin为最大瞬态噪声抑制量,G min的 取值在-30dB到-20dB之间,对G(k,1)进行进一步约束如下: G(k, 1) = min{G(k, 1), 1}; 7) 通过时域重叠相加重构各个帧,重构公式为:
其中,为各帧重构后得到的声信号,IFFT为逆快速傅里叶变换。
2. 根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤4) 中,基于高采样的瞬态噪声检测方法的检测步骤如下: 4. 1. 1)对x(n)采用高采样率进行采样,设x(n)中,目标语音的频率范围为[0,fj,所 采用的高采样率为fsl,则有fsl >> 2f;,fsl >> 2f;是指fsl在2f;的1. 5倍以上; 4. 1. 2)利用子带分析滤波器或快速傅里叶变换,将采样样本按一帧一个子带的方式分 成多个子带,并计算各个子带的能量,具体计算公式为:
其中,Ener_p为采样样本中的第p个子带的能量,ηι为计算子带能量的采样点下限, nu为计算子带能量的采样点上限,(η)为采样样本中的第p个子带,q为指数,q取值为 1为幅度求和,q取值为2为平方求和; 4. 1.3)在x(n)的频率域对每个子带进行噪声能量粗略分带估算,并根据各个子带的 噪声能量粗略分带估算值设定当前子带的瞬态噪声标志; 对于每一个子带,如果存在Enersub,p彡RXNoise_Enersub, p,则将该子带的瞬态噪声标 志设置为1,表征当前子带具有瞬态噪声,反之则将该子带的瞬态噪声标志设置为〇,表征 当前子带没有瞬态噪声; 其中,R为门限,R的取值范围为5?10, N〇ise_Enersub,p为采样样本中的第p个子带 的噪声能量粗略分带估算值; 4. 1. 4)降低采样率对步骤4. 1. 3)处理后的每个子带进行重采样后重构,设重采样的 采样率为fs2,则有fs2 = %; 4. 1. 5)根据步骤4. 1. 4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益 为: G^k, 1) = minU-F^k, 1)}; 其中,h (k,1)为第1帧的初步瞬态噪声抑制增益,匕(k,1)为第1帧的瞬态噪声标志。
3. 根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤4) 中,基于自谱相干的瞬态噪声检测方法的检测步骤如下: 4. 2. 1)计算每个频带的自谱相干,具体计算公式为:
其中,Cxx(k,1)为第1帧的第k个频带的自谱相干,1?和&均为正整数,1?的取值为2 或3或4, KQ的典型值为8, K = [k-KQ…k+Kj ; 4. 2. 2)将每个频带的自谱相干与门限对比,检测每个频带的瞬态噪声; 对于每一个频带,如果存在Cxx (k,1) > Cthl,则将该频带的瞬态噪声标志设置为1,表征 当前帧的当前频带具有瞬态噪声,反之则将该频带的瞬态噪声标志设置为〇,表征当前帧的 当前频带没有瞬态噪声; 其中,Cthl是检测门限,取值范围为[0. 5, 1]; 4. 2. 3)计算帧自谱相干,具体计算公式为:
其中,Cxx⑴为第1帧的自谱相干,1?是正整数,其取值为2或3 kup],klQW的取值为11, kup是一常数; 4. 2. 4)将帧自谱相干与门限对比,检测每个帧的瞬态噪声: 对于每一个巾贞,如果存在cxx(i)彡cth2JU将该巾贞的瞬态噪声标志设置为1,表征当前中贞 具有瞬态噪声,反之则将该帧的瞬态噪声标志设置为0,表征当前帧没有瞬态噪声; 其中,cth2是检测门限,其取值范围为[0.1,1]; 4.2.5)根据步骤4. 2. 4)的瞬态噪声检测结果,得到各个帧的初步瞬态噪声抑制增益 为: G^k, 1) = min{l-Fj(k, 1), j = 2, 3}; 其中,Gjk,1)为第1帧的初步瞬态噪声抑制增益,F2(k,1)为第1帧的瞬态噪声标志, F3(k,1)为第1帧的第k个频带的瞬态噪声标志设置。
4. 根据权利要求3所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤 4. 2. 3)中,传声器拾取声信号的采样频率为8000Hz时,1^的取值为129,传声器拾取声 信号的采样频率为16000Hz时,k up的取值为257,传声器拾取声信号的采样频率大于等于 32000Hz时,kup的取值为513。
5. 根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤5) 中,基于语音谐波的保护方法的计算步骤如下: 5. 1. 1)采用基频估计方法提取各个帧的基频,并计算基频频带,具体计算公式为:
其中,为第1帧的基频频带,feu为第1帧的基频,4为传声器拾取声信号的采样 频率,N为传声器拾取声信号的数据分巾贞巾贞长; 5. 1. 2)对各个帧的基频及谐频对应的频带进行保护,保护策略为: 对于每一个帧,如果存在
则令Gp^k, 1) = 1 ; 其中,k为第1帧的第k个频带,GRl(k,l)为第1帧第k个频带的第一种增益保护函 数,其初始值为〇; 其中,j为小于等于6的正整数。
6. 根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤5) 中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的实时保护方 法,该方法的计算步骤如下: 5. 2. 1. 1)在频域内对谱进行平滑处理,具体处理公式为: |x(k,/)| = w(k)?|x(k,/)|i 其中,w(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗; 5. 2. 1. 2)计算各个帧的增益保护函数,具体计算公式为:
其中,GPi2 (k,1)为第1帧第k个频带的第二种增益保护函数,q为指数,q的典型取值 为0. 5或1或2, L为巾贞偏移。
7.根据权利要求1所述的用于检测及抑制瞬态噪声的方法,其特征在于,所述步骤5) 中,基于语音和音频时频连续性的保护方法采用的是基于语音和音频连续性的非实时保护 方法,该方法的计算步骤如下: 5. 2. 2. 1)在频域内对谱进行平滑处理,具体处理公式为: |x(k,/)| = w(k)?|x(k,/)|; 其中,W(k)为窗函数,具体为矩形窗,或三角窗,或汉宁窗; 5. 2. 1. 2)计算各个帧的增益保护函数,具体计算公式为:
其中,GR2 (k,1)为第1帧第k个频带的第二种增益保护函数,q为指数,q的典型取值 为0. 5或1或2, L为巾贞偏移。
【文档编号】G10L21/0208GK104157295SQ201410418126
【公开日】2014年11月19日 申请日期:2014年8月22日 优先权日:2014年8月22日
【发明者】郑成诗, 厉剑, 彭仁华, 李晓东 申请人:中国科学院上海高等研究院, 中国科学院声学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1