基于听觉感知模型的多通道语音增强方法

文档序号:2827233阅读:166来源:国知局
基于听觉感知模型的多通道语音增强方法
【专利摘要】本发明涉及一种基于听觉感知模型的多通道语音增强方法,所述方法包括:将输入信号非均匀通道划分为多个通道信号;检测每个通道的噪声级得到噪声级数据;根据所述噪声级数据计算得到每个通道的通道增益;每个所述通道的通道信号与通道增益的积作为该通道的增益信号;将所述每个通道的增益信号进行信号综合得到输出信号;发送该输出信号。本发明中采用的模拟听觉感知模型的滤波器将加权叠接相加结构与全通变换相结合,实现在通道数目较少的情况下模拟人耳听觉分辨率,同时,具有较低的计算复杂度。而且,在信号综合过程中加入了全通反变换操作,克服了现有技术中相位失真的问题,可应用于实时信号处理。
【专利说明】基于听觉感知模型的多通道语音增强方法
【技术领域】
[0001]本发明涉及语音数字信号处理技术,具体涉及一种基于听觉感知模型的多通道语音增强方法。
【背景技术】
[0002]语音增强是语音信号处理的一个重要分支,其目的是改善音质,提高清晰度和可懂度,减少听觉疲劳。语音增强的主要方法之一是谱减法,它通过从含噪语音功率谱中减去噪声功率谱来估计干净语音的功率谱。传统的谱减法是在某帧语音经过快速傅立叶变换后的整个频域上减去一个相同的谱减参数。而语音和实际环境中的非平稳噪声在频域上是非均匀分布的。相应的,噪声信号在不同的频带上对语音信号的影响也是不同的。因此,人们提出了多通道语音增强技术。典型的多通道语音增强系统是先用滤波器组将信号划分为多个通道,对每个通道的信号单独进行语音增强处理。最后,将处理后的各通道信号综合成一路信号。
[0003]多通道语音增强系统设计中的一个关键问题是如何使系统的频率分辨率与人类听觉系统的频率分辨率相匹配,又可以尽量减少通道数目。针对以离散傅立叶变换(Discrete Fourier Transform, DFT)为基础的多通道语音增强系统只能提供均勻通道划分的问题,专利号为US7277554的发明提出了用一阶全通滤波器代替离散傅立叶变换中的延迟单元,从而实现在非线性频率变换域上计算压缩放大增益的语音增强系统,适当选择全通滤波器的极点位置,该系统可以较好地模拟听觉系统。但是,由于全通滤波器的群延迟与频率有关,该系统会造成信号的不同频率成分通过该系统的时间不同,导致信号失真,这种由于频率相关的群延迟产生的信号失真在通道数目较多时尤为严重。

【发明内容】

[0004]本发明的目的是针对现有技术的缺陷,提供了一种基于听觉感知模型的多通道语音增强方法,实现在通道数目较少的情况下模拟人耳听觉分辨率,本发明既具有加权叠接相加结构的高效率,同时克服了目前频率变换滤波器组方法中存在的无法实时实现和相位失真的问题。
[0005]为实现上述目的,本发明提供了一种基于听觉感知模型的多通道语音增强方法,所述方法包括以下步骤:
[0006]将输入信号非均匀通道划分为多个通道信号;
[0007]检测每个通道的噪声级得到噪声级数据;
[0008]根据所述噪声级数据计算得到每个通道的通道增益;
[0009]每个所述通道的通道信号与通道增益的积作为该通道的增益信号;
[0010]将所述每个通道的增益信号进行信号综合得到输出信号;
[0011]发送该输出信号。
[0012]优选的,将输入信号非均匀通道划分为多个通道信号具体包括:[0013]截取有限长度的信号片段,并对所述信号片段进行全通变换得到全通变换信号;其中,所述信号片段的长度P为不大于(l+|b|)L(l-|b|)的最大整数,截取步长为D,其中L为分析原型滤波器的长度,b为全通变换参数,全通变换为L-1阶,并且所述全通变换利用L-1个全通滤波器;
[0014]利用分析原型滤波器的时间翻转h(_r)对所述全通变换信号进行加权处理得到加权信号;
[0015]将所述加权信号平均分成L/K个长度为K的加权信号片段,并将所述加权信号片段相加得到和信号;
[0016]对所述和信号进行K点离散傅立叶变换得到变换信号,K为通道数目;
[0017]所述变换信号与中心频率调整系数eXp(jmD0 Icok))之积为各个通道信号的
序列之⑷,其为第k个分量对应第k个通道m时刻的输出,其中GJk = 2k /K,k =
0,? ? ?,K-1 o
[0018]优选的,全通变换具体包括:
[0019]将所述信号片段s (n)进行时间翻转得到翻转信号片段s (N-n);
[0020]将所述翻转信号片段s (N-n)进行全通滤波器A (z)链处理,当n = N时取值,得到
非线性频率变换结果.S(P);其中全通滤波器利用下式实现:

[0021]
【权利要求】
1.一种基于听觉感知模型的多通道语音增强方法,其特征在于,包括以下步骤: 将输入信号非均匀通道划分为多个通道信号; 检测每个通道的噪声级得到噪声级数据; 根据所述噪声级数据计算得到每个通道的通道增益; 每个所述通道的通道信号与通道增益的积作为该通道的增益信号; 将所述每个通道的增益信号进行信号综合得到输出信号; 发送该输出信号。
2.根据权利要求1所述的方法,其特征在于,将输入信号非均匀通道划分为多个通道信号具体包括: 截取有限长度的信号片段,并对所述信号片段进行全通变换得到全通变换信号;其中,所述信号片段的长度P为不大于(l+|b|)L(l-|b|)的最大整数,截取步长为D,其中L为分析原型滤波器的长度,b为全通变换参数,全通变换为L-1阶,并且所述全通变换利用L-1个全通滤波器; 利用分析原型滤波器的时间翻转h(-r)对所述全通变换信号进行加权处理得到加权信号; 将所述加权信号平均分成L/K个长度为K的加权信号片段,并将所述加权信号片段相加得到和信号;· 对所述和信号进行K点离散傅立叶变换得到变换信号,K为通道数目; 所述变换信号与中心频率调整系数exp(jmD0-Hcok))之积为各个通道信号的序列XJk),其为第k个分量对应第k个通道m时刻的输出,其中《 k = 2k Ji /K,k = 0,...,K-1。
3.根据权利要求2所述的方法,其特征在于,所述全通变换具体包括: 将所述信号片段s (n)进行时间翻转得到翻转信号片段s (N-n); 将所述翻转信号片段s (N-n)进行全通滤波器A (z)链处理,当n = N时取值,得到非线性频率变换结果&/?);其中全通滤波器利用下式实现:z—1 -b A(z) =-T, -1、h < 1.。
\-bz '
4.根据权利要求1所述的方法,其特征在于,将所述每个通道的增益信号进行信号综合得到输出信号具体包括: 所述各通道信号序列t(幻与另一组中心频率调整系数exp(-jmD 0 H(Cok))之积为积信号,其中,《k = 2kJi/K,k = 0,...,K-1 ; 对所述积信号进行K点离散傅立叶反变换得到反变换信号; 将所述反变换信号复制L/K次,形成一个长度为L的序列; 利用综合原型滤波器对所述序列进行加权处理得到加权信号; 对所述加权信号进行全通反变换得到全通反变换信号,其中全通反变换为P-1阶,b为全通反变换参数; 将所述全通反变换信号叠加至长度为P的输出缓存,并将输出缓存的左侧移出D个点作为叠加处理后的信号,同时将输出缓存右侧补充D个零; 将所述叠加处理后的信号通过频率响应为一阶全通滤波器A (z)的群延迟的倒数的滤波器,得到输出信号。
5.根据权利要求4所述的方法,其特征在于,所述对加权处理的结果进行P-1阶参数为b的全通反变换,可以通过P-1阶参数为_b的全通变换实现。
6.根据权利要求1所述的方法,其特征在于,所述输入信号为实信号时,所述检测各个通道的噪声级和计算所述各个通道的增益值仅需对第O至K/2通道信号进行处理。
【文档编号】G10L21/0208GK103714825SQ201410019535
【公开日】2014年4月9日 申请日期:2014年1月16日 优先权日:2014年1月16日
【发明者】孟晓辉, 肖灵 申请人:中国科学院声学研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1