使用非线性增益平滑以降低音乐伪声的方法和音频噪声抑制器与流程

文档序号:18457954发布日期:2019-08-17 01:46阅读:206来源:国知局
使用非线性增益平滑以降低音乐伪声的方法和音频噪声抑制器与流程

本发明涉及音频处理领域,尤其涉及一种使用非线性增益平滑以降低音乐伪声的方法和音频噪声抑制器。



背景技术:

许多通信信道是有噪声的;该信道噪声被添加至预期信号并被传送至接收器。另外,许多通信设备,包括手机,在诸如人群、汽车、商店和存在背景音乐或噪声的其他地方的嘈杂环境中被使用;背景噪声通常被麦克风拾取并被有效地添加至预期语音信号中,并且除非该背景噪声在传送设备处被抑制,否则其被传输至接收器。

当信道噪声和背景噪声中的任一个或两者到达接收器时,除非使用噪声抑制器,否则该噪声会损害预期语音信号的可懂度。

可以使用音频噪声抑制器的典型通信系统200在图2中示出。来自人类说话者202和背景噪声源204的音频被麦克风206拾取,来自麦克风206的音频可以在被传输器210传输至信道212之前被噪声抑制器208处理。信道噪声可以被信道噪声源214注入到信道212中,其中信道噪声可以被添加至传输信号并被接收器216接收以提供有噪声的信号,该有噪声的信号可以在驱动扬声器220且被呈现给人类收听者222之前被噪声抑制器218处理。

可用作信道212的传输器端处的噪声抑制器208或作为信道212的接收器端处的噪声抑制器218的传统噪声抑制器100(图1)将音频输入102接收至频域转换单元104。频域信号被带提取器106分离为单独的信号108,每个信号108表示多个频带的频带;这些单独的频带信号被提供给语音检测器110,语音检测器110从单独的频带信号确定进入音频中是否存在语音。每个频带信号被具有噪声估计器114和信噪比估计器116的单独的每带单元112进一步处理,信噪比估计器116将估计的信噪比118提供至增益计算器120。增益计算器120将带特定增益122提供至可变增益单元124,可变增益单元124将带特定增益122应用于表示该频带的单独信号108,以提供带特定增益调节信号126。带特定增益调节信号126由复合器128收集并由模拟或时域转换器130转换为模拟域或数字时域音频输出信号132。

尽管在根据图2的系统中的根据图1的噪声抑制器在来自噪声源204、214的噪声的一些条件下工作良好,在其他条件下,它们可能证明是令人讨厌的“音乐”伪声。这些伪声是由应用于一个或几个频带的不适当的增益引起的,使得当这些频带中的噪声不应被放大或被不充分地抑制时被放大或被不充分地抑制。



技术实现要素:

本发明的实施例提供一种噪声抑制器和一种噪声抑制的方法。

根据一个实施例,噪声抑制器包括:带提取器,适用于按频带分离频域输入;至少一个每带单元,包括:噪声估计器,被耦合以接收所述带提取器的每带输出,信噪比(snr)计算单元,被耦合以接收所述噪声估计器的输出和所述带提取器的每带输出并提供当前snr,直方图单元,被耦合以提供当前和过去snr的直方图,增益曲线更新器,用于从所述当前和过去snr的直方图导出增益曲线,原始增益查找器,用于使用所述增益曲线和所述当前snr确定原始增益,后滤波单元,被耦合以接收所述原始增益并提供滤波的增益,以及可变增益单元,被耦合以接收所述带提取器的每带输出并应用所述滤波的增益以提供带特定增益调节信号;以及组合器,用于将来自每个每带单元的带特定增益调节信号组合为降噪的频域信号。

根据一个实施例,噪声抑制的方法包括:按频带将频域输入分离为频带信号;对于每个频带信号:估计所述频带信号的噪声,从估计的噪声和所述频带信号中获得信噪比,以提供当前的snr,对snr进行直方图化,以提供当前和过去snr的直方图,从所述当前和过去的snr的直方图更新增益曲线,使用所述增益曲线和当前snr查找原始增益,对所述原始增益进行滤波以提供滤波的增益,以及将所述滤波的增益应用于所述频带信号,以提供带特定增益调节信号;以及将所述带特定增益调节信号组合为降噪的频域信号。

附图说明

图1是现有技术音频噪声抑制器的框图。

图2是可以实施一个或多个音频噪声抑制器的系统的框图。

图3是增强的噪声抑制器的框图。

图4是示出单个峰的当前和过去的噪声幅度直方图。

图5是使用图4的直方图导出的自适应增益曲线的曲线图。

图6是示出两个峰的当前和过去的噪声幅度直方图。

图7是使用图6的直方图导出的自适应增益曲线的曲线图。

图8是降低通信系统中的噪声的方法的流程图。

具体实施方式

可用作信道212的传输器端处的噪声抑制器208或用作信道212的接收器端处的噪声抑制器218的改进的噪声抑制器300(图3)将音频输入302接收至频域转换单元304。如果模拟信号被提供至噪声抑制器,它们被模数转换器转换为脉冲编码调制(pcm)格式。在实施例中,频域转换单元304对包含pcm格式的输入音频的多个连续样本的时间片或帧执行快速傅里叶变换(fft)、离散傅立叶变换(dft)或离散余弦变换(dct)。

来自频域转换单元304的频域信号被带提取器306分离为单独的信号或信号组308,每个单独的信号或信号组308表示多个频带的频带;这些单独的频带信号被提供给语音检测器310,语音检测器310从单独的频带信号确定进入音频中是否存在语音,并通过查找与语音相关联的频率的模式来提供语音检测标记312。

这些单独的频带信号被单独的每带增益导出和增益应用单元314进一步处理。

在每个单独的每带增益导出和应用单元314内提供自适应增益曲线计算单元320和非线性后滤波单元322。自适应增益曲线计算单元320基于到该自适应增益曲线计算单元314的输入信号功率和由该增益导出和应用单元的噪声估计器316确定的估计噪声功率,逐帧地调整抑制增益曲线。

非线性后滤波单元322使用针对当前帧计算的当前原始增益和来自增益曲线计算单元320的最近的先前原始增益来提供进一步的平滑。它假设原始增益被噪声破坏并因此计算平滑增益,因此特定频带的平滑增益是当前增益和在先前的时间片中确定的增益的非线性组合。

自适应增益曲线

在自适应增益曲线计算单元320的snr估计器318中使用输入瞬时信号功率和噪声功率估计,以计算当前帧的信噪比(snr),输入瞬时信号功率和噪声功率估计被表示为其中n和k是帧索引和频带索引。在描述计算时,为方便起见,我们在以下等式中省略频带索引k。当前信噪比为:

并且其被用来针对由语音检测器310确定的仅噪声周期更新snr直方图单元324中的snr直方图。我们将ξ(n)的范围离散化为ξmin和ξmax之间等间隔的q个区间。在特定实施例中,ξmin和ξmax分别是0和6。

所有当前和最近的过去snr的直方图的值被初始化为1/q。当当前帧没有语音时,直方图的所有组(bin)的概率是:

对于i=1,2,...q,其中αξ是控制我们多么快速地更新直方图的常数,在实施例中,αξ是0.98。由于直方图的总和等于1,当仅存在噪声时,我们将其用作snr的近似概率分布。对于小于ξmin或大于ξmax的ξ(n),我们跳过更新直方图。

随着ξ(n)在增益曲线更新器326中增大,直方图被用来导出从0开始并且单调增大到1的增益曲线。直方图改变曲线,以使得对于具有高概率的ξ(n),曲线以较小的斜率增加,而对于具有低概率的ξ(n),斜率较陡。结果是,对于更频繁发生的ξ(n)的值,增益变化不那么快,因此降低增益随时间的总体波动。

令原始增益为gr(n),我们使用将瞬时snrξ(n)映射至gr(n)的参数化映射函数:

其中t(pξ(n),i)是定义为下式的参数化函数:

基本上,我们使用snr概率的倒数作为从0开始并以1结束的分段线性曲线的斜率。下面的图示出了具有不同snr分布的gr(n)的两个示例。在图4中,可以看出ξ(n)通常以1db为中心。结果,与例如4至6db的其他区域相比,图5的相应增益曲线在该区域中具有较小的斜率。

在snr的概率分布中存在两个峰的示例增益曲线中,如图6所示,增益曲线适于具有分别在0db和3db附近的两个平坦区域,如图7所示。

更新的增益曲线被应用于原始增益查找器328中的当前帧snr,并且过去的原始增益被保存在增益历史缓存器330中。

非线性后滤波

计算当前和历史原始收益后,我们将它们表示为gr(n)。我们使用历史b缓存器330中的历史增益值进一步平滑增益平滑器340中的当前增益gi;增益平滑器340本质上是利用自适应权重的低通有限脉冲响应(fir)数字滤波器。在特定实施例中,我们在历史缓存器330中保存八个历史原始增益。我们沿时间轴计算权重并将中间增益gi(n)计算为:

即,gr(n)是当前和过去增益值的加权和。为了确定权重wt(i),我们使用:

其中γt和γs是预定义的常数,且zw是被定义为下式的标准化因子:

式(6)示出我们对最近的过去增益加更多权。我们还使用时间衰减exp(-γs)来确保我们强调最近的增益甚于旧的收益。在实施例中,γt和γs分别是4和0.78。在(5)和(6)中,我们在时频域平面上使用原始增益值执行非线性滤波,以提供中间增益gi。

使用来自预定义的滤波器和相邻带增益导出和应用单元的经先前增益历史滤波的原始增益,通过在频域中使用预定义的滤波器对每个中间增益gi(n)进行滤波,在多带增益平滑器342中获得最终平滑增益g0(n):

其中k是频带索引,h(i)是具有低通特性的预定义的滤波器。

然后将平滑的增益g0应用于每带可变增益单元350中的经频域转换的输入信号或信号组308,以提供带特定增益调节降噪的频域信号352。

带特定增益调节降噪的频域信号352由复合器354收集至降噪的频域信号中,并由模拟或时域转换器356转换为模拟域或数字时域音频输出信号358中的任一个。在实施例中,模拟或时域转换器356执行频域转换器304的功能的逆。

如图3的硬件所实现的降低通信系统中的噪声的方法400(图4)开始于将进入模拟或数字信号转换402为频域输入,并且确定404是否存在语音。然后将频域输入405分离至单独的频带以进行进一步处理。

频域输入中的每个频带被单独地处理406,从估计408频带内噪声以及计算410带内信噪比(snr)开始。当语音不存在时确定的当前和最近的过去snr被直方图化412。直方图用于更新414增益曲线。增益曲线与snr一起使用416以查找原始增益。然后使用有限脉冲响应数字低通滤波器在时间上对原始增益进行滤波418以给出中间增益。然后针对在相邻和附近频带中确定的增益对中间增益进行滤波420,以给出最终增益。在可变增益单元中应用422最终增益,以产生用于该频带的降噪的信号。

来自所有频带的降噪的信号被再组合424以产生频域形式的降噪的音频,然后将其再转换426至时间或模拟域。

特征的组合

本文公开的特征可以以各种方式组合。预期的特定组合包括:

指定为a的噪声抑制器具有适用于按频带分离频域输入的带提取器。抑制器具有:具有被耦合以接收带提取器的每带输出的噪声估计器、被耦合以接收噪声估计器的输出和带提取器的每带输出并提供当前snr的信噪比(snr)计算单元、被耦合以提供当前和过去snr的直方图的直方图单元、用于从当前和过去snr的直方图导出增益曲线的增益曲线更新器、用于使用增益曲线和当前snr来确定原始增益的原始增益查找器、被耦合以接收原始增益并提供滤波的增益的后滤波单元,以及被耦合以接收带提取器的每带输出并应用滤波的增益以提供带特定增益调节信号的可变增益单元的至少一个每带单元。噪声抑制器还具有用于将带特定增益调节信号组合为降噪的频域信号的组合器。

指定为aa的噪声抑制器包括指定为a的噪声抑制器,其中至少一个每带单元的后滤波单元包括低通有限脉冲响应数字滤波器。

在包括指定为a或aa的噪声抑制器的指定为ab的噪声抑制器中,至少一个每带单元还包括执行当前带和相邻带中间增益的加权平均以提供滤波的增益的多带平滑器。

在包括指定为a、aa或ab的噪声抑制器的指定为ac的噪声抑制器中,还包括适用于执行快速傅里叶变换(fft)、离散傅里叶变换(dft)或离散余弦变换(dct)以将输入转化为频域输入的频域转换器。

指定为b的噪声抑制的方法包括按频带将频域输入分离为频带信号。对于每个频带信号,该方法包括估计频带信号的噪声,从估计的噪声和频带信号导出信噪比以提供当前snr,对snr进行直方图化以提供当前和过去snr的直方图,从当前和过去snr的直方图更新增益曲线,使用增益曲线和当前snr查找原始增益,对原始增益进行滤波以提供滤波的增益,并将滤波的增益应用于频带信号以提供带特定增益调节信号。该方法包括将带特定增益调节信号再组合为降噪的频域信号。

一种指定为ba的抑制噪声的方法,包括指定为b的方法,并且其中对原始增益进行滤波包括低通有限脉冲响应滤波。

一种指定为bb的抑制噪声的方法,包括指定为b或ba的方法,其中对频带的第一频带的原始增益进行滤波包括执行当前带和相邻带中间增益的加权平均。

一种指定为bc的抑制噪声的方法,包括指定为b、ba或bb的方法,还包括执行快速傅立叶变换(fft)、离散傅里叶变换(dft)或离散余弦变换(dct)以将输入转化为频域输入。

在不脱离本发明的范围的情况下,可以在上述方法和系统中进行改变。因此应当注意的是,包含在以上描述中或在附图中示出的内容应当被解释为说明性的而不是限制性的。以下权利要求旨在涵盖本文描述的所有通用和特定特征,以及作为语言问题可以说落如其间的本方法和系统的范围的所有陈述。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1