噪声消除装置以及噪声消除程序的制作方法

文档序号:2824931阅读:132来源:国知局
专利名称:噪声消除装置以及噪声消除程序的制作方法
技术领域
本发明涉及消除在噪声消除后残留的音乐噪声的噪声消除装置及其程序。
背景技术
在声音识别处理以及免提通话中,由于在声音中重叠噪声,从而存在声音识别性 能以及清楚性降低这样的问题。为了解决该问题,提出了各种噪声消除方法,作为最一般的 方法已知谱减法(以下称为SS法)。在SS法中,从声音信号中的无声音的非声音区间推测噪 声谱,并从声音信号的任意帧的谱中减去所推测出的噪声谱,从而进行噪声消除。但是,在 所推测出的噪声谱与重叠于声音信号的实际的噪声谱之间存在误差的情况下,根据噪声的 频率而产生过减(over subtraction)以及欠减(under subtraction)。在过减的情况下, 通过填平(flooring)处理进行回填,但欠减的分量原样地残留。该欠减的分量被察觉为称 为音乐噪声的人为声音,成为识别性能以及清楚性降低的原因。为了削减音乐噪声,考虑以下的3个对策。( 1)增大减法系数,从而减少欠减分量(2)改善噪声谱的推测精度,减少减法残留误差(3)在减法后推测欠减分量并抑制在上述(1)的方法中,由于在声音区间中也大幅减去噪声,所以声音谱失真,对声 音识别性能造成恶劣影响。作为上述(2)的方法提出了各种方法,但重叠于帧的噪声基本上 是未知的,无法使误差成为0。作为上述(3)的方法,已知计算时间频率平面上的关注点周 边的功率比并消除音乐噪声分量的以往方法(例如,参照非专利文献1)。具体而言,计算由 以时间频率平面上的关注点为中心的距离N所包围的区域的累积功率A和由距离M (N〈M) 所包围的区域的累积功率B,在(A — B) X a〈B的情况下,通过将由关注点的距离N所包围 的区域视为音乐噪声分量并使功率成为0,从而消除音乐噪声分量。非专利文献 1 :Gary Whipple “Low residual noise speech enhancement utilizing time — frequency filtering,,ICASSP94,199
发明内容
以往的音乐噪声消除方法如以上那样构成,所以如果噪声的功率变动变大,且欠 减分量的功率变动也变大,则产生噪声谱的推测错误,其结果,存在如下课题无法消除音 乐噪声分量而原样地残留,或者将应视为声音分量的点作为音乐噪声分量而消除。另外,在音乐噪声分量消除之后,由于关注点的附近区域的功率成为0,所以存在 会产生时间上的不连续性这样的课题。本发明是为了解决上述那样的课题而完成的,其目的在于,即使在噪声的功率变 动变大且欠减分量的功率变动也变大的情况下,也能够适合地判别音乐噪声分量并抑制, 并且使用填平值来抑制音乐噪声分量,从而避免产生时间上的不连续性。本发明提供一种噪声消除装置,具备噪声推测部,推测重叠于输入信号的噪声;噪声消除部,使用噪声推测部推测出的噪声的统计量,消除重叠于输入信号的噪声并且进 行填平处理;密集度计算部,针对噪声消除的输入信号的时间频率平面上的关注点,计算位 于该关注点的周边的各点的规定的密集度;以及部分抑制部,在时间频率平面上的关注点 的密集度小于阈值的情况下,将该关注点的功率置换为噪声消除部在填平处理中使用的填 平值。本发明提供一种噪声消除程序,用于使计算机作为如下单元发挥功能噪声推测 单元,推测重叠于输入信号的噪声;噪声消除单元,使用噪声推测单元推测出的噪声的统计 量,消除重叠于输入信号的噪声并且进行填平处理;密集度计算单元,针对噪声消除的输入 信号的时间频率平面上的关注点,计算位于该关注点的周边的各点的规定的密集度;以及 部分抑制单元,在时间频率平面上的关注点的密集度小于阈值的情况下,将该关注点的功 率置换为噪声消除单元在填平处理中使用的填平值。根据本发明,针对噪声消除的输入信号的时间频率平面上的关注点,计算位于该 关注点的周边的各点的规定的密集度,在密集度小于阈值的情况下,将该关注点的功率置 换为填平值,所以即使在噪声的功率变动大且欠减分量的功率变动的情况下,也能够适合 地判别音乐噪声分量并抑制。另外,由于使用填平值来抑制音乐噪声分量,所以能够避免产 生时间上的不连续性。


图1是示出本发明的实施方式1的噪声消除装置的结构的框图。图2是示出图1所示的噪声推测部100的动作的流程图。图3是示出图1所示的噪声消除部102的动作的流程图。图4是示出图1所示的密集度计算部104的动作的流程图。图5是说明图1所示的密集度计算部104的密集度计算中使用的权重函数的图。图6是说明图1所示的密集度计算部104的密集度计算中使用的权重函数的图, 示出使用与图5不同的权重函数的情况。图7是示出图1所示的密集度计算部104的密集度计算的具体例的图。图8是示出图1所示的部分抑制部105的动作的流程图。图9是示出图1所示的部分抑制部105的部分抑制处理的具体例的图,图9 (a) 是部分抑制处理前的谱图,图9 (b)是部分抑制处理后的谱图。图10是示出本发明的实施方式2的噪声消除装置1的结构的框图。图11是示出图10所示的噪声消除部102的动作的流程图。图12是示出图10所示的密集度计算部104的动作的流程图。图13是示出本发明的实施方式3的噪声消除装置1的结构的框图。图14是示出图13所示的全局SNR推测部107以及阈值选择部108的动作的流程 图。图15是示出图13所示的阈值存储器109保存的全局SNR —阈值对应表的一个例 子的图。图16是示出本发明的实施方式4的噪声消除装置1的结构的框图。图17是示出图16所示的权重函数选择部110的动作的流程图。
图18是示出图16所示的权重函数存储器111保存的全局SNR —附近数一权重函 数一阈值对应表的一个例子的图。
具体实施例方式以下,为了更详细地说明本发明,根据附图,说明具体实施方式
。实施方式1.图1是示出本发明的实施方式1的噪声消除装置1的结构的框图。在图1中,噪 声消除装置1是消除重叠于输入信号的噪声,进而还消除在噪声消除后残留的音乐噪声分 量的装置,具备噪声推测部100、噪声谱存储器101、噪声消除部102、填平值存储器103、密 集度计算部104、部分抑制部105。噪声推测部100推测重叠于输入信号的噪声谱,计算该推测噪声谱的统计量并更 新,并输出到噪声谱存储器101。噪声谱存储器101是预先存储噪声推测部100输出的推测 噪声谱的统计量的存储部。噪声消除部102从噪声谱存储器101获取推测噪声谱的统计量 并从输入信号的谱中减去,并且为了防止过剩的减法而进行填平处理,将每个时间频率的 填平值和有无填平处理输出到填平值存储器103。密集度计算部104从填平值存储器103获取每个时间频率的有无填平的信息并进 行二值化,并求出与权重函数的积和,从而计算出时间频率平面(谱图)上的关注点的密集 度并输出到部分抑制部105。部分抑制部105比较从密集度计算部104输出的密集度和阈 值,将小于阈值的关注点的功率置换为填平值存储器103所存储的填平值,从而抑制音乐
噪声分量。在输入信号之中,在声音部分和非声音部分中,在关注点的周边格子(grid)中产 生填平的频度有意地不同,所以能够计算出周边格子的非填平处理点的密集度并将小于阈 值的关注点判别为音乐噪声分量。另外,在噪声消除装置1中,将噪声推测部100、噪声谱存储器101、噪声消除部 102、填平值存储器103、密集度计算部104以及部分抑制部105,既可以分别通过专用的电 路构成为硬件,也可以设为通过由通用的CPU (Central Processing Unit,中央处理单元) 等构成的控制电路和计算机程序的组合来实现的结构。在由计算机构成噪声消除装置1的 情况下,将记述了噪声推测部100、噪声谱存储器101、噪声消除部102、填平值存储器103、 密集度计算部104以及部分抑制部105的处理内容的噪声消除程序保存到计算机的存储 器,使计算机的通用的CPU等控制电路执行存储器中保存的噪声消除程序即可。进而,即使存在不脱离本发明的要旨的范围的设计变更等,也当然包含在本发明 中。接下来,说明噪声消除装置1的动作。首先,说明噪声推测部100的动作。图2是示出图1所示的噪声推测部100的动 作的流程图。噪声推测部100通过以下的步骤计算频率编号f的推测噪声谱的平均值y (;0和标准偏差0 (f)。首先,噪声推测部100从输入信号中,切出样本帧数NFRAME的帧作为样本(步骤 ST100)。接下来,噪声推测部100对所切出的N帧应用汉宁窗等窗函数(步骤ST101),进行 以点数为N_FFT点的FFT (Fast Fourier Transform,快速傅里叶变换)(步骤ST102)。
接下来,噪声推测部100对频率编号f设定0 (步骤ST103),比较该频率编号f和 FFT点数N_FFT(步骤ST104)。在频率编号f小于FFT点数N_FFT的情况下(步骤ST104“是”), 处理进入步骤ST105,否则(步骤ST104 “否”)处理结束。接下来,噪声推测部100在步骤ST105中,帧编号t小于初始化帧数INIT_ FRAME、或者满足下式(1)的条件的情况下(步骤ST105 “是”),进入步骤ST106,否则(步骤 ST105 “否”)进入步骤ST107。P(t, f)-U (f) < ko (f) (1)此处,P (t,f)是帧编号t的频率编号f的功率谱。k是更新参数,如果k值大,则 针对噪声变动的跟踪性变高,如果k值小,则针对噪声变动的跟踪性变低。另外,初始化帧数INIT_FRAME是学习平均值ii (f)和标准偏差o (f)的初始值 的帧数。噪声推测部100在满足上式(1)的情况下,如后所述依次更新平均值y (f)和标 准偏差0 (f),这是因为需要用某程度的帧数学习这些平均值U (f)和标准偏差0 (f) 的初始值。在以声音识别以及通话用途等为目的的情况下,从噪声消除装置1启动至发出声 音之前存在某程度的无音区间,所以能够通过将初始化帧数INIT_FRAME设为适合的值来 进行初始学习。接下来,噪声推测部100在步骤ST106中,根据下式(2广(8),更新平均值ii (f) 和标准偏差o (f)。SUMl(f) = SUMl(f)-P(oldest, f) (2)如果cnt (f) >BUFSIZESUM2(f) = SUM2(f)-P(oldest, f)2 (3)如果cnt (f) >BUFSIZESUM1 (f) = SUM1 (f) +P(t, f)(4)SUM2 (f) = SUM2 (f) +P (t,f)2(5)
权利要求
1.一种噪声消除装置,其特征在于,具备噪声推測部,推測重叠于输入信号的噪声;噪声消除部,使用所述噪声推測部推測出的噪声的统计量,消除所述重叠于输入信号 的噪声,并且进行填平处理;密集度计算部,针对噪声消除的所述输入信号的时间频率平面上的关注点,计算位于 该关注点的周边的各点的规定的密集度;以及部分抑制部,在所述时间频率平面上的关注点的密集度小于阈值的情况下,将该关注 点的功率置换为所述噪声消除部在所述填平处理中使用的填平值。
2.根据权利要求I所述的噪声消除装置,其特征在干,密集度计算部根据位于关注点的周边的各点有无噪声消除部中的填平处理,计算非填 平处理点的密集度。
3.根据权利要求I所述的噪声消除装置,其特征在干,密集度计算部计算位于关注点的周边的各点的单ー频率分量的局部SNR (信号对噪声 比)的值的密集度。
4.根据权利要求2所述的噪声消除装置,其特征在干,密集度计算部对关注点周边有无填平处理进行ニ值化,利用使用权重函数进行加权而 得到的值来计算密集度。
5.根据权利要求3所述的噪声消除装置,其特征在干,密集度计算部利用对关注点周边的各点的局部SNR使用权重函数进行加权而得到的 值来计算密集度。
6.根据权利要求4所述的噪声消除装置,其特征在于,具备全局SNR推測部,推测输入信号的多个频率分量的全局SNR ;权重函数存储部,保持与全局SNR对应的权重函数;以及权重函数选择部,从所述权重函数存储部中,选择与所述全局SNR推測部推測出的全 局SNR对应的权重函数,密集度计算部使用所述权重函数选择部选择出的权重函数。
7.根据权利要求5所述的噪声消除装置,其特征在于,具备全局SNR推測部,推测输入信号的多个频率分量的全局SNR ;权重函数存储部,保持与全局SNR对应的权重函数;以及权重函数选择部,从所述权重函数存储部中,选择与所述全局SNR推測部推測出的全 局SNR对应的权重函数,密集度计算部使用所述权重函数选择部选择出的权重函数。
8.根据权利要求4所述的噪声消除装置,其特征在干,权重函数中的权重根据时间频率平面上的距关注点的距离而变化。
9.根据权利要求5所述的噪声消除装置,其特征在干,权重函数中的权重根据时间频率平面上的距关注点的距离而变化。
10.根据权利要求I所述的噪声消除装置,其特征在于,具备全局SNR推測部,推测输入信号的多个频率分量的全局SNR ;阈值存储部,保持与全局SNR对应的阈值;以及阈值选择部,从所述阈值存储部中,选择与所述全局SNR推测部推测出的全局SNR对应 的阈值,部分抑制部使用所述阈值选择部选择出的阈值。
11.一种噪声消除程序,其特征在于,用于使计算机作为如下单元发挥功能噪声推测单元,推测重叠于输入信号的噪声;噪声消除单元,使用所述噪声推测单元推测出的噪声的统计量,消除所述重叠于输入 信号的噪声,并且进行填平处理;密集度计算单元,针对噪声消除的所述输入信号的时间频率平面上的关注点,计算位 于该关注点的周边的各点的规定的密集度;以及部分抑制单元,在所述时间频率平面上的关注点的密集度小于阈值的情况下,将该关 注点的功率置换为所述噪声消除单元在所述填平处理中使用的填平值。
12.根据权利要求11所述的噪声消除程序,其特征在于,密集度计算单元根据位于关注点的周边的各点有无噪声消除单元中的填平处理,计算 非填平处理点的密集度。
13.根据权利要求11所述的噪声消除程序,其特征在于,密集度计算单元计算位于关注点的周边的各点的单一频率分量的局部SNR的值的密 集度。
14.根据权利要求12所述的噪声消除程序,其特征在于,密集度计算单元对关注点周边有无填平处理进行二值化,利用使用权重函数进行加权 而得到的值来计算密集度。
15.根据权利要求13所述的噪声消除程序,其特征在于,密集度计算单元利用对关注点周边的各点的局部SNR使用权重函数进行加权而得到 的值来计算密集度。
16.根据权利要求14所述的噪声消除程序,其特征在于,具备全局SNR推测单元,推测输入信号的多个频率分量的全局SNR ;权重函数存储单元,保持与全局SNR对应的权重函数;以及权重函数选择单元,从所述权重函数存储单元中,选择与所述全局SNR推测单元推测 出的全局SNR对应的权重函数,密集度计算单元使用所述权重函数选择单元选择出的权重函数。
17.根据权利要求15所述的噪声消除程序,其特征在于,具备全局SNR推测单元,推测输入信号的多个频率分量的全局SNR ;权重函数存储单元,保持与全局SNR对应的权重函数;以及权重函数选择单元,从所述权重函数存储单元中,选择与所述全局SNR推测单元推测 出的全局SNR对应的权重函数,密集度计算单元使用所述权重函数选择单元选择出的权重函数。
18.根据权利要求14所述的噪声消除程序,其特征在于,权重函数中的权重根据时间频率平面上的距关注点的距离而变化。
19.根据权利要求15所述的噪声消除程序,其特征在于,权重函数中的权重根据时间频率平面上的距关注点的距离而变化。
20.根据权利要求11所述的噪声消除程序,其特征在于,具备全局SNR推测单元,推测输入信号的多个频率分量的全局SNR ;阈值存储单元,保持与全局SNR对应的阈值;以及阈值选择单元,从所述阈值存储单元中,选择与所述全局SNR推测单元推测出的全局 SNR对应的阈值,部分抑制单元使用所述阈值选择单元选择出的阈值。
全文摘要
噪声消除部(102)进行输入信号的噪声消除以及填平处理,密集度计算部(104)针对噪声消除的输入信号的时间频率平面上的关注点,根据其周边的各点有无填平处理,计算非填平处理点的密集度。部分抑制部(105)在其密集度小于阈值的情况下视为音乐噪声分量,将关注点的功率置换为填平值,从而抑制音乐噪声分量。
文档编号G10L21/02GK102667928SQ20108005894
公开日2012年9月12日 申请日期2010年11月17日 优先权日2009年12月25日
发明者成田知宏 申请人:三菱电机株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1