噪音抑制装置以及声音解码装置的制作方法

文档序号：2831933阅读：306来源：国知局

专利名称：噪音抑制装置以及声音解码装置的制作方法
技术领域：
本发明涉及对混入到声音/音响信号中的噪音进行抑制的噪音抑制装置以及具备噪音抑制装置的声音解码装置。
背景技术：
作为如下噪音抑制处理的代表性的方法，例如有SS(SpeCtral Subtraction 谱减)法，其中，所述噪音抑制处理为通过从混入了噪音的输入信号中抑制作为目标外信号的噪音，从而强调作为目标信号的声音信号等。在SS法中，通过从振幅谱中减去另行推测的平均的噪音谱，由此进行噪音抑制(例如，参照非专利文献1)。在进行了 SS法等噪音抑制处理的情况下，噪音谱的推测误差作为失真而残留于噪音抑制处理后的信号中，这具有与处理前的信号大不相同的特性，并且作为刺耳的噪音 (还称为人工的噪音、乐音(musical tone))而出现，所以往往会使输出信号的主观质量大幅劣化(变差)。另外，如果提高声音以及音乐声(musical sound)等声音音响编码方式的压缩率，则与编码时的量化噪音以及符号模型化相伴的谱失真逐渐增大，输出信号的主观质量大幅劣化。特别是在声音音响信号中混入噪音的情况以及在输入信号中仅存在噪音的情况下，编码方式所利用的声音模型、与背景噪音的模型大不相同，所以其劣化变得显著。另外，背景噪音区间中的这些劣化感像“沙沙(〉->〉->) ”这样的水流声，有时被称为水流噪音(Water Flow Noise)。作为对所述那样的主观性的劣化感进行抑制的以往的方法，例如有专利文献1公开的技术。在专利文献1的音信号加工方法中，以在听觉上减轻由于噪音抑制处理、低比特率声音编码处理而产生的失真感为目的，根据由声音/噪音状态判别单元求出的信号中的噪音比率的推测值，对输入信号与将输入信号进行平滑化而得到的加工信号进行加权相加，从而以包含大量背景噪音等劣化成分的区间为中心来改善主观质量。非专利文献 1 :Steven F. Boll “Suppression of Acoustic noise in speech using spectral subtraction", IEEE Trans. ASSP, Vol. ASSP-27, No. 2, April 1979专利文献1 :日本特开2004-272^2号公报(第14页第16页、图4)以往的噪音抑制装置如上所述构成，所以存在如下课题输入信号和加工信号的加权相加控制依赖于声音/噪音状态判别单元，如果声音区间检测失败而在包含声音的区间进行加工，则产生回声感(回音感)、噪音感而使质量显著劣化。另外，在以往的噪音抑制装置中，为了减轻区间判定错误的影响，还举出了使用连续量的区间判定评价值的改善对策，但评价值自身是基于时域中的分析结果的值，对于频域是一定值。因此，存在如下课题例如，在噪音功率集中于低频那样的汽车行驶噪音混入了的声音信号中，如果以对低频的噪音的劣化感进行抑制的方式调整评价值的阈值，则会错误地加工功率相对地比噪音信号大的高频的声音信号而导致质量劣化，相反，如果进行不会发现高频的声音信号的失真这样的调整，则几乎得不到改善效果。另外，在以往的噪音抑制装置中，虽然在谱区域中针对每个频率成分控制着加权相加，但控制要素仅是输入信号的振幅谱成分的大小，而并未针对每个频率成分来判定是声音还是噪音，其结果，输入信号是否是声音(或者音乐声)这较大地依赖于时域中的区间判定评价值，如果错误地进行其区间判定，则质量劣化的状况不会改变。本发明是为了解决所述课题而完成的，目的在于提供一种可以实现听觉上理想的噪音抑制并且即使在高噪音下质量劣化也少的噪音抑制装置以及具备该噪音抑制装置的高质量的声音解码装置。本发明的噪音抑制装置，具备时间/频率变换部，将输入信号变换为作为频率成分的输入信号谱；噪音谱推测部，根据输入信号来推测推测噪音谱；噪音谱抑制部，根据推测噪音谱进行输入信号谱的噪音抑制，生成噪音抑制谱；信号变形部，生成根据基于噪音抑制谱和推测噪音谱的比而使噪音抑制谱变形并且平滑化了的加工谱；以及信号加法部，对噪音抑制谱相加加工谱，来抑制该噪音抑制谱中包含的劣化成分。由此，具有如下效果不会由于区间判定错误而产生回声感以及噪音感，可以针对每个谱成分改善主观质量。另外，本发明的声音解码装置，具备声音解码部，对规定的编码数据进行解码而生成解码信号；时间/频率变换部，将解码信号变换为作为频率成分的解码信号谱；噪音谱推测部，根据解码信号来推测推测噪音谱；信号变形部，生成根据基于解码信号谱和推测噪音谱的比而使解码信号谱变形并且平滑化了的加工谱；以及信号加法部，对解码信号谱相加加工谱，来抑制该解码信号谱中包含的劣化成分。由此，具有如下效果不会由于区间判定错误而产生回声感以及噪音感，可以针对每个谱成分改善主观质量。

图1是本发明的实施方式1的噪音抑制装置的整体结构图。图2是示出本发明的实施方式1记载的信号加工部中的一系列的处理内容的动作说明图，是对某个频率的振幅谱和相位谱进行矢量化而表现的图。图3是说明本发明的实施方式1记载的信号加工部中的一系列的处理的曲线图，示出典型的情况下的谱。图4(a)是示出本发明的实施方式1记载的信号加工部中的一系列的处理内容的动作说明图，示出对图3的区域B的频率的振幅谱和相位谱进行矢量化而表现的结果。图4(b)是示出本发明的实施方式1记载的信号加工部中的一系列的处理内容的动作说明图，示出对图3的区域C的频率的振幅谱和相位谱进行矢量化而表现的结果。图5是本发明的实施方式2的噪音抑制装置的整体结构图。图6是示出本发明的实施方式2记载的信号加工部中的一系列的处理内容的动作说明图，是对某个频率的振幅谱和相位谱进行矢量化而表现的图。图7是本发明的实施方式4的噪音抑制装置的整体结构图。图8是本发明的实施方式5的声音解码装置的整体结构图。图9是本发明的实施方式6的声音解码装置的整体结构图。
图10是本发明的实施方式8的噪音抑制装置的整体结构图。图11是本发明的实施方式9的声音解码装置的整体结构图。图12是本发明的实施方式10的声音解码装置的整体结构图。
具体实施例方式以下，为了进一步详细说明本发明，参照附图来说明用于实施本发明的优选方式。实施方式1.图1是示出本实施方式的噪音抑制装置100的整体结构的图。图1所示的噪音抑制装置100包括时间/频率变换部2、噪音抑制部3、信号加工部4、频率/时间变换部5。噪音抑制部3包括噪音谱抑制部7和噪音谱推测部8，其中，该噪音谱推测部8包括声音/噪音判定部9以及噪音谱更新部10。信号加工部4包括信号加法部11、振幅平滑部12以及信号变形部13，其中，该信号变形部13包括加工成分计算部 14以及相位加扰部15。以下，根据图1，说明噪音抑制装置100的动作原理。首先，以规定的采样频率(例如，8kHz)进行了采样、并以规定的帧周期(例如， 20msec)进行了帧分割的输入信号1被输入到噪音抑制装置100内的时间/频率变换部2 和后述说明的噪音谱推测部8内部的声音/噪音判定部9。时间/频率变换部2对所述的被分割为帧周期的输入信号1进行加窗处理，并对加窗后的信号，使用例如256点的FFTpast Fourier Transform 快速傅立叶变换)，变换为每个频率的谱成分即输入信号谱16。时间/频率变换部2将该输入信号谱16分别输出到噪音抑制部3内部的噪音谱抑制部7和噪音谱推测部8、信号加工部4内部的振幅平滑部 12。在加窗处理中，例如可以使用汉宁窗(Harming window)、梯形窗等公知的方法。另外，由于FFT是公知的方法，所以省略说明。在噪音抑制部3中，噪音谱抑制部7使用从后述说明的噪音谱推测部8输入的推测噪音谱17，对从时间/频率变换部2输入的输入信号谱16进行噪音抑制处理，将所得到的结果作为噪音抑制谱18而输出到信号加工部4内部的信号加法部11和加工成分计算部 14。此处，作为噪音谱抑制部7中的噪音抑制处理的方法，除了例如非专利文献1记载那样的基于谱减法的方法、以及根据输入信号谱16和推测噪音谱17的每个频率的信噪比 (SN比)对每个谱成分提供衰减量的谱振幅抑制等公知的方法以外，还可以使用将谱减法和谱振幅抑制进行了组合的方法(例如，专利第34M190号“噪音抑制装置以及方法”记载的方法)等。信号加工部4根据噪音抑制后的输入信号谱即噪音抑制谱18和推测噪音谱17的形态，进行噪音抑制谱18中的劣化成分的加工处理以使在听觉方面变得理想。具体而言，使用噪音谱抑制部7输出的噪音抑制谱18和噪音谱推测部8输出的推测噪音谱17，由信号变形部13生成加工谱19，并由信号加法部11对噪音谱18相加加工谱19而生成加法谱 20。然后，振幅平滑部12在时间方向以及频率方向上对加法谱20进行平滑化，生成以使在听觉方面变得理想的方式进行了平滑化加工的平滑化噪音抑制谱21而输出到频率/时间变换部5。在后面详述信号加工部4的处理。
频率/时间变换部5通过对从信号加工部4输入的平滑化噪音抑制谱21进行逆 FFT处理而恢复到时域信号，一边进行用于与前后帧的平滑连接的加窗处理一边进行连接，并将所得到的信号作为输出信号6而输出。噪音谱推测部8进行输入信号1中的平均的噪音谱的推测。首先，声音/噪音判定部9使用输入信号1、时间/频率变换部2输出的输入信号谱16、以及根据过去的帧而推测出的推测噪音谱17，计算像声音的信号VAD。像声音的信号VAD表示当前帧的输入信号1 是否是声音或者噪音的程度，例如，是在声音的可能性高的情况下取大的评价值、并在声音的可能性低的情况下取小的评价值的信号。作为像声音的信号VAD的计算方法，声音/噪音判定部9例如可以分别单独或者组合使用输入信号1的自相关分析的最大值、以及可以根据输入信号1的功率与推测噪音谱17的功率之比来计算的帧SN比。此处，关于式(1)、帧SN比SNRft，可以通过式⑵分别计算输入信号1的自相关分析结果的最大值ACFmax。
此处，x(t)是时间t下的帧分割后的输入信号1，N是自相关分析区间长度，S(k) 是输入信号谱16的第k个成分，N(k)是推测噪音谱17的第k个成分，M是FFT点数。可以根据通过所述式⑴求出的自相关分析的最大值ACFmax、和通过式⑵求出的帧SN比SNRft,例如通过下式(3)来计算像声音的信号VAD。VAD = wACF · ACFfflax+wSNE · SNRfr · SNRnorm (3)此处，SNRnorm是用于将SNRft的值标准化到0 1范围内的规定的值、wAeF以及wSNK 是用于加权的规定的值，分别根据噪音的种类或者噪音的功率，以可以适合地判定像声音的信号VAD的方式预先调整即可。另外，ACFmax根据所述式(1)的性质，取0 1的范围的值。声音/噪音判定部9将通过以上所示的处理而计算出的用于噪音谱推测的像声音的信号VAD输出到噪音谱更新部10。另外，在所述式(3)中，通过将或者wSNK的值中的某一个设定为0，还可以单独利用设定为0以外的一方的参数来计算出像声音的信号VAD。具体而言，在将wSNK设成的情况下，仅利用自相关分析的最大值ACFmax就求出像声音的信号VAD。另一方面，在像声音的信号VAD的计算中，还可以追加所述式C3)所示的指标/值以外的分析参数。例如，可以追加如下等各种改善、变更声音/噪音判定部9使用输入信号谱16和推测噪音谱17，计算出每个频率的谱成分的SN比，利用取该每个频率的谱成分的 SN比的总和而得到的值(总和越大，声音的可能性越高)、或者利用每个频率的谱成分的SN 比的方差(方差(variance)越大，越是出现声音的谐波构造，声音的可能性越高)。噪音谱更新部10参照声音/噪音判定部9的输出即像声音的信号VAD，在当前帧的输入信号1的形态是噪音的可能性高的情况下，使用当前帧的输入信号谱16，更新从内部存储器等中保存的过去的帧推测出的推测噪音谱17。噪音谱更新部10例如按照下式(4)将输入信号谱16反映到推测噪音谱17从而进行更新。
权利要求
1.一种噪音抑制装置，具备时间/频率变换部，将输入信号变换为作为频率成分的输入信号谱；噪音谱推测部，根据所述输入信号来推测推测噪音谱；噪音谱抑制部，根据所述推测噪音谱进行所述输入信号谱的噪音抑制，生成噪音抑制谱；信号变形部，生成根据基于所述噪音抑制谱和所述推测噪音谱的比而使所述噪音抑制谱变形并且平滑化了的加工谱；以及信号加法部，对所述噪音抑制谱相加所述加工谱，来抑制该噪音抑制谱中包含的劣化成分。
2.根据权利要求1所述的噪音抑制装置，其特征在于，信号变形部生成进行了频率轴方向的加权的加工谱。
3.一种噪音抑制装置，具备时间/频率变换部，将输入信号变换为作为频率成分的输入信号谱；噪音谱推测部，根据所述输入信号来推测推测噪音谱；噪音谱抑制部，根据所述推测噪音谱进行所述输入信号谱的噪音抑制，生成噪音抑制谱；信号变形部，生成根据基于所述噪音抑制谱和所述推测噪音谱的比而使所述噪音抑制谱变形了的变形噪音抑制谱，并且生成对该变形噪音抑制谱进行了平滑化的加工谱；信号减法部，从所述噪音抑制谱减去所述变形噪音抑制谱；以及信号加法部，对由所述信号减法部减去了所述变形噪音抑制谱后的所述噪音抑制谱相加所述加工谱，来抑制该噪音抑制谱中包含的劣化成分。
4.根据权利要求3所述的噪音抑制装置，其特征在于，信号变形部生成进行了频率轴方向的加权的加工谱。
5.一种噪音抑制装置，具备时间/频率变换部，将输入信号变换为作为频率成分的输入信号谱；噪音谱推测部，根据所述输入信号来推测推测噪音谱；噪音谱抑制部，根据所述推测噪音谱进行所述输入信号谱的噪音抑制，生成噪音抑制谱；以及相位加扰部，以与基于所述噪音抑制谱和所述推测噪音谱的比对应的程度，对所述噪音抑制谱的相位进行加扰。
6.根据权利要求5所述的噪音抑制装置，其特征在于，相位加扰部求出进行了频率轴方向的加权的相位加扰的程度。
7.一种声音解码装置，具备声音解码部，对规定的编码数据进行解码而生成解码信号；时间/频率变换部，将所述解码信号变换为作为频率成分的解码信号谱；噪音谱推测部，根据所述解码信号来推测推测噪音谱；信号变形部，生成根据基于所述解码信号谱和所述推测噪音谱的比而使所述解码信号谱变形并且平滑化了的加工谱；以及信号加法部，对所述解码信号谱相加所述加工谱，来抑制该解码信号谱中包含的劣化成分。
8.根据权利要求7所述的声音解码装置，其特征在于，信号变形部生成进行了频率轴方向的加权的加工谱。
9.一种声音解码装置，具备声音解码部，对规定的编码数据进行解码而生成解码信号；时间/频率变换部，将所述解码信号变换为作为频率成分的解码信号谱；噪音谱推测部，根据所述解码信号来推测推测噪音谱；信号变形部，生成根据基于所述解码信号谱和所述推测噪音谱的比而使所述解码信号谱变形了的变形解码信号谱，并且生成对该变形解码信号谱进行了平滑化的加工谱；信号减法部，从所述解码信号谱减去所述变形解码信号谱；以及信号加法部，对由所述信号减法部减去了所述变形解码信号谱后的所述解码信号谱相加所述加工谱，来抑制该解码信号谱中包含的劣化成分。
10.根据权利要求9所述的声音解码装置，其特征在于，信号变形部生成进行了频率轴方向的加权的加工谱。
11.一种声音解码装置，具备声音解码部，对规定的编码数据进行解码而生成解码信号；时间/频率变换部，将所述解码信号变换为作为频率成分的解码信号谱；噪音谱推测部，根据所述解码信号来推测推测噪音谱；以及相位加扰部，以与基于所述解码信号谱和所述推测噪音谱的比对应的程度，对所述解码信号谱的相位进行加扰。
12.根据权利要求11所述的声音解码装置，其特征在于，相位加扰部求出进行了频率轴方向的加权的相位加扰的程度。
全文摘要
加工成分计算部(14)根据噪音抑制谱(18)与推测噪音谱(17)之比求出变形噪音抑制谱(18a)，而且相位加扰部(15)进行相位加扰，得到在主观上察觉不到噪音抑制谱(18)中包含的劣化成分的作为平滑化成分的加工谱(19)。信号加法部(11)对由于噪音抑制部(3)的噪音抑制处理而劣化了的噪音抑制谱(18)的频率成分相加加工谱(19)来抑制劣化成分。
文档编号G10L21/02GK102150206SQ20088013105
公开日2011年8月10日申请日期2008年10月24日优先权日2008年10月24日
发明者古田训, 田崎裕久申请人:三菱电机株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：古田训;田崎裕久
技术所有人：三菱电机株式会社
我是此专利的发明人

上一篇：多声道音频编码器和解码器的制作方法
上一篇：噪声抑制装置的制作方法