噪音抑制装置的制作方法

文档序号：2824942阅读：155来源：国知局

专利名称：噪音抑制装置的制作方法
技术领域：
本发明涉及一种对重叠于声音信号的噪音进行抑制的噪音抑制装置。
背景技术：
噪音抑制装置主要输入在声音信号中重叠了噪音的时域的信号而作为输入信号，将该输入信号变换为作为频域的信号的功率谱之后，从输入信号的功率谱推定噪音的平均的功率谱，并从输入信号的功率谱减去所推定的噪音的功率谱而得到进行了噪音抑制的输入信号的功率谱，将其恢复为原来的时域的信号，从而进行噪音抑制处理。作为这种以往的噪音抑制装置，例如公开了专利文献I。在专利文献I公开的噪音抑制装置中，以非专利文献I公开的技术为基础，在噪音谱推定和抑制量的计算时求出输入信号的多个功率谱分量的平均值，从得到的一个平均值进行噪音谱推定和抑制量计算，并将它们共同地应用于多个功率谱分量中。专利文献I :日本专利4172530号公报(第8 12页、图2)非专利文献I :Y. Ephraim, D. Malah, “Speech Enhancement Using a MinimumMean-Square Error Short-Time Spectral Amplitude Estimator，，，IEEE Trans. ASSP,Vol. 32，No. 6，pp.1109-1121，Dec.198
发明内容
以往的噪音抑制装置如以上那样构成，因此存在下面所述的课题。在以往的噪音抑制装置中，在用于噪音抑制的抑制量计算中，需要对输入信号的每个功率谱分量进行贝塞尔函数等复杂的计算，处理量非常大。因此在专利文献I公开的以往的噪音抑制装置中，通过将多个谱分量进行汇总而平均化，并将平均化的谱分量作为各谱分量的代表谱分量进行计算，从而进行处理量的削减。然而，在该方法中，即使谱分量中存在振幅大的分量(即，认为是声音分量)，通过进行平均化，声音分量会被处理得过小，其结果，声音信号被抑制而使声音的湮灭感增大，具有音质变差的课题。本发明是为了解决上述课题而作出的，其目的在于提供一种能够以少的处理量进行高品质的噪音抑制的噪音抑制装置。本发明的噪音抑制装置具备代表分量生成部，该代表分量生成部将时间/频率变换部所变换的多个功率谱汇总到I组，优先选择该组内的多个功率谱中的值大的功率谱而设为代表功率谱，噪音抑制量生成部使用代表功率谱来计算噪音抑制量。根据本发明，使用代表功率谱来计算噪音抑制量，因此处理量较少也可以，并且，在该代表功率谱中使用组内的值大的功率谱，因此在噪音抑制量计算时输入信号的声音分量不会被评价得过小，其结果不会抑制声音信号而能够进行高品质的噪音抑制。

图I是表示与本发明的实施方式I有关的噪音抑制装置的结构的框图。
图2是表示频带分离部的功率谱的频带分割的一个例子的图。图3示意性地示出频带代表分量生成部的处理效果，图3的(a)是输入信号的功率谱的图，图3的(b)是以子带(Subband)内的功率谱的平均值为代表的情况(以往方法)，图3的(c)是以子带内的功率谱的最大值为代表的情况(本发明)。图4是表示噪音抑制量生成部的详细结构的框图。
具体实施方式下面，为了更详细地说明本发明，根据

用于实施本发明的方式。实施方式I.图I所示的噪音抑制装置具备输入端子I、时间/频率变换部2、声音相似度推定部3、噪音谱推定部4、频带分离部5、频带代表分量生成部(代表分量生成部)6、噪音抑制量生成部7、频带复用部8、噪音抑制部9、频率/时间变换部10、以及输出端子11。作为该噪音抑制装置的输入，使用如下信号，S卩，该信号是对通过麦克风(未图示)等取入的声音以及音乐等进行A/D (模拟/数字)变换之后以规定的采样频率(例如，8kHz)进行采样、并且分割为帧单位(例如，IOms)的信号。下面，根据图I说明与实施方式I有关的噪音抑制装置的动作原理。输入端子I接受如上所述的信号，并作为输入信号y (t)而输出到时间/频率变换部2。时间/频率变换部2对分割为帧单位的输入信号I (t)进行加窗处理，并对于该加窗后的信号y (n, t),使用例如256点的FFT (Fast Fourier Transform :快速傅立叶变换)将时间轴上的信号变换为频率上的信号(谱)，计算出输入信号的功率谱Y (n，k)和相位谱P (n，k)。这里，n表示帧编号，k表示谱编号，t表示离散时间编号。以下，只要不需要特别地表示，就指当前帧的输入信号，在该信号表示谱的情况下省略帧编号。所得到的功率谱分别输出到声音相似度推定部3、噪音谱推定部4、频带分离部5以及噪音抑制部9。另外，所得到的相位谱输出到频率/时间变换部10。此外，作为加窗处理，例如能够使用汉宁窗、梯形窗等的公知的方案。另外，时间/频率变换部2在进行加窗处理时，根据需要还实施零填充处理。FFT是公知的方案，因此省略说明。声音相似度推定部3使用从时间/频率变换部2输入的输入信号的功率谱，计算出声音相似度评价值来作为当前帧的输入信号的形态“是否像声音”的程度，其中，所述声音相似度评价值例如是在声音的可能性高的情况下取大的值、在声音的可能性低的情况下取小的值这样的声音相似度评价值。作为声音相似度评价值的计算方法，能够分别单独或者组合使用例如通过对输入信号的功率谱进行傅立叶变换而得到的自相关系数的最大值、从功率谱的总和得到的输入信号能量、输入信号的全频带SN比(信噪比)、以及表示功率谱的变动状态的谱熵等公知的方案。在此为了简化说明，只示出单独使用了能够通过当前帧的输入信号的功率谱来计算的自相关系数的最大值的情况。自相关系数c ( T )能够如下式(I)那样求出。c ( T ) =F [Y (n, k) ] (I)这里，T表示延迟(延迟时间)，F□表示傅立叶变换。在该傅立叶变换中，能够与在时间/频率变换部2中所使用的FFT相同地使用例如256点的FFT。上式(I)的自相关系数的计算方法是公知的方案，因此省略说明。声音相似度推定部3接下来通过将所得到的自相关系数c ( T )除以c (0)而在(Tl的范围内进行标准化，例如在存在声音的基频的可能性高的16〈 T <120的范围内搜寻自相关系数的最大值，并将所得到的最大值作为声音相似度评价值VAD而输出到噪音谱推定部4。噪音谱推定部4使用输入信号的功率谱Y (k)和声音相似度评价值VAD来推定包含在输入信号中的平均的噪音谱。具体地说，噪音谱推定部4参照作为声音相似度推定部3的输出的声音相似度评价值VAD，在当前帧的输入信号的形态为噪音的可能性高的情况下(即，是声音的可能性低的情况下)，使用当前帧的输入信号的功率谱Y (n，k)，来更新噪音谱推定部4所存储的前I帧的噪音谱N (n-1，k)，并将更新了的噪音谱输出到噪音抑制量生成部7。噪音谱推定部4例如按照下式(2)，在声音相似度评价值VAD为规定的阈值(例如0. 2)以下的情况下，将输入信号的功率谱反映到噪音谱，从而实施噪音谱的更新。在声音相似度评价值VAD超过阈值0. 2的情况下，认为当前帧的输入信号是声音的可能性高，因此不进行噪音谱的更新，而将前I帧的噪音谱原样地用作当前帧的噪音谱。< ( 2 )其中，(Xk〈K这里，n为帧编号，k为谱编号，K为FFT点数的一半的值，N (n-1, k)为更新前的噪音谱，Y (n，k)是判断为噪音的可能性高的当前帧的噪音谱，旷(n，k)是更新后的噪音谱。在此由于电子申请的关系，将上式(2)中的“ ”(颚化符号(tilde))记载为“、’，但是在以后的说明中省略更新后的噪音谱的颚化符号。另外，a (k)是取(Tl的值的规定的更新速度系数，可以设定为比较接近0的值。但是，有时优选随着频率变高而使更新速度系数变大，因此还能够根据噪音的种类等而适当调整更新速度系数。而且，噪音谱推定部4为了在接下来的更新处理中使用当前帧的噪音谱N (n，k)而将当前帧的噪音谱N (n，k)进行存储。作为存储单元，使用例如以半导体存储器、硬盘等为代表的电或者磁的能够随时读出以及写入的存储单元。频带分离部5将输入信号的功率谱Y (k)分割为非均匀的频率频带，并针对每个子带进行分组。图2中示出输入信号的功率谱Y (k)的频带分割的一个例子。在图2的例子中，将输入信号的功率谱Y (k)的低频带至高频带分割为19个非均匀的频率频带，并将各组设为子带。具体地说，在子带编号Z=IO的情况下，第k=35 40个的谱分量属于该子带。此外，图2的子带称为临界频带，与人的听觉特性的匹配性高。该临界频带的子带编号的单位是Bark (巴克)。关于临界频带的详细内容，可以参照E. 7力一著《心理音響学》(西村書店，1992年8月)。此外，在图2的例子中示出了以临界频带进行频带分割的例子，但是不限于此，例如既可以是随着成为低频带而使频带以2的幂乘变窄的倍频带分割，也可以是将全部的频带分割为例如由4个谱分量构成的子带那样的均等分割。另外，为了提高特定的频率频带(低频带、作为声音的重要部分的基频频带、或者共振峰分量分布的可能性高的频带)的精度，也可以以更细的单位进行分割，通过以细小的单位进行分割，能够抑制后述的噪音抑制特性变差。频带分离部5在如以上那样实施了分割处理之后，将分组了的每个子带编号z的功率谱Y (z，k)输出到频带代表分量生成部6。频带代表分量生成部6使用从频带分离部5输入的每个子带的功率谱Y(z，k)，生成代表各子带的代表功率谱Yd (z)并输出到噪音抑制量生成部7。作为代表功率谱Yd (z)的生成方法，例如如下式(3)那样，在各子带内依次比较功率谱Y (k)的大小，将值最大的功率谱Y (k)设为代表功率谱Yd (z)0但是，在声音相似度推定部3所输出的声音相似度评价值VAD为规定的阈值(例如，0. 2)以下的情况下，并非是选择值最大的功率谱Y (k)作为代表功率谱Yd (z)的方法，而是切换到例如专利文献I那样的算出子带内的全部功率谱Y (k)的平均值来设为代表功率谱Yd (z)的方法。

权利要求
1.一种噪音抑制装置，具备时间/频率变换部，将时域的输入信号变换为作为频域的信号的功率谱和相位谱；噪音谱推定部，推定重叠于所述输入信号的噪音谱；噪音抑制量生成部，使用所述功率谱和所述噪音谱来计算噪音抑制量；噪音抑制部，根据所述噪音抑制量来抑制所述功率谱的振幅；以及频率/时间变换部，将所述相位谱和由所述噪音抑制部进行了振幅抑制的所述功率谱变换为时域的信号，所述噪音抑制装置的特征在于，具备代表分量生成部，该代表分量生成部将所述时间/频率变换部所变换的多个功率谱汇总为I组，优先选择该组内的所述多个功率谱中的值大的功率谱而设为代表功率谱，所述噪音抑制量生成部使用所述代表功率谱来计算出噪音抑制量。
2.根据权利要求I所述的噪音抑制装置，其特征在于，具备声音相似度推定部，该声音相似度推定部计算表示输入信号是否像声音的程度的声音相似度评价值，代表分量生成部生成基于所述声音相似度评价值的代表功率谱。
3.根据权利要求2所述的噪音抑制装置，其特征在于，代表分量生成部根据声音相似度评价值，在输入信号的声音相似度的程度高的情况下优先选择组内的值大的功率谱而生成代表功率谱，在该输入信号的声音相似度的程度低的情况下求出该组内的多个功率谱的平均值而生成代表功率谱。
4.根据权利要求I所述的噪音抑制装置，其特征在于，代表功率谱是组内的多个功率谱中的具有最大值的功率谱。
5.根据权利要求I所述的噪音抑制装置，其特征在于，代表功率谱是从组内的多个功率谱中的值大的功率谱起依次附加大的权重而求出的加权平均。
6.根据权利要求2所述的噪音抑制装置，其特征在于，代表功率谱是将声音相似度评价值用于加权系数的、组内的多个功率谱的最大值与平均值的加权和。
7.根据权利要求I所述的噪音抑制装置，其特征在于，代表分量生成部针对每个组切换代表功率谱的生成方法。
全文摘要
频带分离部(5)对时间/频率变换部(2)所变换的多个功率谱进行频带分割而汇总到子带，频带代表分量生成部(6)将子带内的多个功率谱中的具有最大值的功率谱设为代表功率谱。噪音抑制量生成部(7)使用代表功率谱和噪音谱来计算子带的噪音抑制量，噪音抑制部(9)根据噪音抑制量来抑制功率谱的振幅。
文档编号G10L21/02GK102792373SQ20108006524
公开日2012年11月21日申请日期2010年3月9日优先权日2010年3月9日
发明者古田训, 田崎裕久申请人:三菱电机株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：古田训;田崎裕久
技术所有人：三菱电机株式会社
我是此专利的发明人