声音处理设备、声音处理方法和程序的制作方法

文档序号:2825029阅读:220来源:国知局
专利名称:声音处理设备、声音处理方法和程序的制作方法
技术领域
本发明涉及一种声音处理设备、声音处理方法和程序。
背景技术
已经开发了从包括噪声的输入声音中抑制噪声以强调目标声音的技术(例如,参见日本特许3677143号公报、日本特许4163294号公报和日本特许公开2009-49998号公报)。在日本特许3677143号公报、日本特许4163294号公报和日本特许公开2009-49998 号公报中,通过假设强调目标声音后所获得的声音频率分量包括目标声音和噪声且噪声频率分量仅包括噪声、并且从声音频率分量的功率谱中减去噪声频率分量的功率谱,能够从输入声音中去除噪声。

发明内容
然而,在日本特许3677143号公报、日本特许4163294号公报和日本特许特开 2009-49998号公报中说明的技术中,在处理过的声音信号中可能发生被称为音乐噪声的特定失真。另外,声音频率分量中所包括的噪声可能与噪声频率分量中所包括的噪声不同。由此,可能出现噪声被不适当地去除的问题。因此,本发明提供能够进行声音强调从而通过使用预定的增益函数减少音乐噪声的、新颖和改进的声音处理设备、声音处理方法和程序。根据本发明的实施例,一种声音处理设备,包括目标声音强调单元,被配置用于通过对其中混合有目标声音和噪声的输入声音中的目标声音进行强调来获取声音频率分量;目标声音抑制单元,被配置用于通过抑制所述输入声音中的所述目标声音获取噪声频率分量;增益计算单元,被配置用于使用根据所述声音频率分量和所述噪声频率分量的预定增益函数计算将与所述声音频率分量相乘的增益值;以及增益乘法器单元,被配置用于将所述声音频率分量与由所述增益计算单元计算出的增益值相乘,其中所述增益计算单元使用以下增益函数来计算所述增益值当所述声音频率分量与所述噪声频率分量的能量比率小于或等于预定值时,所述增益函数提供小于预定值的增益值和斜率。声音频率分量包括目标声音分量和噪声分量。增益乘法器单元通过将所述声音频率分量乘以所述增益值能够抑制所述声音频率分量中包括的噪声分量。增益计算单元能够假设由所述目标声音抑制单元所获取的噪声频率分量中仅包括噪声并且计算所述增益值。所述增益函数能够在依据所述声音频率分量与所述噪声频率分量的能量比率噪声比率所集中的噪声集中范围中提供小于预定值的增益值并且具有斜率小于预定值的增益曲线。所述增益函数具有如下增益曲线所述增益曲线的斜率在除了所述噪声集中范围之外的范围中小于所述增益函数的最大斜率。所述声音处理设备还包括目标声音时段检测单元,用于检测存在所述输入声音中所包括的目标声音的时段。所述增益计算单元能够根据由所述目标声音时段检测单元进行的检测的结果对由所述目标声音强调单元所获取的声音频率分量的功率谱和由所述目标声音抑制单元所获取的噪声频率分量的功率谱取平均。作为所述目标声音时段检测单元进行的检测的结果,当时段是存在目标声音的时段时,所述增益计算单元可以选择第一平滑系数,并且当时段是不存在目标声音的时段时, 所述增益计算单元选择第二平滑系数,并且所述增益计算单元能够对所述声音频率分量的功率谱和所述噪声频率分量的功率谱取平均。所述增益计算单元能够使用所述声音频率分量的平均功率谱和所述噪声频率分量的平均功率谱对所述增益值取平均。所述声音处理设备还包括噪声校正单元,用于校正所述噪声频率分量,使得由所述目标声音抑制单元所获取的所述噪声频率分量的幅度与由所述目标声音强调单元所获取的所述声音频率分量中包括的噪声分量的幅度相对应。所述增益计算单元能够根据由所述噪声校正单元校正的噪声频率分量计算增益值。所述噪声校正单元能够响应于用户操作校正噪声频率分量。所述噪声校正单元能够根据所检测的噪声的状态校正噪声频率分量。根据本发明的另一实施例,一种声音处理方法,包括以下步骤通过强调其中混合有目标声音和噪声的输入声音中的目标声音获取声音频率分量;通过抑制所述输入声音中的所述目标声音获取噪声频率分量;使用以下增益函数来计算要与所述声音频率分量相乘的增益值当所述声音频率分量与所述噪声频率分量的能量比率小于或等于预定值时,所述增益函数提供小于预定值的增益值和斜率;以及将所述声音频率分量乘以在计算增益值的步骤中计算出的增益值。根据本发明的又一实施例,一种程序,包括用于使计算机用作声音处理设备的程序代码,所述声音处理设备包括目标声音强调单元,用于通过对其中包括目标声音和噪声的输入声音中的目标声音进行强调来获取声音频率分量;目标声音抑制单元,用于通过抑制所述输入声音中的所述目标声音获取噪声频率分量;增益计算单元,用于使用根据所述声音频率分量和所述噪声频率分量的预定增益函数计算将与所述声音频率分量相乘的增益值;以及增益乘法器单元,用于将所述声音频率分量与由所述增益计算单元计算出的增益值相乘,其中,所述增益计算单元使用以下增益函数来计算所述增益值当所述声音频率分量与所述噪声频率分量的能量比率小于或等于预定值时,所述增益函数提供小于预定值的增益值和斜率。如上所述,根据本发明的实施例,通过使用预定的增益函数,能够强调声音同时减少音乐噪声。


图1是示出本发明实施例的概要的图;图2是示出本发明实施例的概要的图;图3是根据本发明第一实施例的声音处理设备的示例功能结构的框图;图4是根据本发明第一实施例的增益计算单元的示例功能结构的框图;图5是由根据本发明第一实施例的增益计算单元进行的平均处理的流程图6是根据本发明第一实施例的目标声音时段检测单元的示例功能结构的框图;图7是示出根据本发明第一实施例的用于检测目标声音的处理的图;图8是示出根据本发明第一实施例的用于检测目标声音的处理的图;图9是根据本发明第一实施例的用于检测目标声音时段的处理的流程图;图10是示出根据本发明第一实施例的用于检测目标声音的处理的图;图11是示出根据本发明第一实施例的白色化处理(whitening process)的图;图12是根据本发明第一实施例的噪声校正单元的示例功能结构的框图;图13是根据本发明第一实施例的噪声校正处理的流程图;图14是根据本发明第一实施例的噪声校正单元的示例功能结构的框图;图15是根据本发明第一实施例的噪声校正处理的流程图;图16是根据本发明第一实施例的声音处理设备的示例功能结构的框图;图17示出不同格式的输出信号之间的差异;图18是根据本发明第二实施例的声音处理设备的示例功能结构的框图;图19是示出根据本发明第二实施例在强调目标声音前后的噪声谱的图;图20是示出根据本发明第二实施例在强调目标声音前后的目标声音谱的图;图21示出现有技术;以及图22示出现有技术。
具体实施例方式下面将参考附图详细说明本发明的示例实施例。注意,如这里所用的,使用相同的标记说明具有基本相同功能和结构的组件,因此,不重复对其的说明。以如下顺序说明示例实施例1.本实施例的目的2.第一实施例3.第二实施例1.本实施例的目的首先说明本实施例的目的。已开发了从包括噪声的输入声音中抑制噪声以强调目标声音的技术(例如,参见日本特许3677143号公报、日本特许4163294号公报和日本特许特开2009-49998号公报)。在日本特许3677143号公报中,使用多个麦克风获取包括被强调的目标声音的信号(在下文称为“声音频率分量”)和包括被抑制的目标声音的信号(在下文称为“噪声频率分量”)。假设声音频率分量包括目标声音和噪声,并且噪声频率分量仅包括噪声。于是,使用声音频率分量和噪声频率分量进行谱相减。在日本特许3677143号公报说明的谱相减处理中,在处理过的声音信号中可能发生被称为音乐噪声的特定失真,这是有问题的。另外, 尽管假设声音频率分量中包括的噪声与噪声频率分量中包括的噪声相同,实际上这两者有可能不同。下面说明广泛使用的谱相减处理。通常,在谱相减中,估计信号中所包括的噪声分量,并且对功率谱进行相减。在下文,设S表示声音频率分量X中包括的目标声音分量,设N 表示声音频率分量X中包括的噪声分量,并且设N’表示噪声频率分量。于是,如下表示处理过的频率分量y的功率谱Yl2 = IxI2-In' 2通常,由于使用输入信号的相位进行恢复,因此,即使在使用相减时,也能够通过如下将x乘以预定值(在下文称为“增益值”)来抑制噪声分量x = vw2-m2
_3] -fW·^=wsihyx由于ws(h)可以被认为是x与n’的比率h的函数,图21示出其曲线。h<l的范围被称为“基底(flooring)”。通常,以适当的小的值替代ws (h)(例如,ws (h) =0.05)。 如图21所示,ws(h)的曲线在h小的范围内具有非常大的斜率。因此,如果在h小的范围内 (例如,1 <h<2)h轻微振荡,则结果增益值显著振荡。由此,针对每个时间-频率表示, 频率分量乘以显著变化的值。以这种方式,产生被称为音乐噪声的噪声。当s在声音频率分量x中非常小时或在s = 0的非声音时段中,h值小。在此时段中,声音质量显著劣化。另外,假设n = n’。然而,如果该假设不正确,则增益值显著振荡, 尤其是在非声音时段中,并且因此声音质量显著劣化。在日本特许特开2009-49998号公报中,为了进行输出适应,对于声音频率分量(X = s+n)和噪声频率分量n’,使得声音频率分量中包括的噪声分量n的振幅与噪声频率分量 n’的振幅相等。然而,尽管后置滤波装置进行map优化,但由于该技术基于维纳滤波器,因此,输出适应不是充分有效的。在维纳滤波器中,通过如下所示将声音频率分量乘以目标声音分量S和噪声分量 n的以下值,来抑制噪声
S2实际上,由于很难观察S和N,因此,使用可观察的声音频率分量X和噪声频率分量 N’如下计算W
y2 — j\j、2v2w=-~f—=i-^y-如同上述谱相减一样,如果W被认为是h的函数,则图22示出其曲线。如同图21 所示的谱相减一样,w(h)的曲线在h小的范围内具有大的斜率。由于输出适应,h的变化小 (h值集中在值1周围)。因此,与现有技术相比,能够保持待乘的增益值的变化小。然而, 不期望h的值集中在斜率大的点。因此,为了解决这个问题,设计了根据本实施例的声音处理设备。根据本实施例, 能够使用特定的增益函数进行具有减小的音乐噪声的声音强调。2.第一示例实施例接着,说明第一示例实施例。参考图1和图2说明第一示例实施例的概要。根据第一实施例,用于抑制噪声的增益函数g(r)具有如下特征(1)在r小(例如,r<2)的范围rl中提供最小值并且具有小斜率;
(2)在r为中间范围值(例如,2 <r < 6)的范围R2中具有大的正斜率;(3)在r充分大(例如,r彡6)的范围R3中具有小斜率并且收敛于1 ;以及(4)关于拐点不对称。 图1中所示的曲线图300表示满足上述条件⑴到(4)的函数G(r)的曲线。图2 是使用实际观察数据的、在仅存在噪声的时间段中h值的分布的曲线图。如直方图301所示,在实际观察数据中,在仅存在噪声的时间段中h的几乎全部值(80%)集中于值0到2。 因此,上述条件(1)中的r小的范围可以被定义为当计算仅包括噪声的时段中的噪声比率 (h)的直方图时,在该范围内包括80%的数据。在以下的说明中,使用提供最小值并且在r < 2的范围Rl中具有小斜率的增益函数G(r)抑制噪声。另外,根据本实施例,通过检测目标声音时段来平均时间方向上的功率谱。例如, 通过在不存在目标声音的时段中进行功率谱的长期平均,能够降低时间方向上的变化。由此,使用上述增益函数能够在r小的范围Rl中输出具有小变化的值。另外,能够获得在时间方向上具有小变化的值。由此,能够减少音乐噪声。此外,根据本实施例,对频率特性进行校正,使得声音频率分量中包括的噪声分量 N与噪声频率分量N’的比率在G(r)的Rl范围内。以这种方式,能够在计算增益值时进一步降低h,因此,能够进一步减小变化。结果,能够实现显著的噪声抑制和显著的音乐噪声减少。下面参考图3说明声音处理设备100的示例功能结构。图3是声音处理设备100 的示例功能结构的框图。声音处理设备100包括目标声音强调单元102、目标声音抑制单元 104、增益计算单元106、增益乘法器单元108、目标声音时段检测单元110和噪声校正单元 112。目标声音强调单元102对包括噪声的输入声音中所包括的目标声音进行强调。由此,目标声音强调单元102获取声音频率分量YMP。根据本实施例,尽管参考从多个麦克风输入的声音&进行了说明,然而,本发明不限于这种情况。例如,可以从单个麦克风输入声音&。将由目标声音强调单元102获取的声音频率分量Yemp提供至增益计算单元106、增益乘法器单元108和目标声音时段检测单元110。目标声音抑制单元104对包括目标声音和噪声的输入声音中的目标声音进行抑制。由此,目标声音抑制单元104获取噪声频率分量Ysup。通过使用目标声音抑制单元104 抑制目标声音,能够估计噪声分量。将由目标声音抑制单元104获取的噪声频率分量Ysup提供至增益计算单元106、目标声音时段检测单元110和噪声校正单元112。增益计算单元106使用与由目标声音强调单元102获取的声音频率分量和由目标声音抑制单元104获取的噪声频率分量相对应的特定增益函数,来计算要与该声音频率分量相乘的增益值。术语“特定增益函数”是指如下增益函数如图1所示,当声音频率分量与噪声频率分量的能量比率小于或等于预定值时,增益函数提供的增益值和该增益函数的斜率小于预定值。增益乘法器单元108将由增益计算单元106计算的增益值与由目标声音强调单元 102获取的声音频率分量相乘。通过将声音频率分量与由如图1所示的增益函数提供的增益值相乘,能够减小音乐噪声,并且因而能够抑制噪声。目标声音时段检测单元110检测存在包括在输入声音中的目标声音的时段。目标
8声音时段检测单元110根据从目标声音强调单元102提供的声音频率分量^mp计算振幅谱并获得该振幅谱与输入声音Xi的振幅谱之间的相关,并且根据从目标声音抑制单元104 获取的噪声频谱^叩计算振幅谱并获得该振幅谱与输入声音Xi的振幅谱之间的相关。以这种方式,目标声音时段检测单元110检测目标声音的时段。以下更详细地说明由目标声音时段检测单元110进行的用于检测目标声音的处理。根据由目标声音时段检测单元110进行的检测的结果,增益计算单元106对由目标声音强调单元102获取的声音频率分量的功率谱和由目标声音抑制单元104获取的功率谱取平均。下面参考图4说明根据由目标声音时段检测单元110进行的检测的结果的增益计算单元106的功能。如图4所示,增益计算单元106包括计算单元122、第一平均单元124、第一保持单元126、增益计算单元128、第二平均单元130和第二保持单元132。计算单元122计算由目标声音强调单元102获取的声音频率分量Yemp和由目标声音抑制单元104获取的频谱Ysup 的每一个的功率谱。之后,第一平均单元IM根据表示由目标声音时段检测单元110所检测的目标声音时段的控制信号对功率谱取平均。例如,第一平均单元IM根据由目标声音时段检测单元110进行的检测的结果使用一阶衰减对功率谱取平均。在存在目标声音的时段中,第一平均单元IM使用以下公式对功率谱取平均Px = t1 · Px+(It1) · Yemp2Pn = r3 · Pn+(It3) · Ysup2然而,在不存在目标声音的时段中,第一平均单元IM使用以下公式对功率谱取平均Px = r2 · Px+(l-r2) · Yemp2Pn = r3 · Pn+(It3) · Ysup20 ^ T1 ^ r2 ^ 1例如,在上述公式中,当Γι < r2时,使用Γι = 0. 3和r2 = 0. 9。另外,例如,r3为接近r2的值是令人满意的。根据目标声音的存在,代替使用离散值的巧和巧,可以连续改变巧和巧。下面更详细地说明用于连续改变rl和r2的技术。另外,尽管参考使用一阶衰减的平滑进行了说明,然而,本实施例不限于这种操作。例如,可以平均N个帧,并且,类似于r,可以控制数N。即,如果存在目标声音,则可以使用过去的三个帧的平均进行控制。然而,如果不存在目标声音,则可以使用过去的七个帧的平均进行控制。在以上说明中,通过在不存在目标声音的时段中对I^x和Pn进行长期平均,能够降低时间方向上的变化。如图1所示,通过使用根据本实施例的增益函数,能够在r小的范围 (Rl)中输出具有小变化的值。S卩,通过使用增益函数G(r),即使在r小的范围内,也能减少音乐噪声的出现。另外,通过对功率谱取平均,能够获得在时间方向上具有小变化的值。以这种方式,能够进一步减小音乐噪声。然而,如果在存在目标声音的时段中进行长期平均, 则用户感知到回音。因此,根据目标声音的存在控制平滑系数r。增益计算单元1 根据h = Px/Pn计算提供如图1所示的曲线的值。此时,可以使用预存的表中的值。替代地,可以使用具有如图1所示的曲线的如下函数G(h) = b ‘ e_c'h
例如,b= 0. 8 并且 C = 0. 4。第二平均单元130进行与第一平均单元IM进行的增益值平均处理相同的处理。 平均系数可以是与I^r2、和r3相同的值。替代地,平均系数可以是与I^r2、和r3不同的值。 下面参考图5说明由增益计算单元106进行的平均处理。图5是由增益计算单元106进行的平均处理的流程图。如图5所示,增益计算单元106从目标声音强调单元102和目标声音抑制单元104 获取频谱(Yemp,Ysup)(步骤。之后,增益计算单元106计算功率谱(Yemp2,Ysup2)(步骤 S104)。随后,增益计算单元106从第一保持单元1 获取过去的平均功率谱(Px,Pn)(步骤S106)。增益计算单元106判断该时段是否是存在目标声音的时段(步骤S108)。如果在步骤S108中判断为该时段是存在目标声音的时段,则增益计算单元106选择平滑系数使得r = Γι (步骤S110)。然而,如果在步骤S108中判断为该时段是不存在目标声音的时段,则增益计算单元106选择平滑系数使得r = r2。之后,增益计算单元106使用如下公式对功率谱取平均(步骤S114)Px = r · Px+(l-r) · Yemp2Pn = r3 · Pn+(It3) · Ysup2随后,增益计算单元106使用和Pn计算增益值g (步骤S116)。之后,增益计算单元106从第二保持单元132获取过去的增益值G (步骤S118)。增益计算单元106使用如下公式对步骤S118中获取的增益值G取平均G = r · G+(l-r) · g 在步骤S120中,增益计算单元106将平均增益值G发送至增益乘法器单元108 (步骤S122)。之后,增益计算单元106在第一保持单元126中存储和Pn (步骤S124)并且在第二保持单元132中存储增益值G(步骤SU6)。对全部频率范围进行该处理。另外,尽管参考与用于功率谱的平均和增益的平均的平均系数相同的平均系数说明了上述处理,然而,本实施例不限于此。不同的平均系数可以用于功率谱的平均和增益的平均。下面参考图6说明由目标声音时段检测单元110进行的用于检测目标声音的处理。如图6所示,目标声音时段检测单元110包括计算单元131、相关计算单元134、比较单元136和判断单元138。计算单元131接收从目标声音强调单元102提供的声音频率分量Yemp、从目标声音抑制单元104提供的频谱Ysup和输入信号的频谱&中的一个。为了选择频谱&中的一个, 可以选择任意一个麦克风。然而,如果预先确定了输入目标声音的位置,则使用设置在最接近该位置的位置处的麦克风是令人满意的。以这种方式,能够以最高电平输入目标声音。计算单元131计算每个输入频谱的振幅谱或功率谱。之后,相关计算单元134计算Yemp的振幅谱与\的振幅谱之间的相关Cl和Ysup的振幅谱与\的振幅谱之间的相关C2。 比较单元136将由相关计算单元134计算的相关Cl与相关C2相比较。判断单元138根据由比较单元136进行的比较结果判断是否预先设置了目标声音。判断单元138使用振幅谱之间的相关和以下技术判断是否存在目标声音。输入至计算单元131的信号中包括以下分量从目标声音强调单元102获取的声音频率分量 Yemp(目标声音和被抑制的噪声分量之和)、从目标声音抑制单元104获取的频谱Ysup (噪声分量)、以及输入信号的频谱Xi中的一个(目标声音和被抑制的噪声分量之和)。
当两个谱类似时,振幅谱之间的相关呈现大的值。如由图7所示的曲线图310所表示,在存在目标声音的时段中,谱\的形状相比Ysup更类似于Ymp。另外,如由图7所示的曲线图312所表示,在不存在目标声音的时段中,仅存在噪声。因此,Ysup类似于Ymp,并且\的形状类似于Ysup和Yemp。因此,在存在目标声音的时段中,Xi和Yemp之间的相关值Cl大于\和Ysup之间的相关值C2。相反地,在不存在目标声音的时段中,Cl与C2大致相同。如由图8所示的曲线图314所表示,通过从相关值Cl中减去相关值C2所获得的值与用于表示存在实际目标声音的时段的值大致相同。通过以这种方式比较谱之间的相关,能够从不存在目标声音的时段中区分存在目标声音的时段。下面参考图9说明由目标声音时段检测单元110进行的用于检测目标声音时段的处理。图9是由目标声音时段检测单元110进行的用于检测目标声音时段的处理的流程图。 如图9所示,从目标声音强调单元102获取声音频率分量Yemp,从目标声音抑制单元104获取频谱YSUP,并且从麦克风的输入获取频谱\ (步骤S13》。使用步骤S132中获取的频谱计算振幅谱(步骤S134)。之后,目标声音时段检测单元Iio计算\和Yemp的振幅谱之间的相关Cl以及\和Ysup的振幅谱之间的相关C2 (步骤S136)。随后,目标声音时段检测单元110判断通过从相关Cl中减去相关C2(即C1-C2) 所获得的值是否大于\的阈值Th (步骤S138)。如果在步骤S138中判断为(C1-C2)大于Th,则目标声音时段检测单元110判断为存在目标声音(步骤S140)。然而,如果在步骤S138中判断为(C1-C2)小于Th,则目标声音时段检测单元110判断为不存在目标声音(步骤S142)。如上所述,由目标声音时段检测单元110进行用于检测目标声音时段的处理。下面说明由目标声音时段检测单元110使用数学公式进行的用于检测目标声音时段的处理。首先,如下定义振幅谱
Axi (n, k) = Xi的帧η的以频率点k的振幅谱, Aemp (n, k) = Yemp的帧η的以频率点k的振幅谱,以及 Asup (n, k) = Ysup的帧η的以频率点k的振幅谱. 使用Axi的平均值如下进行白色化处理
权利要求
1.一种声音处理设备,包括目标声音强调单元,被配置用于通过对其中混合有目标声音和噪声的输入声音中的目标声音进行强调来获取声音频率分量;目标声音抑制单元,被配置用于通过抑制所述输入声音中的目标声音获取噪声频率分量;增益计算单元,被配置用于使用根据所述声音频率分量和所述噪声频率分量的预定增益函数计算将与所述声音频率分量相乘的增益值;以及增益乘法器单元,被配置用于将所述声音频率分量与由所述增益计算单元计算出的增益值相乘,其中,所述增益计算单元使用以下增益函数来计算所述增益值当所述声音频率分量与所述噪声频率分量的能量比率小于或等于预定值时,所述增益函数提供小于预定值的增益值和斜率。
2.根据权利要求1所述的声音处理设备,其中,所述声音频率分量包括目标声音分量和噪声分量,并且所述增益乘法器单元通过将所述声音频率分量与所述增益值相乘来抑制包括在所述声音频率分量中的噪声分量。
3.根据权利要求1所述的声音处理设备,其中,所述增益计算单元假设在由所述目标声音抑制单元所获取的噪声频率分量中仅包括噪声,并且计算所述增益值。
4.根据权利要求1所述的声音处理设备,其中,在依据所述声音频率分量与所述噪声频率分量的能量比率噪声比率所集中的噪声集中范围中,所述增益函数提供小于预定值的增益值并且具有斜率小于预定值的增益曲线。
5.根据权利要求4所述的声音处理设备,其中,所述增益函数具有如下增益曲线所述增益曲线的斜率在除了所述噪声集中范围之外的范围中小于所述增益函数的最大斜率。
6.根据权利要求1所述的声音处理设备,还包括目标声音时段检测单元,用于检测存在所述输入声音中所包括的目标声音的时段; 其中,所述增益计算单元根据由所述目标声音时段检测单元进行的检测的结果对由所述目标声音强调单元所获取的声音频率分量的功率谱和由所述目标声音抑制单元所获取的噪声频率分量的功率谱取平均。
7.根据权利要求6所述的声音处理设备,其中,作为所述目标声音时段检测单元进行的检测的结果,当时段是存在目标声音的时段时,所述增益计算单元选择第一平滑系数,并且当时段是不存在目标声音的时段时,所述增益计算单元选择第二平滑系数,并且所述增益计算单元对所述声音频率分量的功率谱和所述噪声频率分量的功率谱取平均。
8.根据权利要求6所述的声音处理设备,其中,所述增益计算单元使用所述声音频率分量的平均功率谱和所述噪声频率分量的平均功率谱对所述增益值取平均。
9.根据权利要求1所述的声音处理设备,还包括噪声校正单元,用于校正所述噪声频率分量,使得由所述目标声音抑制单元所获取的所述噪声频率分量的幅度与由所述目标声音强调单元所获取的所述声音频率分量中包括的噪声分量的幅度相对应,其中,所述增益计算单元根据由所述噪声校正单元校正的噪声频率分量计算所述增益值。
10.根据权利要求9所述的声音处理设备,其中,所述噪声校正单元响应于用户操作校正噪声频率分量。
11.根据权利要求9所述的声音处理设备,其中,所述噪声校正单元根据所检测的噪声的状态校正噪声频率分量。
12.—种声音处理方法,包括以下步骤通过强调其中混合有目标声音和噪声的输入声音中的目标声音获取声音频率分量; 通过抑制所述输入声音中的所述目标声音获取噪声频率分量; 使用以下增益函数来计算要与所述声音频率分量相乘的增益值当所述声音频率分量与所述噪声频率分量的能量比率小于或等于预定值时,所述增益函数提供小于预定值的增益值和斜率;以及将所述声音频率分量与在计算增益值的步骤中计算出的增益值相乘。
13.一种程序,包括用于使计算机用作声音处理设备的程序代码,所述声音处理设备包括目标声音强调单元,用于通过对其中包括目标声音和噪声的输入声音中的目标声音进行强调来获取声音频率分量;目标声音抑制单元,用于通过抑制所述输入声音中的所述目标声音获取噪声频率分量;增益计算单元,用于使用根据所述声音频率分量和所述噪声频率分量的预定增益函数计算将与所述声音频率分量相乘的增益值;以及增益乘法器单元,用于将所述声音频率分量与由所述增益计算单元计算出的增益值相乘,其中,所述增益计算单元使用以下增益函数来计算所述增益值当所述声音频率分量与所述噪声频率分量的能量比率小于或等于预定值时,所述增益函数提供小于预定值的增益值和斜率。
全文摘要
本发明提供一种声音处理设备、声音处理方法和程序。该声音处理设备包括目标声音强调单元,用于通过对其中包括目标声音和噪声的输入声音中的目标声音进行强调来获取声音频率分量;目标声音抑制单元,用于通过抑制所述输入声音中的所述目标声音获取噪声频率分量;增益计算单元,使用以下增益函数来计算将与所述声音频率分量相乘的增益值当所述声音频率分量与所述噪声频率分量的能量比率小于或等于预定值时,所述增益函数提供小于预定值的增益值和斜率;以及增益乘法器单元,用于将所述声音频率分量与由所述增益计算单元计算出的增益值相乘。
文档编号G10L21/02GK102194464SQ20111006087
公开日2011年9月21日 申请日期2011年3月9日 优先权日2010年3月16日
发明者关矢俊之, 大迫庆一, 安部素嗣 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1