声音处理方法及装置的制作方法

文档序号：2822508阅读：260来源：国知局

专利名称：声音处理方法及装置的制作方法
技术领域：
本公开总体涉及声音处理方法，具体而言，涉及对输入信号的动态范围进行压縮
的声音处理方法。
背景技术：
当嵌入在便携式终端等中的扬声器发出较大的声音时，优选在抑制由于削峰 (clipping)所致的声音失真的同时增大声音的音量。为此，对动态范围压縮技术展开了研究。
动态范围压縮技术减小了输入信号的幅度范围。图1是例示了用在相关技术的系统中的动态范围压縮的例子的图。如图1所示，动态范围压縮单元1对输入信号的动态范围进行压縮。然后，DA转换器2将数字音频信号转换成模拟音频信号。放大器3将该模拟音频信号放大以驱动扬声器4。扬声器4对由放大器3放大的该模拟音频信号进行接收并发出声音。非专利文献1中公开了这样的动态范围压縮技术的示例。所公开的技术对输入信号的电平进行测量，在对较小输入电平的部分进行放大的同时对较大输入电平的部分进行衰减(attenuate)。图2是例示了在非专利文献1中公开的相关技术的动态范围压縮的示例的图。在图2例示的例子中，将具有较大音量的部分A衰减，同时将具有较小音量的部分B放大，由此，基于增益控制来压縮输入信号的动态范围。这能够在抑制由于削峰所致的声音失真的同时增大输出声音的音量。由于削峰引起的声音失真可以通过将输入信号乘以借助于相关技术获得的增益
而进行抑制。虽然在时域中对信号波形进行修改，但是，这种修改影响了整个频域中的频
谱，从而导致很差的声音质量。下面，参照图3和图4来说明上述问题。图3是例示了通过
相关技术执行增益控制之前和之后的时域信号波形的例子的图。如图3所示，与增益控制
之前的时域信号A相比，增益控制之后的时域信号B具有更窄的幅度范围。图4是例示了通过相关技术执行增益控制之前和之后的频谱轮廓(spectrum
profile)的例子的图。如图4所示，与增益控制之前的功率谱A相比，增益控制之后的功率
谱B具有在高频率范围被放大的频率分量。当再现音频声音时，该放大的频率范围可能被
感知为不协调的声音(dissonant sound)，从而导致了音频质量的下降。因此，优选的是，提供一种在避免音频质量下降的同时能够压縮动态范围的声音
处理方法。 [非专利文献l]" Dolby Digital Encoding Technique Section 2' Dy謹ic Range Compression ' 〃， URL :http://www. dolby. co. jp/professional/studio/dvd_ authoring03. html

发明内容
根据实施方式的一个方面，提供了一种声音处理方法，该方法包括以下步骤将输
4入信号从时域变换到频域以产生频谱；检测所述频谱的谱峰；基于所述输入信号和所述频谱二者中的一个来计算目标衰减量；基于所述目标衰减量及所检测到的谱峰来计算所述频谱的各频率分量的衰减量；通过响应于计算出的各频率分量的衰减量对所述频谱进行衰减来校正所述频谱的电平；以及对该电平校正后的频谱执行逆频率变换以产生输出信号。

图1是例示了用在相关技术系统中的动态范围压縮的例子的图；图2是例示了用在相关技术系统中的动态范围压縮的例子的图；图3是例示了通过相关技术执行增益控制之前和之后的时域信号波形的例子的
图4是例示了通过相关技术执行增益控制之前和之后的频谱轮廓的例子的图；图5是例示了根据第一实施方式的声音处理装置的结构的例子的图；图6是例示了根据第一实施方式的动态范围压縮单元的结构的例子的图；图7是例示了功率谱与衰减量之间的关系的图8是例示了根据第一实施方式的输入频谱与电平校正后的频谱之间的关系的图9是图8所例示的各频率的增益的图10是例示了根据第一实施方式的声音处理的示例的图；图11是例示了根据第一实施方式的增益计算处理的流程图；图12是例示了根据第二实施方式的声音处理装置的结构的例子的图；图13是例示了根据第二实施方式的各频率分量的衰减量的图14是例示了根据第二实施方式的输入频谱与电平校正后的频谱之间的关系的图15是图14所例示的各频率的增益的图16是例示了根据第二实施方式的增益计算处理的例子的流程图；图17是例示了根据第三实施方式的输入频谱与电平校正后的频谱之间的关系的
图18是图17所例示的各频率的增益的图19是例示了根据第三实施方式的增益计算处理的例子的流程图；图20是例示了根据第四实施方式的动态范围压縮单元的结构的例子的图；图21是例示了根据第四实施方式的声音处理的示例的图；图22是例示了所公开的声音处理的应用的变型的图。
具体实施例方式
下面，参照

用于实现本发明的实施方式。 [第一实施方式] 〈主要结构>
图5是例示了根据第一实施方式的声音处理装置的结构的例子的图。图5例示的例子涉及应用于IP (Internet Protocol :网际协议)电话的声音处理装置。图5中描述的声音处理装置包括分组接收单元10、解码单元11、动态范围压縮单元12、放大器13和扬声器14。分组接收单元10通过网络接收包含有编码音频信号的数据的分组，并将接收到的分组提供给解码单元11。解码单元11对从分组接收单元10提供的分组中包含的数据进行解码，并将解码后的音频信号提供给动态范围压縮单元12。设计用在IP电话中的解码单元11已被广泛采用，因此省略其具体的说明。动态范围压縮单元12对从解码单元11提供的音频信号(下面，称作"输入信号") 的动态范围进行压縮。后面将详细介绍动态范围压縮。动态范围压縮单元12将动态范围被压縮后的音频信号提供给放大器13。放大器13将从动态范围压縮单元12提供的音频信号放大以驱动扬声器14。放大器13将放大后的音频信号提供给扬声器14。扬声器14响应于从放大器13提供的音频信号而发出声音。下面，参照图6来详细介绍动态范围压縮单元12。图6是例示了根据第一实施方式的动态范围压縮单元12的结构的例子的图。图6中所示的动态范围压縮单元12包括划分单元121、最大幅度检测单元122、目标增益计算单元123、频率变换单元124、功率谱计算单元125、谱峰检测单元126、增益计算单元127、电平校正单元128和逆频率变换单元129。
划分单元121将接收到的输入信号划分成具有恒定时间长度的多个帧。从划分单元121将划分后的帧提供至最大幅度检测单元122和频率变换单元124。
最大幅度检测单元122利用下面的公式(1)在划分单元121提供的感兴趣的帧中
对输入信号的最大幅度值进行检测
Pmax = max (| x (n) |) (1) 这里，Pmax是感兴趣的帧中的最大幅度值，而x(n)是该帧中的输入信号。最大幅
度检测单元122将检测到的最大幅度值Pmax提供给目标增益计算单元123。目标增益计算单元123利用以下的条件表达式(2)，基于由最大幅度检测单元122
提供的最大幅度值来计算目标衰减量(即，目标增益值)。下面，将以分贝(dB)为单位来说
明衰减量。 if (Pmax > THR1) G_target = Pmax-THR1 else G_target = 0 (2) 这里，G—target是目标衰减量，而THR1是第一阈值。根据扬声器的特点预先确定了该第一阈值。目标增益计算单元123将计算出的目标衰减量提供给增益计算单元127。
频率变换单元124逐帧地将输入信号从时域变换到频域。可以通过将信号从时域变换到频域的诸如离散傅里叶变换(DFT)或快速傅里叶变换(FFT)的变换方案来进行时间到频率的变换。第一实施方式中使用FFT。 FFT是公知的，所以省略其详细说明。下面，将通过FFT获得的频谱称作X(f)。频率变换单元124将通过频率变换获得的频谱X(f)提供给功率谱计算单元125和电平校正单元128作为输入频谱。功率谱计算单元125通过以下的公式(3)根据频率变换单元124提供的输入谱来计算功率谱。
Amp(f) = 101oglO(|X(f)2|) (3) 这里，Amp (f)是功率谱，其被表示为对数功率谱。功率谱计算单元125将计算出的功率谱提供给谱峰检测单元126和增益计算单元127。谱峰检测单元126基于由功率谱计算单元125提供的功率谱通过以下的公式(4) 来检测功率谱峰值(下面简称为"功率值")。谱峰检测单元126还基于功率谱通过使用以下的公式(5)来检测功率谱峰的频率。
Amp_peak = max (Amp (f)) (4)
f_peak = argmax (Amp (f)) (5) 这里，Amp_peak是功率谱峰值(即，功率谱的谱峰的值)，而f_peak是功率谱的谱峰的频率。谱峰检测单元126将通过公式(4)获得的谱峰的功率值(即，功率谱峰值)和通过公式(5)获得的频率提供给增益计算单元127。增益计算单元127基于由功率谱计算单元125提供的功率谱Amp (f)、由谱峰检测单元126提供的谱峰的功率值Amp_peak、由目标增益计算单元123提供的目标衰减量G_ target、和第二阈值，利用下面的条件表达式(6)来计算各个频率分量的衰减量(即，增益值)。 if (Amp(f) > Amp_peak-THR2)G(f) = (G_target/THR2)(Amp(f)-(Amp_peak_THR2))
elseG (f) =0 (6) 这里，G(f)表示各个频率的衰减量，而THR2是第二阈值。预先确定第二阈值来指定功率谱值衰减的范围。下面将参照图7来说明条件表达式(6)。图7是例示了功率谱与衰减量之间的关
系的图。也就是说，图7图示地例示了条件表达式(6)。如图7所示，给定频率分量的衰减
量按照与对应功率谱值和谱峰功率值之差成比例的方式从目标衰减量减小。当对应功率谱值与谱峰功率值之差小于或等于第二阈值时，上述语句为真
(true)。对于上述差大于第二阈值的给定频率分量而言，将衰减量设置为0。通过这种设置，
一旦给定了目标衰减量，则通过得出对应功率谱值与谱峰功率值之差而确定了给定频率分
量的衰减量。当该差大于第二阈值时将衰减量设置为0的原因是因为没有必要将从开始就不是很大的输入信号频率分量衰减。再次参照图6，增益计算单元127将计算出的各个频率分量的衰减量G(f)提供给电平校正单元128。电平校正单元128基于由频率变换单元124提供的输入频谱和由增益计算单元 127提供的各个频率分量的衰减量利用下面的公式(7)来计算电平校正后的频谱。
Y(f) = X(f)e-"維 (7)
这里，Y(f)表示电平校正后的频谱。图8是例示了根据第一实施方式的输入频谱与电平校正后的频谱之间的关系的图。如图8所示，输入频谱的频率分量被衰减了通过增益计算单元127计算出的相应衰减量，从而产生电平校正后的频谱。图9是图8所例示的各频率的增益的图。如图9所示，根据第一实施方式，在各谱
7峰周围执行增益控制。再次参照图6，电平校正单元128将所计算出的电平校正后的频谱 Y(f)提供给逆频率变换单元129。逆频率变换单元129针对由电平校正单元128提供的电平校正后的频谱执行逆频率变换(例如，IFFT)。逆频率变换单元129将通过逆频率变换而获得的信号提供给放大器 13。扬声器响应于放大器13放大的音频信号而发出声音。
〈声音处理> 将参照图IO和图ll来介绍第一实施方式的声音处理。图IO是例示了根据第一实施方式的声音处理的示例的图。在步骤Sll中，划分单元121将输入信号划分成多个帧，并将划分成的帧提供给最大幅度检测单元122以及频率变换单元124。步骤S12和S13中的处理以及步骤S14至S16的处理可以并行地执行。首先来介绍对步骤S12的路径的处理。
在步骤S12中，最大幅度检测单元122使用公式(1)识别出以帧为单位提供的输入信号的最大幅度，接着，将获得的最大幅度提供给目标增益计算单元123。在步骤S13中，目标增益计算单元123基于提供的最大幅度使用公式(2)来计算目标衰减量，然后，将计算出的目标衰减量提供给增益计算单元127。接着将介绍步骤S14的路径的处理。在步骤S14，频率变换单元124对以帧为单位而提供的输入信号执行频率变换，然后，将获得的输入频谱提供给功率谱计算单元125和电平校正单元128。在步骤S15，功率谱计算单元125使用公式(3)由所提供的输入频谱来计算功率谱，然后，将计算出的功率谱提供给谱峰检测单元126和增益计算单元127。
在步骤S16中，谱峰检测单元126使用公式(4)由所提供的功率谱来确定谱峰的功率值，然后将获得的功率值提供给增益计算单元127。此外，谱峰检测单元126使用公式 (5)而识别出谱峰的频率，接着，将获得的频率提供给增益计算单元127。在第一实施方式中，谱峰的频率可以不使用并且可以不进行检测。在步骤S17中，增益计算单元127基于从功率谱计算单元125提供的功率谱、从谱峰检测单元126提供的谱峰的功率值、以及从目标增益计算单元123提供的目标衰减量，使用条件表示式(6)来计算各个频率分量的衰减量。下面将参照图11来介绍由增益计算单元127执行的处理的细节。将各个频率分量的计算出的衰减量提供给电平校正单元128。
在步骤S18中，电平校正单元128通过使从频率变换单元124提供的输入频谱衰减由增益计算单元127提供的相应频率分量的衰减量来执行电平校正，然后，将获得的电平校正后的频谱提供给逆频率变换单元129。在步骤S19中，逆频率变换单元129对所提供的电平校正后的频谱执行逆频率变换，接着将通过逆频率变换获得的信号提供给放大器13。参照图11介绍第一实施方式的增益计算处理。图11是例示了根据第一实施方式的增益计算处理的流程图。由增益计算单元127执行图11所例示的步骤S20至S24的处理。在步骤S20中，增益计算单元127计算感兴趣功率谱值与谱峰功率值之差。在步骤S21，检查在步骤S20中获得的功率值的差是否不大于阈值。如果步骤S21中的检查结果为"是"，则在步骤S22中利用条件表达式(6)来计算与用于计算该差的感兴趣功率谱值相对应的频率分量的衰减量(参见图7)。如果步骤S21中的检查结果为"否"，则在步骤S23中将该对应频率分量的衰减量设置为0。
在步骤S24中，检查是否已经对所有的频率分量计算了衰减量。如果检查的结果为"否"，则过程返回至步骤S20。如果检查的结果为"是"，则增益计算处理结束，过程前进到图10所例示的下一步骤S18。根据第一实施方式，在频域中对谱峰进行衰减，由此在避免由于频谱放大而导致产生不协调声音的同时压縮输入信号的动态范围。针对谱峰的功率值来确定目标衰减量。然后，给定频率分量的衰减量是基于目标衰减量以及谱峰功率值与对应功率谱值之差来确定。这在避免音频质量的下降的同时使得要被衰减的频谱位于谱峰周围。
[第二实施方式]
〈主要结构> 下面将介绍根据第二实施方式的声音处理装置。图12是例示了根据第二实施方式的声音处理装置的结构的例子的图。图12中例示的示例涉及将声音处理装置应用于便携终端。图12中所示的声音处理装置包括解码单元20、动态范围压縮单元21、放大器单元13和扬声器14。针对图12所例示的构成单元，用相同的标号来指代与图5中的单元相同或类似的单元，并省略对它们的说明。如图12所示，解码单元20接收通过音频通信网发送的经编码音频信号(下面称作"接收到的信号")，并对接收到的信号进行解码来产生音频信号。设计用在便携终端中的解码单元20较普遍，所以省略其具体说明。解码单元20将解码后的音频信号(输入信号)提供给动态范围压縮单元21。动态范围压縮单元21对输入信号的动态范围进行压縮，然后将电平校正后的音频信号提供给放大器13。动态范围压縮单元12的主要结构与图6所例示的结构类似，所以省略其说明。但是，在第二实施方式中，由增益计算单元127执行的处理与第一实施方式不同。下面，介绍增益计算单元127执行的处理。增益计算单元127基于由谱峰检测单元126提供的谱峰的频率、和由目标增益计算单元123提供的目标衰减量来确定各个频率分量的衰减量。通过使用以下的条件表达式 (8)来确定各个频率分量的衰减量。
if (0《S (f) < f_peak- a )
G(f) =0 elseif (f_peak_a《S (f) < f_peak) G (f) = (G_target/ a ) (S (f) - (f_peak_ a )) elseif (f_peak《S(f) < f_peak+a ) G (f) = (G_target/a)(S(f)-f_peak)+G_target else G(f) =0 (8) 这里，S(f)是谱峰与各频谱之间的频率差，而a是阈值。该阈值a表示与谱峰的频率的距离以规定频谱被衰减的频率范围。图13是例示了根据第二实施方式的各个频率分量的衰减量的图。图13图示地例示了条件表达式(8)。按照这种方式，在谱峰周围频谱被衰减，由此在避免由于频谱放大而
9导致音频质量下降的同时压縮了动态范围。图14是例示了根据第二实施方式的输入频谱与电平校正后的频谱之间的关系的图。如图14所示，使输入频谱的频率分量衰减由增益计算单元127计算出的相应衰减量，由此产生电平校正后的频谱。图15是图14所例示的各频率的增益的图。如图15所示，根据第二实施方式在谱峰周围执行增益控制。[owe]〈声音处理〉第二实施方式的声音处理的概要与图IO所示的类似，所以省略其说明。下面，参照图16来介绍第二实施方式的增益计算处理。图16是例示了根据第二实施方式的增益计算处理的例子的流程图。针对图16中所例示的步骤，与图11中的步骤相同或类似的步骤用相同的标号表示并省略对它们的说明。由增益计算单元127来执行图16所例示的处理。在步骤S30中，增益计算单元127计算谱峰频率与感兴趣频谱频率之差。在步骤S31，检查计算的出的频率差是否在预定的范围之内。在图13所例示的例子中，该预定的范围表示为-a《S(f)《a 。如果步骤S31中的检查结果为"是"，则在步骤S32中使用条件表达式(8)来计算感兴趣频率分量的衰减量。如果步骤S31中的检查结果为"否"，则在步骤S33将感兴趣频率分量的衰减量设置为O。当针对所有的频率分量计算了衰减量时，增益计算处理结束。作为第二实施方式的增益计算处理的变型例，不仅可以对谱峰的周围还可以针对第二谱峰、第三谱峰等来执行由条件表达式(8)表示的处理以针对这些谱峰中的每一个来计算衰减量。通过这种设置，即使当谱峰(诸如第二谱峰和第三谱峰)具有较大的功率值时，也有效地压縮了动态范围。在上述变型例中，可以不照原样来应用条件表达式(8)，而是在进行以下修改的情况下应用该条件表达式随着感兴趣谱峰的序数(诸如第二或第三谱峰)增大而减小G—target禾口 a 。根据第二实施方式，在频域中对谱峰进行衰减，由此在避免产生由于频谱放大而导致的不协调声音的同时压縮输入信号的动态范围。针对谱峰的功率值来确定目标衰减量。然后，给定频率分量的衰减量是基于目标衰减量以及谱峰频率与对应频谱频率之差来确定。这在避免音频质量下降的同时使得要衰减的频谱位于谱峰周围。
[第三实施方式]
〈主要结构〉下面介绍根据第三实施方式的声音处理装置。根据第三实施方式的声音处理装置的应用领域与第二实施方式的应用领域类似。这种声音处理装置的主要结构与图6所例示的结构类似，并省略其说明。但是，在第三实施方式中，增益计算单元127执行的处理不同于第一实施方式和第二实施方式中的处理。下面说明增益计算单元127执行的处理。
增益计算单元127基于由谱峰检测单元126提供的谱峰的功率值Amp_peak以及由目标增益计算单元123提供的目标衰减量G—target，利用公式(9)来计算目标功率值。
Amp_target = Amp_peak_G_target (9)
这里，Amp—target是目标功率值。增益计算单元127将各频率分量的衰减量计算为使得这些频率分量的功率谱值不超过目标功率值。图17是例示了根据第三实施方式的输入频谱与电平校正后的频谱之间的关系的图。如图17所示，输入频谱的频率分量被衰减了由增益计算单元127计算出的相应衰减量，由此产生了电平校正后的频谱。图18是例示图17所示各频率的增益的图。如图18所示，在超过目标功率值的各个谱峰周围执行增益控制。〈声音处理〉第二实施方式的声音处理的概要与图IO所例示的声音处理类似，所以省略其详细说明。下面，参照图19来介绍第三实施方式的增益计算处理。图19是例示了根据第三实施方式的增益计算处理的例子的流程图。针对图19所例示的步骤，与图11的步骤相同或类似的步骤用相同的标号表示，并省略对它们的说明。通过增益计算单元127来执行图19所例示的处理。在步骤S40，增益计算单元127通过从谱峰的功率值中减去目标衰减量来计算目标功率值。在步骤S41中，检查感兴趣频率分量的频谱功率值是否为谱峰并且不小于目标功率值。如果步骤S41中的检查结果为"是"，则在步骤S42中将感兴趣的频率分量周围的衰减量计算为使得所得到的功率值不超过目标功率值，并且还形成从谱峰下降的平缓曲线。如果步骤S41中的检查结果为"否"，则过程返回至步骤S41。当针对全部的频率分量计算了衰减量之后，增益计算处理结束。根据第三实施方式，在频域中对谱峰进行衰减，由此在避免产生由于频谱放大而导致的不协调声音的同时压縮输入信号的动态范围。针对谱峰的功率值来确定目标衰减量。然后，将各频率分量的衰减量确定为使得所得到的功率谱值不超过目标功率值，并且还形成从各谱峰下降的平缓曲线。这在避免音频质量下降的同时使得要衰减的频谱位于谱峰周围。
[第四实施方式]
〈主要结构〉下面介绍根据第四实施方式的声音处理装置。第四实施方式的声音处理装置的应用领域可以是第一至第三实施方式的应用领域中的一个。图20是例示了根据第四实施方式的动态范围压縮单元的结构的例子的图。第四实施方式与前述实施方式的不同之处在于如何计算目标衰减量。如图20所示，目标增益计算单元130从由谱峰检测单元126提供的谱峰的功率值Amp_peak中减去预定的阈值以计算目标衰减量。按照与确定第一阈值的方式类似的方式响应于扬声器的特性而预先确定该预定的阈值。在目标衰减量的计算之后执行的处理与前述实施方式相同或类似。〈声音处理〉图21是例示了根据第四实施方式的声音处理的示例的图。针对图21所示处理，用相同的标号来表示与图IO的处理相同或类似的处理，并省略对它们的说明。第四实施方式的声音处理与前述实施方式的声音处理的不同之处在于在步骤S16的计算谱峰的处理之后，执行步骤S50的目标增益计算处理。如上所述，目标增益计算处理通过从谱峰的功率值Amp—peak中减去预定的阈值来计算目标衰减量。第四实施方式的增益计算处理可以是前述实施方式所使用的增益计算处理中的任何一个。上述第四实施方式通过使用更简单的结构而实现了与前述实施方式的优点一样有利的优点。当期望精确地控制音量时，可以使用第一实施方式至第三实施方式之一。在更希望用更简单的结构来实现该目的时，可以使用第四实施方式。下面将介绍上述实施方式的变型例。图22是例示了所公开的声音处理的应用的变型的图。如图22所示，前述实施方式的声音处理可以被实现为使计算机31执行处理的程序。这种程序可以从服务器30等进行安装以由计算机31来执行，由此执行上述的声音处理。该程序可以记录在记录介质(例如，CD-ROM 32、 SD卡34等)中。可以通过计算机31或便携终端33来读取其中记录有程序的这种记录介质，由此执行前述的声音处理。该记录介质可以是任何类型的记录介质，也就是说，其可以是利用光、电或磁装置(诸如，CD-R0M、软盘或磁光盘)来记录信息的记录介质、或者可以是利用电装置(诸如，R0M或闪存)来记录信息的半导体存储器。所公开的实施方式及其变型例对于具有小扬声器的装置(诸如，便携终端或IP电话)特别有效。根据至少一个实施方式，提供了一种在避免音频质量降低的同时压縮动态范围的声音处理方法。出于教育目的而在本文中引用的全部实施例和条件性用语旨在帮助读者理解本发明以及发明人为进一步发展现有技术而做出贡献的原理，并且应被解释为不限于此类具体引用的实施例和条件，并且此类实施例在说明书中的组织形式也不是为了示出本发明的优劣。尽管已经详细描述了本发明的实施方式，但应理解的是在不偏离本发明的精神和范围的情况下可进行各种改变、替换和变更。
1权利要求
一种声音处理方法，该方法包括以下步骤将输入信号从时域变换到频域以产生频谱；检测所述频谱的谱峰；目标衰减量计算步骤，基于所述输入信号和所述频谱二者中的一个来计算目标衰减量；衰减量计算步骤，基于所述目标衰减量及所检测到的谱峰来计算所述频谱的各频率分量的衰减量；通过响应于计算出的各频率分量的衰减量对所述频谱进行衰减来校正所述频谱的电平；以及对该电平校正后的频谱执行逆频率变换以产生输出信号。
2. 根据权利要求1所述的声音处理方法，其中，该目标衰减量计算步骤基于所述输入信号的最大幅度和所检测到的谱峰的功率谱值这二者中的一个来计算所述目标衰减量。
3. 根据权利要求2所述的声音处理方法，其中，该衰减量计算步骤将所述谱峰的衰减量设置为目标衰减量，并且将除了所述谱峰以外的频率分量的衰减量设置为小于所述目标衰减量。
4. 根据权利要求3所述的声音处理方法，其中，该衰减量计算步骤基于所述谱峰的功率谱值与除了所述谱峰以外的给定频率分量的功率谱值之差，确定该给定频率分量的衰减
5. 根据权利要求4所述的声音处理方法，其中，该衰减量计算步骤将除了所述谱峰以外的且所述差比阈值小的给定频率分量的衰减量确定为，使得所确定的衰减量比所述目标衰减量小一个与所述差成比例的值。
6. 根据权利要求5所述的声音处理方法，其中，该衰减量计算步骤将除了所述谱峰以外的且所述差比所述阈值大的给定频率分量的衰减量设置为0。
7. 根据权利要求3所述的声音处理方法，其中，该衰减量计算步骤基于所述谱峰的频率与除了所述谱峰以外的给定频率分量的频率之差来确定该给定频率分量的衰减量。
8. 根据权利要求7所述的声音处理方法，其中，该衰减量计算步骤基于除了所述谱峰以外的局部最大频率分量的频率与除了所述谱峰以外的给定频率分量的频率之差来确定该给定频率分量的衰减量。
9. 根据权利要求7所述的声音处理方法，其中，该衰减量计算步骤将除了所述谱峰以外的且所述差比阈值小的给定频率分量的衰减量确定为，使得所确定的衰减量比所述目标衰减量小一个与所述差成比例的值。
10. 根据权利要求8所述的声音处理方法，其中，该衰减量计算步骤将除了所述局部最大频率分量以外的且所述差比阈值小的给定频率分量的衰减量确定为，使得所确定的衰减量比所述目标衰减量小一个与所述差成比例的值。
11. 根据权利要求9所述的声音处理方法，其中，该衰减量计算步骤将除了所述谱峰以外的且所述差比所述阈值大的给定频率分量的衰减量设置为0。
12. 根据权利要求IO所述的声音处理方法，其中，该衰减量计算步骤将除了所述局部最大频率分量以外的且所述差比所述阈值大的给定频率分量的衰减量设置为O。
13. 根据权利要求3所述的声音处理方法，其中，该衰减量计算步骤通过将所述谱峰的功率谱值减少该目标衰减量来计算目标功率谱值，并且将除了所述谱峰以外的给定频率分量的衰减量确定为使得该给定频率分量的功率谱值变得小于该目标功率谱值。
14. 一种其中包含有程序的计算机可读介质，所述程序使得计算机执行以下操作将输入信号从时域变换到频域以产生频谱；检测所述频谱的谱峰；基于所述输入信号的最大幅度和所检测到的谱峰的功率谱值二者中的一个来计算目标衰减量；基于所述目标衰减量及所检测到的谱峰来计算所述频谱的各频率分量的衰减量；通过响应于计算出的各频率分量的衰减量对所述频谱进行衰减来校正所述频谱的电平；以及对该电平校正后的频谱执行逆频率变换以产生输出信号。
15. —种声音处理装置，该装置包括频率变换单元，其被配置为将输入信号从时域变换到频域以产生频谱；谱峰检测单元，其被配置为对所述频谱的谱峰进行检测；目标衰减量计算单元，其被配置为基于所述输入信号的最大幅度和所检测到的谱峰的功率谱值二者中的一个来计算目标衰减量；衰减量计算单元，其被配置为基于所述目标衰减量及所检测到的谱峰来计算所述频谱的各频率分量的衰减量；电平校正单元，其被配置为通过响应于计算出的各频率分量的衰减量对所述频谱进行衰减来校正所述频谱的电平；以及逆频率变换单元，其被配置为对该电平校正后的频谱执行逆频率变换以产生输出信号。
全文摘要
本发明提供了一种声音处理方法及装置。该方法包括以下步骤将输入信号从时域变换到频域以产生频谱；检测所述频谱的谱峰；基于所述输入信号和所述频谱二者中的一个来计算目标衰减量；基于所述目标衰减量及所检测到的谱峰来计算所述频谱的各频率分量的衰减量；通过响应于计算出的各频率分量的衰减量对所述频谱进行衰减来校正所述频谱的电平；以及对该电平校正后的频谱执行逆频率变换以产生输出信号。
文档编号G10L21/02GK101751929SQ200910258019
公开日2010年6月23日申请日期2009年12月9日优先权日2008年12月9日
发明者外川太郎, 大田恭士, 大谷猛申请人:富士通株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：大谷猛;外川太郎;大田恭士
技术所有人：富士通株式会社
我是此专利的发明人

上一篇：乐音产生装置以及乐音产生程序的制作方法
上一篇：通话音量自动调节方法及装置的制作方法