修改输入音频信号的装置及方法

文档序号:2832799阅读:456来源:国知局
专利名称:修改输入音频信号的装置及方法
修改输入音频信号的装置及方法技术领域
根据本发明的实施方式涉及音频信号处理,尤其涉及修改输入音频信号的装置及 方法。
背景技术
已经进行过许多尝试来开发令人满意的测量响度的客观方法。Fletcher和 Munson在1933年确定人的听觉在低频和高频处比在中间(或语音)频率处较不敏感。他们 还发现敏感度的相对变化随声级的增加而降低。早先的响度测量仪由麦克风、放大器、测量 仪和被设计为在低、中和高声级大致模仿听觉的频率响应的滤波器的组合构成。
尽管这样的设备提供了单一的、恒定声级、独立音调的响度测量,但是更加复杂声 音的测量不能非常好地匹配响度的主观感觉。这种类型的声级测量仪已经被标准化,但是 它仅仅用于诸如监控和控制工业噪声的特定任务。
在20 世纪 50 年代早期,Zwicker 和 Stevens 扩展了 Fletcher 和 Munson 的工 作,在于开发了更为逼真的响度感觉处理的模型。Stevens于1956年在Journal of the Acoustical Society of America 中发表了一种用于 “Calculation of the Loudness of Complex Noise”的方法,以及Zwicker于1958年在Acoustica中发表了他的文章 “Psychological and Methodical Basisof Loudness”。在 1959 年,Zwicker 发表了响度 计算的图形化处理并在不久之后发表了若干类似的论文。Stevens和Zwicker方法已(分别 地)被标准化为IS0532部分A和B。这两种方法包含类似的步骤。
首先,通过将音频传输穿过具有在临界频带速率标度上均匀间隔的中心频率的一 组带通听觉滤波器来模拟被称之为激励的沿内耳基膜能量的时间变化分布。每个听觉滤 波器被设计成模拟沿内耳基膜在特定位置的频率响应,该滤波器的中心频率对应于这个位 置。临界频带带宽被定义为这样的一个滤波器的带宽。以Hz为单位进行测量,这些听觉 滤波器的临界带宽随中心频率的增加而增加。所以,有用的是,定义翘曲频率标度以便以 这种翘曲标度测量的所有听觉滤波器的临界带宽为常量。这种翘曲标度被称为临界频带速 率标度并且对理解和模拟范围广泛的心理声学现象是非常有用的。例如,参见E. Zwicker 和 H. Fastl 所著的 Psychoacoustics-Factsand Models, Springer-Verlag,柏林,1990 年。 Stevens和Zwicker的方法使用被称为Bark标度的临界频带速率标度,其中,临界频带带 宽在500Hz以下是常量而在500Hz以上增加。近来,Moore和Glasberg定义了一种临界带 宽速率标度,他们称其为等效矩形带宽(ERB)标度(B. C. J. Moore, B. Glasberg, T. Baer, “A Model for the Prediction of Thresholds, Loudness, and Partial Loudness,,,Journal of the Audio Engineering Society, Vol. 45,No. 4,1997 年 4 月,pp. 224-240)。通过使用 陷波噪声屏蔽器的心理声学实验,Moore和Glasberg证明临界频带带宽在500Hz以下继续 减小,这与临界频带带宽保持恒定的Bark标度相反。
术语“临界频带”要追溯到于1938年由Harvey Fletcher利用伴随信号对声觉掩 蔽进行的工作(“J. B. Allen, “A short history of telephonepsychophysics”,Audio Eng.Soc. Convention, 1997”)。临界频带可以利用Zwicker在1961年提出的Bark标度进行表 达每个临界频带具有一Bark(Heinrich Barkhausen之后命名的单位)的宽度。存在模仿人 类听觉感知的超滤波器组,例如,等效矩形带宽(ERB)标度(“B. C. J. Moore, B. R. Glasberg 及 T. Baer, uK model for the prediction of thresholds,loudness, andpartial loudness”, J. Audio Eng. Soc.,1997,,)。
术语“单位响度”描述了由基膜某区域上的信号对临界频带中测量的某频率带宽 引起的响度感觉。以Sone/Bark为单位进行测量。术语“临界频带”是指包括被设计用于 模仿人耳的频率分辨率的非均匀带通滤波器组的听觉滤波器组的频带。声音的总响度等于 所有临界频带上的单位响度的和/积分。
在“A. J. Seefeldt, “Calculating and adjusting the perceived loudnessand/ or the perceived spectral balance of an audio signal” 的美国专利 2009/0097676, 2009”中描述了一种处理音频信号的方法。该方法的目的在于控制音频信号的单位响度,可 应用于音量控制、动态范围控制、动态均衡及背景噪声补偿。在该文献中,对输入音频信号 (通常在频域内)进行修改使得单位响度与目标单位响度匹配。
为了说明如在 “A. J. Seefeldt, “Calculating and adjusting the perceivedloudness and/or the perceived spectral balance of an audio signal,,的 美国专利2009/0097676,2009 ”中所提出的处理的优势,考虑了音频信号的音量控制。改变 声音重放中音频信号的级别的目的通常在于改变感知响度。换句话说,响度的控制传统上 以声级的控制来实现。然而,人们的生活经验以及心理声学知识表明这不是最佳的。
人的听觉敏感度随频率和级变化,以便声强度级的降低使比中频(例如, 2000-4000Hz)的感觉大的低频和高频(例如,分别为IOOHz和10000Hz)的感觉减弱。当使 播放级从“舒适响度”级(例如,75-80dBA)至较低级降低18dB时,音频信号的感知频谱平衡 发生改变。这种情况在众所周知的等响度曲线,一般称为Fletcher-Munson曲线(在首次于 1933年测量等响度曲线的研究人员之后)中示出。等响度曲线表示频谱上的声压级(SPL), 当以纯正平稳的音调呈现时收听者会感知到恒定的响度。
例如,在“B. C. J. Moore, B. R. Glasberg 及 T. Baer, “A model for theprediction of thresholds, loudness, and partial loudness,,, J. Audio Eng. Soc. , 1997,第 232页,图 13”中描述了等响度曲线。修订测量在2003年已被标准化为ISO 226:2003。
因此,传统的响度控制不仅改变了响度,而且还改变了音色。该效应的影响取决于 SPL (例如,使SPL从86dBA改变为68dBA时,与从76dBA改变为58dBA相比,不太明显),但 不是所有类中所期望的那样。
这是由如在“A. J. Seefeldt, “Calculating and adjusting the perceivedloudness and/or the perceived spectral balance of an audio signal,,的 美国专利2009/0097676,2009”中所描述的处理补偿的。
图 7 不出 了 在 “A. J. Seefeldt, “Calculating and adjusting the perceivedloudness and/or the perceived spectral balance of an audio signal,,的 美国专利2009/0097676,2009”中描述的方法700的流程图。
通过计算激励信号710、计算单位响度720、计算目标单位响度730、计算目标激励 信号740、计算频谱权重750以及将频谱权重应用于输入信号并重新合成输出信号760对输出信号进行处理。
频谱权重H为取决于输入信号的单位响度以及目标单位响度的频带的权重。如 在“A. J. Seefeldt, “Calculating and adjusting the perceivedloudness and/or the perceived spectral balance of an audio signal ” 的美国专利 2009/0097676, 2009,,中 所述的计算包括单位响度的计算以及单位响度的计算的逆处理,该逆处理用于目标单位响度。
处理步骤的计算量都很大。在“E.Zwicker, H. Fasti, U. Widmann, K. Kurakata, S. Kuwano及S. Namba,“Program for calculating loudnessaccording to DIN 45631 (ISO 532B) ”, J. Acoust. Soc. Jpn. (E),vol. 12,1991” 以及 “B. C. J. Moore, B. R. Glasberg 及 T. Baer, “A model for the predictionof thresholds,loudness, and partial loudness”,J. Audio Eng. Soc. , 1997”中提出了计算单位响度的方法。发明内容
本发明的目的在于提供一种改进的修改音频信号的构想以便以低的计算复杂性 进行有效的实现。
该目的通过根据权利要求1所述的装置或根据权利要求20所述的方法来解决。
本发明的实施方式提供了一种修改输入音频信号的装置,包括激励确定器、存储 设备以及信号修改器。所述激励确定器被配置为基于输入音频信号的多个子带中的一个子 带信号的能含量确定所述子带的激励参数值。所述存储设备被配置为存储包含多个频谱权 重因子的查找表,其中,多个频谱权重因子中的一个频谱权重因子与激励参数的预定义值 以及多个子带中的一个子带相关联。此外,所述存储设备被配置为提供与激励参数的确定 值对应以及与确定了激励参数值的子带对应的频谱权重因子。所述信号修改器被配置为基 于所提供的频谱权重因子修改确定了激励参数的输入音频信号的子带的内容以提供修改 的子带。
根据本发明的实施方式基于以下中心思想,可以利用含有频谱权重因子的查找表 容易地对音频信号的子带进行修改,所述频谱权重因子可以根据各个子带及子带的激励参 数进行选择。为此,查找表包含多个子带中的至少一个预定义子带的激励参数的多个预定 义值的频谱权重因子。由于频谱权重因子的明显的计算(包括响度计算、修改及响度计算的 逆过程)不是必须的,因此利用所述该查找表可以大幅降低计算复杂性。所以,允许有效实 现。
在根据本发明的一些实施方式中,激励确定器确定并不是多个子带的所有子带的 激励参数值。此外,所述查找表仅包含与确定了激励参数值的子带相关联的频谱权重因子。 这样,可以减少查找表所需的存储空间以及激励确定器的计算工作量。
根据本发明的一些实施方式涉及一种查找表,所述查找表精确地包括与激励参数 的预定义值相关联、与多个子带中的子带相关联以及与外部修改参数的预定义值相关联的 三维度。
根据本发明的一些另外的实施方式涉及一种查找表,所述查找表精确包括与激励 参数的预定义值相关联、与多个子带中的子带相关联、与外部修改参数的预定义值相关联 以及与背景噪声参数的预定义值相关联的四维度。


随后将参照附图详细介绍本发明的实施方式,其中
图1为用于修改输入音频信号的装置的框图2为等响度曲线的示意图3为由传输滤波器标准化的等响度曲线的示意图4为用于修改输入音频信号的装置的框图5为用于修改输入音频信号的方法的流程图6为用于修改输入音频信号的方法的流程图7为用于修改输入音频信号的已知方法的流程图。
在下文中,相同的参考编号部分用于具有相同或相似功能性质的物件及功能单 元,有关图的说明同样应适用于其他图以减少实施方式的说明部分的冗余。
具体实施方式
图1示出了根据本发明实施方式的用于修改输入音频子带信号102的装置100的 框图。装置100包括激励确定器110、存储设备120及信号修改器130。激励确定器110被 连接至存储设备120而存储设备120被连接至信号修改器130。激励确定器110基于子带 102的能含量确定输入音频信号102的多个子带中的一个子带102的激励参数值112。存 储设备120存储有含有多个频谱权重因子的查找表,其中,多个频谱权重因子中的一个频 谱权重因子124与激励参数的预定义值以及多个子带中的一个子带相关联。进一步地,存 储设备120提供与激励参数的确定值112对应以及与确定了激励参数值112的子带102对 应的频谱权重因子124。信号修改器130基于所提供的频谱权重因子124修改确定了激励 参数值112的输入音频信号的子带102的内容以提供修改的子带132。
通过利用查找表来提供用于修改输入音频信号的频谱权重因子124,与已知的构 想相比可以明显降低计算复杂度。
激励确定器110基于子带102的能含量确定激励参数值112。例如,这可以通过测 量子带102的能含量来执行以确定子带102的激励参数值112。这样,由于能含量可以随 时间而变化和/或可以在不同的子带之间变化,所以激励参数可以表示功率/子带或特定 子带中的短时能量的测量。可选地,可以基于子带的短时能量的(唯一、内射、双射)函数(例 如,指数函数、对数函数或线性函数)来确定激励参数值。例如,可以使用量化函数。在该实 例中,激励确定器110可以确定子带的能含量且可以量化所测量的子带的能含量以获得激 励参数值,使得激励参数值等于激励参数的预定义值。换句话说,可以将所测量的能量值分 配给激励参数的预定义值(例如,激励参数的最接近预定义值)。可选地,激励参数值直接表 示所测量的能含量且存储设备120可以将激励参数的确定值分配给激励参数的预定义值。
输入音频信号的子带可以表示输入音频信号不同的频带。考虑到频带的感知分 布,例如,可以根据ERB标度或Bark标度或模仿人耳频率分辨率的另一个频率间隔来分布 子带。换句话说,可以根据ERB标度或Bark标度对输入音频信号的多个子带中的子带进行 分割。
存储设备120包括用于激励参数(激励信号)以及表示确定了激励参数值112的子带102的子带指数的输入端。可选地,存储设备包括用于其他参数的一个或多个其他输入端。
存储设备120可以是数字存储介质,例如,只读存储器(ROM)、硬盘、CD、DVD或任何 其他类型的非易失性存储器或随机存取存储器(RAM)。
查找表至少表示包含多个频谱权重因子的二维矩阵。查找表包含的频谱权重因子 124明确地与激励参数的预定义值以及多个子带中的一个子带相关联。换句话说,查找表包 含的每个频谱权重因子可以与激励参数的预定义值以及多个子带中的一个子带相关联。存 储设备120可以提供与最接近激励参数的确定值112的激励参数的预定义值相关联的频谱 权重因子124。可选地,例如,存储设备120可以线性地或对数地插入与最接近激励参数的 确定值112的激励参数的两个预定义值相关联的两个频谱权重因子。
激励参数的预定义值可以线性地或对数地进行分布。
例如,信号修改器130可以利用所提供的频谱权重因子124对确定了激励参数值 112的子带102的内容进行放大或衰减。
例如,通过利用所描述的构想,可以容易地补偿由音频信号的声强级增大或减小 导致的低频、中频及高频的人类听觉的不同衰减。例如,当使播放级从一级降为另一级时, 音频信号的感知频谱平衡就改变。这种情况在图2和图3示出,表示等响度曲线。特别是 在低频区域中,不同的等响度的曲线彼此不平行。与中频带和/或高频带不同的低频带的 放大或衰减可以等于等响度曲线弯曲度,使得等响度曲线可以平行或比之前更平行。这样, 感知频谱平衡改变可以被补偿或几乎可以利用所描述的构想进行补偿。
图2的等响度曲线和图3的等响度曲线之间的差别为传输滤波器的标准化。传输 滤波器可以模拟通过外耳和内耳音频的传输的滤波效果。这样的传输滤波器可选地在图1 所示的装置中实现以便在提供给激励确定器110之前对输入音频信号进行滤波处理。
对于输入音频信号的更连续的修改,激励确定器110可以确定多个子带的一个以 上子带的激励参数值112。然后,存储设备120可以为确定了激励参数值112的每个子带 102提供频谱权重因子124,且信号修改器130可以基于各对应的所提供的频谱权重因子 124修改确定了激励参数值112的每个子带102的内容。
输入音频信号的多个子带可以由存储器单元提供或可以由分析滤波器组产生。
可以确定多个子带中的一个子带、一个以上子带或所有子带的激励参数。为此,装 置100可以只包括确定一个激励参数值、一个以上激励参数值或所有激励参数值的一个激 励确定器110或可以包括用于确定了激励参数值112的每个子带102的激励确定器110。 此外,装置100可以包括用于确定了激励参数的一个或多个子带的一个或多个单一修改器 130。然而,对于确定了激励参数值112的所有子带102,使用单个查找表(以及存储设备) 就足够了。
激励确定器110、存储设备120以及信号修改器可以是独立的硬件单元、计算机的 一部分、微控制器或数字信号处理器以及被配置为在计算机、微控制器或数字信号处理器 上运行的计算机程序或软件产品。
图4示出了根据本发明实施方式的用来修改输入音频信号的装置400的框图。装 置400类似于图1中所示的装置,但还包括分析滤波器组410以及合成滤波器组420。分析 滤波器组410将输入音频信号分为多个子带。然后,激励确定器110确定多个子带中的一个或多个子带的激励参数值(计算特征)。然后,存储设备120为一个或多个信号修改器130 提供对应的一个或多个频谱权重因子。最后,合成滤波器组420将含有至少一个修改的子带的多个子带结合在一起以获得并提供修改的音频信号(或输出音频信号)。
图4中所示的实例可以是所提出的方法对于通用的应用情况。用于第η子带信号 (第η子带)所示的处理可以以相同的方式用于所有其他子带信号(或只用于确定了激励参数值的所有子带)。
可选地,由查找表包含的频谱权重因子还与外部修改参数的预定义值相关联,如图4中用虚线所示(但也适用于图I中所示的装置)。例如,外部修改参数(或简单修改参数) 可以表示用户界面的输入值(例如,音量和/或环境设置)。因此,在这种情况下,存储设备 120可以提供与外部修改参数值对应的频谱权重因子。例如,如果用户增加或减少音量设置,外部修改参数值就改变且存储设备120可以提供对应的其他频谱权重因子。总之,存储设备120可以提供与子带的激励参数的确定值对应的、与确定了激励参数值的子带对应的以及与外部修改参数值对应的频谱权重因子。
在该实例中,查找表可以包括与激励参数的预定义值相关联、与多个子带中的子带相关联以及与外部修改参数的预定义值相关联的精确的三维度。这意味着由查找表包含的每个频谱权重因子与激励参数的特定预定义值、多个子带的一个子带以及外部修改参数的特定预定义值相关联。换句话说,对于激励参数的预定义值、子带以及外部修改参数的预定义值的每个组合,查找表包含一个频谱权重因子。例如,外部修改参数的预定义值可以线性地或对数地分布在外部修改参数的可能的范围内。
此外,在一些实施方式中,由查找表包含的频谱权重因子也与背景噪声参数的预定义值相关联。背景噪声参数可以表示输入音频信号的背景噪声级。这样,例如,在存在背景噪声时可以实现音频信号的部分屏蔽的效果的补偿。在这种情况下,存储设备可以提供与 背景噪声参数值对应的频谱权重因子。这种情况可以另外地或可选地对外部修改参数的上述考虑事项进行。如果考虑了这两种情况,存储设备可以提供与子带的激励参数的确定值对应、与确定了激励参数的子带对应、与外部修改参数值对应以及与背景噪声参数值对应的频谱权重因子。在这种情况下,查找表可以精确地包括与激励参数的预定义值相关联、 与多个子带中的子带相关联、与外部修改参数的预定义值相关联以及与背景噪声参数的预定义值相关联的四维度。例如,背景噪声参数的预定义值可以线性地或对数地分布在背景噪声参数的可能的范围内。
背景噪声参数值可以由背景噪声检测器确定。可以对被分为子带之前的整个输入音频信号进行或可以单独对一个子带、一个以上子带或所有子带的子带级进行。可选地,如果输入音频信号的多个子带由存储器单元存储并提供,背景噪声参数值也可以由存储器单元提供。
在任何情况下,尽管由查找表包含的频谱权重因子可以基于单位响度参数或目标单位响度参数进行计算,但存储设备不包括单位响度参数的输入或目标单位响度参数的输入。频谱权重因子的计算可以在外部进行,然后频谱权重因子可以由存储设备进行存储。由于不需要频谱权重因子的显示计算,因此与已知设备相比,可以明显降低根据所描述的构想实现的装置的计算复杂度。
例如,可以对频谱权重因子进行计算以便存储设备通过以下方式进行存储。
音频的处理可以在数字域中进行。相应地,音频输入信号可以通过离散时间序列 X[η]表示,该时间序列已经以某采样频率f。从音频源进行采样。可以假设序列x[n]已经被适当地定标从而通过以下公式以分贝给出的x[n]的均方根(rms)功率
= E Ologj 極H
等于收听者正在以它进行倾听的单位为dB的声压级。另外,为了简化说明起见假设音频信号是单声道的。
音频输入信号被应用于分析滤波器组或滤波器组函数(“分析滤波器组”)。分析滤波器组中的每个滤波器被设计为模拟在沿内耳基膜的特定位置处的频率响应。滤波器组可以包括一组线性滤波器,其带宽和间隔在等效矩形带宽(ERB)频率标度上是恒定的,如通过 Moore、Glasberg 和 Baer (上文提到的 B. C. J. Moore, B. Glasberg, T. Baer, “A Model for thePrediction of Thresholds, Loudness, and Partial Loudness,,,)所定义的。
尽管ERB频率标度更加紧密地匹配人的感觉并且显示出在产生匹配主观响度结果的客观响度测量中改进的性能,但是可以利用降低的性能应用Bark频率标度。
对于单位为Hz的中心频率f,单位为Hz的ERB频带的带宽可以被近似为
ERB(f) = 24. 7(4. 37f/1000+l) (I)
根据这种关系定义翘曲频率标度从而使得在沿曲折标度的任何点处,以曲折标度为单位的相应的ERB等于一。用于从单位为Hz的线性频率转换到这种ERB频率标度的函数通过对方程I的倒数积分而获得
调/)
权利要求
1.一种用于修改输入音频信号的装置(100),包括激励确定器(110),被配置为基于所述输入音频信号的多个子带中的子带(102)的能含量确定所述子带(102)的激励参数值(112);存储设备(120),存储包含多个频谱权重因子的查找表,其中,所述多个频谱权重因子中的一个频谱权重因子与所述激励参数的预定义值以及所述多个子带中的一个子带相关联,其中,所述存储设备被配置为提供与激励参数的确定值(112)对应以及与确定了激励参数值(112)的子带(102)对应的频谱权重因子(124);以及信号修改器(130),被配置为基于所提供的频谱权重因子(124)修改确定了所述激励参数值(112)的输入音频信号的子带 (102)的内容以提供修改的子带(132)。
2.根据权利要求I所述的装置,其中,所述激励确定器(110)被配置为确定所述多个子带中的一个以上子带(102)的激励参数值(112),其中,所述存储设备(120)被配置为为确定了所述激励参数值(112)的每个子带(102)提供频谱权重因子(124),并且其中,所述信号修改器(130)被配置为基于各个对应的所提供的频谱权重因子(124)修改确定了所述激励参数值(112)的每个子带(102)的内容。
3.根据权利要求I或2所述的装置,进一步包括分析滤波器组(410),被配置为将所述输入音频信号分为多个子带;以及合成滤波器组(420),被配置为组合含有至少一个修改的子带(132)的多个子带以提供修改的音频信号。
4.根据权利要求I至3中任一项所述的装置,其中,由所述查找表包含的每个频谱权重因子与所述激励参数的预定义值以及所述多个子带中的一个子带相关联。
5.根据权利要求I至4中任一项所述的装置,其中,根据ERB标度、Bark标度或模仿人耳频率分辨率的另一个频率间隔对所述输入音频信号的所述多个子带中的子带进行分割。
6.根据权利要求I至5中任一项所述的装置,其中,所述激励确定器(110)被配置为确定并不是所述多个子带中的所有子带的激励参数值(112),并且其中,所述查找表仅包含与确定了激励参数值的子带相关联的频谱权重因子。
7.根据权利要求6所述的装置,其中,确定了激励参数值(112)的子带(102)包括比没有确定激励参数值的子带低的频率。
8.根据权利要求6或7所述的装置,其中,如果所述激励确定器(110)没有确定所述输入音频信号的子带的激励参数值(112),则该子带的内容不被所述信号修改器(130)修改。
9.根据权利要求I至8中任一项所述的装置,其中,所述激励确定器(110)被配置为只确定所述多个子带中不到三分之一的子带的激励参数值(112),并且其中,所述信号修改器(130)被配置为基于各个对应的所提供的频谱权重因子修改确定了激励参数值的子带的内容,其中,这些子带包括比多个子带中的确定了激励参数值的所有其他子带都低的频率。
10.根据权利要求I至9中任一项所述的装置,其中,所述信号修改器(130)被配置为基于为确定了激励参数值(112)的子带(102)提供的频谱权重因子(124)修改没有确定激励参数值的子带的内容。
11.根据权利要求10所述的装置,其中,所述信号修改器(130)基于为确定了激励参数值(112)的包含比确定了激励参数值(112)的所有其他子带(102)都高的频率的子带(102) 提供的频谱权重因子(124)修改没有确定激励参数值的子带的内容。
12.根据权利要求I至11中任一项所述的装置,其中,由所述查找表包含的频谱权重因子还与外部修改参数的预定义值相关联,其中,所述存储设备(120)被配置为提供与子带(102)的激励参数的确定值(112)对应的、与确定了激励参数值(112)的子带(102)对应的以及与外部修改参数值对应的频谱权重因子(124)。
13.根据权利要求12所述的装置,其中,所述查找表精确地包括与所述激励参数的预定义值相关联、与所述多个子带中的子带相关联以及与所述外部修改参数的预定义值相关联的二维度。
14.根据权利要求12至13中任一项所述的装置,其中,所述信号修改器(130)被配置为基于所述外部修改参数值修改没有确定激励参数值的子带的内容。
15.根据权利要求I至14中任一项所述的装置,其中,由所述查找表包含的频谱权重因子还与背景噪声参数的预定义值相关联,其中,所述存储设备(120)被配置为提供与子带 (102 )的激励参数的确定值(112)对应的、与确定了激励参数值(112)的子带(102)对应的以及与背景噪声参数值对应的频谱权重因子(124)。
16.根据权利要求15所述的装置,其中,所述查找表精确地包括与所述激励参数的预定义值相关联、与所述多个子带中的子带相关联、与所述外部修改参数的预定义值相关联以及与所述背景噪声参数的预定义值相关联的四维度。
17.根据权利要求I至16中任一项所述的装置,其中,所述存储设备(120)不包括单位响度参数的输入或目标单位响度参数的输入。
18.根据权利要求I至17中任一项所述的装置,其中,由所述存储设备(120)存储的查找表仅是用于修改所述输入音频信号的装置的查找表。
19.根据权利要求I至18中任一项所述的装置,其中,所述激励确定器(110)被配置为测量子带(102)的能含量并被配置为量化所测量的基带的能含量以获得激励参数值,从而使得所述激励参数值等于所述激励参数的预定义值。
20.一种用来修改输入音频信号的方法(500,600),包括基于所述输入音频信号的多个子带中的一个子带的能含量确定所述子带的激励参数值(510);提供与激励参数的确定值对应以及与确定了所述激励参数值的所述子带对应的频谱权重因子(520),其中,将所述频谱权重因子存储在包含多个频谱权重因子的查找表中,其中,多个频谱权重因子中的一个频谱权重因子与所述激励参数的预定义值以及所述多个子带中的一个子带相关联;基于所提供的频谱权重因子修改确定了激励参数值的子带以提供修改的子带(530)。
21.一种具有程序代码的计算机程序,用于当所述计算机程序在计算机或微控制器上运行时执行根据权利要求20所述的方法。
全文摘要
一种修改输入音频信号的装置包括激励确定器、存储设备以及信号修改器。所述激励确定器基于输入音频信号的多个子带中的一个子带的能含量确定所述子带的激励参数值。此外,所述存储设备存储包含多个频谱权重因子的查找表。多个频谱权重因子中的一个频谱权重因子与激励参数的预定义值以及多个子带中的一个子带相关联。所述存储设备提供与激励参数的确定值对应以及与确定了激励参数值的子带对应的频谱权重因子。此外,所述信号修改器基于所提供的频谱权重因子修改确定了激励参数值的音频信号的子带的内容以提供修改的子带。
文档编号G10L19/00GK102986136SQ201180030337
公开日2013年3月20日 申请日期2011年4月20日 优先权日2010年4月22日
发明者克里斯蒂安·乌勒, 于尔根·赫莱, 奥利弗·黑尔慕斯, 斯特凡·菲瑙尔 申请人:弗兰霍菲尔运输应用研究公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1