计算和调节音频信号的感觉响度和/或感觉频谱平衡的制作方法

文档序号:7538168阅读:658来源:国知局
专利名称:计算和调节音频信号的感觉响度和/或感觉频谱平衡的制作方法
技术领域
本发明涉及音频信号处理。更具体而言,本发明涉及音频信号的感觉声音响度和/或感觉频谱平衡的测量和控制。本发明可用于例如以下的一个或更多方面响度补偿音量控制、自动增益控制、动态范围控制(包括例如限幅器、压缩器、扩展器等等)、动态均衡、和补偿音频重放环境中的背景噪声干扰。
背景技术
已经进行过许多尝试来开发令人满意的测量响度的客观方法。Fletcher和Munson在1933年确定人的听觉在低频和高频时比在中间(或话音)频率较不敏感。他们还发现敏感度的相对变化随声级的增加而降低。早先的响度测量仪由麦克风、放大器、测量器和被设计用于在低、中和高声级大致模仿听觉的频率响应的滤波器的组合而构成。
尽管这些设备提供了单一的、恒定声级、独立音调的响度测量,但是更加复杂声音的测量不能非常好地匹配响度的主观感觉。这种类型的声级测量仪已经被标准化,但是它仅仅用于诸如监控和控制工业噪声的特定任务。
在20世纪50年代早期,Zwicker和Stevens在开发更为逼真的响度感觉处理的模型中扩展了Fletcher和Munson的工作。Stevens于1956年在Journal of the Acoustical Society of America中发表了一种用于“Caculation of the Loudness of Complex Noise”的方法,以及Zwicker在1958年在Acoustica中发表了他的论文“Psychological andMethodical Basis of Loudness”。在1959年Zwicker发表了响度计算的图形化处理以及不久之后发表了若干类似的论文。Stevens和Zwicker方法已(分别地)标准化为ISO532部分A和B。两种方法包含类似的步骤。
首先,通过将音频传递通过具有在临界频带速率标度上均匀间隔的中心频率的一组带通听觉滤波器模拟被称之为激励的沿内耳基膜能量的时间变化分布。每个听觉滤波器被设计成模拟沿内耳基膜在特定位置的频率响应,该滤波器的中心频率对应于这个位置。临界频带带宽定义为这样一个滤波器的带宽。以Hz为单位进行度量,这些听觉滤波器的临界带宽随中心频率的增加而增加。所以,有利的是定义曲折的频率标度以便以这种曲折标度度量的所有听觉滤波器的临界带宽是常量。这种曲折的标度被称之为临界频带速率标度并且对理解和模拟范围广泛的心理声学现象非常有用。例如,参见E.Zwicker和H.Fastl所著的Psychoacoustics-Facts and Models,Springer-Verlag,柏林,1990年。Stevens和Zwicker的方法使用被称之为Bark标度的临界频带速率标度,其中临界频带带宽在500Hz以下是常量并且在500Hz以上增加。近来,Moore和Glasberg定义了一种临界带宽速率标度,他们称其为等效矩形带宽(ERB)标度(B.C.J.Moore,B.Glasberg,T.Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness”,Journal of the Audio EngineeringSociety,Vol.45,No.4,1997年4月,pp.224-240)。通过使用陷波噪声屏蔽器的心理声学实验,Moore和Glasberg证明临界频带带宽在500Hz以下继续减小,这与临界频带带宽保持恒定的Bark标度相反。
在激励计算之后是产生称之为“单位响度”的量的非线性压缩功能。单位响度是作为频率和时间的函数的感觉响度的度量并且可以沿诸如以上讨论的Bark或ERB标度的临界频率速率标度以每个单位频率的感觉响度为单元进行度量。最后,通过在频率上积分单位响度计算时间变化“总响度”。当根据沿临界频带速率标度均匀分布的一组有限听觉滤波器估计单位响度时,可以通过对来自每个滤波器的单位响度简单地进行求和计算总响度。
响度可以以“方”(phon)为单位度量。以方为单位给定声音的响度是具有等于声音响度的主观响度的1kHz音调的声压级(SPL)。传统上,SPL的基准0dB是2×10-5帕压强的均方根,所以这也是基准0方。使用这种定义在比较在除1kHz以外的频率音调的响度和在1kHz音调的响度中,等响度轮廓能够被确定用于给定的方级。
图11所示为用于20Hz和12.5kHz之间的频率,以及4.2方(被认为是听觉的门限)和120方之间的方级的等响度轮廓(ISO2261087(E),“Acoustics-Normal equal loudness level contours”)。这种方度量考虑人耳随频率变化的敏感度,但是结果不允许以变化的级评价声音的相对主观的响度,因为没有尝试以校正响度随SPL增加的非线性,即轮廓的间隔发生变化的事实。
响度还可以以“宋”(sone)为单位度量。如在图11中所指示,在方单位和宋单位之间存在一一映射。1宋定义为40dB(SPL)1kHz纯正弦波的响度并且等效于40方。宋单位是这样的,即宋单位两倍的增加对应于感觉响度的加倍。例如,4宋被感觉为2宋两倍的响度。因此,以宋为单位表达响度级提供更多的信息。如果单位响度定义为作为频率和时间的函数的感觉响度的度量,单位响度可以以每单位频率宋为单位进行度量。因此,当使用Bark标度时,单位响度具有每Bark宋的单位,同理当使用ERB标度时,所述单位是每ERB宋。
如上所述,人耳的敏感度随频率和级变化,这是在心理声学文献中充分记载的事实。其中的一个结果是给定声音的感觉频谱或音色随听到声音的声级而变化。例如,对于包含低频、中频和高频的声音,感觉的相对成比例的这些频率分量随声音的总响度变化;当无声时低频和高频分量相对于中频比当嘈杂时它们听起来更无声。这种现象是众所周知的并且已经在声音再现设备中通过所谓的响度控制减轻。响度控制是当音量下降时应用低频以及有时候还应用高频增强的音量控制。因此,人耳在频率极限处的较低敏感度被通过这些频率的人为增强进行补偿。这些控制是完全被动的;应用的补偿程度是音量控制或某些其他用户操作控制的设置的函数,而不是音频信号内容的函数。
实际上,在低频、中频和高频中感觉的相对频谱平衡的变化取决于信号,特别是其实际的频谱以及是否目的是高声或低声。考虑交响乐团的录音。在音乐厅内听众中的一员将会听到的相同级再现,无论交响乐正在大声或无声地演奏都可以校正在频谱上的平衡。如果例如以10dB较无声地再现音乐,在频谱上的感觉平衡对于大声通过以一种方式改变以及以对于无声通过以另一种方式改变。传统的被动响度控制不应用作为音乐的函数的不同的补偿。
在Seefeldt等人于2004年5月27日申请的第PCT/US2004/016964号、2004年12月23日公开号为WO2004/111994A2的国际专利申请中,公开了一种测量和调节音频信号的感觉响度的系统。指定美国的所述PCT申请在此全部包含引作参考。在所述申请中,心理声学模型以感觉单元计算音频信号的响度。另外,该申请引入了计算宽带乘法增益的技术,当该增益被应用于音频时,导致增益修正音频的响度基本上与基准响度相同。但是,这种宽带增益的应用改变了音频的感觉频谱平衡。

发明内容
在一个方面,本发明提供通过修改音频信号以便减小它的单位响度和目标单位响度之间的差来导出可用来控制音频信号的单位响度的信息。单位响度是作为频率和时间的函数的感觉响度的度量。在实际的实现中,经修改音频信号的单位响度可以近似目标单位响度。如下所述,这种近似不仅受普遍信号处理条件而且受在修改中可以被应用的时间和/或频率平滑的影响。
由于单位响度是作为频率和时间的函数的音频信号的感觉响度的度量,以便减小音频信号的单位响度和目标单位响度之间的差,所述修改可以修改音频信号作为频率的函数。尽管在某些情况下目标单位响度可以是时间恒定的以及音频信号典型本身可以是稳态时间恒定的信号,但是所述修改还可以修改音频信号作为时间的函数。
还可以应用本发明的这些方面补偿在音频重放环境中干扰的背景噪声。当在存在背景噪声的情况下倾听音频时,所述噪声可能部分或全部地以一种取决于音频级和频谱以及噪声级和频谱的方式屏蔽该音频。结果是音频感觉频谱的改变。根据心理声学研究(例如参见Moore、Glasberg、和Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness”,J.Audio Eng.Soc.,Vol.45,No.4,1997年4月),可将音频的“部分单位响度”定义为在存在诸如噪声的次干扰声音信号的情况下音频的感觉响度。
因此,在另一个方面,本发明提供通过修改音频信号以便减小它的部分单位响度和目标单位响度之间的差来导出控制音频信号的部分单位响度可使用的信息。这样做以感觉精确的方式减轻了噪声的影响。在考虑到干扰噪声信号的本发明这个方面和其他方面,假设存在对音频信号和次干扰信号的单独地存取。
在另一个方面,本发明提供通过修改音频信号以便减小它的单位响度和目标单位响度之差来控制音频信号的单位响度。
在另一个方面,本发明提供通过修改音频信号以便减小它的部分单位响度和目标单位响度之差来控制音频信号的部分单位响度。
当目标单位响度不是音频信号的函数时,它可能是一个已存储的或接收的目标单位响度。当目标单位响度不是音频信号的函数时,修改或导出可以显式或隐式地计算单位响度或部分单位响度。显式计算的实例包括查询表或“封闭式”数学表达式,其中本质上是确定单位响度和/或部分单位响度(术语封闭式的意思是描述使用有限数量的标准数学运算和函数,诸如指数和余弦来精确地表示的数学表达式)。而且当目标单位响度不是音频信号的函数时,目标单位响度可以是时间和频率恒定的或者它可以仅仅是时间恒定的。
在再一个方面,本发明提供通过根据一个或更多处理以及一个或更多处理控制参数处理音频信号或音频信号的度量以产生目标单位响度来处理音频信号。尽管目标单位响度可以是时间恒定(“固定”)的,但是目标单位响度可以有利地是音频信号的单位响度的函数。尽管它典型可以是静态的、频率和时间恒定的信号,但是音频信号本身是频率和时间变化的,因此当它是音频信号的函数时导致目标单位响度也是频率和时间变化的。
可以从发送接收或根据存储媒体再现所述音频和目标单位响度或目标单位响度的表示。
目标单位响度的表示可以是定标音频信号或音频信号度量的一个或更多定标因子。
本发明的任何上述方面的目标单位响度可以是音频信号或音频信号度量的函数。音频信号的一种适当的度量是音频信号的单位响度。音频信号或音频信号度量的函数可以是音频信号或音频信号度量的定标。例如,所述定标可以是以下定标之一或其组合(a)时间和频率变化定标因子Ξ[b,t]定标单位响度为如下关系N^[b,t]=Ξ[b,t]N[b,t];]]>(b)时间变化、频率恒定的定标因子Ф[t]定标单位响度为如下关系N^[b,t]=Φ[t]N[b,t];]]>(c)时间恒定、频率变化的定标因子Θ[b]定标单位响度为如下关系N^[b,t]=Θ[b]N[b,t];]]>和(d)时间恒定、频率恒定的定标因子α定标音频信号的单位响度为如下关系N^[b,t]=αN[b,t],]]>其中 是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。
在时间和频率变化定标因子的情况(a)中,至少可以部分地通过期望的多频带响度和音频信号的多频带响度之比确定所述定标。这种定标可以用作动态范围控制。应用本发明的这些方面作为动态范围控制的进一步细节在以下进行阐述。
而且在时间和频率变化定标因子的情况(a)中,通过期望频谱形状的度量和音频信号频谱形状的度量之比可以定标所述单位响度。这种定标可以被应用于将音频信号的感觉频谱从时间变化的感觉频谱变换成基本上时间恒定的感觉频谱。当通过期望频谱形状的度量和音频信号频谱形状的度量定标单位响度时,这种定标可以用作动态均衡器。应用本发明的这些方面作为动态均衡器的进一步细节在以下进行阐述。
在时间变化、频率恒定定标因子的情况(b)中,至少可以部分地通过期望的宽带响度和音频信号的宽带响度之比来确定所述定标。这种定标可以用作自动增益控制或动态范围控制。应用本发明的这些方面作为自动增益控制或动态范围控制的进一步细节在以下进行阐述。
在情况(a)(时间和频率变化定标因子)或情况(b)(时间变化、频率恒定定标因子)中,所述定标因子可以是音频信号或音频信号度量的函数。
在时间恒定、频率变化定标因子的情况(c)或时间恒定、频率恒定定标因子的情况(d)中,所述修改或导出可以包括存储定标因子或从外部来源接收定标因子。
在(c)和(d)的任何一种情况中,定标因子可以不是音频信号或音频信号度量的函数。
在本发明各个方面及其变型中任何一个中,修改、导出、或再现可以以不同的方式、显式或隐式地计算(1)单位响度,和/或(2)部分单位响度,和/或(3)目标单位响度。显式计算可以包含例如查询表或封闭式数学表达式。
修改参数可以被时间平滑。修改参数可以例如是(1)和音频信号频带相关的多个幅度定标因子或(2)控制诸如多抽头FIR滤波器或多极IIR滤波器的一个或更多滤波器的多个滤波器系数。所述定标因子或滤波器系数(以及应用它们的滤波器)可以是时间变化的。
在计算定义目标单位响度的音频信号的单位响度的函数或该函数的反函数中,执行这种计算的处理以可以被表征为感觉(心理声学)响度域的方式操作-该计算的输入和输出是单位响度。相反,在应用幅度定标因子于音频信号的频带中或应用滤波器系数于音频信号的可控制滤波中,修改参数进行操作以修改在可以被表征为电信号域的感觉(心理声学)响度域之外的音频信号。尽管对音频信号的修改可以用于电信号域中的音频信号,但是在感觉(心理声学)响度域中根据计算导出这种电信号域中的改变以便经修改的音频信号具有近似期望的目标单位响度的单位响度。
通过根据在响度域中的计算导出修改参数,可以比如果在电信号域中导出这种修改参数实现在感觉响度和感觉频谱平衡上的较强控制。另外,在执行响度域计算中使用模拟心理声学滤波器组的基膜或其等效物可以比在电信号域中导出修改参数的结构提供更详细的感觉频谱控制。
修改、导出、和再现中的每一个可以取决于干扰音频信号度量、目标单位响度、根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度估计、未经修改音频信号的单位响度、以及根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度近似中一个或更多。
所述修改或导出可以至少部分地根据干扰音频信号的度量、目标单位响度、根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度的估计、未经修改音频信号的单位响度、以及根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度的近似之一或更多导出修改参数。
更具体而言,所述修改或导出可以至少部分地根据以下导出修改参数(1)目标单位响度和从经修改音频信号的单位响度所导出的未经修改音频信号的单位响度的估计之一,以及(2)未经修改音频信号的单位响度和根据经修改音频信号的单位响度导出的目标单位响度的近似之一,或者当考虑干扰音频信号时,所述修改或导出可以至少部分地根据以下导出修改参数(1)干扰音频信号的度量,(2)目标单位响度和根据经修改音频信号的部分单位响度导出的未经修改音频信号的单位响度估计之一,以及(3)未经修改音频信号的单位响度和根据经修改音频信号的部分单位响度导出的目标单位响度的近似之一。
可以应用前馈结构,其中根据音频信号导出单位响度以及从方法外部源接收目标单位响度或者当修改或导出包括存储目标单位响度时从存储接收该目标单位响度。可替换地,可以应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及从方法外部源接收目标单位响度或者当所述修改或导出包括存储目标单位响度时从存储接收该目标单位响度。
所述修改或导出可以包括用于显式或隐式获得目标单位响度的一个或更多处理,其中的一个处理或更多处理显式或隐式地计算音频信号或音频信号度量的函数。在一种替换中,可以应用根据音频信号导出单位响度和目标单位响度的前馈结构,目标单位响度的导出应用音频信号或音频信号度量的函数。在另一种替换中,可以应用根据经修改音频信号导出目标单位响度的近似以及根据音频信号导出目标单位响度的混合前馈/反馈结构,目标单位响度的导出应用音频信号或音频信号度量的函数。
所述修改或导出可以包括显式或隐式地响应于经修改的音频信号获得未经修改音频信号的单位响度估计的一个或更多处理,其中一个处理或更多处理显式或隐式地计算音频信号或音频信号度量的函数的反函数。在一种替换中,应用根据经修改音频信号导出未经修改音频信号的单位响度的估计和目标单位响度的近似的反馈结构,单位响度的估计使用音频信号音频信号度量的函数的反函数或进行计算。在另一种替换中,应用根据音频信号导出单位响度以及根据经修改音频信号导出未经修改音频信号的单位响度估计的混合前馈/反馈结构,估计的导出使用音频信号或音频信号度量的所述函数的反函数进行计算。
修改参数可以应用于音频信号以产生经修改的音频信号。
本发明的另一个方面在于可以存在处理或设备的时间和/或空间分离,以便实际上存在编码器或编码以及还有解码器或解码。例如,可以存在编码/解码系统,其中所述修改或导出可以发送和接收或存储以及还再现音频信号以及(1)修改参数或(2)目标单位响度或目标单位响度的表示。可替换地,实际上可以仅存在编码器或编码,其中发送或存储音频信号和(1)修改参数或(2)目标单位响度或目标单位响度的表示。可替换地,如上所述,实际上可以仅存在解码器或解码,其中接收和再现音频信号(1)修改参数或(2)目标单位响度或目标单位响度的表示。


图1是示例根据本发明方面的前馈实现实例的功能框图。
图2是示例根据本发明方面的反馈实现实例的功能框图。
图3是示例根据本发明方面的混合前馈/反馈实现实例的功能框图。
图4是示例根据本发明方面的另一种混合前馈/反馈实现实例的功能框图。
图5是示例可以存储或发送如通过前馈、反馈、和混合前馈反馈结构中任何一个所确定的未经修改音频信号和修改参数用于例如时间或空间分离设备或处理中的方式的功能框图。
图6是示例可以存储或发送如通过前馈、反馈、和混合前馈反馈结构中任何一个所确定的未经修改音频信号和目标单位响度或其表示用于例如时间或空间分离设备或处理中的方式的功能框图。
图7是显示本发明方面的概述的示意功能框图或示意流程图。
图8是在本发明实施例中适合用作传输滤波器的线性滤波器P(z)的理想特性响应,其中垂直轴是单位为分贝(dB)的衰减以及水平轴是对数底为10单位为Hz的频率。
图9所示为ERB频率标度(垂直轴)和单位为Hz的频率(水平轴)之间的关系。
图10所示为近似临界频带的设置的理想听觉滤波器特性响应。水平标度是单位为Hz的频率以及垂直标度是单位为分贝的级。
图11所示为ISO226的等响度轮廓。水平标度是单位为Hz的频率(对数底为10的标度)以及垂直标度是单位为分贝的声压级。
图12所示为通过传输滤波器P(z)规格化的ISO226的等响度轮廓。水平标度是单位为Hz的频率(对数底为10的标度)以及垂直标度是单位为分贝的声压级。
图13a是显示用于在柔和语音段上0.25响度定标的宽带和多频带增益的理想化图。水平标度是ERB频带和垂直标度是单位为分贝(dB)的相对增益。
图13b是分别显示原始信号、宽带增益修改信号、以及多频带增益修改信号的单位响度的理想化图。水平标度是ERB频带以及垂直标度是单位响度(宋/ERB)。
图14a是显示作为用于典型AGC的Li[t]的函数的L0[t]的理想化图。水平标度是log(Li[t])以及垂直标度是log(L0[t])。
图14b是显示作为用于典型DRC的Li[t]的函数的L0[t]的理想化图。水平标度是log(Li[t])以及垂直标度是log(L0[t])。
图15是显示用于多频带DRC的典型频带平滑函数的理想化图。水平标度是频带号以及垂直标度是频带b的增益输出。
图16是显示本发明方面的概述的示意功能框图或示意流程图。
图17是类似于图1的示意功能框图或示意流程图,它还包括补偿重放环境中的噪声。
具体实施例方式
图1到4所示为示例根据本发明方面的可能的前馈、反馈、以及两种型式的混合前馈/反馈实现实例的功能框图。
参考图1中的前馈拓扑的实例,音频信号被施加于两个通道(1)具有能够响应于修改参数以修改音频的处理或设备2的信号通道(“修改音频信号”),和(2)具有能够产生这些修改参数的处理或设备4的控制通道(“产生修改参数”)。在图1中前馈拓扑实例以及图2-4每个实例中的修改音频信号2可以是根据从产生修改参数4(或分别从图2-4每个实例中的对应处理或设备4’、4”和4_)接收的修改参数M以频率和/或时间变化的方式修改音频信号例如其幅度的设备或处理。产生修改参数4及其图2-4中的对应部分的每一个至少部分在感觉响度域中操作。在图1-4的每个实例中修改音频信号2在电信号域中操作并产生修改的音频信号。而且在图1-4的每个实例中,修改音频信号2和产生修改参数4(或其对应部分)修改所述音频信号以减小其单位响度和目标单位响度之间的差值。
在图1的前馈实例中,处理或设备4可以包括若干处理和/或设备响应于音频信号或音频信号的度量诸如音频信号的单位响度计算目标单位响度“计算目标单位响度”处理或设备6,响应于音频信号或音频信号的度量诸如它的激励计算音频信号的单位响度的“计算单位响度”处理或设备8,以及响应于单位响度和目标单位响度计算修改参数的“计算修改参数”处理或设备10。计算目标单位响度6可以执行一个或更多函数“F”,每个函数可以具有函数参数。例如,它可以计算音频信号的单位响度以及然后应用一个或更多函数F给它以提供目标单位响度。这在图1中被示意性指示为处理或设备6的“选择函数F和函数参数”输入。代替通过设备或处理6进行计算,目标单位响度可以由包括在产生修改参数4中或与它相关的存储处理或设备(示意性示为处理或设备10的“存储”输入)提供,或者通过整个处理或设备的外部源(示意性示为处理或设备10的“外部”输入)提供。因此,所述修改参数至少部分基于在感觉(心理声学)响度域中的计算(即,至少单位响度,以及在某些情况下基于目标单位响度计算)。
处理或设备6、8和10(以及图2实例中的处理或设备12、14、10’,图3实例中的6、14、10”,图4实例中的8、12、10_)执行的计算可以被显式和/或隐式地执行。显式执行的实例包括(1)查询表,它的项目全部或部分地基于单位响度和/或目标单位响度和/或修改参数计算,以及(2)封闭式数学表达式,它本质上全部或部分地基于单位响度和/或目标单位响度和/或修改参数。
尽管示意性示出并且单独地描述图1实例的计算处理或设备6、8和10(以及图2实例中的处理或设备12、14、10’,图3实例中的6、14、10”,图4实例中的8、12、10_),但是这仅仅是为了说明的目的。将会明白这些处理或设备的部分或全部可以被组合到单个处理或设备中或以不同的方式组合到多个处理或设备中。例如,在以下图9的结构中,如图1实例中的前馈拓扑,计算修改参数的处理或设备响应于根据音频信号和目标单位响度导出的平滑激励这样做。在图9的实例中,显式计算修改参数的设备或处理计算音频信号的单位响度。
作为本发明的一个方面,在图1的实例以及在这里本发明实施例的其他实例中,通过利用一个或更多定标因子定标所述单位响度N[b,t]可以计算目标单位响度 这种定标可以是以如下关系定标所述单位响度的时间和频率变化的定标因子Ξ[b,t]N^[b,t]=Ξ[b,t]N[b,t],]]>以如下关系定标单位响度的时间变化、频率恒定的定标因子Ф[t]N^[b,t]=Φ[t]N[b,t],]]>以如下关系定标单位响度的时间恒定、频率变化的定标因子Θ[b]N^[b,t]=Θ[b]N[b,t],]]>或以如下关系定标音频信号的单位响度的定标因子αN^[b,t]=αN[b,t],]]>其中,b是频率的度量(例如频带号)以及t是时间的度量(例如块号)。还可以使用特定定标的多个实例和/或特定定标的组合应用多个定标。以下给出这些多个定标的实例。在某些情况下,如以下进一步的说明,所述定标可以是音频信号或音频信号度量的函数。在其他情况下,正如以下进一步的说明,当所述定标不是音频信号度量的函数时,同样可以确定或提供该定标。例如,用户能够选择或应用时间和频率恒定的定标因子α或时间恒定、频率变化的定标因子Θ[b]定标。
因此,目标单位响度可以被表示为音频信号或音频信号度量的一个或更多函数F(单位响度是音频信号的一个可能的度量)N^[b,t]=F(N[b,t]).]]>如果函数F是可逆的,未经修改音频信号的单位响度(N[b,t])可以计算为目标单位响度 的反函数或函数F-1N^[b,t]=F-1(N^[b,t]).]]>正如在以下将会看到,在图2和4的反馈和混合前馈/反馈实例中计算反函数或函数F-1。
用于计算目标单位响度6的“选择函数和函数参数”输入被示出以指示设备或处理6可以根据一个或更多函数参数通过应用一个或更多函数计算目标单位响度。例如,计算目标单位响度8可以计算音频信号的单位响度的函数“F”以便定义目标单位响度。例如,“选择函数参数”输入可以选择落入上述类型定标之一或更多中的一个或更多特定函数,以及诸如关于函数的常数(例如定标因子)的一个或更多函数参数。
如上所指示,与定标相关的所述定标因子可以用作目标单位响度的表示因为目标单位响度可以被计算单位响度的定标。因此,在以下描述和上述的图9实例中,可以通过定标因子和激励对查询表进行索引,从而单位响度和目标单位响度的计算固有位于该表中。
无论是应用查询表、封闭式数学表达式还是其他技术,产生修改参数4的操作(及其在图2-4每个实例中的对应处理或设备4’、4”和4_)都是这样的,即所述计算基于感觉(心理声学)响度域即使可以不显式地计算单位响度和目标单位响度。存在显式的单位响度或存在抽象的隐式单位响度。类似地,存在显式的目标单位响度或存在抽象的隐式目标单位响度。在任何情况下,修改参数的计算旨在产生修改音频信号以减小单位响度和目标单位响度之差的修改参数。
在具有诸如噪声的次干扰音频信号的重放环境中,计算修改参数10(及其分别在图2-4每个实例中的对应处理或设备10’、10”和10_)还可以接收这种次干扰音频信号的度量作为可选的输入或者次干扰信号本身作为其输入之一。这种可选的输入在图1(以及图2-4)中示为虚引线。次干扰信号的度量可以是它的激励诸如在以下描述的图17实例中。应用干扰信号度量或信号本身(假设干扰信号单独可用于处理)于图1中的计算修改参数处理或设备10(及其分别在图2-4实例中的相应处理或设备10’、10”和10_)允许适当配置的这种处理或设备在标题“噪声补偿”下如以下进一步的说明计算考虑干扰信号的修改参数。在图2-4的实例中,部分单位响度的计算假设干扰信号的适当度量不仅被应用于相应的计算修改参数10’、10”或10_,而且还被应用于“计算未经修改音频的单位响度的近似”处理或设备12和/或“计算目标单位响度的近似”处理或设备14以便方便通过该函数或设备计算部分单位响度。在图1的前馈实例中,不显式地计算部分单位响度-图1的计算修改参数10计算适当的修改参数以使经修改音频的部分单位响度近似所述目标单位响度。这在以下的标题“噪声补偿”下进行进一步的说明。
如上所述,在图1-4的每个实例中,当修改参数M被音频信号修改器2应用于音频信号时,该参数减小所产生的经修改音频信号的单位响度或部分单位响度与目标单位响度之差。在理想情况下,经修改音频信号的单位响度与目标单位响度严密地近似或相同。所述修改参数M例如可以采取被应用于根据滤波器组所导出频带的时间变化增益因子或时间变化滤波器系数的形式。因此,在所有图1-4实例中,修改音频信号2可以例如被实现为多个幅度定标器,每个定标器在一频带中工作,或实现为时间变化滤波器(例如,多抽头FIR滤波器或多极IIR滤波器)。
在本文的这里或其他地方,使用相同的附图标记指示设备或处理可以基本上与另一个或其他具有相同附图标记的设备或处理相同。具有撇号的附图标记(例如,10’)指示该设备或处理在结构或功能方面相类似但可以是具有相同基本附图标记或其带撇号型式的另一个或其他设备或处理的修改。
在一定的约束下,可以实现图1中前馈实例的几乎等效的反馈结构。图2描述了音频信号还在单个通道中被应用于修改音频信号处理或设备2的这样一个实例。处理或设备2还从控制通道接收修改参数M,反馈结构中的产生修改参数处理或设备4’在该通道中从修改音频信号2的输出接收经修改的音频信号作为它的输入。因此,在图2的实例中,经修改的音频而不是未经修改的音频被应用于控制通道。修改音频信号处理或设备2以及产生修改参数处理或设备4’修改所述音频信号以减小它的单位响度和目标单位响度之间的差。处理或设备4’可以包括若干功能或设备“计算未经修改音频单位响度的近似”处理或设备12、“计算目标单位响度的近似”处理或设备14、以及计算修改参数的“计算修改参数”处理或设备10’。
利用函数F可逆的约束,处理或设备12通过应用反函数F-1给经修改音频信号的单位响度或部分单位响度估计未经修改音频信号的单位响度。如上所述,设备或处理12可以计算反函数F-1。这在图2中被示意性指示为处理或设备12的“选择反函数F-1和函数参数”输入。“计算目标单位响度的近似”14通过计算经修改音频信号的单位响度或部分单位响度进行操作。这种单位响度或部分单位响度是目标单位响度的近似。未经修改音频信号的单位响度的近似和目标单位响度的近似被计算修改参数10’用来导出修改参数M,如果该参数被修改音频信号2应用于音频信号,它将减小经修改音频信号的单位响度或部分单位响度与所述目标单位响度之差。如上所述,这些修改参数M可以例如采取被应用于滤波器组频带的时间变化增益或时间变化滤波器的系数的形式。在计算修改参数10”的实际实施例中,反馈环路可能在修改参数M的计算和应用之间引入延迟。
如上所述,在具有诸如噪声的次干扰音频信号的重放环境中,计算修改参数10、计算未经修改音频单位响度的近似12、以及计算目标单位响度的近似14其每一个可以接收这种次干扰音频信号的度量作为可选的输入或次干扰信号本身作为其输入之一并且处理或设备12以及处理或设备14每个可以计算经修改音频信号的部分单位响度。在图2中使用虚引线示出这种可选的输入。
如上所述,本发明方面的混合前馈/反馈实现实例也是可能的。图3和4示出了这些实现的两个实例。正如在图1和2的实例中,在图3和4的实例中,所述音频信号还在信号通道中被应用于修改音频信号处理或设备2,但是产生修改参数(图3中的4”和图4中的4_)在相应的控制通道中每个都接收未经修改的音频信号和经修改的音频信号。在图3和4的实例中,修改音频信号2和产生修改参数(分别是4”和4_)修改所述音频信号以减小它的可能是隐式的单位响度和也可以是隐式的目标单位响度之间的差。
在图3的实例中,产生修改参数处理或设备4’可以包括若干功能和或设备如图1实例中的计算目标单位响度6、如图2反馈实例中的计算目标单位响度的近似14、以及如图1实例中的“计算修改参数”处理或设备10”。如在图1的实例中,在这种混合前馈/反馈实例的前馈部分中,计算目标单位响度6可以执行一个或更多函数“F”,其中每个函数可以具有函数参数。这在图3中被示意性指示为处理或设备6的“选择函数F和函数参数”输入。在这种混合前馈/反馈实例的反馈部分中,经修改的音频信号被应用于计算目标单位响度14的近似,如在图2的反馈实例中。设备或处理14在图3的实例中如在图2的实例一样通过计算经修改音频信号的单位响度或部分单位响度进行操作。这种单位响度或部分单位响度是目标单位响度的近似。目标单位响度(来自处理或设备6)以及目标单位响度的近似(来自处理或设备14)被应用于计算修改参数10”以导出修改参数M,如果该参数被修改音频信号2应用于音频信号,将减小未经修改音频信号的单位响度和目标单位响度之差。如上所述,这些修改参数M可以例如采取应用于滤波器组频带的时间变化增益或时间变化滤波器系数的形式。在实际的实施中,反馈环路可以在修改参数M的计算和应用之间引入延迟。如上所述,在具有诸如噪声的次干扰音频信号的重放环境中,计算修改参数10”和计算目标单位响度14的近似其中每一个还可以接收这种次干扰音频信号的度量作为可选的输入或次干扰信号本身作为它的输入之一以及处理或设备14可以计算经修改音频信号的部分单位响度。所述可选的输入在图3中使用虚引线示出。
计算修改参数10”可以应用误差检测设备或函数,从而它的目标单位响度和目标单位响度近似输入之差调节所述修改参数以减小目标单位响度的近似和“实际的”目标单位响度之间的差。这些调节减小未经修改音频信号的单位响度和可以是隐式的所述目标单位响度之间的差。因此,修改参数M可以被基于在前馈通道中根据原始音频的单位响度使用函数F计算的目标单位响度和在反馈通道中根据经修改音频的单位响度或部分单位响度计算的目标单位响度近似之间的误差进行更新。
在图4的实例中,示出了替换的前馈/反馈实例。这种替换不同于图3的实例之处在于在反馈通道中计算反函数或函数F-1而不是在前馈通道中计算函数F。在图4的实例中,产生修改参数处理或设备4’可以包括若干功能和或设备如图1前馈实例中的计算单位响度8、如图2反馈实例中的计算未经修改音频信号12的单位响度的近似、以及计算修改参数10_。如图1前馈实例中的计算单位响度8提供未经修改音频信号的单位响度作为计算修改参数10_的输入。如在图2的反馈实例中,约束条件是函数F是可逆的,处理或设备12通过应用反函数F-1给经修改音频信号的单位响度或部分单位响度以估计未经修改音频信号的单位响度。如上所述,计算未经修改音频12的单位响度近似的“选择反函数和反函数参数”输入被示出以指示设备或处理12可以计算反函数F-1。这在图4中被示意性指示为处理或设备12的“选择反函数F-1和函数参数”输入。因此,处理或设备12提供未经修改音频信号的单位响度的近似作为计算修改参数10_的另一个输入。
如在图1-3的实例中,计算修改参数10_导出修改参数M,如果该参数被修改音频信号2应用于音频信号,将减小未经修改音频信号的单位响度和在本实例中隐式的目标单位响度之间的差。如上所述,修改参数M可以例如采取应用于滤波器组频带的时间变化增益或时间变化滤波器系数的形式。在实际的实施中,反馈环路可以在修改参数M的计算和应用之间引入延迟。如上所述,在具有诸如噪声的次干扰音频信号的重放环境中,计算修改参数10_和计算未经修改音频12的单位响度近似其中每个还接收这种次干扰音频信号的度量作为可选的输入或次干扰信号本身作为它的输入之一以及处理或设备12可以计算经修改音频信号的部分单位响度。所述可选的输入在图4中使用虚引线示出。
计算修改参数10_可以应用误差检测设备或函数,从而它的目标单位响度和目标单位响度近似输入之差产生调节所述修改参数的输出以减小单位响度的近似和“实际的”单位响度之间的差。由于单位响度的近似根据经修改音频的单位响度或部分单位响度进行导出,这能够被视为目标单位响度的近似,所以这些调节将减小经修改音频信号的单位响度和目标单位响度之间的差,所述单位响度近似在本质上以F-1函数。因此,修改参数M可以基于在前馈通道中根据原始音频计算的单位响度,和在反馈通道中使用反函数或函数F-1根据经修改音频的单位响度或部分单位响度计算的单位响度近似之间的误差进行更新。由于所述反馈通道,实际的实现可以在修改参数的更新和应用之间引入延迟。
尽管图1-4实例中的修改参数M当被应用于修改音频信号处理或设备2时减小音频信号的单位响度和目标单位响度之差,在实际的实施中响应于同一音频信号产生的相应修改参数不可以彼此相同。
尽管对于本发明的方面不关键或不必要,音频信号或经修改音频信号的单位响度的计算可以有利地应用在第PCT/US2004/016964号、公开号为WO2004/111964A2的所述国际专利申请中所阐述的技术,其中所述计算从一组两个或更多单位响度模型函数中选择两个或更多单位响度模型函数之一或组合,这种选择受输入音频信号特征的度量的控制。图1中单位响度104的描述在以下描述了这种结构。
根据本发明的其他方面,未经修改的音频信号和(1)修改参数或(2)目标单位响度或目标单位响度的表示(例如在显式或隐式地计算目标单位响度中可使用的定标因子)可以被存储或发送用于例如时间和/或空间分离的设备或处理中。修改参数、目标单位响度、或目标单位响度的表示可以以任何适当的方式确定,例如以如上所述的图1-4的前馈、反馈、和混合前馈反馈结构实例之一。实际上,诸如图1实例中的前馈结构是最小复杂度和最快速的因为它避免了基于经修改音频信号的计算。发送或存储未经修改音频和修改参数的实例在图5中示出,而发送或存储未经修改音频和目标单位响度或目标单位响度表示的实例在图6中示出。
诸如图5实例中的结构可以被用于时间和/或空间地分离修改参数到音频信号的应用与这些修改参数的产生。诸如在图6实例中的结构可以被用于时间和/或空间地分离修改产生的产生和应用与目标单位响度或目标单位响度表示的产生。两种类型的结构有可能产生简单低成本的重放或接收结构,这种结构避免了产生修改产生或产生目标单位响度的复杂性。尽管图5类型的结构比图6类型的结构更简单,但是图6的结构所具有的优点是存储或发送所需的信息可以更少,特别是当存储或发送目标单位响度的表示,诸如一个或更多定标因子时。这种信息存储或发送的减小在低比特率音频环境中尤其有用。
相应地,本发明的其他方面提供一种设备或处理(1)从存储或发送设备或处理接收或重放修改参数M并将它们应用于还接收的音频信号或(2)从存储或发送设备或处理接收或重放目标单位响度或目标单位响度的表示,通过应用目标单位响度或目标单位响度表示给还接收的所述音频信号(或音频信号的度量诸如它的单位响度,该度量可以从音频信号导出)产生修改参数M,并将修改参数M应用于接收的音频信号。这些设备或处理可以被表征为解码处理或解码器;而产生存储或发送的信息所需的设备或处理可以被表征为编码处理或编码器。这些编码处理或编码器是图1-4结构实例可用于通过相应的解码处理或解码器产生所需信息的那些部分。这些解码处理器或解码器可以与实际上任何类型的处理和/或再现声音的处理或设备相关或一起操作。
在本发明的一个方面,如在图5的实例中,未经修改的音频信号和例如通过修改参数产生处理或发生器诸如图1的产生修改参数4、图2的4’、图3的4”或图4的4_产生的修改参数M可以被应用于任何适当的存储或发送设备或函数(“存储或发送”)16。在使用图1中的前馈实例作为编码处理或编码器的情况下,修改音频信号2将不需要用于产生经修改的音频并且如果不需要在编码器或编码处理的时间或空间位置上提供经修改的音频则它能够被省略。存储或发送16可以包括例如任何适当的磁性、光学或固态存储和重放设备或任何适当的有线或无线发送和接收设备,所述这些设备的选择对于本发明来说并不关键。重放或接收的修改参数然后可以被应用于在图1-4实例中所应用类型的修改音频信号2,以修改重放或接收的音频信号,从而它的单位响度近似目标单位响度或本质上位于导出修改参数的结构中。所述修改参数可以以各种方式中的任何一种进行存储或发送。例如,它们可以作为伴随音频信号的元数据被存储或发送,它们可以在独立通道或信道中被发送,它们可以在音频中被用密码编码,它们可以被多路复用等等。使用修改参数修改音频信号可以是可选的,如果可选,它们的使用也是例如通过用户可选择的。例如,如果修改参数被应用于音频信号,该修改参数可能减小音频信号的动态范围。是否应用这种动态范围减小是能够通过用户可选择的。
在本发明的另一个方面,如在图6的实例中,未经修改的音频信号和目标单位响度或目标单位响度表示可以被应用于任何适当的存储或发送设备或函数(“存储或发送”)16。在使用诸如图1实例的前馈结构作为编码处理或编码器的情况下,不论计算修改参数10类型的处理或设备还是修改音频信号2类型的处理或设备都不需要并且如果不需要在编码器或编码处理的时间或空间位置上提供经修改音频的修改参数它们能够被省略。如在图5实例的情况下,存储或发送16可以包括例如任何适当的磁性、光学或固态存储和重放设备或任何适当的有线或无线发送和接收设备,这些设备的选择对于本发明来说并不关键。重放或接收的目标单位响度或目标单位响度表示然后可以与未经修改的音频一起被应用于在图1实例中所应用类型的计算修改参数10,或在图3实例中所应用类型的计算修改参数10”,以提供任何被应用于在图1-4实例中所应用类型的修改音频信号2的修改参数M,以修改重放或接收的音频信号从而它的单位响度近似目标单位响度或本质上位于导出修改参数的结构中。尽管图1实例类型的编码处理或编码器中可以最容易地获得目标单位响度或目标单位响度表示,但是在图2到4实例类型的编码处理或编码器中也可以获得目标单位响度或目标单位响度表示或目标单位响度或目标单位响度表示的近似(在图2和3的处理或设备14中以及在图4的处理或设备12中计算近似)。目标单位响度或目标单位响度表示可以以各种方式中的任何一种方式被存储或发送。例如,它可以作为伴随音频信号的元数据被存储或发送,它可以在单独的通道或信道中发送,它可以在音频中被用密码编码,它可以被多路复用等等。使用根据存储或发送的目标单位响度或表示导出的修改参数修改音频信号可以是可选的,如果可选,它们的使用可以是例如通过用户可选择的。例如,如果修改参数被应用于音频信号,该参数可能减小音频信号的动态范围。是否应用这种动态范围减小是能够通过用户可选择的。
当实现本公开的发明为数字系统时,前馈结构是最实际的,所以以下将详细地描述这些结构的实例,应该明白本发明的范围并不受到这种限制。
在本申请的全文中,术语诸如“滤波器”或“滤波器组”在这里被用于包括基本上任何形式的递归和非递归滤波诸如IIR滤波器或变换,以及“滤波的”信息是应用这些滤波器的结果。以下描述的实施例应用通过变换实现的滤波器组。
图7描述了以前馈结构实施的本发明一个方面的示意性实施例进一步的细节。音频首先通过分析滤波器组函数或设备(“分析滤波器组”)100,它将音频信号分离成多个频带(因此,图5所示为来自分析滤波器组100的多个输出,每个输出表示一个频带,输出维持各种函数或设备到将频带求和成组合的宽带信号的合成滤波器组,如以下进一步的描述)。与分析滤波器组100中的每个频带相关的滤波器的响应被设计成模拟在内耳基膜的特定位置处的响应。分析滤波器组100中每个滤波器的输出接下来传递到模拟通过外耳和中耳的音频传输的滤波器效应的传输滤波器或传输滤波器函数(“传输滤波器”)101中。如果只有音频的响度将要被测量,在分析滤波器组之前能够应用传输滤波器,但是由于分析滤波器组输出用于合成经修改的音频,因此在滤波器组之后应用传输滤波器是有利的。传输滤波器101的输出接下来传递到激励函数或设备(“激励”)102,它的输出模拟沿基膜的能量分布。激励能量值可以通过平滑函数或设备(“平滑”)103在时间上进行平滑。平滑函数的时间常量根据想要应用的要求进行设置。平滑的激励信号接下来在单位响度函数或设备(“单位响度(SL)”)104中被转换成单位响度。单位响度以每单位频率宋为单位来表示。与每个频带相关的单位响度分量被传递到单位响度修改函数或设备(“SL修改”)105中。SL修改105采取原始单位响度作为它的输入以及然后输出想要的或“目标的”单位响度,根据本发明的一个方面,所述目标单位响度优选是原始单位响度的函数(参见以下的下一个标题,标题为“目标单位响度”)。SL修改105可以在每个频带上独立地操作,或者取决于想要的效果,可能存在频带之间的互相依赖性(在图7中通过交叉连接线所建议的频率平滑)。采取来自激励102的平滑的激励频带分量以及来自SL修改105的目标单位响度作为它的输入,增益解算器函数或设备(“增益解算器”)106确定需要被应用于分析滤波器组100输出的每个频带的增益以便将测量的单位响度变换成目标单位响度。所述增益解算器可以以各种方式实现。例如,增益解算器可以包括迭代处理诸如以第PCT/US2004/016964号、公开号为WO2004/111964A2的所述国际专利申请中公开的方式或可替换地以表查询的方式。尽管增益解算器106产生的每个频带增益可以进一步通过可选的平滑函数或设备(“平滑”)107在时间上进行平滑以便最小化感觉结果,优选的是如在别处所述在整个处理或设备中在别处应用时间平滑。最后,通过相应的乘法合并函数或合并器108将所述增益应用于分析滤波器组100的相应频带,以及在合成滤波器组函数或设备(“合成滤波器组”)110中根据增益修改的频带合成经处理或“经修改的”音频。另外,来自分析滤波器组的输出可以在应用增益之前通过延迟函数或设备(“延迟”)109被延迟以便补偿与增益计算相关的任何等待时间。可替换地,代替计算用于在频带中应用增益修改中使用的增益,增益解算器106可以计算控制诸如多抽头FIR滤波器或多极IIR滤波器的时间变化滤波器的滤波器系数。为了简单说明,本发明的这些方面主要被描述为应用被应用于频带的增益因子,应该明白在实际的实施例中还可以应用滤波器系数和时间变化滤波器。
在实际的实施例中,音频的处理可以在数字域中执行。相应地,音频输入信号通过离散时间序列x[n]表示,该时间序列已经以某采样频率fs从音频源进行采样。假设序列x[n]已经被适当地定标从而通过以下公式以分贝给出的x[n]的均方根(rms)功率RMSdB=10log10(1LΣn=0Lx2[n])]]>等于收听者正在以它进行倾听的单位为dB的声压级。另外,为了简化说明起见假设所述音频信号是单声道的。
如下将更详细地描述分析滤波器组100、传输滤波器101、激励102、单位响度104、单位响度修改105、增益解算器106、以及合成滤波器组110。
分析滤波器组100所述音频输入信号被应用于分析滤波器组或滤波器组函数(“分析滤波器组”)100。分析滤波器组100中的每个滤波器被设计成模拟在沿内耳基膜的特定位置处的频率响应。滤波器组100可以包括一组线性滤波器,其带宽和间隔在等效矩形带宽(ERB)频率标度上是恒定的,如通过Moore、Glasberg和Baer(上文提到的B.C.J.Moore,B.Glasberg,T.Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness,”)所定义的。
尽管ERB频率标度更加紧密地匹配人的感觉并且显示出在产生匹配主观响度结果的客观响度度量中改进的性能,但是可以利用降低的性能应用Bark频率标度。
对于单位为Hz的中心频率f,单位为Hz的ERB频带的带宽可以被近似为ERB(f)=24.7(4.37f/1000+1)(1)根据这种关系定义曲折的频率标度即在沿曲折标度的任何点上,以曲折标度为单位的相应ERB等于一。用于从单位Hz的线性频率转换到这种ERB频率标度的函数通过积分方程1的倒数而获得HzToERB(f)=∫124.7(4.37f/1000+1)df=21.4log10(4.37f/100+1)---(2a)]]>通过解方程2a求解f表示从ERB标度回变换回线性频率标度也是有用的ERBToHz(e)=f=10004.3710(e/21.4-1),---(2b)]]>其中,e是以ERB标度的单位。图9所示为ERB标度和单位为Hz的频率之间的关系。
分析滤波器组100可以包括位于沿ERB标度均匀间隔的中心频率fc[1]...fc[B]的被称之为频带的B听觉滤波器。更具体而言,fc[1]=fmin(3a)fc[b]=fc[b-1]+ERBToHz(HzToERB(fc[b-1])+Δ) b=2...B(3b)fc[B]<fmax,(3c)其中,Δ是想要的分析滤波器组100的ERB间隔,以及fmin和fmax分别是想要的最小和最大中心频率。可以选择Δ=1,并且考虑人耳敏感的频率范围,可以设置fmin=50Hz和fmax=20000Hz。利用这些参数,例如,应用方程3a-c产生B=40的听觉滤波器。
每个听觉滤波器的幅度频率响应其特征在于如Moore和Glasberg所提出的舍入指数函数。具体而言,具有中心频率fc[b]的滤波器的幅度响应可以被计算为Hb(f)=(1+pg)e-pg(4a)这里g=|f-fc[b]fc[b]|,---(4b)]]>
p=4fc[b]ERB(fc[b])---(4c)]]>在图10示出了在ERB标度上近似临界频带的这些B听觉滤波器的幅度响应。
使用有限长度离散余弦变换可以充分地近似分析滤波器组100的滤波操作,所述变换通常被称之为短时间离散傅里叶变换(STDFT),因为被称之为全速率实现即在音频信号的采样速率运行滤波器的实现被认为提供比精确响度度量所必须的分辨率更高的时间分辨率。通过使用STDFT代替全速率实现,可以实现效率的提高和计算复杂度的降低。
输入音频信号x[n]的STDFT定义如下X[k,t]=Σn=0N-1w[n]x[n+tT]e-j2πkN,---(5a)]]>其中,k是频率索引,t是时间块索引,N是DFT大小,T是跳跃大小,以及w[n]是规格化的长度为N的窗从而Σn=0N-1w2[n]=1---(5b)]]>应该注意到方程5a中的变量t是表示与以秒为单位的时间度量相对的STDFT时间块的离散索引。t中的每个递增表示沿信号x[n]的T采样的跳跃。接下来参考索引t假设这种定义。尽管取决于实现的细节,可以使用不同的参数设置和窗形状,对于fs=44100Hz,选择N=2048,T=1024,并且让w[n]是汉宁窗提供时间和频率分辨率的足够平衡。使用快速傅里叶变换(FFT)上述的STDFT可以更加有效。
取代STDFT,可以使用修正离散余弦变换(MDCT)实现分析滤波器组。MDCT是一种通常在诸如Dolby AC-3的感觉音频编码器中使用的变换。如果本公开的系统利用这种感觉编码的音频实现,通过处理现有的编码音频的MDCT系数,并因此消除执行分析滤波器组变换的需要,本公开的响度测量和修改可以被更为有效地实现。输入音频信号x[n]的MDCT通过以下公式给出X[k,t]=Σn=0N-1w[n]x[n+tT]cos((2π/N)(k+1/2)(n+n0)),]]>
其中n0=(N/2)+12---(6)]]>通常情况下,选择跳跃大小T精确为一半的变换长度N以便有可能完全重构信号x[n]。
传输滤波器101分析滤波器组100的输出被应用于根据通过外耳和中耳的音频传输滤波滤波器组的每个频带的传输滤波器或传输滤波器函数(“传输滤波器”)101。图8描述了传输滤波器在可听频率范围上的一种适当的幅度频率响应P(f)。该响应统一低于1kHz,以及在1kHz以上,遵循在ISO226标准中规范的听觉门限的倒数,该门限被规格化成等于在1kHz的1。
激励102为了计算输入音频信号的响度,在应用传输滤波器101之后需要在分析滤波器组100的每个滤波器中音频信号短时间能量的度量。这种时间和频率变化的度量被称之为激励。在激励函数102中通过频率域中的滤波器响应和输入信号的功率谱相乘可以近似分析滤波器组100中的每个滤波器的短时间能量输出E[b,t]=1NΣk=0N-1|Hb[k]|2|P[k]|2|X[k,t]|2,---(7)]]>其中,b是频带号,t是块号,以及Hb[k]和P[k]分别是听觉滤波器和传输滤波器的频率响应,所述输入信号以对应于STDFT或MDCT二进制索引k的频率进行采样。应该注意到除方程4a-c中规定以外的听觉滤波器幅度响应的形式可以在方程7中使用以实现类似的结果。例如,第PCT/US2004/016964号、公开号为WO2004/111964A2的所述国际申请描述了两种替换通过第12阶IIR传递函数表征的听觉滤波器,以及低成本的“砖墙(brick-wall)”带通近似。
总而言之,激励函数102的输出是在每时间周期t的各个ERB频带b中能量E的频率域表示。
时间平均(“平滑”)103如下所述,对于本公开发明的一定应用,可能期望在它的变换到单位响度之前平滑激励E[b,t]。例如,在平滑函数103中根据以下方程可以递归地执行平滑E[b,t]=λbE[b,t]+(1-λb)E[b,t],(8)其中,根据期望的应用选择在每个频带b的时间常量λb。在绝大多数情况下时间常量可以被有利地选择为与在频带b内人类响度感觉的积分时间成比例。Watson和Gengel进行的实验表明这种积分时间在低频(125-200Hz)位于150-175ms的范围内以及在高频位于40-60ms内(Charles S.Watson and Roy W.Gengel,“Signal Duration andSignal Frequency in Relation to Auditory Sensitivity”,Journal of theAcoustical Society of America,Vol.46,No.4(Part 2),1969年,第989-997页)。
单位响度104在单位响度转换器或转换函数(“单位响度”)104中,将激励的每个频带转换成以每ERB宋为单位度量的单位响度的分量值。
开始,在计算单位响度中,每个频带中的激励级E[b,t]可以被变换成如ISO226的等响度轮廓所规定的(图11)通过传输滤波器P(z)规格化的在1kHz的等效激励级(图12)E1kHz[b,t]=T1kHz(E[b,t],fc[b]), (9)其中,T1kHz(E,f)是产生在1Kz所述级的函数,该级和在频率f的级E一样响。实际上,将T1Hz(E,f)实现为通过传输滤波器规格化的等响度轮廓查询表的内插。转换成在1kHz的等效级简化了以下的单位响度计算。
接下来,每个频带中的单位响度可以计算为N[b,t]=α[b,t]NNB[b,t]+(1-α[b,t])NWB[b,t],(10)其中,NNB[b,t]和NWB[b,t]分别是基于窄带和宽带信号模型的单位响度值。值α[b,t]是根据音频信号计算的位于0和1之间的内插因子。第PCT/US2004/016964、公开号为WO2004/111964A2的所述国际申请描述了一种根据激励的频谱平坦性计算α[b,t]的技术。它还更详细地描述“窄带”和“宽带”信号模型。
所述窄带和宽带单位响度值NNB[b,t]和NWB[b,t]可以使用指数函数根据变换的激励进行估计
NNB[b,t]=GNB((E‾1kHz[b,t]TQ1kHz)βNB-1),E‾1kHz[b,t]>TQ1kHz0,otherwise---(11a)]]>NWB[m,t]=GWB((E‾1kHz[b,t]TQ1kHz)βWB-1),E‾1kHz[b,t]>TQ1kHz0,otherwise---(11b)]]>其中,TQ1kHz是对于1KHz宋来说在无声门限的激励级。根据等响度轮廓(图11和12)TQ1kHz等于4.2dB。注意到当所述激励等于无声门限时这些单位响度函数都等于零。对于大于无声门限的激励,两个函数根据Stevens的级感觉定律以幂定律单调地增加。选择窄带函数的指数大于宽带函数的指数,使得窄带函数相对于宽带函数更快速地增加。具体选择的用于窄带和宽带情况的指数β和增益G被选择成在音调和噪声的响度增加时匹配实验数据。
Moore和Glasberg建议当所述激励处于听觉门限时单位响度应该等于取代零的某些小值。然后单位响度应该随激励减小到零而单调地减小到零。理由是听觉门限是盖然性门限(在这点上50%的时间检测音调),以及每个位于门限的大量音调一起存在可以相加成一种比任何各个音调更可听的声音。在本公开的申请中,利用这种特性增加单位响度函数已经具有当所述激励接近门限时使以下讨论的增益解算器行为更加正确的附加益处。如果当所述激励位于门限或低于门限时所述单位响度被定义成零,那么对于位于门限或低于门限的激励来说增益解算器的唯一解不存在。另一方面,如果单位响度被定义成对于大于或等于零的所有激励值来说单调地增加,如Moore和Glasberg所建议的,那么唯一解存在。大于统一值的响度定标将总是导致大于统一值的增益并且反之亦然。方程11a和11b中的单位响度函数可以被修改成具有根据以下公式的期望特性NNB[b,t]=GNB((E‾1kHz[b,t]TQ1kHz)βNB-1),E‾1kHz[b,t]>λTQ1kHzexp{KNB(-log(E‾1kHz[b,t]TQ1kHz)+CNB)ηNB},otherwise---(11c)]]>
NWB[m,t]=GWB((E‾1kHz[b,t]TQ1kHz)βWB-1)E‾1kHz[b,t]>λTQ1kHzexp{KWB(-log(E‾1kHz[b,t]TQ1kHz)+CWB)ηWB},otherwise---,(11c)]]>其中,常量λ大于1,η指数小于1,以及常量K和C如此选择从而单位响度函数及其一阶导数在点E1kHz[b,t]=λTQ1kHz处是连续的。
根据单位响度,通过在所有频带b上单位响度的求和给出全部或“总”响度L[t]L[t]=ΣbN[b,t]---(12)]]>单位响度修改105在单位响度修改函数(“单位响度修改”)105中,被称之为 的目标单位响度可以取决于全部设备或处理的期望应用以各种方式根据SL104的单位响度(图7)计算。正如以下更详细的描述,例如,在音量控制的情况下,目标单位响度可以使用定标因子α计算。参见以下的方程16及其相关的描述。在自动增益控制(AGC)和动态范围控制(DRC)的情况下,目标单位响度可以使用期望输出响度和输入响度的比率进行计算。参见以下的方程17和18及其相关的描述。在动态均衡的情况下,目标单位响度可以使用方程23及其相关描述中阐述的关系进行计算。
增益解算器106在本实例中,对于每个频带b和每个时间间隔t,增益解算器106采取平滑的激励E[b,t]和目标单位响度 作为它的输入并且产生接下来修改所述音频使用的增益G[b,t]。让函数Ψ{·}表示从激励导单位响度的非线性变换从而N[b,t]=Ψ{E[b,t), (13)增益解算器得到G[b,t],从而N^[b,t]=Ψ{G2[b,t]E‾[b,t]}.---(14a)]]>增益解算器106确定频率和时间变化的增益,当该增益被应用于原始激励时,它产生在理想情况下等于期望目标单位响度的单位响度。实际上,所述增益解算器确定频率和时间变化的增益,当该增益被应用于音频信号的频率域型式时导致修改所述音频信号以便减小它的单位响度和目标单位响度之间的差。在理想情况下,所述修改是这样的即经修改的音频信号具有紧密近似目标单位响度的单位响度。方程14a的解可以以大量的方式实现。例如,如果通过Ψ-1{·}表示的用于反单位响度的封闭形式的数学表达式存在,那么所述增益可以直接通过重新安排方程14a进行计算G[b,t]=Ψ-1(N^[b,t])E‾[b,t]---(14b)]]>可替换地,如果用于Ψ-1{·}的封闭形式的解不存在,可以应用迭代方法,其中对于每个迭代使用增益的当前估计评估方程14a。比较所产生的单位响度和期望的目标单位响度以及基于误差更新增益。如果增益被正确地更新,它们将会聚到期望的解。另一种方法包含对于每个频带中的激励范围预先计算函数Ψ{·}以创建查询表。根据该查询表,获得反函数Ψ-1{·}的近似以及然后可以根据方程14b计算所述增益。正如以前所述,目标单位响度可以通过单位响度的定标表示N^[b,t]=Ξ[b,t]N[b,t]---(14c)]]>将方程13代入14c中然后将14c代入14b中产生增益的替换表达式G[b,t]=Ψ-1(Ξ[b,t]Ψ(E‾[b,t]))E‾[b,t]---(14d)]]>我们看到增益可以精确地表示为激励E[b,t]和单位响度定标Ξ[b,t]的函数。所以,通过14d方程或等效查询表可以计算所述增益而不用显式地计算单位响度或目标单位响度作为中间值。但是,通过方程14d的使用隐式地计算这些值。可以设计通过显式或隐式计算单位响度或目标单位响度用于计算修改参数的其他等效方法,本发明旨在覆盖所有这些方法。
合成滤波器组110如上所述,分析滤波器组100可以通过使用短时间离散傅里叶变换(STDFT)或修正离散余弦变换有效地实现,以及可以类似地使用STDFT或MDCT实现合成滤波器组110。具体而言,如以前所述,让X[k,t]表示输入音频的STDFT或MDCT,经处理(修改)的音频STDFT或MDCT在合成滤波器组110可以被计算为X^[k,t]=ΣbG[b,t]Sb[k]X[k,t-d],---(15)]]>其中,Sb[k]是与频带b相关的合成滤波器的响应,以及d是与图7中延迟块109相关的延迟。可以选择合成滤波器的形状Sb[k]与分析滤波器组中使用的滤波器Hb[k]相同,或者可以修改它们以在缺少任何增益修改(即,当G[b,t]=1时)中提供完全的重构。然后如本领域普通技术人员所熟知的那样,通过 的逆傅里叶或修正余弦变换和叠加附加合成可以产生最后处理的音频。
目标单位响度实施本发明这些方面的结构的行为诸如图1-7的实例主要通过计算目标单位响度 的方式指示。尽管本发明并不局限于任何特定的计算目标单位响度的函数或反函数,但是现在将描述用于它们的若干这些函数和适当的应用。
适于音量控制的时间恒定和频率恒定函数标准音量控制通过应用宽带信号给所述音频调节音频信号的响度。通常,所述增益被耦合到通过用户调节的旋钮或滑动块直到音频的响度位于期望的级。本发明的一个方面考虑用于实现这种控制的更加心理声学一致的方式。根据本发明的这个方面,不是具有耦合到音量控制的宽带增益,其中该音量控制在所有频带上通过相同的量产生增益的变化,这可能导致感觉频谱的变化,而是相反将单位响度定标因子与音量控制调节进行相关以便通过考虑人类听觉模型的量改变多个频带的每个频带中的增益,从而在理想情况下不存在感觉频谱的变化。在本发明这个方面及其示意性应用的上下文中,“常量”或“时间恒定”旨在考虑音量控制定标因子的设置中例如通过用户不时的变化。这种“时间恒定”有时候被称之为“准时间恒定”、“准固定”、“分段时间恒定”、“分段固定”、“逐步时间恒定”和“逐步固定”。给定这种定标因子α,目标单位响度可以被计算为通过α相乘的度量的单位响度N^[b,t]=αN[b,t.].---(16)]]>由于总响度L[t]是在所有频带b上单位响度N[b,t]的求和,上述修改还通过因子α定标总响度,但是它以这样一种方式进行即保存在特定时间音量对于控制调节变化来说相同的感觉频谱。换言之,在任何特定的时间,音量控制调节的变化导致感觉响度的变化但是经修改音频的感觉频谱和未经修改音频的感觉频谱之比值不变化。图13a描述了当对于由柔和语音组成的音频信号α=0.25时在特定时间“t”在频带“b”上所产生的多频带增益G[b,t]。为了比较,如在标准音量控制中,还对通过0.25定标原始总响度所需的宽带增益(水平线)进行绘图。与中频带相比多频带增益G[b,t]在低频带和高频带增加。这与指示人耳在低频和高频较不敏感的等响度轮廓相一致。
图13b描述了用于原始音频信号、如根据现有技术音量控制修改的宽带增益修改信号、和如根据本发明本方面修改的多频带增益修改信号的单位响度。多频带增益修改信号的单位响度是通过0.25定标的原始信号的单位响度。宽带增益修改信号的单位响度已经相对于原始未经修改信号改变了它的频谱形状。在这种情况下,在相对意义上,单位响度在低频和高频具有丢失的响度。随着它的音量降低这被感觉为音频的不洪亮,一个多频带修改信号不会发生的问题,该信号的响度受在感觉响度域中所导出增益的控制。
连同与传统音量控制相关的感觉频谱平衡的失真这里存在第二个问题。在方程11a-11d表示的响度模型中所反映的响度感觉的特性是在任何频率的信号的响度随信号级接近听觉门限而更快速地降低。结果,给予更柔和信号相同响度衰减的电子衰减小于较响亮信号所需的衰减。传统的音量控制给予恒定衰减而不管信号级如何,所以柔和信号相对于较响亮信号随音量降低而变得“太柔和”。在许多情况下这导致音频细节的丢失。考虑在回响室内响板的记录。在这种记录中响板的主“击打”与回响回声相相比较相当地响亮,但是它是传达房间大小的回响回声。当利用传统的音量控制降低音量时,回响回声相对主击打变得较柔和并且最终消失在听觉门限之下,留下“干的”发声音的响板。基于响度的音量控制通过相对于较响亮的主击打增强记录的较柔和回响部分,以便这些部分之间的相对响度保持恒定来防止记录的较柔和部分消失。为了实现这个效果,多频带增益G[b,t]必须以和人的响度感觉时间分辨率相称的一定速率随时间变化。由于多频带增益G[b,t]被计算为平滑激励E[b,t]的函数,方程8中时间常量λb的选择指示在每个频带b中增益如何可以在时间上快速地变化。如之前所述的,可以选择这些时间常量为在频带b中人响度感觉的成比例的积分时间,并因此随时间产生G[b,t]的适当变型。应该注意到如果不正确地选择这些时间常量(过快或过慢),那么在处理的音频中可能引入可感觉的客观结果。
适于固定均衡的时间恒定和频率变化函数在某些应用中,可能希望应用固定感觉均衡于所述音频,在这种情况下可以通过应用如以下关系中的时间恒定但频率变化的定标因子Θ[b]计算目标单位响度N^[b,t]=Θ[b]N[b,t],]]>其中, 是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。在这种情况下,所述定标可以随频带而变化。这种应用对于加重例如语音频率所支配的频谱部分以便增强清晰度是有用的。
适于自动增益和动态范围控制的的频率恒定和时间变化函数自动增益和动态范围控制(AGC和DRC)的技术在音频处理领域中是熟知的。在一种抽象含义下,两种技术以某种方式测量音频信号的级以及然后通过为测量级函数的量来增益修改该音频信号。对于AGC的情况,增益修改所述信号以便它的测量级更接近于用户选择的参考级。对于DRC,增益修改所述信号以便将信号的度量级的范围变换成某种期望的范围。例如,可能希望使得音频的无声部分更响亮以及响亮部分较无声。Robinson和Gundry(Charles Robinson和Kenneth Gundry,“Dynamic Range Control via Metadata”,107thConvention of the AES,Preprint 5028,1999年9月24-27日,纽约)描述了这种系统。AGC和DRC的传统实现通常使用音频信号级的简单度量,诸如平滑的峰值或均方根(rms)幅度以驱动增益修改。这些简单的度量和音频感觉响度的某种度相关,但是本发明的方面通过利用基于心理声学模型的响度的度量驱动增益修改考虑更加感觉相关的AGC和DRC。而且,许多传统的AGC和DRC系统应用具有宽带增益的增益修改,从而导致经处理音频中的上述音质(频谱)失真。另一方面,本发明的这些方面使用多频带增益以减小或最小化这些失真的方式对所述单位响度整形。
应用本发明这些方面的AGC和DRC应用通过一种函数表征,该函数将输入宽带响度Li[t]变换或映射成期望的输出宽带响度Lo[t],这里所述响度以诸如宋的感觉响度单位进行度量。输入宽带响度Li[t]是输入音频信号的单位响度N[b,t]的函数。尽管它可以和输入音频信号的总响度相同,但是它可以是音频信号总响度的时间平滑的型式。
图14a和14b描述了典型分别用于AGC和DRC的映射函数的实例。给定Lo[t]是Li[t]的函数的这种映射,目标单位响度可以被计算为N^[b,t]=Lo[t]Li[t]N[b,t].---(17)]]>音频信号的原始单位响度N[b,t]简单地通过期望的输出宽带响度和输入宽带响度之比进行定标以产生输出单位响度 对于AGC系统,输入宽带响度Li[t]应该通常是音频的长期总响度的度量。这能够通过在时间上平滑总响度L[t]产生Li[t]予以实现。
与AGC相比较,DRC系统反作用于信号响度的较短期变化,所以能够使Li[t]简单等于L[t]。结果,通过Lo[t]/Li[t]给出的单位响度的定标可以快速地波动,这导致经处理音频中的不想要的非自然信号。一种典型的结果是通过一些其他相对不相关的频谱部分对一部分频谱的声频调制。例如,经典音乐选择可能包含持续的弦音所支配的高频,而低频包含大声激增的定音鼓。无论何时定音鼓击打,总响度Li[t]都将增加,以及DRC系统应用衰减给整个单位响度。然后弦被听到利用定音鼓在响度方面上下“急剧起伏”。这种在频谱中的交叉急剧起伏是传统宽带DRC系统的问题,以及典型的解决方案包含独立地应用DRC于不同的频带。由于滤波器组和应用感觉响度模型的单位响度计算所以这里公开的系统本质上是多频带的,因此修改DRC系统根据本发明的方面以多频带方式工作相对地直接并且接下来进行描述。
适于动态范围控制的频率变化和时间变化的函数DRC系统可以被扩展成通过允许输入和输出响度独立于频带b变化从而以多频带或频率变化方式工作。这些多频带响度值指Li[b,t]和Lo[b,t],目标单位响度然后可以通过以下公式给出N^[b,t]=Lo[b,t]Li[b,t]N[b,t],---(18)]]>其中,如在图14b中所示例,已经根据Li[b,t]计算或从它映射Lo[b,t],但是对于每个频带b来说是独立的。输入多频带响度Li[b,t]是输入音频信号的单位响度N[b,t]的函数。尽管它可以和输入音频信号的单位响度相同,但是它可以是音频信号的单位响度的时间平滑/或频率平滑的型式。
计算Li[b,t]的最直接的方式是设置它等于单位响度N[b,t]。在这种情况下,在感觉响度模型的听觉滤波器组中的每个频带上独立地执行DRC而不是根据上述在标题“适于自动增益和动态范围控制的频率恒定和时间变化函数”下用于所有频带的相同输入相对于输出响度比率。在应用40频带的实际实施例中,沿频率轴这些频带的间隔相对精细以便提供响度的精确度量。但是,独立地应用DRC定标因子于每个频带可以导致经处理的音频听起来“一团糟”。为了避免这个问题,可以选择通过在频带上平滑单位响度N[b,t]以便从一个频带应用到下一个频带的DRC量不剧烈地变化来计算Li[b,t]。这可以通过定义频带平滑滤波器Q(b)以及然后根据标准的卷积和在所有频带c上平滑单位响度实现Li[b,t]=ΣcQ(b-c)N[c,t].---(19)]]>其中,N[c,t]是音频信号的单位响度以及Q(b-c)是平滑滤波器的频带位移响应。图15描述了这种频带平滑滤波器的一个实例。
如果计算作为Lo[b,t]的函数的Li[b,t]的DRC函数对于每个频带b是固定的,那么单位响度N[b,t]的每个频带导致的变化类型将根据被处理音频的频谱变化,即使信号的总响度保持相同。例如,具有响亮低音和无声高音的音频信号可以让低音削减以及让高音增强。具有无声低音和响亮高音的音频信号可以发生相反的情况。实际效果是音频的音质或感觉频谱的变化,并且这在一定的应用中可能是令人想要的。
但是,可能希望执行多频带DRC而不修改音频的平均的感觉频谱。可能想要平均在每个频带中的修改成大致的相同同时仍然允许修改的短期变化在频带之间以及频带中独立地操作。想要的效果可以通过强制每个频带中DRC的平均行为和某种参考行为相同实现。可以选择这种参考行为作为用于宽带输入响度Li[t]的想要的DRC。让函数Lo[t]=DRC{Li[t]}表示用于宽带响度的想要的DRC映射。然后让Li[t]表示宽带输入响度的时间平均型式,以及让Li[b,t]表示多频带输入响度Li[b,t]的时间平均型式。然后多频带输出响度可以被计算为Lo[b,t]=L‾i[b,t]L‾i[t]DRC{L‾i[t]L‾i[b,t]Li[b,t]}.---(20)]]>值得注意的是首先将所述多频带输入响度定标位于同一平均范围内作为宽带输入响度。然后应用被设计用于宽带响度的DRC函数。最后,将该结果向下定标回多频带响度的平均范围。利用多频带DRC的这种表示法,保持减小频谱急剧起伏的有益之处,而与此同时保留音频的平均感觉频谱。
适于动态均衡的频率变化和时间变化函数本发明方面的另一个应用是音频的时间变化感觉频谱有意的变换成目标时间恒定的感觉频谱同时仍然保留音频的原始动态范围。可以称这种处理为动态均衡(DEQ)。利用传统的静态均衡,应用简单的固定滤波于音频以便改变它的频谱。例如,可能应用固定低音或高音增强。这种处理不考虑音频的当前频谱并且所以对于某些信号即已经包含相对大量低音或高音的信号来说是不适当的。利用DEQ,度量所述信号的频谱以及然后动态地修改该信号以便将度量的频谱变换成基本上静态的想要的形状。对于本发明的方面,在滤波器组中的频带上规定这种想要的形状并且被称为EQ[b]。在实际的实施例中,度量的频谱应该表示通过在时间上平滑单位响度N[b,t]所产生的音频的平均频谱形状。可以称平滑的单位响度为N[b,t]。当利用多频带DRC时,可以不想要EDQ修改来从一个频带到下一个频带剧烈地变化,所以可以应用频带平滑函数产生频带平滑的频谱L[b,t]L‾[b,t]=ΣcQ(b-c)N‾[c,t].---(21)]]>为了保留音频的原始动态范围,应该规格化想要的频谱EQ[b]以具有相同的总响度如通过L[b,t]所给出的度量的频谱形状。可以称这种规格化的频谱形状为LEQ[b,t]L‾EQ[b,t]=(ΣcL‾[c,t]ΣcEQ[c])EQ[b].---(22)]]>最后,计算所述目标单位响度为N^[b,t]=(L‾[b,t]L‾EQ[b,t])1-βL‾EQ[b,t]L‾[b,t]N[b,t],---(23)]]>其中,β是范围从零到一的用户特定参数,它指示将应用的DEQ的程度。参见方程23,注意到当β=0时,不修改原始的单位响度,以及当β=1时,通过想要的频谱形状和度量的频谱形状之比定标所述单位响度。
一种产生想要的频谱形状EQ[b]的简便方式是用户将它设置成等于如对音频的某些片段所度量的L[b,t],用户发现该音频的频谱平衡令人愉悦。在实际的实施例中,例如在图16中所示,可以给用户提供按钮或其他适当的致动器507,当它被激励时,导致捕获所述音频的频谱形状L[b,t]的当前度量,然后存储该度量作为当启动DEQ时(如通过预置选择508)可以以后被加载到EQ[b]中的预置(在目标单位响度预置捕获和存储506中)。图16是图7的简化型式,其中只示出了单条线来表示从分析滤波器组100到合成滤波器组110的多个频带。图17的实例还提供动态EQ单位响度(SL)修改505,该修改提供对根据如上所述的动态均衡通过函数或设备104所度量的单位响度的修改。
合并处理可能希望合并所有之前描述的处理,包括音量控制(VC)、AGC、DRC和DEQ到单个系统中。由于这些处理中的每个处理可以表示为单位响度的定标,因此它们全部被容易地进行如下合并N^[b,t]=(ΞVC[b,t]ΞAGC[b,t]ΞDRC[b,t]ΞDEQ[b,t])N[b,t],---(24)]]>其中,Ξ*[b,t]表示与处理“*”相关的定标因子。然后可以为表示合并处理的目标单位响度计算单个一组增益G[b,t]。
在某些情况下,响度修改处理之一或组合的定标因子可以随时间快速地波动并且在所产生的处理音频中产生非自然信号。所以可能想要平滑这些定标因子的某子集。通常,来自VC和DEQ的定标因子在时间上平滑地变化,但是可能需要平滑AGC和DRC定标因子的组合。让这些定标因子的组合通过以下表示ΞC[b,t]=ΞAGC[b,t]ΞDRC[b,t](25)在平滑之后的基本概念是当单位响度增加时组合的定标因子应该快速地进行反作用,以及当单位响度减小时定标因子应该被更加缓慢地平滑。这种概念对应于在音频处理器的设计中熟知的使用快攻和慢释放的实践。用于平滑定标因子的适当时间常量可以通过在时间上平滑单位响度的频带平滑型式进行计算。首先计算单位响度的频带平滑型式Σc(b-c)N[c,t]---(26)]]>其中,N[c,t]是音频信号的单位响度以及Q(b-c)是如上述方程19中的平滑滤波器的频带位移响应。
然后这种频带平滑单位响度的时间平滑型式被计算为L[b,t]=λ[b,t]L[b,t]+(1-λ[b,t])L[b,t-1] (27)其中,频带相关的平滑系数λ[b,t]通过以下给出λ[b,t]=λfast,L[b,t]>L‾[b,t]λslowL[b,t]≤L‾[b,t]---(28)]]>然后计算平滑的组合定标因子为ΞC[b,t]=λM[b,t]ΞC[b,t]+(1-λM[b,t])ΞC[b,t-1] (29)其中,λM[b,t]是λ[b,t]的频带平滑型式
λM[b,t]=(1ΣcQ(c))ΣcQ(b-c)λ[b,t].---(30)]]>平滑系数的频带平滑防止时间平滑的定标因子在频带上剧烈地变化。所述定标因子时间和频带平滑产生包含更少客观感觉非自然信号的经处理的音频。
噪声补偿在许多音频重放环境中存在和听众希望听到的音频相干扰的背景噪声。例如,在行使汽车中的听众可以在安装的立体声系统上播放音乐以及来自引擎和道路的噪声可以严重地改变音乐的感觉。特别是,对于噪声能量相对于音乐能量显著的所述频谱部分,该音乐的感觉响度被减小。如果噪声级足够大,音乐则被完全地屏蔽。有关本发明的一个方面,愿意选择增益G[b,t]从而在存在干扰噪声的情况下经处理音频的单位响度等于目标单位响度 为了实现这种效果,可以利用如通过Moore和Glasberg在上面定义的部分响度的构思。假设能够单独地获得噪声的度量以及单独地获得音频的度量。让EN[b,t]表示来自噪声的激励以及让EA[b,t]表示来自音频的激励。然后通过以下公式给出音频和噪声的组合单位响度NTOT[b,t]=Ψ{EA[b,t]+EN[b,t]}, (31)其中,Ψ{·}仍然表示从激励到单位响度的非线性变换。可以假设听众的听觉以一种保留组合单位响度的方式在音频的部分单位响度和噪声的部分单位响度之间区分组合的单位响度NTOT[b,t]=NA[b,t]+NN[b,t]. (32)音频的部分单位响度NA[b,t]是希望控制的值,所以必须求解该值。噪声的部分单位响度可以被近似为NN[b,t]=(ETN[b,t]EA[b,t])κ(Ψ{EN[b,t]+ETN[b,t]}-Ψ{ETQ[b]})---(33)]]>其中,ETN[b,t]是存在噪声时的屏蔽门限,ETQ[b]是在频带b处于无声的听觉门限,以及κ是位于0和1之间的指数。组合方程31-33可以得到用于音频的部分单位响度的表达式
NA[b,t]=Ψ{EA[b,t]+EN[b,t]}-(ETN[b,t]EA[b,t])κ(Ψ{EN[b,t]+ETN[b,t]}-Ψ{ETQ[b]})---(34)]]>注意到当所述音频的激励等于噪声的屏蔽门限时(EA[b,t]=ETN[b,t]),该音频的部分单位响度在无声门限等于信号的响度,这是想要的结果。当音频的激励非常大于噪声的激励时,方程34中的第二项趋于零,以及如果不存在噪声的话则该音频的单位响度近似等于它实际上的值。换言之,如果音频变得比噪声更响亮,则噪声被该音频所屏蔽。通过经验选择指数κ以在噪声中的音调响度上赋予数据最佳的拟合作为信噪比的函数。Moore和Glasberg已经发现值κ=0.3是合适的。噪声的屏蔽门限可以被近似为噪声激励本身的函数ETN[b,t]=K[b]EN[b,t]+ETQ[b] (35)其中,K[b]是在较低频带上增加的常量。因此,通过方程34给出的音频的部分单位响度可以被抽象地表示为音频激励和噪声激励的函数NA[b,t]=Φ{EA[b,t],EN[b,t]}. (36)然后可以使用修改增益解算器来计算增益G[b,t],从而在存在噪声时经处理音频的部分单位响度等于目标单位响度N^[b,t]=Φ{G2[b,t]EA[b,t],EN[b,t]}---(37)]]>图17描述图7的系统,该系统具有被所述噪声补偿增益解算器206替换的原始增益解算器106(注意表示滤波器组的多个频带的块之间的多个垂直线已经被替换成单条线以简化图)。另外,该图描述了和音频激励(来自平滑103)和目标单位响度(来自SL修改105)一起馈送到新增益解算器206中的噪声激励的测量(通过分析滤波器组200、传输滤波器201、激励202和平滑203以一种对应于方框100、101、102和103的操作的方式)。
在其最基本的操作模式中,图17中的SL修改105可以简单地设置目标单位响度 等于音频的原始单位响度N[b,t]。换言之,SL修改提供对音频信号的单位响度定标的频率恒定的定标因子α,其中α=1。利用诸如图17中的结构,计算增益从而在噪声存在时经处理音频的感觉响度频谱等于在噪声不存在时所述音频的响度频谱。另外,上述计算目标单位响度为原始音频函数的技术中任何一个或组合,包括VC、AGC、DRC和DEQ都可以被结合噪声补偿响度修改系统使用。
在实际的实施例中,可以从被放置在将会播放音频的环境中的或靠近这种环境的麦克风获得噪声的度量。可替换地,可以使用近似在各种条件下的预期噪声频谱的一组预定的模板噪声激励。例如,可以以各种驱动速度预先分析汽车室内的噪声以及然后将其存储为与速度相对的噪声激励的查询表。接下来可以在汽车速度变化时根据这个查询表近似馈送到图17的增益解算器206中的噪声激励。
实现本发明可以以硬件或软件、或二者的组合(例如可编程逻辑阵列)实现。除非特别声明,被包括作为本发明一部分的算法在本质上与任何特定的计算机或其他设备无关。特别是,可以根据这里的教导利用写入程序使用各种通用机器,或者可以更为方便的是构造更专用的设备(例如集成电路)来执行所需的方法步骤。因此,本发明可以以在一个或更多可编程计算机系统上执行的一个或更多计算机程序实现,每个计算机系统包括至少一个处理器、至少一个数据存储系统(包括易失性和非易失性存储器和/或存储单元)、至少一个输入设备或端口、以及至少一个输出设备或端口。应用程序代码给输入数据以执行这里描述的功能和产生输出信息。该输出信息以已知的方式应用于一个或更多输出设备。
每个这种程序可以以任何想要的计算机语言(包括机器、汇编、或高级程序、逻辑、或面向对象的编程语言)实现以与计算机系统进行通信。在任何情况下,所述语言可以是编译或解释语言。
每个这种计算机程序优选被存储在或下载到通用或专用可编程计算机可读的存储媒体或设备(例如固态存储器或媒体、磁性或光学媒体),用于当存储媒体或设备被计算机系统读取时,配置和操作计算机执行这里描述的程序。本发明的系统还可以考虑实现为计算机可读的用计算机程序配置的存储媒体,这里如此配置的所述存储媒体使得计算机系统以一种特定和预先定义的方式操作来执行这里描述的功能。
已经描述了本发明的多个实施例。但是,将会明白在不背离本发明精神和范围的条件下可以作出各种修改。例如,这里描述的某些步骤可以是顺序不相关的,因此能够以不同于这里所描述的顺序执行这些步骤。
权利要求
1.一种用于导出可用于控制音频信号的单位响度的信息的方法,其中单位响度是作为频率和时间的函数的感觉响度的度量,该方法包括导出可用于修改音频信号以便减小它的单位响度和目标单位响度之间差值的修改参数。
2.一种用于导出可用于控制音频信号的部分单位响度的信息的方法,其中单位响度是作为频率和时间的函数的感觉响度的度量以及信号的部分单位响度是作为频率和时间的函数的在存在次干扰信号时该信号的感觉响度的度量,该方法包括导出可用于修改音频信号以便减小它的部分单位响度和目标单位响度之间差值的修改参数。
3.一种用于控制音频信号的单位响度的方法,其中单位响度是作为频率和时间的函数的感觉响度的度量,该方法包括修改所述音频信号以便减小它的单位响度和目标单位响度之间的差值。
4.一种用于控制音频信号的部分单位响度的方法,其中单位响度是作为频率和时间的函数的感觉响度的度量以及信号的部分单位响度是作为频率和时间的函数的在存在次干扰信号时该信号的感觉响度的度量,该方法包括修改所述音频信号以便减小它的部分单位响度和目标单位响度之间的差值。
5.根据权利要求1-4中任何一个所述的方法,其中所述修改或导出从传输接收或从存储媒体再现音频和目标单位响度或目标单位响度的表示。
6.根据权利要求3或4所述的方法,其中所述修改根据修改参数修改所述音频信号以提供经修改的音频信号以及所述修改从传输接收或从存储媒体再现音频和修改参数。
7.根据权利要求3或4所述的方法,其中所述修改包括产生修改参数。
8.根据权利要求1-7中任何一个所述的方法,其中所述目标单位响度不是音频信号的函数。
9.根据权利要求8所述的方法,其中所述修改或所述导出包括存储目标单位响度。
10.根据权利要求8所述的方法,其中所述修改或所述导出包括从本方法的外部来源接收目标单位响度。
11.根据权利要求8-10中任何一个所述的方法,其中所述修改或所述导出包括显式计算单位响度和/或部分单位响度的处理。
12.根据权利要求8-10中任何一个所述的方法,其中所述修改或所述导出包括隐式计算单位响度和/或部分单位响度的处理。
13.根据权利要求12所述的方法,其中所述处理应用查询表以便该处理固有地确定单位响度和/或部分单位响度。
14.根据权利要求12所述的方法,其中以所述处理应用的封闭式数学表达式固有地确定单位响度和/或部分单位响度。
15.根据权利要求8-14中任何一个所述的方法,其中所述目标单位响度是时间和频率恒定的。
16.根据权利要求8-14中任何一个所述的方法,其中所述目标单位响度是时间恒定的。
17.一种用于处理音频信号的方法,包括根据一个或更多处理以及一个或更多处理控制参数来处理音频信号或音频信号的度量以产生目标单位响度,其中单位响度是作为频率和时间的函数的音频信号的感觉响度的度量。
18.根据权利要求1-7和17中任何一个所述的方法,其中所述目标单位响度是音频信号或音频信号度量的函数。
19.根据权利要求18所述的方法,其中所述音频信号的度量是音频信号的单位响度。
20.根据权利要求18或19所述的方法,其中音频信号或音频信号度量的函数是音频信号或音频信号度量的一个或更多定标。
21.根据权利要求20所述的方法,其中所述一个或更多定标包括如在以下关系中定标单位响度的时间和频率变化的定标因子Ξ[b,t]N^[b,t]=Ξ[b,t]N[b,t],]]>其中, 是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。
22.根据权利要求21所述的方法,其中至少部分地通过想要的多频带响度和音频信号的多频带响度之比确定所述定标。
23.根据权利要求22所述的方法,其中所述定标可以如在以下关系中被表示为Lo[b,t]/Li[b,t]N^[b,t]=Lo[b,t]Li[b,t]N[b,t],]]>其中,N[b,t]是音频信号的单位响度,Lo[b,t]是想要的多频带响度,Li[b,t]是音频信号的多频带响度,以及 是目标单位响度。
24.根据权利要求23所述的方法,其中Lo[b,t]是Li[b,t]的函数。
25.根据权利要求24所述的方法,其中作为Li[b,t]的函数的Lo[b,t]可以被表示为Lo[b,t]=DRC{Li[b,t]},其中,DRC{}指示将Li[b,t]映射到Lo[b,t]的动态范围函数。
26.根据权利要求23所述的方法,其中Li[b,t]是音频信号的单位响度的时间平滑和/或频率平滑的型式。
27.根据权利要求22-26中任何一个所述的方法,其中该方法可用作动态范围控制,在该控制中产生所述修改或所述修改参数的应用或所述目标单位响度对应于音频信号,对于单位响度定标的不同值来说感觉的音频频谱或在存在干扰信号时所述感觉的音频频谱是不同的。
28.根据权利要求27所述的方法,其中所述动态范围函数控制每个频带中的响度从而应用于每个频带的短期变化在频带之间独立地变化,而应用于每个频带的平均变化对于所有频带基本上是相同的。
29.根据权利要求28所述的方法,其中作为Li[b,t]的函数的Lo[b,t]可以被表示为Lo[b,t]=L‾i[b,t]L‾i[t]DRC{L‾i[t]L‾i[b,t]Li[b,t]}]]>其中,Lo[t]=DRC{Li[t]}表示音频信号总响度到想要的总响度的映射,Li[t]表示音频信号宽带响度Li[t]的时间平均型式,以及Li[b,t]表示音频信号的多频带响度Li[b,t]的时间平均型式。
30.根据权利要求28或29所述的方法,其中该方法可用作动态范围控制,在该控制中产生所述修改或所述修改参数的应用或所述目标单位响度对应于音频信号,其中对于单位响度定标的不同值来说,感觉的音频频谱或在干扰信号存在时感觉的音频频谱基本上和所述音频信号的感觉音频频谱保持相同。
31.根据权利要求21所述的方法,其中通过想要的频谱形状和音频信号的频谱形状的度量之比定标所述单位响度。
32.根据权利要求31所述的方法,其中该方法将音频信号的感觉频谱从时间变化的感觉频谱变换成基本上时间恒定的感觉频谱。
33.根据权利要求31或32所述的方法,其中所述定标可以在以下关系中被表示为(L‾[b,t]L‾EQ[b,t])1-βL‾EQ[b,t]L‾[b,t]:]]>N^[b,t]=(L‾[b,t]L‾EQ[b,t])1-βL‾EQ[b,t]L‾[b,t]N[b,t],]]>以及其中,L[b,t]是音频信号的时间平滑的多频带响度,LEQ[b,t]是想要的频谱EQ[b],其被规格化成和多频带响度L[b,t]具有相同的宽带响度,从而可以将LEQ[b,t]表示为L‾EQ[b,t]=(ΣcL‾[c,t]ΣcEQ[c])EQ[b]]]>其中,N[b,t]是音频信号的单位响度, 是目标单位响度,以及β是具有通过并包括零和一所限制范围的参数,所述参数控制定标的等级。
34.根据权利要求33所述的方法,其中通过本方法的外部来源选择或控制参数β。
35.根据权利要求34所述的方法,其中所述来源是本方法的用户。
36.根据权利要求31到35中任何一个所述的方法,其中该方法可用作动态均衡器,在该均衡器中产生所述修改或所述修改参数的应用或所述目标单位响度对应于音频信号,其中对于单位响度定标的不同值来说感觉的音频频谱或在干扰信号存在时感觉的音频频谱可以是不同的。
37.根据权利要求21-36中任何一个所述的方法,其中通过将音频划分成临界频带以及在临界频带之一上进行频率平滑来近似音频信号的多频带响度。
38.根据权利要求37所述的方法,其中在特定的频带b,多频带响度的频带平滑型式L[b,t]可以表示为在所有频带c上的卷积和L[b,t]=ΣcQ(b-c)N[c,t],]]>其中,N[c,t]是音频信号的单位响度以及Q(b-c)是平滑滤波器的频带位移响应。
39.根据权利要求20所述的方法,其中一个或更多定标包括如在以下关系中定标单位响度的时间变化、频率恒定的定标因子Φ[t]N^[b,t]=Φ[t]N[b,t],]]>其中, 是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。
40.根据权利要求39所述的方法,其中至少部分地通过想要的宽带响度和音频信号的宽带响度之比确定所述定标。
41.根据权利要求39或40所述的方法,其中音频信号的单位响度函数中的所述定标可以如在以下关系中被表示为Lo[t]/Li[t]N^[b,t]=Lo[t]Li[t]N[b,t],]]>其中,N[b,t]是音频信号的单位响度,Lo[t]是想要的宽带响度,Li[t]是音频信号的宽带响度,以及 是目标单位响度。
42.根据权利要求41所述的方法,其中Lo[t]是Li[t]的函数。
43.根据权利要求42所述的方法,其中作为Li[t]的函数的Lo[t]可以被表示为Lo[t]=DRC{Li[t]}其中,DRC{}指示将Li[t]映射到Lo[t]的动态范围函数。
44.根据权利要求41所述的方法,其中Li[t]是音频信号总响度的时间平滑型式。
45.根据权利要求41所述的方法,其中Li[t]是音频信号的长期响度的度量。
46.根据权利要求41所述的方法,其中Li[t]是音频信号的短期响度的度量。
47.根据权利要求39-46中任何一个所述的方法,其中该方法可用作自动增益控制或动态范围控制,在该控制中产生所述修改或所述修改参数的应用以及所述目标单位响度对应于音频信号,其中对于单位响度定标或部分单位响度定标的不同值来说,感觉的音频频谱或在干扰信号存在时感觉的音频频谱基本上和音频信号的感觉音频频谱保持相同。
48.根据权利要求21-47中任何一个所述的方法,其中所述定标因子是音频信号或音频信号度量的函数。
49.根据权利要求20所述的方法,其中一个或更多定标包括如在以下关系中定标单位响度的时间恒定、频率变化的定标因子Θ[b]N^[b,t]=Θ[b]N[b,t],]]>其中, 是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。
50.根据权利要求49所述的方法,其中所述修改或所述导出包括存储定标因子Θ[b]。
51.根据权利要求49所述的方法,其中从本方法的外部来源接收定标因子Θ[b]。
52.根据权利要求20所述的方法,其中所述一个或更多定标包括如在以下关系中定标音频信号的单位响度的时间恒定、频率恒定的定标因子αN^[b,t]=αN[b,t],]]>其中, 是目标单位响度,N[b,t]是音频信号的单位响度,b是频率的度量,以及t是时间的度量。
53.根据权利要求52所述的方法,其中所述修改或所述导出包括存储定标因子α。
54.根据权利要求52所述的方法,其中从本方法的外部来源接收所述定标因子α。
55.根据权利要求49-54中任何一个所述的方法,其中该方法可用作音量控制,在该控制中产生所述修改或所述修改参数的应用或所述目标单位响度对应于音频信号,其中对于单位响度或部分单位响度定标的不同值,感觉的音频频谱或在存在干扰信号时感觉的音频频谱基本上与音频信号的感觉音频频谱保持相同。
56.根据权利要求49-55中任何一个所述的方法,其中所述定标因子不是音频信号或音频信号度量的函数。
57.根据权利要求1-56中任何一个所述的方法,其中所述修改、所述导出、或产生显式地计算(1)单位响度,和/或(2)部分单位响度,和/或目标单位响度。
58.根据权利要求1-56中任何一个所述的方法,其中所述修改、所述导出、或产生隐式地计算(1)单位响度,和/或(2)部分单位响度,和/或目标单位响度。
59.根据权利要求58所述的方法,其中所述修改、所述导出、或所述产生应用查询表,该查询表固有地确定(1)单位响度,和/或(2)部分单位响度,和/或目标单位响度。
60.根据权利要求58所述的方法,其中所述修改、所述导出、或所述产生应用封闭式数学表达式,该表达式固有地确定(1)单位响度,和/或(2)部分单位响度,和/或目标单位响度。
61.根据权利要求1、2、7中任何一个以及从属于权利要求1、2或7的权利要求8-16以及18-60中任何一个所述的方法,其中所述修改或导出(1)发送和接收或(2)存储和再现音频信号和修改参数。
62.根据权利要求1、2、6、7中任何一个以及从属于权利要求1、2、6或7的权利要求8-16以及18-60中任何一个所述的方法,其中时间平滑所述修改参数。
63.根据权利要求62所述的方法,其中所述修改参数包括多个与音频信号的频带相关的幅度定标因子。
64.根据权利要求63所述的方法,其中多个幅度定标因子的至少一部分是时间变化的。
65.根据权利要求62所述的方法,其中所述修改参数包括用于控制一个或更多滤波器的多个滤波器系数。
66.根据权利要求65所述的方法,其中一个或更多滤波器中的至少一部分和所述滤波器系数中的至少一部分是时间变化的。
67.根据权利要求1-66中任何一个所述的方法,其中所述修改、所述导出、或所述产生取决于以下之一或更多干扰音频信号的度量,目标单位响度,根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度的估计,未经修改音频信号的单位响度,和根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度的近似。
68.根据权利要求1-4、7中任何一个以及从属于权利要求1-4或7的权利要求8-16和18-66中任何一个所述的方法,其中所述修改或所述导出至少部分根据以下之一或更多导出修改参数干扰音频信号的度量,目标单位响度,根据经修改音频信号的单位响度或部分单位响度导出的未经修改音频信号的单位响度的估计,未经修改音频信号的单位响度,和根据经修改音频信号的单位响度或部分单位响度导出的目标单位响度的近似。
69.根据权利要求68所述的方法,其中所述修改或所述导出至少部分根据以下导出修改参数(1)目标单位响度和根据经修改音频信号的单位响度导出的未经修改音频信号的单位响度的估计之一,以及(2)未经修改音频信号的单位响度和根据经修改音频信号的单位响度导出的目标单位响度的近似之一。
70.根据权利要求68所述的方法,其中所述修改或所述导出至少部分根据以下导出修改参数(1)干扰音频信号的度量,(2)目标单位响度和根据经修改音频信号的部分单位响度导出的未经修改音频信号的单位响度的估计之一,以及(3)未经修改音频信号的单位响度和根据经修改音频信号的部分单位响度导出的目标单位响度的近似之一。
71.根据权利要求69或70所述的方法,其中该方法应用前馈结构,其中根据音频信号导出单位响度以及从本方法的外部来源或当修改或导出包括存储目标单位响度时从存储接收目标单位响度。
72.根据权利要求69或70所述的方法,其中该方法应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及从本方法的外部来源或者当所述修改或导出包括存储目标单位响度时从存储接收目标单位响度。
73.根据权利要求69或70所述的方法,其中所述修改或导出包括显式或隐式地获得目标单位响度的一个或更多处理,其中的一个或更多处理显式或隐式地计算音频信号或音频信号度量的所述函数。
74.根据权利要求73所述的方法,其中该方法应用前馈结构,其中根据音频信号导出单位响度和目标单位响度,目标单位响度的导出应用音频信号或音频信号度量的所述函数。
75.根据权利要求73所述的方法,其中该方法应用混合前馈/反馈结构,其中根据经修改的音频信号导出目标单位响度的近似以及根据音频信号导出目标单位响度,目标单位响度的导出应用音频信号或音频信号度量的所述函数。
76.根据权利要求69或70所述的方法,其中所述修改或导出包括响应于经修改的音频信号显式或隐式地获得未经修改音频信号的单位响度估计的一个或更多处理,其中的一个或更多处理显式或隐式地计算音频信号或音频信号度量的所述函数的反函数。
77.根据权利要求76所述的方法,其中该方法应用反馈结构,其中根据经修改的音频信号导出未经修改音频信号的单位响度的估计以及目标单位响度的近似,使用所述音频信号或音频信号度量的所述函数的反函数计算单位响度的估计。
78.根据权利要求76所述的方法,其中该方法应用混合前馈/反馈结构,其中根据音频信号导出单位响度以及根据经修改的音频信号导出未经修改音频信号的单位响度估计,使用音频信号或音频信号度量的所述函数的反函数计算所述估计的导出。
79.根据权利要求1-4、17以及从属于1-4或17的权利要求18-78中任何一个所述的方法,其中所述修改或导出(1)发送和接收或(2)存储和再现音频信号和目标单位响度或目标单位响度的表示。
80.根据从属于权利要求20、21、39、49或52中任何一个的权利要求79所述的方法,其中目标单位响度的表示是定标音频信号或音频信号度量的一个或更多定标因子。
81.根据权利要求1、2、6和7以及从属于权利要求1、2、6或7的权利要求8-16和18-80中任何一个所述的方法,还包括应用所述修改参数于音频信号以产生经修改的音频信号。
82.根据权利要求1-4、17以及从属于权利要求1-4或17的权利要求18-78中任何一个所述的方法,还包括发送或存储音频信号和目标单位响度或目标单位响度的表示。
83.根据权利要求82所述的方法,还包括接收或再现发送的或存储的音频信号和目标单位响度或目标单位响度的表示。
84.根据权利要求83所述的方法,还包括响应于音频信号和目标单位响度或它的表示修改所述音频信号,以便减小音频信号的单位响度和所述目标单位响度之间的差值。
85.根据从属于权利要求20-60中任何一个的权利要求82-84中任何一个所述的方法,其中目标单位响度的表示是定标所述音频信号或音频信号度量的一个或更多定标因子。
86.根据权利要求1、2、7以及从属于权利要求1、2或7的权利要求18-60中任何一个所述的方法,还包括发送或存储音频信号和修改参数。
87.根据权利要求86所述的方法,还包括接收或再现发送的或存储的音频信号和修改参数。
88.根据权利要求87所述的方法,还包括响应于所述修改参数修改音频信号。
89.一种适于执行权利要求1到88中任何一个所述的方法的设备。
全文摘要
本发明涉及音频信号的感觉声音响度和/或感觉频谱平衡的测量和控制。响应于至少部分在感觉(心理声学)响度域中执行的计算修改音频信号。本发明可用于例如以下之一或更多响度补偿音量控制、自动增益控制、动态范围控制(包括例如限幅器、压缩器、扩展器等等)、动态均衡、以及补偿音频重放环境中的背景噪声。本发明不仅包括方法而且还包括相应的计算机程序和设备。
文档编号H03G9/14GK101048935SQ200580036760
公开日2007年10月3日 申请日期2005年10月25日 优先权日2004年10月26日
发明者阿伦·J.·西非尔特 申请人:杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1