慢级和快级中的音频限峰的制作方法

文档序号:7512611阅读:192来源:国知局
专利名称:慢级和快级中的音频限峰的制作方法
技术领域
本发明总地涉及音频数字信号处理和音频限峰。更具体地,本发 明涉及音频信号的可变增益减小以使音频信号限于阔值。
背景技术
音频限峰是50年来音频制作、传输和再现的基本部分。如图1 所示,作为最基本的形式,音频限峰器提供的输入到输出信号电平特 性满足输出电压等于输入电压,直到限峰阈值。对于振幅大于阈值 的输入音频信号,输出音频信号电平被约束(限制)为不超过阈值。 关于其它音频动态增益控制系统,修改增益的方法对引入到输出音频 信号中的伪像(artifact)的性质和可听性具有显著的影响。
在音频限峰的最早用途之一中,音频限峰控制音频信号振幅以防 止无线电广播期间的过调制。现今,音频限峰仍常用来防止电台和电 视广播中的过调制。
音频限峰也是唱片母版制作的重要部分。唱片母版制作涉及在唱 片母盘中切割出表示音频波形的凹槽的车床。在这种情况下,限峰约 束音频的振幅,从而限制唱片的凹槽的宽度和深度,以使它们限于留 声机介质的物理极限内。
随着数字音频技术的到来,使用限峰的音频振幅控制在记录和再 现期间仍然很重要。在将模拟转换为数字的数字音频记录期间,如果 输入模拟音频信号超过与数字系统能够表示的最大数字音频采样对 应的输入信号电平(0dBFS),则得到的音频的记录数字表示将被剪 切。这是由于大于0 dBFS的模拟音频信号电平最多可用0 dBFS表示。 类似地,如果在数字域中没有缩放地混合多个数字音频信号,则在播 放期间,音频数据之和可能超过OdBFS,即在数模转换期间可表示的
8最大数字信号。结果为被剪切的输出模拟波形。
图2中显示了表示数字记录和再现二者的剪切的典型例子。随着 现代多声道音频格式(诸如Dolby Digital 5.1和MLP)和用于缩混 (downmix)在立体声或单声道兼容系统上播放的多声道素材的再现系 统的出现,多个数字音频信号的混合变得非常普遍。
最近,在母版制作数字音频素材(即,CD和DVD音频)中, 为了允许音频的电平(因而,视在响度)增加而不超过用户定义的峰 电平(例如,-O.ldBFS或0dBFS ),限峰算法是标准的。随着产生越 来越大声的音频表示的需求增长,这种做法变得日益普遍。
可在完整的全带宽信号上执行音频限峰,或者以多带方式执行音 频限峰,即对完全不同的音频带执行各自的限峰操作。对于多带限峰, 在限峰之后将分别处理的频带相加以重新产生合成信号。
通常,当偏好于音频频谱和音色的最小改变时,诸如对于音乐母 版制作,使用多带限峰。多带限峰通常用于实现大量的限峰,但是具 有显著改变音频的频语特性和感知音色的可能性。多带限峰的用途包 括FM无线电传输,其中电台希望具有非常大声的感知声音电平,同 时具有唯一的"声音,,——通过多带限峰器的设置来指定。
音乐母版制作中的限峰典型地要求0-约20 dB之间的增益减 小。如在DVD播放器和家庭影院接收机中进行的,将5声道环绕声 音频信号缩混到2声道立体声信号要求达到9dB的增益减小——其 中,例如,对于5声道环绕声信号来说,立体声左声道为左声道、左 环绕声和减小3dB的中央声道之和。
典型地,对于0-12dB的增益减小,可实现几乎听不到的限峰, 存在在此范围内性能很好的一些商业产品。需要大于约12dB的增益 减小的限峰可变得完全听得到,在这个讨论中,认为大于约12dB的 增益减小为相当大或显著的。

发明内容
这里教导了用于限制音频信号的绝对幅度的方法和设备。该方法
9可包括第一可变增益地减小音频信号的增益;然后,比第一可变增 益减小更快地第二可变增益地减小音频信号的增益,从而将音频信号 的绝对幅度限制到阈值。第一可变增益减小可包括在第一级中可变增 益地减小音频信号的增益,第二可变增益减小可包括在第二级中可变 增益地减小音频信号的增益,第二级比第一级更快地减小增益。
第一可变增益减小可包括检测音频信号中超过阈值的偏移,使用
检测到的偏移计算慢增益和将慢增益应用于音频信号。
第二可变增益减小可包括延迟音频信号,查找延迟的音频信号中
的峰、利用找到的峰计算快增益和用计算出的快增益修改延迟的音频 信号。延迟步骤可包括对音频信号进行緩冲,查找步骤可包括检查緩 冲的音频信号。各虛像的视在方向和各个矩阵编码的音频信号的方向 可被保持。第二可变增益减小可产生比如以上构成的除了没有延迟之 外的方法更少听得到的频谱飞溅。緩冲步骤可包括为第二可变增益减 小提供有限的时间量来滑动以遇到超过阈值的峰。延迟步骤可包括至 少lms的延迟,可包括约1.5ms的延迟。查找峰的步骤可包括确定在 延迟的音频信号的各时间段中的最大值,延迟音频信号最大值和基于 延迟的最大值计算用于减小音频信号的增益的控制信号。
上面第一次提及的延迟步骤可与接下来记载的延迟步骤相匹配。
计算步骤可包括利用延迟的最大值的低通滤波的函数来计算控制信 号。计算步骤可包括利用加权平均后的延迟的最大值的函数来计算控 制信号。
计算步骤可包括使用滤波系数,所述系数是Hamiing窗的平方 根的函数。该使用步骤可包括将Hanning窗的大小调整为与延迟緩冲 器的长度相同。
计算步骤可包括使用加权值,所述加权值是Hanning窗的平方 根的函数。该使用步骤可包括将Hanning窗的大小调整为与延迟緩冲 器的长度相同。
快增益的计算可包括基本上颠倒查找峰的步骤所包括的确定、 延迟和计算步骤。快增益的计算可包括快增益被计算为等于l加上计算出的用于减小增益的控制信号之和的倒数。
快增益的计算可包括利用Newton-Rhapson逼近法计算快增益。
计算可包括利用收敛减慢的Newton-Rhapson逼近法来计算。计算可
包括利用收敛速度S被限制为满足 1 1
的减'艮Newton-Rhapson逼近法来计算
计算可包括利用收敛速度S约为0.3的减慢Newton-Rhapson逼
近法来计算。
这里还教导了一种包含用于执行以上方法之一的计算机程序的 计算机可读介质。
这里还教导了 一种包括CPU、计算机可读介质之一和耦合CPU 和介质的总线的计算机系统。
这里还教导了一种音频限峰器。该限峰器可包括第一可变增益 减小器,用于可变增益地减小音频信号的增益;和第二可变增益减小 器,用于比第一可变增益减小更快地进一步可变增益地减小音频信号 的增益,从而将音频信号的绝对幅度限制到阈值。
第一可变增益减小器可包括对音频信号的增益进行可变增益减
小的第一级,第二可变增益减小器可包括对音频信号的增益进行可变
增益减小的第二级,第二级比第一级更快地减小增益。
第一可变增益减小器可包括延迟音频信号的延迟部分;查找延
迟的音频信号内的峰的峰查找器;快增益计算器,利用找到的峰计算 快增益减小;和修改器,用计算出的快增益修改延迟的音频信号。
延迟部分可包括緩冲器,峰查找器可包括緩冲的音频信号的检查 器。各虚像的视在方向和各矩阵编码的音频信号的方向可被保持。第 二可变增益减小可产生比如上的除了没有延迟部分之外的限峰器更 少听得到的频镨飞溅。延迟部分可包括至少lms的延迟,可包括约 1.5ms的延迟。峰查找器可包括用于确定延迟的音频信号的各时间 段中的最大值的差引擎;延迟緩冲器,用于延迟音频信号最大值;和 计算器,基于延迟的最大值来计算用于减小音频信号的增益的控制信号。
峰查找器的延迟緩冲器可匹配限峰器的延迟部分。计算器可包括 利用延迟最大值的低通滤波的函数来计算控制信号的计算器。计算器 可包括利用加权平均后的延迟的最大值的函数来计算控制信号的计 算器。
滤波系数可以是Hanning窗的平方根的函数。Hanning窗的长 度可与延迟緩冲器相同。
加权值可以是Hanning窗的平方根的函数。Hanning窗的长度 可与延迟緩冲器相同。
快增益计算器可包括通过将峰查找器的操作基本颠倒次序来计 算快增益减小的快增益计算器。快增益计算器可包括将快增益计算为 等于i和计算出的用于减小增益的控制信号之和的倒数的快增益计算器。
快增益计算器可包括用于计算快增益的快增益计算器。快增益计 算器可包括利用收敛减慢的Newton-Rhapson逼近法来计算的快增益
计算器。快增益计算器可包括利用收敛速度S被限制为满足
1 1 ,;《S*《(xe*a》-I)《?
的减慢Newton-Rhapson逼近法来计算的快增益计算器。
快增益计算器可包括利用收敛速度S约为0.3的减慢
Newton-Rhapson逼近法来计算的快增益计算器。
通过参考以下讨论和附图,可更好地理解本发明及其优选实施例
的各个特征。


图1总结了典型的音频限峰器的操作,示出系统级的音频限峰 器,显示典型的具有任意阈值的音频限峰器的输入/输出电压特性,并 提供限峰处理之前和之后的音频信号的例子。
图2显示代表数字记录和再现的剪切的典型例子。 图3a示出根据本发明一个实施例的两级音频限峰器。
12图3b进一步详细示出根据本发明一个实施例的图3a的音频限峰器。
图4示出根据本发明一个实施例的几百个输入信号采样和偏移(excursion)检测器输出的对应的控制信号。
图5为根据本发明一个实施例的慢增益计算器的处理的示意图。
图6描绘根据本发明一个实施例的慢增益计算器304的伸缩(warping )函数。
图7示出根据本发明一个实施例的慢增益电路的RC模型的电阻值的更新。
图8对根据本发明一个实施例的慢增益计算器的RC电路建模。
图9描绘根据本发明 一个实施例的输出电阻器R自和先前的慢增益减小值之间以及输入电阻器Rin和超过限峰器阈值的连续输入音频釆样的数量之间的关系。
图IO详细示出根据本发明一个实施例的峰采样查找器。
图11显示与真实值重叠的、对几百个采样的逼近"Newton-Rhapson"估计的快增益减小值。
图12描绘根据本发明一个实施例的剪切3- 18dB的信号的快增益减小、以及更大的增益减小量与相应更高的频镨离散量的关系。
图13显示根据本发明的实施例计算得到的典型的44.1kHz数字音频内容在半秒内的限峰增益减小信号。
图14显示根据本发明的实施例计算得到的典型的44.1kHz数字音频内容在一秒半内的另 一限峰增益减小信号。
图15显示根据本发明实施例的限峰器的两级如何在大量的持续的剪切减小条件下工作。
图16为根据本发明一个实施例的慢峰采样查找器的处理的示意图。
具体实施例方式
图3a示出根据本发明一个实施例的两级音频限峰器102。限峰
13器102包括慢增益减小器202和快增益减小器204。慢增益减小器202接收阈值信号201和音频信号101作为输入,并生成中间音频信号203。快增益减小器204接收中间音频信号203以及阈值信号201作为输入,并生成音频信号103作为输出。
限峰器102如下操作慢增益减小器202利用输入信号101接收一个或多个音频声道,利用阈值信号201接收表示限峰器阈值的信号。音频声道的绝对峰可能超过限峰器阈值。
快增益减小器204输出信号103,即输入音频信号101的可能被限峰的音频声道。限峰器102将输入音频信号101中超过限峰器阈值的任何绝对峰都限制(增益减小)为不大于限峰器阈值。
根据本发明的一个实施例,输入音频信号101和输出音频信号103分别可以是线性PCM采样。阈值信号201可以是以dBFS为单位的值。于是,x表示输入音频信号101, M表示输入音频信号101中的输入声道的数量,在表示式x/附,/i/中,m为从0到M-l的声道索引,n为采样索引。
图3b进一步详述根据本发明的一个实施例的限峰器102。慢增益减小器202包括偏移/超过量检测器302、慢增益计算器304和乘法器306。偏移检测器302接收阈值信号201和音频信号101作为输入,并生成控制信号g/w/303作为输出。慢增益计算器304接收控制信号j2pi/303作为输入,并生成当前慢增益值G^,/"/信号305作为输出。乘法器306接收输入音频信号101和当前慢增益值Gkow/"/信号305作为输入,并生成增益减小的音频信号JC,/柳,"/307作为输出。
快增益减小器204包括快增益计算器312、峰采样查找器311、延迟308和乘法器315。延迟308接收增益减小的音频信号;c,/附,w/ 307作为输入,并生成延迟的增益减小的音频信号JC"/w,w/314作为输出。延迟308还使其延迟的音频信号的完整緩冲可用作信号309。峰采样查找器310接收延迟緩沖信号309和阈值信号201作为输入,并生成控制信号,Ai/ 311作为输出。快增益计算器312接收控制信号311作为输入,并生成快增益减小值GFM7/w/ 313作为输出。乘法器
14315接收快增益减小值(^ast//1/ 313和延迟的增益减小的音频信号 x"/m,w/ 314作为输入,并生成最终的增益减小的釆样x",/w,"/ 103 作为输出。
在慢增益减小器202和快增益减小器204的每次迭代操作中,对 来自每个输入声道的一个采样进行处理,计算单个慢增益减小值和单 个快增益减小值,并将二者应用于所有声道。由于所有声道接受相同 的慢增益减小和快增益减小,所以虛像的碎见在方向和矩阵编码的音频 信号的方向被保持。
检测偏移(检测超过限峰器阈值的音频)
当输入音频信号101的所有M个声道上的最大绝对采样不大于 限峰器阈值T时,偏移检测器302将控制信号^/"/303设置为0。当 所有M个声道上的最大绝对采样超过限峰器阈值T时,偏移检测器 302将控制信号设置为与输入信号超过限峰器阈值T的程度 成比例的信号。
因而,仅当输入信号101超过限峰器阈值T时,慢增益减小器 202才减小输入音频信号101以输出中间音频信号307。
因而,在生成中间音频信号307时,当输入音频信号IOI超过限 峰器阈值T时,慢增益减小器202响应——但是,在音频信号303下 降到阈值T以下之后,可继续减小增益。
在一个实施例中,如果输入信号的所有M个声道上的最大绝对 采样大于限峰器阈值T,则将控制信号^/"/^:置为最大绝对采样与阅 值T之比减1。方程(l)详述这个实施例。<formula>formula see original document page 15</formula>
图4根据本发明的一个实施例示出输入信号的几百个采样和对 应的控制信号j2/w/303。输入信号为具有-3 dB峰振幅的500Hz的数字正弦波,限峰器阈值T为0.5或-6.02 dB。如图4所示,对于每个 输入的PCM采样计算控制信号g/"/303采样值。
(为了减小计算复杂性,不采用所显示的除法操作,而是乘以 1/T即可实现g/"/的计算)。
计算慢增益
图5是根据本发明的一个实施例的慢增益计算器304的处理的示 意图。接收控制信号和前一慢增益值Gko^/"-J/305作为输 入,慢增益计算器304修改控制信号303 (步骤601),对修改 后的控制信号602进行平滑处理(步骤603 ),并且根据经过平滑处 理的、修改后的控制信号604计算当前慢增益值G^^/"/ 305 (步骤 605)。
在一个实施例中,平滑步骤603包含信号相关的发起(attack)和 释放(release)特性。
修改控制信号
慢增益计算器304用前一慢增益值G^o^"-7/修改(伸缩)控制 信号2/"/ 303以产生修改的控制信号g,/w/ 602。前一慢增益值 G^o^/w-J/被初始设置为单位值或1.0的值。
当增益减小已经为非单位值时——即,如果增益减小已经在被应 用,则该修改过程放大(增大)控制信号g/fi/303对增益减小量增大 的影响。有利的是,信号剪切(也就是说,将被剪切的偏移)的不频 繁发生对产生慢增益减小具有较小的影响,但快速连续的频繁发生导 致显著增多的增益减小。因而,对于不频繁的剪切发生,这一级几乎 不工作,并且避免了听得见的抽吸的可能性。
方程2a和2b显示根据本发明的一个实施例的伸缩操作,图6 描绘这个伸缩函数。通过大量的实验和测试确定方程2a和2b及图6 的伸缩操作。当前一慢增益值约为-6dB时,它的效果最突出(如可 从图6看出)。<formula>formula see original document page 17</formula>
对控制信号进行平滑
根据本发明的 一 个实施例,具有信号相关的发起时间和释放时间 的滤波器对修改后的控制信号g,/"/ 602进行平滑处理。这些信号相 关的技术使因应用增益减小而产生的听得见的伪像最小化,尤其是在 要求大量增益减小的情况下。
在一个实施例中,在压缩器/限峰器领域公知的模拟RC电路的 数字仿真对修改后的控制信号2,/"/ 602进行平滑处理。这里,改变 电阻值影响信号相关的发起和释放行为。
图8对根据本发明的一个实施例的这样的电路进行建模。为了简 化模型,假设二极管两端的电压降为零,并且在对电容器C充电期间 忽略输出电阻器R⑧t。 C的优选值为ljiF。图7示出根据本发明一个实施例的电阻值的更新。如果修改的控 制信号2,/ /602大于0——即,当前输入采样幅度超过限峰器阈值, 则采样剪切计数递增(步骤708),从而增加剪切时间长度的度量, 并输入电阻器Rin被计算为剪切时间长度的函数(步骤709)。此夕卜, 利用前一增益减小值G^o^/w-7/的函数来计算输出电阻器R。ut (步骤 709)。
如果修改的控制信号Q,[n]602不大于0 (步骤702)——即,当 前采样幅度不超过限峰器阈值——则将电阻器设置为默认值(步骤 705和706),并将采样剪切计数设置为0 (步骤704),从而使剪切 时间长度的度量复位。
通过用检测偏移的时间长度的函数来计算输入电阻Rin,平滑器 以频率相关的方式改变它的发起时间。剪切发生频率更短或更高导致 快的发起时间,剪切发生频率更长或更低导致逐渐变慢的发起时间。 这降低了较低频率内容上剧烈的增益波动的可能性,从而使听得到的 砰砰声最小化。对于听觉频率掩蔽更占优的、更短时间或更高频率的
(2a) (2b)剪切发生,可容忍快的增益减小的发起行为。
在图9中,曲线图"b)"描绘根据本发明一个实施例的输入电阻 Rin和超过限峰器阈值的连续输入音频釆样的数量之间的关系。用欧 姆表示电阻,用在44.1kHz的采样率下剪切的采样数量(剪切计数) 表示剪切持续时间。
图9b中的曲线图的形状从实验和听力测试获得。对于小于~ 13ms的剪切长度(44.1kHz下的600个采样),R化为非线性。对于
长于~ 13ms的剪切长度,Rh为线性——如方程5中
4 = 16,+2 J3 * (C争Dil - , (5)
其中,ClipCnt为44.1kHz下剪切的采样数量。
在低剪切时间长度下,Rin随着剪切时间增加而快速上升。在长 剪切时间长度下,Rin更慢地上升。较低的Rin值给予慢增益计算器304 更快的发起时间,较高的Rin值给予慢增益计算器304更慢的发起时 间。
通过用前一慢增益减小值的函数来计算输出电阻R。ut,慢增益计 算器304可与所使用的减小量成比例地改变它的释放行为。当使用很 小的增益减小时,更快的释放时间允许增益减小更快速地返回到单位 值。当使用大数量的增益减小时,释放时间增加以使听得到的抽吸伪 像最小化。这还意味着,当要求大的持续的增益减小量时,更慢的第 一级比更快的第二级产生更多的增益减小。这有助于使当应用大量增 益减小时笫二级可产生的听得到的频镨飞溅最小化。
(将音频乘以可变增益因子可被认为是振幅调制。这样,根据音 频的频语、可变增益因子的频语和增益变化的程度,运算引入可听得 到的额外的频语分量。这里,这些分量被称为"频谱飞賊"。)
在图9中,曲线图"a)"描绘才艮据本发明一个实施例的输出电阻 R。ut和前一慢增益减小值Gkow/w"/之间的关系。先前所使用的增益 减小的量越多,R。ut的值越低,从而,平滑电路的释放行为越快。
方程3计算输出电阻值
J 偶,-21950*(2墨^5加,《顆1〗) n、对于许多计算机和数字信号处理器(DSP),平方根的计算在计 算上昂贵。然而,在计算上更便宜的方法可逼近平方根函数。优选方 法为方程4中显示的"Newton Iteration"迭代平方根估计方程。
,胸誠,一幽,f,":"〗
在这个方程中,第k次迭代的平方根估计为先前的第k-l次估计 和正对其计算平方根的值——在这种情况下Gslow[ii-1
的函数。
正常情况下,要求多次迭代以获得单个相对精确的估计。然而, 由于慢增益减小值随时间相对慢地改变,所以执行一次迭代并使用前 一采样的平方根估计或慢增益减小计算就足够精确了。然而,这需要 单次除法运算,它在计算上可被容忍或者可用离散值的查找表代替 ——不过可能以精度为代价。
用建模的RC电路对控制信号进行平滑操作。如果控制信号2,/"/ 602大于源自前一计算2"/"-// 602的电容器电压,则如下所述,通
过Rin对电容器充电并通过R。ut ;改电。
0 —fl
及?C, (6a)
(6b)
否则,电容器只是通过R。ut放电,如下所示
0
(参数/s为以Hz为单位的采样率。)然后将平滑后的控制信号 g,Y"/ 604用于计算慢增益减小值。
由于在许多计算机和DSP上除法运算在计算上昂贵,所以可将
1/Rin和1/R。ut的值的使用范围作为离散值存储在查找表中。从方程6
和7的理想情况,这可以容忍,而没有控制信号(g,,/w/604的听得见 的变化。
19计算慢增益值
方程l之后,慢增益减小值将典型地为经过调节和平滑的控制信
号g"/"/604的倒数的函数。方程8显示这一关系
然而,由于平滑特性且在大量实验之后,优选函数具有如方程9 所示的减法形式。
(常数s具有1.65的值)
尽管优选这个函数,但是它在理论上可导致对于控制信号^"/"/ 604的大值的负增益。为了实现的目的,在所要求的增益减小的典型 量小于20dB的地方,平滑确保慢增益减小总是大于零。
最后,乘法器306将慢增益减小值C7^cw/fi/305乘以来自每个输 入声道m的PCM采样以产生增益减小的采样x,/zw,"/307。
jc'[w,w] = x[m,"]*GSiCW[>],对于所有w (10)
快增益减小 延迟
慢增益减小的采样jc,/m,zi/307穿过延迟308。这为快增益减小器 204提供前瞻(look-ahead),从而快增益减小器204可知道超过限 峰器阈值的偏移将在什么时候发生,并可计算确保输出音频信号不超 过阈值的快增益减小。与没有前瞻的限峰器相比,前瞻允许用于快增 益减小的有限时间量滑过(slew)以遇到超过限峰器阈值的偏移,因 此减小因增益轨迹产生的听得见的频谱飞溅量。
延迟308的一个实施例为延迟线,更具体地讲,具有约1.5ms 的前瞻或者在44.1kHz的采样率下N=66个采样的延迟线308。延迟 线308可以是先入先出(FIFO )緩冲器,输出为音频采样信号x"/附,w/ 314。在多于一个声道存在的情况下,每个声道m被延迟相同数量的 采样。
20关于延迟308的长度,更长的增益变化是期望的。然而,在一个 实施例中,更高的目标是保持尽可能低的等待时间。实验表明,快于 lms的增益变化可以是完全听得到的,而且令人厌烦的。约1.5ms的 前瞻为好的折衷。
在以下描述中假设用延迟线实现延迟308 。
查找峰采样
图10详述根据本发明一个实施例的峰采样查找器310。在这个 实施例中,峰釆样查找器包括用于存储滤波器系数的存储器1004、 CPU 1003或其它计算装置1003、延迟緩冲器1002以及比较器和差引 擎IOOI。(当然,CPU 1003或其它计算装置1003可与比较器和差引 擎1001相同)。
比较器和差引擎1001接收延迟308的延迟緩沖信号309作为输 入,并输出中间控制信号。延迟緩冲器1002接收中间控制信号作为 输入,并将其緩冲器的内容产生为输出。计算装置1003接收延迟緩 冲器1002的内容和存储器1004的内容作为输入,并输出控制信号 311。
峰采样查找器310找到在定义的时间长度上的峰值并保存该峰 值。它取出延迟308的输出309,并产生控制信号iP,/w/311, Py /311 为在延迟308的内容中(这里,在整个延迟线308的长度上,实际上 为之前的 1.5ms)超过限峰器阈值T的最大采样值的函数。
图16是根据本发明一个实施例的峰采样查找器310的处理1600 的示意图。对于每个输入采样,峰采样查找器310找到在延迟线308 的长度上且在所有m个声道上的最大绝对值(步骤1605)。它310 然后将最大绝对值除以限峰器阔值T,并减去1,以产生中间控制信 号(步骤1610 )。(如方程(1)中,乘以1/T可有效地实现除 以T。)
21<formula>formula see original document page 22</formula>这个中间控制信号iy"/穿过FIFO延迟线或延迟緩沖器1002, 延迟緩冲器1002具有与延迟线308相同的长度(步骤1615)。
峰采样查找器310然后利用经过低通滤波或加权平均的中间控 制信号/Y"/计算输出控制信号311 (步骤1620 )。延迟线1002 用于第(N-1)阶滤波或平均。
峰采样查找器310利用长度N的Hanning窗(与延迟緩冲器1002 相同的长度)的平方根来计算优选的滤波器系数或加权值1004。
经验上,这些产生最小的听得到的伪像。

严〖"〗* £ £>《1一 *邵]

m) (12a)
其中,
" (12b)
其中,
F/| = ^/Aw"iwgL/〗,forO< /<W-l (12c)
方程12b中的规范化步骤确保滤波器系数H[i] 1004之和为单位
值,
计算快增益
在一个实施例中,快增益减小值为1加上平滑后的峰控制信号 311的倒数。这本质上为方程11中的峰采样查找运算的逆。参 见方程13:
(13)由于两个延迟线308和1002的长度相同,所以在从延迟线308 出现峰采样的同时,方程13中的快增益减小值达到将绝对峰减小到 限峰器阈值T的水平所需的值。偶数延迟长度N导致从音频信号307 直到控制信号311和对应的快增益减小值C^^t/"/的整数采样群 延迟。
如前所述,由于在许多计算机和DSP上除法运算可能在计算上 昂贵,所以用于在方程13中计算快增益减小值的基于非除法的方法 将是有利的。然而,包含离散值的查找表的使用需要较大的存储器来 保证精度,并避免因粗取值的查找表引起的寄生频谱飞溅。
一种替换方法是使用"Newton-Rhapson"迭代估计方程逼近快增 益减小值。"Newton-Rhapson,,估计迭代地对以下形式的方程求解
/") = 0 (14)
公知的"Newton-Rhapson"迭代逼近法使用x的初始估计值或者 i兌xo,并计算x的更新值或者说x!。 4吏用"Newton-Rhapson,,逼近方程 对初始值和更新值进行运算
■/fa)
A — & — 7771
其中,/r力表示方程14、 15和16中显示的函数,/Y》为该函数 的导数。
对于我们试图求解的快增益减小值方程13, GV^7/"/W的值因而 方程13采取以下的一般形式
—1 — !
—1 + P關fl (15)
那么,"Newton-Rhapson"逼近法以方程14的形式对方程15进 行求解
(16)
其中,a-(l+户,/w/)。对于我们尝试在方程16中求解的方程,方 程17的"Newton-Rhapson,,逼近法采取以下形式fl (18)
然而,这种形式仍要求除以a,没有效率地执行方程15。但是, 对于快增益减小计算,我们可借用以下事实1/a近似Xo。在假设这个 近似的情况下,方程18采取以下形式
给出"Newton-Rhapson,,方法
Xj =*(i ((^ (20) 这个逼近法以每次计算迭代双倍精度的小数位的数值非常快速 地收敛到x值。
为了使逼近法的计算成本保持低,低如单次迭代中的有用收敛是 期望的。然而,对于单次迭代,方程20在采样之间表现出不期望的 波动。可使迭代的收敛变慢以提供引入更少伪像的解决方案。如果收 敛速度项S,皮应用于方程20,则该方程采取以下形式
^-:0*(14*((:0*"),) (21)
其中,S=l指示完全的"Newton-Rhapson", S=0.001意味着有意 非常慢地收敛的方法。实际上,避免方程21不期望的收敛行为需要 正确地选择S的值。例如,优选地,由于这个表达式的更大的值可引
起收敛中的"过度反应",所以S为这样的值
1 1
2 2 (22) 应用在GpAST[n
计算中使用的控制参数,方程21采取以下形式,
G雕W = C 赚〖"〗*(1 -0.3*((l + ,〗)*< 匿〖《+1)) (23)
在这个方程中,快增益减小值G/r^j/w/为来自前一时间采样n-l 的前一值和方程的输入值——在这种情况下,/w/的函数。如前所述, 精确的估计典型地需要多次迭代。然而,在这种方法中,緩慢地使快 增益减小值Gf^;r/w/滑向期望的1/(l+x)值的单次迭代导致比更精确的 估计、甚至准确的计算更少的听得到的伪像。听力实验发现,S=0.3的值提供具有音频中的最小听得到的伪像的非常好的结果。图11显
示与使用方程13计算的真实值重叠的对几百个采样的逼近 "Newton-Rhapson" F"WGfl/"(快增益)值的例子。
最后,快增益减小值G/^t/"/313与从延迟线308输出的前一个 增益减小的采样x7w,/i/的相乘产生最后的增益减小的采样x"/附,w/
103 (步骤1625)。
x"[m,"] = x'[w,"]*GF^r["],对于所有m (24)
在图12中,曲线图"a)"描绘根据本发明一个实施例的关于剪切3 -18dB的信号的快增益减小。剪切进行约1.5ms,曲线图显示前瞻如 何预计剪切发生。更大的增益减小量导致更高速率的增益变化,对应 地,图12的曲线图"b),,中显示的更高的频镨分散量。然而,由于首先, 慢增益减小级在该增益减小级之前,所以快级不必提供如单独使用那 么多的增益减小,因而,听得到的频谱分散被最小化。图15中显示 这的例子,以下进一步讨论这。
在图12中,曲线图"b)"显示由于在峰平滑中使用FIR滤波器 而导致的频谱分散中的波紋。IIR滤波器可去除波紋,但是,平滑器 中得到的随频率变化的群延迟将不保证音频信号精确地减小到限峰 器阅值的水平。快增益减小值可能下降得太早或太晚以至于不能遇到 需要增益减小的采样,将不会精确地达到要求的增益值。
性能
图13显示利用本发明的实施例计算得到的半秒的典型的 44.1kHz数字音频内容的限峰增益减小信号。在显示的例子中,限峰 器阈值T为0.5或-6dB。示意图的下半部显示输入的PCM信号(语 音)的绝对振幅,示意图的上半部显示合成的慢和快增益减小信号。 在图13中,慢增益分量提供(在附图的整个宽度上)最小的、緩慢 变化的增益减小信号,而快增益分量对于超过限峰器阈值的短期信号 分量提供更显著的增益减小。
图14显示利用本发明的实施例计算得到的一秒半的典型的44.1kHz数字音频内容的另一限峰增益减小信号。在显示的例子中, 限峰器阈值为0.25或-12dB。在图14中,慢增益分量提供(在附图的 整个宽度上)适中量的、緩慢变化的增益减小信号,而快增益分量对 于超过限峰器阈值的短期信号分量提供临时的短期增益减小。由于图 像缩放,短期增益减小分量显现为垂直线,所以图14还放大了增益 减小信号的一部分,更详细地显示短期增益减小分量。图14中的短 期增益减小分量具有与图13类似的形状和持续时间。
图15显示根据本发明实施例的两级如何在大量的、持续的剪切 减小条件下工作。曲线图显示需要 10dB的持续增益减小的突发性定 调管信号的組合增益减小轨迹。在图15中,曲线图"a)"给出在约1 秒的时间间隔上增益减小的示意图。在图15中,曲线图"b)"显示约 0.2秒的非常精细的细节。在这个例子中,第一级的緩慢变化的增益 减小级提供约0.2或-14dB的大部分的增益减小,第二级的快动作的 增益减小级负责约土ldB的波动。
权利要求
1. 一种用于限制音频信号的绝对幅度的方法,该方法包括第一可变增益地减小音频信号的增益;以及然后,比所述第一可变增益减小更快地第二可变增益地减小所述音频信号的增益,从而将所述音频信号的绝对幅度限制到阈值。
2. 根据权利要求1所述的方法,其中所述第一可变增益减小包括在第一级中可变增益地减小所述音频信号的增益;并且其中所述 第二可变增益减小包括在第二级中可变增益地减小所述音频信号的增益,所述第二级比 所述第一级更快地减小增益。
3. 根据权利要求1或2所述的方法,其中所述第一可变增益减 小包括检测所述音频信号中超过所述阈值的偏移; 使用检测到的偏移来计算慢增益;以及 将所述慢增益应用于所述音频信号。
4. 根据权利要求3所述的方法,其中所述笫二可变增益减小包括延迟音频信号;查找延迟的音频信号中的峰;利用找到的峰计算快增益;以及利用计算出的快增益来修改所述延迟的音频信号。
5. 根据权利要求4所述的方法,其中所述延迟步骤包括 緩冲所述音频信号;并且其中,所述查找步骤包括 检查緩冲的音频信号。
6. 根据权利要求4所述的方法,其中各虚像的视在方向和各矩阵编码的音频信号的方向被保持。
7. 根据权利要求4所述的方法,其中所述第二可变增益减小与 按权利要求4来构建、但缺少所述延迟步骤的方法相比,产生更少的听得到的频谱飞溅。
8. 根据权利要求4所述的方法,其中所述緩冲步骤包括为所述第二可变增益减小提供有限的时间量来滑动以遇到超过 所述阈值的峰。
9. 根据权利要求4所述的方法,其中所述延迟步骤包括 延迟至少1 ms。
10. 根据权利要求9所述的方法,其中所述延迟步骤包括 延迟约1.5 ms。
11. 根据权利要求4所述的方法,其中查找峰的步骤包括 确定在所述延迟的音频信号的各时间段中的最大值; 延迟所述音频信号最大值;以及基于延迟的最大值来计算用于减小所述音频信号的增益的控制信号。
12. 根据权利要求11所述的方法,其中在权利要求11中首次记 载的延迟步骤与在权利要求4中首次记载的延迟步骤匹配。
13. 根据权利要求ll所述的方法,其中所述计算步骤包括 利用所述延迟的最大值的低通滤波的函数来计算所述控制信号。
14. 根据权利要求ll所述的方法,其中所述计算步骤包括 利用加权平均后的所述延迟的最大值的函数来计算所述控制信号。
15. 根据权利要求13所述的方法,其中所述计算步骤包括 使用所述滤波的系数,所述系数是Hanning窗的平方根的函数。
16. 根据权利要求15所述的方法,其中所述使用步骤包括 裁剪所述Haiming窗的长度,使其与延迟緩冲器的长度相同。
17. 根据权利要求14所述的方法,其中所述计算步骤包括 使用加权值,所述加权值是Hanning窗的平方根的函数。
18. 根据权利要求17所述的方法,其中所述使用步骤包括 裁剪所述Hanning窗的长度,使其与延迟緩沖器的长度相同。
19. 根据权利要求ll所述的方法,其中计算快增益的步骤包括: 基本上颠倒所述查找峰的步骤所包括的确定、延迟和计算步骤。
20. 根据权利要求ll所述的方法,其中计算快增益的步骤包括 计算所述快增益等于计算出的用于减小增益的控制信号加1之和的倒数。
21. 根据权利要求20所述的方法,其中计算快增益的步骤包括 利用Newton-Rhapson逼近法来计算所述快增益。
22. 根据权利要求21所述的方法,其中所述计算步骤包括 利用收敛减慢的Newton-Rhapson逼近法来计算。
23. 根据权利要求22所述的方法,其中所述计算步骤包括利用收敛速度S被限制为满足<formula>formula see original document page 4</formula>的减'匱Newton-Rhapson逼近法来计算。
24. 根据权利要求23所述的方法,其中所述计算步骤包括 利用收敛速度S约为0.3的减慢Newton-Rhapson逼近法来计算。
25. —种计算机可读介质,其包含用于执行如权利要求1或2所 述的方法的计算机程序。
26. —种计算机可读介质,其包含用于执行如权利要求1或3所 述的方法的计算机程序。
27. —种计算机系统,包括 CPU;如权利要求25所述的计算机可读介质;和 耦合所述CPU和所述介质的总线。
28. —种计算;f几系统,包括 CPU;如权利要求26所述的计算机可读介质;和 耦合所述CPU和所述介质的总线。
29. —种音频限峰器,包括第一可变增益减小器,用于可变增益地减小音频信号的增益;和 第二可变增益减小器,用于比所述第一可变增益减小更快地进一步可变增益地减小所述音频信号的增益,从而将所述音频信号的绝对幅度限制到阈值。
30. 根据权利要求29所述的限峰器,其中所述第一可变增益减 小器包括用于可变增益地减小所述音频信号的增益的第一级;并且其中所 述第二可变增益减小器包括用于可变增益地减小所述音频信号的增益的第二级,所述第二级 比所述第一级更快地减小增益。
31. 根据权利要求29或30所述的限峰器,其中所述第一可变增 益减小器包括用于延迟音频信号的延迟部分;用于查找延迟的音频信号中的峰的峰查找器;利用找到的峰计算快增益减小的快增益计算器;以及利用计算出的快增益来修改所述延迟的音频信号的修改器。
32. 根据权利要求31所述的限峰器, 其中所述延迟部分包括緩冲器;并且 其中所述峰查找器包括緩沖的音频信号的检查器。
33. 根据权利要求31所述的限峰器,其中各虚像的视在方向和 各矩阵编码的音频信号的方向被保持。
34. 根据权利要求31所述的限峰器,其中所述第二可变增益减 小与按权利要求31来构建、但缺少所述延迟部分的P艮峰器相比,产 生更少的听得到的频谱飞溅。
35. 根据权利要求31所述的限峰器,其中所述延迟部分包括 至少1 ms的延迟部分。
36. 根据权利要求35所述的限峰器,其中所述延迟部分包括 约1.5 ms的延迟部分。
37. 根据权利要求31所述的限峰器,其中所述峰查找器包括 用于确定在所述延迟的音频信号的各时间段中的最大值的差引用于延迟所述音频信号最大值的延迟緩冲器;以及 基于延迟的最大值来计算用于减小所述音频信号的增益的控制 信号的计算器。
38. 根据权利要求37所述的限峰器,其中所述峰查找器的延迟 緩冲器与所述限峰器的延迟部分匹配。
39. 根据权利要求37所述的限峰器,其中所述计算器包括 利用所述延迟的最大值的低通滤波的函数来计算所述控制信号的计算器。
40. 根据权利要求37所述的限峰器,其中所述计算器包括 利用加权平均后的延迟的最大值的函数来计算所述控制信号的计算器。
41. 根据权利要求39所述的限峰器,其中所述滤波的系数是 Hanning窗的平方根的函数。
42. 根据权利要求41所述的限峰器,其中所述Hanning窗与所 述延迟緩冲器具有相同的长度。
43. 根据权利要求40所述的限峰器,其中所述加权值是Hanning 窗的平方根的函数。
44. 根据权利要求43所述的限峰器,其中所述Hanning窗与所 述延迟緩冲器具有相同的长度。
45. 根据权利要求37所述的限峰器,其中所述快增益计算器包括通过基本上颠倒所述峰查找器的操作来计算快增益减小的快增 益计算器。
46. 根据权利要求37所述的限峰器,其中所述快增益计算器包括用于将所述快增益计算为等于计算出的用于减小增益的控制信 号加1之和的倒数的快增益计算器。
47. 根据权利要求46所述的限峰器,其中所述快增益计算器包括用于计算快增益的快增益计算器。
48. 根据权利要求47所述的限峰器,其中所述快增益计算器包括利用收敛减慢的Newton-Rhapson逼近法来计算的快增益计算器。
49. 根据权利要求48所述的限峰器,其中所述快增益计算器包括利用收敛速度S ^皮限制为满足一定条件的减'隄Newton-Rhapson 逼近法来计算的快增益计算器。
全文摘要
一种用于限制音频信号的绝对幅度的方法和设备。所述方法可包括第一可变增益地减小音频信号的增益;然后,比第一可变增益减小更快地第二可变增益地减小音频信号的增益,从而将音频信号的绝对幅度限制到阈值。第一可变增益减小可包括在第一级中对音频信号的增益进行可变增益减小,第二可变增益减小可包括在第二级中对音频信号的增益进行可变增益减小,第二级比第一级更快地减小增益。第二可变增益减小可包括延迟音频信号,查找延迟的音频信号中的峰,利用找到的峰计算快增益和用计算出的快增益修改延迟的音频信号。
文档编号H03G7/00GK101501988SQ200780029647
公开日2009年8月5日 申请日期2007年8月8日 优先权日2006年8月9日
发明者B·G·克罗克特, D·S·迈克格拉斯, M·J·斯密斯尔思 申请人:杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1