使用音频信号水平的随时间变化的估计概率密度的随时间变化的音频信号水平的制作方法

文档序号:7515490阅读:122来源:国知局
专利名称:使用音频信号水平的随时间变化的估计概率密度的随时间变化的音频信号水平的制作方法
技术领域
本发明涉及音频信号处理。具体而言,本发明涉及通过平滑音频信号的短期水平来计算出随时间变化的对音频信号的水平的度量,其中至少部分地通过随时间变化的对短期水平的概率密度的估计来控制平滑处理的参数。
弓I用文献且该文献通过弓I用结合于此 在Alan Jeffrey Seefeldt等人的国际专利申请公布WO 2004/111994A2 (于2004年12月23日公布,题为"Method, Apparatus and ComputerProgr咖for Calculating andAdjusting the Perceived Loudness of anAudio Signal")中禾口在Alan Seefeldt等人的文章(Audio EngineeringSociety(音频工程协会)大会论文6236, 2004年10月28日旧金山,题为"A New 0bj ective Measure of Perceived Loudness")中描述了在更好地理解本发明时有用的用于度量感知的(心理声学)响度的一些技术。所述申请WO 2004/111994A2和所述文章通过整体引用而结合于此。
背景技术
在音频信号处理中,生成随时间变化的对音频信号水平的度量常常是必要的(这里术语"水平" 一般地指代水平的度量,诸如峰水平、均方根水平、响度水平等)。例如,响度计可以显示随时间变化的对音频信号的感知响度的度量,其中该度量被明显地平滑以便表明在过去数秒内的平均响度。在另一例子中,自动增益控制(Automatic Gain Control,AGC)处理可以计算随时间变化的对音频信号水平的高度平滑的度量、然后使用所得度量来生成缓慢变化的增益,该增益在应用于音频信号时可以将音频的平均水平自动移动到更接近希望的目标水平。 在许多例子中的这两个例子中,通过将某一形式的平滑滤波器应用于对短期水平的度量来计算出平滑的水平度量。("短期"的意思是在比执行后续的平滑处理的间隔明显更短的时间间隔内进行计算。)例如,如在申请W0 2004/111994 A2中所述,可以在数十毫秒的间隔内计算信号的均方根水平或者感知响度水平以生成短期水平。然后,后续的对该短期水平的平滑可以涉及到数秒量级的时间常数。在以下讨论中,将该随时间变化的对短期水平的度量表示为信号L[t],而将后续的平滑后的水平度量表示为[[t],其中t表示离散的时间索引。 许多类型的平滑滤波器可以应用于L[t]以生成[[t]。可以使用有限冲激响应(Finite Impulse Response, FIR)滤波器或者多极无限冲激响应(Infinite ImpulseResponse, IIR)滤波器。所用具体滤波器不是关键的。出于示例目的,可以考虑常用的快速上升/缓慢释放的单极IIR平滑器。利用这样的滤波器,可以根据以下方程来更新平滑后的水平度量C[t]

(1)
a上升丄0 _ 1] + (1 — 上升)丄|>] 丄|>] _丄[t -1 ] > 0"释放Z[f — 1] + (1 一 《释放)丄P] — Z[t -1] s 0
可以选择平滑系数a上升和a释放使得a上升< a释放。这意味着[[t]在L[t]增加(上升)时比在L[t]减少(释放)时更快速地跟踪L[t]。对于AGC,例如可以选择与一秒的时间常数对应的a ±#和与四秒的时间常数对应的a k。这样,[[t]随时间很缓慢变化,结果,修改音频的对应增益也缓慢变化,由此维持原音频的短期动态性。然而,当使用这样大的时间常数时可能出现问题。假设为了在节目之间和在各种频道之间维持一致的平均水平,使用这样的AGC对电视机的音频进行操作。在这样的情形中,AGC处理的音频信号的内容可能骤然改变(例如在频道改变时),而相关的音频信号的平均水平因此也可能骤然改变。然而,AGC由于它的时间常数大而需要大量时间来收敛至新水平和使所处理的音频的修改水平符合希望的目标水平。在这样的调整时间期间,电视的观看者可以感觉到音频的水平太响或者太低。结果,观看者可能快速去拿遥控器以调节音量——而没有想到自己只是在AGC收敛时与它对抗。 现有技术通常使用基于短期水平L[t]与平滑水平[[t]的相对关系来改变的时间常数来解决刚才描述的问题。例如,如果信号的短期水平明显大于或者少于由平滑水平周围的一些阈值边界所限定的平滑水平,则平滑操作分别向较快的上升时间常数和/或释放时间常数切换,直至短期水平回落至平滑水平周围的阈值边界内。随后,系统切换回原来较慢时间常数。可以修改方程l以通过包括四种情况而不是两种情况来实施这一更复杂的平滑技术
a快上升丄1> _ + (1 _ a快上升)丄1>]"上升Z[f —1] + (l-a;上升)丄[f]
Z[,-1] + (l-a释放)朋
释放
丄W-丄[t]〉AL,决
0〈i:[f] — Z[t]sAL快
(2)
快释放
丄[f —1] + (1_ 快释放)
化]_训《-M
快 在方禾呈2中,a快上升< a上升禾口 a快释放< a释放意b未着a快上升禾口 a快释放分另lJX寸应于比a上升和a释放更快的时间常数。如果a上升和a释放分别对应于1秒和4秒的时间常数,则可以选择例如分别与0. 1秒和0. 4秒的时间常数(快至十倍)对应的a ^^和a ttffiK。必须合理地选择快速时间常数阈值ALft,使得向这些较快的时间常数的切换没有太频繁地出现,造成不希望的平滑后的水平[[t]的不稳定。例如,如果水平度量L[t]和[[t]表示以分贝为单位的均方根水平,则可以将ALft设置为10dB,约为感知响度的两倍。
虽然相对于方程1中的平滑带来了改善,但是方程2的平滑对于许多信号仍然有次优表现。 一般而言,对于任意合理阈值ALft,可以存在如下信号,对于这些信号而言,短期水平L[t]的原来希望的动态性在平均水平[[t]周围的阈值边界以外波动,因此使平滑处理错误地向快速上升或者释放模式切换。 为了更好地理解其中方程2的平滑如希望的那样表现以及其中该平滑表现不充分的情况,可以设想短期水平L[t]随时间的分布。可以将这一分布设想为随时间变化的如下概率密度,该概率密度预测在当前时间索引t附近的时间间隔内遇到短期水平L的任何特定值的概率。这一间隔的持续时间应当与方程2的平滑滤波器中所用的较慢的一组时间常数相当。 现在针对之前描述的电视频道改变的例子来考虑这种概率密度的行为。假定针对给定频道的短期水平的动态范围有些限制,那么短期水平L[t]的概率密度函数呈现为位于平滑水平[[t]周围的相当窄的峰的形式。当频道改变时,假设新频道的平均水平明显高于原频道,那么概率密度函数将开始改变新峰增长到位于新频道的更高平均水平周围,而原峰降低。 图l描绘了在描述的转变开始时的概率密度函数。在图中,水平轴表示水平而竖直轴表示概率。实线表示短期水平在转变开始时的概率密度。注意左侧为降低的峰(表示与旧频道的选择相关联的概率的降低)而右侧为增长的峰(表示与新频道的选择相关联的概率的升高)。在转变开始时,平滑水平[[t-l]仍然落在旧频道选择的峰内,而短期水平L[t]落在新频道的峰内。在图中,短期水平L[t]比[[t-l]超出大于ALft的数量,因此根据等式2,快速时间常数用来将[[t]朝向L[t]更新。这是希望的效果平滑水平[[t]快速适应于新选择的频道的更高水平,从而快速跃过将概率密度的两个峰分开的间隙。
图2描绘了对于大为不同的音频信号的短期水平的概率密度。在这一情况下,信号的原动态性比较大,因此概率密度的峰扩展很宽。这样的动态性在高质量记录爵士或者经典音乐时是典型的。也在图2中,[[t-l]与L[t]之间的关系与图1中完全相同,但是现在两个值都落在概率密度的主峰内。因此,因为[[t-l]与L[t]之间的关系是信号的典型动态性的一部分,所以向快速时间常数的切换是不希望的。在这一情况下,方程2描述的平滑并不合适。

发明内容
这里教导用于平滑信号的随时间变化的水平的方法、介质和装置。 一种方法包括估计信号的短期水平的随时间变化的概率密度和通过使用概率密度来平滑信号的水平。信号可以是音频信号,而平滑后的水平和估计出的概率密度可以按近似相同的速率随时间变化。 短期水平和平滑后的水平可以是时间序列,其每个都具有当前时间索引和先前时
间索引。在本文中,在平滑之前可以计算在先前时间索引处的平滑后的水平的概率。在平滑
之前,可以使用概率密度来计算平滑参数。计算平滑参数可以包括使用在先前时间索引处
的平滑后的水平、在当前时间索引处的短期水平和在先前时间索引处的平滑后的水平的概
率来计算平滑参数。计算平滑参数可以包括使用估计的概率密度的宽度来计算平滑参数。 计算平滑参数可以包括当在先前时间索引处的平滑后的水平不大于阈值概率
时,使用第一上升时间常数和释放时间常数;相反,当在先前时间索引处的平滑后的水平大
于阈值概率时,使用如下的上升和释放时间常数,该上升和释放时间常数中的一个比它的
对应第一时间常数更慢。所用的上升时间常数和释放时间常数均可以比它们的对应第一时
间常数更慢。
阈值概率可以是可变的。可变阈值概率可以是估计的概率密度的函数。
平滑可以包括通过使用概率密度来平滑短期水平。 估计概率密度可以包括将参数表达与短期水平的以往值拟合。拟合可以包括将高斯混合模型与短期水平的以往值拟合。估计概率密度可以包括计算短期水平的以往值的直方图。 —种计算机可读存储器,包含用于实现这里描述的方法中的任意一个的计算机程序。 —种计算机系统,包括中央处理器、所述存储器以及通信耦合中央处理器和存储器的总线。 —种音频信号水平平滑器,包括短期水平计算器,用于计算音频信号的短期水平;水平平滑器,用于使用平滑参数来平滑音频信号的水平;概率密度估计器,用于估计音频信号的概率密度;概率计算器,用于计算经延迟的平滑后的水平的概率;平滑参数计算器,用于计算平滑参数;以及延迟器,用于延迟平滑后的水平。 概率密度估计器可以包括用于使用音频信号的短期水平的时间序列来估计概率密度的概率密度估计器。概率计算器可以包括用于使用估计出的概率密度和经延迟的平滑后的水平来计算概率的概率计算器。平滑参数计算器可以包括用于使用概率、经延迟的平滑后的水平和短期水平来计算平滑参数的平滑参数计算器。概率计算器可以包括用于使用估计出的概率密度和经延迟的平滑后的水平来计算概率的概率计算器,而平滑参数计算器可以包括用于使用概率、经延迟的平滑后的水平和短期水平来计算平滑参数的平滑参数计算器。 水平平滑器可以包括用于平滑音频信号的短期水平的水平平滑器。 概率密度估计器可以包括用于将参数表达与短期水平的以往值拟合的拟合器。参
数表达拟合器可以包括用于将高斯混合模型与短期水平的以往值拟合的拟合器。概率密度
估计器可以包括用于计算短期水平的以往值的直方图的直方图计算器。 另一种用于平滑信号的随时间变化的水平的方法包括接收具有短期水平的信号和平滑随时间变化的水平,其中短期水平和平滑后的随时间变化的水平为时间序列,其每个具有当前时间索引和先前时间索引,而平滑可以包括当在先前时间索引处的平滑后的短期水平与在当前时间索引处的短期水平之差超过指示使用快速时间常数的阈值时,使用缓慢时间常数。 可以通过参照以下讨论和附图来更好地理解本发明的各种特征及其优选实施例,在附图中相似标号指代相似元件。


图1描绘了适合向快速平滑时间常数切换的音频信号的短期水平的概率密度。 图2描绘了不适合向快速平滑时间常数切换的音频信号的短期水平的概率密度。 图3描绘了本发明一个实施例的总体框图。 图4描绘了本发明一个实施例对在水平明显不同的源之间切换的音频信号的操作。 图5是根据本发明一个实施例的平滑水平生成器的操作流程图。
具体实施例方式
图3是根据本发明一个实施例的平滑水平生成器3的框图。 平滑水平生成器3包括短期水平计算器31、短期水平平滑器32、概率密度估计器33、概率计算器34、平滑参数计算器35和延迟器36。短期水平计算器31接收作为输入的音频信号3D,产生作为其输出的短期水平L[t]37。概率密度估计器33接收作为输入的短期水平L[t]37和产生作为其输出的估计出的概率密度p(1, t)38。概率计算器34接收作为其输入的估计出的概率密度P (1, t) 38和经延迟的平滑后的水平度量[[t-l] 3C,产生作为其输出的概率P([[t-l], t)39。平滑参数计算器35接收作为其输入的概率p([[t-l],t)39以及经延迟的平滑后的短期水平3B和短期水平L[t]37,产生作为其输出的平滑参数3A。短期水平平滑器32接收作为其输入的平滑参数3A和短期水平L[t]37,产生作为其输出的平滑后的水平度量[[t] 3C。最后,延迟器36接收和延迟平滑后的水平度量[[t] 3C。
当然,平滑水平生成器3可以整体或者部分地实施为包括已编程的存储器的通用计算机、专用电路、可编程门阵列等。 接着描述根据一个实施例的平滑水平生成器3的操作。 平滑水平生成器3通过平滑短期水平估计L[t]来生成平滑后的水平估计[[t],其中至少部分地按照从短期水平L[t]的随时间变化的概率密度估计导出的信息进行控制。所生成的平滑后的水平估计[[t]例如可用作由实时响度计显示的值或者在音频动态处理器(如AGC)中的控制路径中使用。 图5是根据本发明一个实施例的平滑水平生成器3的操作流程图。首先,计算音频信号的短期水平L[t](步骤505)。平滑该短期水平(步骤510),生成平滑的水平度量[[t]。 并行地,根据短期水平L[t]来更新短期水平的概率密度的随时间变化的估计(步骤515)。这一概率密度估计p(l, t)返回输入水平l的在零与一之间的概率。时间索引t表明在概率密度估计器33(图3)接收短期水平L[t]的新值时,这一函数随时间改变。理想地,概率密度估计器33考虑用于创建估计p(l,t)的L[t]值的时间间隔应当与平滑器32用来生成[[t]的时间常数相当。结果[[t]和p(l,t)以近似相同的速率随时间变化。
通过向密度估计p(l, t)馈送水平值[[t-l]来计算(步骤520)来自先前时间索引的平滑后的水平度量的概率P([[t-l],t)。这一概率值p([[t-l],t表示与[[t-l]和短期水平在时间索引t周围的许多值之间的关系(不仅仅是[[t-l]与当前短期水平L[t]之间的关系)有关的信息。例如,如果P([[t-l], t)较高,则这表明[[t-l]类似于短期水平在最近的许多值。相反,如果P([[t-l], t)较低,则[[t-l]不同于短期水平在最近的多数值。 _ 最后,概率值p([[t-l], t)以及当前短期水平L[t]和先前的平滑后的水平度量[[t-l]馈送到平滑参数计算器35(图3)中,该计算器使用这些值来选择用于生成当前的平滑后的水平度量[[t]的平滑参数(步骤525)。 虽然图3描绘了控制平滑参数的p([[t-l], t),但是可以采用从密度估计p(l, t)得出的其它信息。例如,平滑参数计算器35可以使用密度估计的宽度度量,这是音频信号的动态范围的指示。 回到p([[t-l], t)的示例使用,一般而言,当密度估计p(l, t)估计出先前的平滑后的值[[t-l]具有低概率时,那么应当用快速时间常数更新[[t]。如果[[t-l]的概率相对较高,则应当使用正常的较慢的时间常数。这样,如果多数短期水平值已经远离先前的平滑后的值[[t-l],则[[t]将朝向这些值更快移动。如果[[t-l]已经在多数短期水平值附
9近,则较慢的移动是合适的。 参照图2,因为[[t-l]仍然落在高概率区内(虽然短期水平L[t]相对较远),所 以本发明的一个实施例可以防止不希望的向更快时间常数的切换。对于图1中的频道改变 例子,值得更具体地考察这一策略如何仍然产生希望的快速适应。为了有所帮助,图4描绘 了在五个阶段中两个频道之间的转变。 一种简单的时间常数控制策略假设当P([[t-l],t) 大于某一阈值PT时使用缓慢时间常数来更新[[t-l]。当p([[t-l],t)少于这一阈值PT时 使用快速时间常数。(图中的符号中去除了时间下标以简化表达。) 图4的第一阶段(初始稳态)描绘了紧接在选择较响的第二频道之前的状态。短
期水平的概率密度紧密地分布于第一频道的平均水平周围。平滑后的水平[落在这一密度
的主峰内。因此,[的概率P([)大于阈值PT,因此使用缓慢时间常数来更新[。 第二阶段(转变开始)表示紧接在音频已经向较响的第二频道切换之后的系统状
态。在这一阶段中,位于第一频道的平均水平周围的概率密度的大峰收縮,而位于较响的第
二频道的平均水平周围的新峰增长。平滑水平[已经开始朝向第二频道的平均水平右移。
然而它的概率仍然大于PT,因此仍然采用较慢时间常数。 在第三阶段(转变中间)中,概率分布的第一峰继续收縮,而第二峰继续增长。平 滑后的水平[继续朝向第二频道向右生长,但是现在它的概率下降至阈值PT以下。([已经 移入两个峰之间的低概率间隙中。)这时,使用快速时间常数来更新[,使得它快速越过间 隙而移向第二频道的峰。 在第四阶段(转变结束)中,[已经移入第二频道的主峰中,它的概率再次大于PT。 现在进行返回到较慢时间常数的切换。 最后在第五阶段(新的稳态)中,平滑水平[已经稳定于第二频道的平均水平,继 续使用缓慢时间常数。 通过使用从随时间变化的概率密度估计p(l, t)得出的信息,本发明实施例以在 真正的转变时段期间快速响应而对于先前有问题的信号仍然保持稳定的方式来适应用于 平滑音频信号水平度量的时间常数。 现在具体地描述本发明一个具体实施例的例子。在这一实施例中,从L[t]生成 [[t]的平滑处理可以被表达为具有随时间变化的系数a [t]的单极滤波器
[[t] = a [t][[t-l] + (l-a [t])L[t](3) 通过根据概率密度估计p(l,t)来改变系数a [t],来对平滑进行调整。先描述从 短期水平L[t]得出密度估计p(l,t)。然后描述系数a [t]的控制。
概率密度的估计 概率密度估计p(l,t)捕获短期水平L[t]在从当前时间索引t延伸到过去近期的 时间间隔内的行为。为此,估计器33(图3)维护包含短期水平L[t]的过去的T个值的缓 存器。(可以根据希望的应用来选择该缓存器的长度T。对于之前讨论的AGC例子,例如可 以设置缓存器的长度等于四秒。) 从该缓存器可以用任意的多种方式生成概率密度的估计。例如,可以将参数表达 (如高斯混合模型)与缓存器中的数据拟合。另一技术计算缓存数据的直方图。缓存器中 的每个值分配给离散的格子(bin)。通过先找出值1落入的格子、然后将概率计算为数据缓 存器中分配给该格子的点的数目除以数据缓存器中的点的总数目,以计算出密度函数P (1,t)。可以将直方图的格子限定为以间距AL^位于某一最小水平Lmin与最大水平L^之间。
例如,如果以dB为单位表示水平,则可以设置Lmin = ldB、L隨=120dB和A Lbin = ldB以产 生具有120个格子的直方图。格子的总数目B可以一般地表达为 J 一丄 <formula>formula see original document page 11</formula> 在每个时间瞬间t,对长度为T的数据缓存器中落入直方图的每个格子中的样本 的数目进行计数。Ht[b] (b = 1…B)表示直方图的格子,可以根据映射函数计算水平值l被 分配到的格子b:
<formula>formula see original document page 11</formula>(5) <formula>formula see original document page 11</formula> 在算法上,根据以下伪代码计算每个时间t的直方图Ht[b]: for b = 1 to B,
Ht[b] = 0 end for r =0 to T_l, b = LevelToBin (L[t_ t ]) Ht[b] = Ht[b]+1 end 然后,通过在1被分配到的格子处的直方图除以缓存器中的数据点的总数目给出 概率密度估计P(l,t): <formula>formula see original document page 11</formula>
结果是估计出的概率密度p(l, t)不是输入水平1的连续函数而是以ALbin的间 隔"逐级阶跃"的函数。然而如果直方图间距ALbin足够小,概率密度估计对于实际用途而 言也足够光滑。 平滑滤波器系数的计算 现在描述自适应滤波器系数a [t]的计算。在正常条件之下,当[[t-l]的概率相 对较高时使用正常的上升时间常数和释放时间常数(如在方程l中那样)。当[[t-l]的概 率较低时使用较快的上升时间常数和释放时间常数。 为了在正常时间常数与快速时间常数之间平滑地插值,基于从密度估计p(l, t) 计算出的[[t-l]概率来生成范围在零与一之间的控制信号13 [t]:
<formula>formula see original document page 11</formula> 则= 如果p([[t-l],t)大于阈值PT,则控制信号13 [t]等于一。随着p([[t-l],t)下 降至Pt以下,控制信号13 [t]下降至零。最后,通过基于控制信号13 [t]在正常与快速的 上升和释放系数之间插值来计算平滑滤波器系数a [t]。<formula>formula see original document page 12</formula> 当|3 [t]等于零时([[t-l]落在低概率区中),使用快速上升系数和快速释放系
数。当e [t]等于一 ([[t-l]落在高概率区中)时,则使用正常上升和释放系数。 为了实施AGC,可以设置分别与1秒、0. l秒、4秒和0. 4秒的时间常数对应的a上升、
a快上升、a释放和a快释放值。可以将概率阈值PT的值设置 为0. 075的固定值。
尽管这一实施例使用固定值的阈值PT,但是在一些应用中使pT为可变阈值(例如 根据密度估计P(l, t)的某一度量而改变)也可以是有利的。例如,Pt可以随着水平1中 的最大值P(l,t)而变化。 本说明书通过引用合并了本文提到的所有出版物和专利申请,也就是说本说明书 已经通过引用来具体和个别地合并这样的各个出版物或者专利申请。 由于可以在不脱离本发明的实质精神的情况下用多个形式实施本发明,所以本文 中实施例为示例而非限制。因此,落入权利要求的界限和范围内或者落入这样的界限和范 围的等同内的改变将被权利要求所涵盖。
权利要求
一种用于平滑信号的随时间变化的水平的方法,所述方法包括估计所述信号的短期水平的随时间而变化的概率密度;以及使用所述概率密度来平滑所述信号的水平。
2. 根据权利要求1所述的方法,其中 所述信号是音频信号。
3. 根据权利要求1所述的方法,其中平滑后的水平和估计出的概率密度以近似相同的速率随时间变化。
4. 根据权利要求1所述的方法,其中所述短期水平和所述平滑后的水平为时间序列,其每个具有当前时间索引和先前时间 索引;以及在所述平滑之前进行以下操作计算在所述先前时间索引处所述平滑后的水平的概率。
5. 根据权利要求1所述的方法,其中 在所述平滑之前进行以下操作使用所述概率密度来计算平滑参数。
6. 根据权利要求5所述的方法,其中 所述平滑参数的计算包括使用在所述先前时间索引处的所述平滑后的水平、在所述当前时间索引处的所述短期 水平和在所述先前时间索引处的所述平滑后的水平的概率来计算所述平滑参数。
7. 根据权利要求5所述的方法,其中 所述平滑参数的计算包括使用所述估计出的概率密度的宽度来计算所述平滑参数。
8. 根据权利要求6所述的方法,其中 所述平滑参数的计算包括当在所述先前时间索引处的所述平滑后的水平不大于阈值概率时,使用第一上升时间 常数和释放时间常数;以及相反,当在所述先前时间索引处的所述平滑后的水平大于所述阈值概率时,使用如下 的上升时间常数和释放时间常数,所述上升时间常数和释放时间常数之一比其对应的第一 时间常数更慢。
9. 根据权利要求8所述的方法,其中上升常数和释放常数的使用包括 使用如下的上升时间常数和释放时间常数,所述上升时间常数和释放时间常数都比其对应的第一时间常数更慢。
10. 根据权利要求6所述的方法,其中 所述阈值概率是可变的。
11. 根据权利要求10所述的方法,其中 可变阈值概率是所述估计出的概率密度的函数。
12. 根据权利要求l-ll中的任一权利要求所述的方法,其中所述平滑包括使用所述概 率密度来平滑所述短期水平。
13. 根据权利要求1-11中的任一权利要求所述的方法,其中估计所述概率密度包括将参数表达与所述短期水平的以往值拟合。
14. 根据权利要求13所述的方法,其中所述拟合包括 将高斯混合模型与所述短期水平的所述以往值拟合。
15. 根据权利要求1-11中的任一权利要求所述的方法,其中估计所述概率密度包括 计算所述短期水平的以往值的直方图。
16. —种计算机可读存储器,包含用于实现根据权利要求l-ll的方法中的任一方法的 计算机程序。
17. —种计算机系统,包括 中央处理器;根据权利要求16所述的存储器;以及总线,通信耦合所述中央处理器和所述存储器。
18. —种音频信号水平平滑器,包括 短期水平计算器,用于计算音频信号的短期水平; 水平平滑器,用于使用平滑参数来平滑所述音频信号的水平; 概率密度估计器,用于估计所述音频信号的概率密度; 概率计算器,用于计算经延迟的平滑后的水平的概率;平滑参数计算器,用于计算所述平滑参数;以及 延迟器,用于延迟所述平滑后的水平。
19. 根据权利要求18所述的音频信号水平平滑器,其中所述概率密度估计器包括 用于使用所述音频信号的所述短期水平的时间序列来估计概率密度的概率密度估计器。
20. 根据权利要求18所述的音频信号水平平滑器,其中所述概率计算器包括用于使用估计出的概率密度和经延迟的平滑后的水平来计算所述概率的概率计算器。
21. 根据权利要求18所述的音频信号水平平滑器,其中所述平滑参数计算器包括用于使用所述概率、所述经延迟的平滑后的水平和所述短期水平来计算所述平滑参数 的平滑参数计算器。
22. 根据权利要求19所述的音频信号水平平滑器,其中所述概率计算器包括用于使用所述估计出的概率密度和所述经延迟的平滑后的水平来计算所述概率的概 率计算器;以及所述平滑参数计算器,包括用于使用所述概率、所述经延迟的平滑后的水平和所述短期水平来计算平滑参数的平 滑参数计算器。
23. 根据权利要求18-22所述的音频信号水平平滑器,其中所述水平平滑器包括 用于平滑所述音频信号的所述短期水平的水平平滑器。
24. 根据权利要求18-22所述的音频信号水平平滑器,其中所述概率密度估计器包括 拟合器,用于将参数表达与所述短期水平的以往值拟合。
25. 根据权利要求24所述的音频信号水平平滑器,其中所述参数表达拟合器包括 用于将高斯混合模型与所述短期水平的以往值拟合的拟合器。
26. 根据权利要求18-22所述的音频信号水平平滑器,其中所述概率密度估计器包括用于计算所述短期水平的以往值的直方图的直方图计算器。
27. —种用于平滑信号的随时间变化的水平的方法,所述方法包括 接收具有短期水平的信号;以及 平滑所述随时间变化的水平,其中所述短期水平和平滑后的随时间变化的水平为时间序列,其每个具有当前时间索引和 先前时间索引,以及 所述平滑包括当在所述先前时间索引处的平滑后的短期水平与在当前时间索引处的短期水平之差 超过指示使用快速时间常数的阈值时,使用缓慢时间常数。
全文摘要
用于平滑信号的随时间变化的水平的方法、介质和装置。该方法包括估计信号的短期水平的随时间变化的概率密度和通过使用概率密度来平滑信号的水平。信号可以是音频信号。短期水平和平滑后的水平可以是各自具有当前时间索引和先前时间索引的时间序列。这里,在平滑之前可以计算在先前时间索引处的平滑后的水平的概率。在平滑之前可以使用概率密度来计算平滑参数。计算平滑参数可以包括使用在先前时间索引处的平滑后的水平、在当前时间索引处的短期水平和在先前时间索引处的平滑后的水平的概率来计算平滑参数。计算平滑参数可以包括使用估计的概率密度的宽度来计算平滑参数。
文档编号H03G3/30GK101743689SQ200880024506
公开日2010年6月16日 申请日期2008年7月11日 优先权日2007年7月13日
发明者阿兰·杰弗里·西费尔特 申请人:杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1