元数据驱动的动态范围控制的制作方法

文档序号:9422875阅读:373来源:国知局
元数据驱动的动态范围控制的制作方法
【专利说明】
[000。 相关问题
[0002] 本专利申请要求于2013年3月29日提交的美国临时专利申请61/806, 628 ;于 2013年7月24日提交的美国临时专利申请61/857, 966 及于2013年10月16日提交的 美国临时专利申请61/891,687的较早申请日期的权益。
技术领域
[0003] 本发明的实施例通常设及一种用于对音频信号进行编码并对其应用动态范围控 制/压缩值RC)的系统和方法。此外,本文所述的系统和方法考虑到开发中的新的编解码 器在MPEG-H(3D音频)中的DRC需求。还描述了其他实施例。
【背景技术】
[0004] 动态范围控制/压缩值RC)通过(1)使得音频信号中的轻柔部分较响亮;似使得 音频信号中的响亮部分较轻柔;或(3)同时使得轻柔部分较响亮并使得响亮部分较轻柔来 在某种程度上减小音频信号的动态范围。减小的动态范围在若干个情况下可为所期望的, 运些情况包括对于可仅再现小的动态范围并同时保持低失真、收听具有分屯、噪声的环境的 音频回放系统的情况,W及在收听者不想打扰其他人的情况。
[0005] 尽管DRC是如今音频编解码器的重要特征,但若干个新近的音频编解码器并不支 持DRC。例如,移动图像专家组(MPEG)设定的统一的语音和音频编码扣SAC)标准中缺少 DRC。高级音频编码(AAC)结合DRC工具,但该DRC工具具有包括有限时间分辨率和混叠失 真在内的缺点。

【发明内容】

[0006] 本发明描述了一种用于对动态范围控制/压缩值RC)增益值进行编码并将其应用 于一条声音节目内容的系统和方法。在一个实施例中,表示一条声音节目内容的DRC增益 曲线的一组DRC增益值可被分为与该条声音节目内容的帖对应的若干个帖。附加字段或一 组字段可与表示一条声音节目内容的音频信号一起被包括。附加字段可使用线性插值或样 条插值来表示DRC增益值。在一个实施例中,附加字段可包括:1)用于每个DRC帖的初始增 益值,2)DRC曲线中的特定点处的一组斜率值,3)用于每对连续斜率值的一组时间增量值, W及4)表示与斜率值对应的点之间的DRC增益曲线中的DRC增益值的变化的一个或多个 增益增量值。如本文所述,本文的系统和方法提供了一种用于对DRC增益值进行编码并将 其应用于一条声音节目内容的有效技术。
[0007] W上概述不包括本发明的所有方面的详尽列表。可预期的是,本发明包括可由上 文概述的各个方面W及在下文的【具体实施方式】中公开并且在随该专利申请提交的权利要 求中特别指出的各种方面的所有合适的组合来实施的所有系统和方法。此类组合具有未在 上述
【发明内容】
中具体阐述的特定优点。
【附图说明】
[000引本发明的实施例W举例的方式进行说明,而不仅限于各个附图的图示,在附图中 类似的附图标号指示类似的元件。应当指出,本公开中提到"一"或"一个"实施例未必是 同一实施例,并且它们表示至少一个实施例。
[0009] 图1示出了根据一个实施例的在音频解码器之后的压缩后处理的框图。
[0010] 图2示出了根据一个实施例的动态范围控制/压缩值RC)增益表示。
[0011] 图3示出了根据一个实施例的编码器DRC特性。
[0012] 图4示出了根据一个实施例的在发射器处生成的一组示例性DRC元数据。
[0013] 图5示出了根据一个实施例的示例性差值类型。
[0014] 图6示出了根据一个实施例的两个延迟模式。
[0015] 图7示出了根据一个实施例的林奎茨-莱利化inkwitz-化ley)交叉滤波器的拓 扑结构。
[0016] 图8示出了根据一个实施例的利用具有64个子频带的滤波器组的4频带DRC的 加权系数的实例。
[0017] 图9示出了根据一个实施例的用于某些对应解码器窗口形状的动态范围控制/压 缩值RC)窗口形状。
[0018] 图10示出了根据一个实施例的应用于单独小块窗口的DRC增益值。
[0019] 图11示出了根据一个实施例的应用于音频信号上的DRC增益值。
【具体实施方式】
[0020] 现在将参考所附附图来解释本发明的若干个实施例。每当在实施例中描述的部件 的形状、相对位置和其它方面未明确限定时,本发明的范围并不仅局限于所示出的部件,所 示出的部件仅用于例证的目的。另外,虽然阐述了许多细节,但应当理解,本发明的一些实 施例可在没有运些细节的情况下被实施。在其他情况下,未详细示出熟知的电路、结构和技 术,W免模糊对本【具体实施方式】的理解。
[0021] 将动态范围控制/压缩值RC)元数据结合到比特流/格式中的元数据系统相比于 在收听者端处(即,在回放处)确定DRC增益值的系统提供若干个优点。运些优点包括(1) 音频信号的回放处的较低复杂性;(2)DRC的复杂性在回放期间出现的问题减少,运就允许 实现更复杂的DRC程序;W及(3)收听者端处的音频回放设备可决定是否应用DRC。尽管 使用DRC元数据系统提供了若干个优点,但传统的DRC元数据系统诸如由高级电视系统委 员会(ATSC)和移动图像专家组(M阳G)所提供的那些传统的DRC元数据系统也提供了若干 个缺点。
[002引传统的DRC元数据系统(例如,由ATSC和MPEG标准所限定的那些传统DRC元数 据系统)支持如表1所示的轻压缩和重压缩。在大多数情况下,DRC增益值更新的速率为 每帖一个值。在48曲Z的采样率下,运相当于介于21ms和43ms之间的更新间隔。轻压缩 模式中的AC-3在48曲Z、约5ms的情况下具有快六倍的速率。此外,对于较低音频采样率, 运些传统的DRC元数据系统中的DRC增益值W较低速率更新。
[0023]
[002引表I:音频标准中的DRC增益元数据的参数
[0026] 实际DRC调谐表明,对于某些音频信号的增益变化应比可利用当前标准所实现的 增益变化快得多。
[0027] 当前DRC标准和系统(诸如MPEG-AAC和ATSC)的另一问题源于在应用反相MDCT 滤波器组之前将DRC增益应用于频域中的事实。MDCT滤波器组为基于时域混叠消除的转 换。如果对连续重叠块应用不同的增益值,则无法实现混叠消除。增益变化可导致听觉失 真诸如预回声。运对于响板记录可能很容易示出。
[0028] 在一个实施例中,如果在解码器重建音频信号之后将DRC增益应用于时域中,贝U 可避免MDCT伪像。在频域中,每个长块或每个短块至多可修改增益一次。相比之下,本文 所述的时域方法支持所期望的更高时间分辨率。
[0029] 尽管时域方法当前不支持多频带DRC(对MPEG轻压缩可用),但可改进本文所述的 实施例W支持多频带DRC。由于插值和DRC增益的应用,本发明提出的方案可稍微增大解码 器复杂性。然而,考虑到特别是利用可在高比特率下出现并且可利用高质量回放系统重现 的内容来避免不必要的失真,运些缺点显得无关紧要。
[0030] DRC工具
[0031] SM
[0032] 本文所述的DRC工具基于可应用于时域或子频带域音频信号(诸如肥-AAC解码 器的QMF滤波器组的子频带)的统一DRC增益编码。W下描述首先涵盖了时域应用。对于 子频带域应用,仅描述了对时域方法的修改。
[0033] 时域麻用
[0034] 如图1所示,本节描述了动态压缩工具如何应用于解码之后的时域音频信号。图 1示出了在音频解码器之后的压缩后处理的框图。在一个实施例中,DRC工具的解码器部件 由元数据来驱动,该元数据有效地表示压缩增益样本和用于插值的参数。在一些实施例中, 增益样本可尽可能快地更新W准确地表示下至至少Ims的更新间隔的增益变化。如果增益 基本上恒定,则每DRC帖仅使用单个增益样本可足W。为了使比特率最小化,编码器可仅选 择足够的DRC增益样本W确保解码之后的音频信号中的重建的DRC增益的足够精度。实际 上,在存在较大增益变化的情况下,运可能意味着较小的更新间隔。
[0035] 由于编码器仅提供稀疏采样的增益值,因此解码器可应用插值W实现样本之间的 平滑增益转换。经插值的增益的采样率为音频采样率。所使用的插值技术可基于样条。两个 相继增益样本之间的一个区段的内插值从该区段的两端处的两个增益样本及其斜率(导 数)导出。因此,当从一个区段过渡到下一个区段时,由于该两个区段在过渡点处具有相同 斜率,因此一阶导数是连续的。
[0036] 图2示出了基于经量化的DRC增益样本的插值。上面的曲线A示出了W诸如音频 采样率的高采样率的DRC输出增益。DRC增益的样本和斜率(即,圆圈和箭头)基于均匀时 间网格稀疏地提取。下面的曲线B示出了经量化的增益样本坐标(时间和值)和经量化的 斜率,该两者被传输至DRC解码器工具。解码器工具在增益曲线应用于由虚线所示的音频 信号之前对其进行插值。
[0037] 在一个实施例中,用于对增益曲线进行采样的最小可能时间间隔为介于0. 5ms和 1.Oms之间的固定值并且最大可能时间间隔为每DRC帖一个增益样本。
[0038] 除了上述样条模式之外,"简单"模式在没有定时参数和斜率参数的情况下也可用 于传输每DRC帖仅一个DRC增益值。该模式最适合于具有基本上恒定DRC增益的帖并且占 用最小数量的位。
[0039] 对于DRC工具与音频编解码器协同应用,提供如下参数来调节DRC帖尺寸和时间 分辨率,使得编解码器和DRC处理在复杂性和延迟方面可最有效地完成。运些参数为:
[0040] ?W音频采样间隔为单位的DRC帖尺寸
[00川 ?W音频采样间隔为单位的delta_t_min
[004引.延迟模式
[0043] 尽管运些参数具有默认值,但编解码器规格可覆写运些默认值。
[0044] 修放DRC特忡
[0045] DRC工具支持通过W下若干种方式对经解码的DRC增益进行的修改:
[0046] ?升压因子
[0047] ?压缩因子
[004引 ?自定义DRC特性
[0049] 升压因子为W地为单位的应用于正增益值
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1