用于各种回放环境的动态范围控制的制作方法_5

文档序号:9794357阅读:来源:国知局
近听觉事件边界的其它响度水平相比,听觉事件边界附近的响度水平对直方图具有更 大的影响(例如,巧f]具有相对大的值等)。
[019引 16.复位
[0194] 在一些实施例中,运里描述的编码器(例如,150等)被配置为检测复位事件且在由 编码器(150)生成的编码音频信号(例如,102等)中包含复位事件的指示。在第一例子中,编 码器(150)响应于确定出现连续(例如,250毫秒,可通过系统和/或用户配置等)的相对安静 周期检测复位事件。在第二例子中,编码器(150)响应于确定跨着所有频带在激励水平中出 现大的瞬时下降来检测复位事件。在第=例子中,编码器被提供出现需要复位的内容(例 如,节目开始/结束、场景改变等)中的过渡的输入(例如,元数据、用户输入、系统控制等)。
[0195] 在一些实施例中,运里描述的解码器(例如,100等)实现可用于瞬时加速增益平滑 化的复位机构。复位机构是有用的,并且可在出现信道或视听输入之间的切换时被调用。
[0196] 在一些实施例中,解码器(100)可被配置为通过确定是否出现连续(例如,250毫 秒,可通过系统和/或用户配置等)的相对安静周期、是否出现跨着所有频带的激励水平的 大的瞬时下降等确定是否出现复位事件。
[0197] 在一些实施例中,解码器(100)可被配置为响应接收通过上游编码器(例如,150 等)在编码音频信号(102)中提供的指示(例如,复位事件的指示等)确定出现复位事件。
[0198] 可使复位机构在解码器(100)确定出现复位事件时发出复位。在一些实施例中,复 位机构被配置为利用DRC压缩曲线的略微更激进的切割行为W防止(例如,大声的节目/信 道/视听源等的)硬开始。另外、任选地或者作为替代方案,解码器(100)可被配置为实现保 护措施W在解码器(100)检测到复位被错误地触发时溫和地恢复。
[0199] 17.编码器提供的增益
[0200] 在一些实施例中,音频编码器可被配置为计算编码成编码音频信号的音频内容的 各单个部分(例如,音频数据块、音频数据帖等)的一组或更多组增益(DRC增益等)。由音频 编码器生成的多组增益可包含W下方面中的一个或更多个:包含所有信道(左前、右前、低 频效果或LFE、中屯、、左环绕、右环绕等)的单个广带(或宽带)增益的第一组增益;包含信道 的各单个子集的各单个广带(或宽带)增益的第二组增益;包含信道的各单个子集和第一数 量(例如,两个等)单个频带(例如,各信道中的两个频带等)中的每一个的各单个广带(或宽 带)增益的第=组增益;包含信道的各单个子集和第二数量(例如,四个等)单个频带(例如, 各信道中的四个频带等)中的每一个的各单个广带(或宽带)增益的第四组增益;等等。运里 描述的信道的子集可W是包含左前、右前和WE信道的子集、包含中屯、信道的子集、包含左 环绕和右环绕信道的子集等中的一个或更多个。
[0201] 在一些实施例中,音频编码器被配置为W时间同步方式传送音频内容的一个或更 多个部分(例如,音频数据块、音频数据帖等)和对音频内容的一个或更多个部分计算的一 个或更多个组的增益。接收音频内容的一个或更多个部分的音频解码器可W W很少的延迟 或者在没有延迟的情况下选择和施加一组或更多个组的增益中的一组增益。在一些实施例 中,音频编码器可实现在图4所示的一个或更多个子帖中承载(例如,通过差分编码等)一组 或更多组增益的子帖技术。在例子中,可在计算增益的音频数据块或音频数据帖内编码子 帖。在另一例子中,可在计算增益的音频数据块或音频数据帖前面的音频数据块或音频数 据帖内编码子帖。在另一非限制性例子中,可在从计算增益的音频数据块或音频数据帖在 一定的时间内的在音频数据块或音频数据帖内编码子帖。在一些实施例中,可W使用 化ffman和差分编码,W占据和/或压缩承载多组增益的子帖。
[0202] 18.示例性系统和处理流程
[0203] 图5示出非限制性示例性实施例中的示例性编解码器系统。可W是诸如150等的音 频编码器中的处理单元的内容创建器被配置为向编码器单元("NGC化coder")提供音频内 容("Audio")。编码器单元将音频内容格式化成音频数据块和/或帖,并且将音频数据块和/ 或帖编码成编码的音频信号。内容创建器还被配置为在音频内容和一个或更多个动态范围 压缩曲线标识符("Compression州rve I化")中建立/生成一个或更多个节目、商业广告等 的一个或更多个对话响度水平("dialnorm")。内容创建器可从音频内容中的一个或更多个 对话音频轨道确定对话响度水平。可至少部分地基于用户输入、系统配置参数等选择动态 范围压缩曲线标识符。内容创建器可W是利用工具W生成音频内容和dialnorm的人(艺术 家、音频工程师等)。
[0204] 基于动态范围压缩曲线标识符,编码器(150)生成包含但不限于由一个或更多个 动态范围压缩曲线支持的多个回放环境的相应基准对话响度水平("Reference levels") 的一个或更多个DRC参数组。在编码的音频信号的元数据中,运些DRC参数组在编码音频信 号的元数据中可通过音频内容被带内编码、通过音频内容被带外编码等。作为生成可传输 到诸如100等的音频解码器的编码音频信号的一部分,可W执行诸如压缩、格式化多路复用 ("MUX")等的动作。可用支持音频数据要素、DRC参数组、基准响度水平、动态范围压缩曲线、 函数、查找表、在压缩中使用的化ffman代码、子帖等的输送的句法编码编码的音频信号。在 一些实施例中,在一些实施例中,句法允许上游装置(例如,编码器、解码器、变码器等)将增 益传送到下游装置(例如,解码器、变码器等)。在一些实施例中,用于将数据编码成编码的 音频信号和/或从其解码数据的句法被配置为支持向后的兼容,使得依赖于由上游装置计 算的增益的装置可任选地继续运样做。
[020引在一些实施例中,编码器(150)计算音频内容的一组、两组或更多组增益(例如, DRC增益、增益平滑化,通过适当的基准对话响度水平等)。在W音频内容编码成编码音频信 号的元数据中,多组增益可具有一个或更多个动态范围压缩曲线。第一组增益可与(例如, 缺省等)扬声器配置或简档中的所有信道的广带(或宽带)增益对应。第二组增益可与扬声 器配置或简档中的所有信道中的每一个的广带(或宽带)增益对应。第=组增益可与扬声器 配置或简档中的所有信道中的每一个的两个频带中的每一个的广带(或宽带)增益对应。第 四组增益可与扬声器配置或简档中的所有信道中的每一个中的四个频带中的每一个的广 带(或宽带)增益对应。在一些实施例中,可用元数据中的扬声器配置的(例如,参数化等)动 态范围压缩曲线传送对扬声器配置计算的多组增益。在一些实施例中,对扬声器配置计算 的多组增益可替代元数据中的扬声器配置的(例如,参数化等)动态范围压缩曲线。可根据 运里描述的技术支持附加的扬声器配置或简档。
[0206] 解码器(100)被配置为例如通过诸如解压缩、去格式化、去多路复用("DEMUr)等 的动作从编码的音频信号提取音频数据块和/或帖和元数据。提取的音频数据块和/或帖可 通过解码器单元("NGC Decoder")解码成音频数据要素或采样。解码器(100)进一步被配置 为确定要呈现音频内容的解码器(100)处的特定回放环境的简档,并且从从编码音频信号 提取的元数据选择动态范围压缩曲线。数字音频处理单元("DAP")被配置为出于生成在特 定回放环境中驱动音频信道的音频信号的目的在音频数据要素或采样上施加 DRC和其它动 作。解码器(100)可基于从音频数据块或帖确定的响度水平和选择的动态范围压缩曲线计 算和施加 DRC增益。解码器(100)也可基于与选择的动态范围压缩曲线相关的基准对话响度 水平和从编码音频信号提取的元数据中的对话响度水平调整输出对话响度水平。解码器 (100)可随后施加与音频内容和特定回放环境相关的回放情形特有的增益限制器。因此,解 码器(100)可呈现/播放针对回放情形定制的音频内容。
[0207] 图5A示出另一示例性解码器(可W与图5的解码器100相同)。如图5A所示,图5A的 解码器被配置为例如通过诸如解压缩、去格式化、去多路复用("DEMUX")等的动作从编码的 音频信号提取音频数据块和/或帖和元数据。提取的音频数据块和/或帖可通过解码器单元 ("Decoder")解码成音频数据要素或采样。图5A的解码器进一步被配置为对一组缺省增益 基于缺省压缩曲线、与缺省压缩曲线有关的平滑化常数等执行DRC增益计算。图5A的解码器 进一步被配置为从元数据中的简档相关元数据提取非缺省增益简档的一组差分增益、确定 要呈现音频内容的图5A的解码器处的非缺省增益简档的一组非差分增益、出于生成在特定 回放环境中驱动音频信道的DRC增强音频输出的目的在音频数据要素或采样上施加一组非 差分增益和其它动作。因此,即使图5A的解码器自身可能或者可能没有实现用于执行一组 增益生成动作W直接对非缺省增益简档获得一组非差分增益的支持,图5A的解码器也可根 据非缺省增益简档呈现/播放音频内容。
[0208] 图6A~抓示出示例性处理流程。在一些实施例中,媒体处理系统中的一个或更多 个计算装置或单元可执行该处理流程。
[0209] 图6A示出可通过运里描述的音频解码器实现的示例性处理流程。在图6A的块602 中,第一装置(例如,图IA的音频解码器100等)接收包含音频内容和一个或更多个动态范围 压缩曲线的定义数据的音频信号。
[0210] 在块604中,第一装置确定特定回放环境。
[0211] 在块606中,第一装置基于从音频信号提取的一个或更多个动态范围压缩曲线的 定义数据建立特定回放环境的特定动态范围压缩曲线。
[0212] 在块608中,第一装置在从音频信号提取的音频内容的一个或更多个部分上执行 一个或更多个动态范围控制(DRC)动作。一个或更多个DR惊力作至少部分地基于从特定动态 范围压缩曲线获得的一个或更多个DRC增益。
[0213] 在实施例中,一个或更多个动态范围压缩曲线的定义数据包含起音时间、释放时 间或与一个或更多个动态范围压缩曲线中的至少一个相关的基准响度水平中的一个或更 多个。
[0214] 在实施例中,第一装置进一步被配置为执行W下过程:计算音频内容的一个或更 多个部分的一个或更多个响度水平;基于特定动态范围压缩曲线和音频内容的一个或更多 个部分的一个或更多个响度水平确定一个或更多个DRC增益;等等。
[0215] 在实施例中,对音频内容的一个或更多个部分计算的响度水平中的至少一个是与 一个或更多个频带相关的特定响度水平、跨着广带范围的广带响度水平、跨着宽带范围的 宽带响度水平、跨着多个频带的广带响度水平、跨着多个频带的宽带响度水平等中的一个 或更多个。
[0216] 在实施例中,对音频内容的一个或更多个部分计算的响度水平中的至少一个是瞬 时响度水平或在一个或更多个时间间隔上平滑化的响度水平中的一个或更多个。
[0217] 在实施例中,一个或更多个动作包括与调整对话响度水平、增益平滑化、增益限 审IJ、动态均衡化、噪声补偿等中的一个或更多个相关的一个或更多个动作。
[0218] 在实施例中,第一装置进一步被配置为执行W下过程:从编码的音频信号提取一 个或更多个对话响度水平;将一个或更多个对话响度水平调整到一个或更多个基准对话响 度水平,等等。
[0219] 在实施例中,第一装置进一步被配置为执行W下过程:从编码音频信号提取一个 或更多个听觉场景分析(ASA)参数;改变在平滑化施加到音频信号的增益时使用的一个或 更多个时间常数,增益与一个或更多个DRC增益、增益平滑化或增益限制等中的一个或更多 个有关。
[0220] 在实施例中,第一装置进一步被配置为执行W下过程:基于复位事件的指示确定 复位事件在音频内容的一个或更多个部分中出现,该复位的指示是从编码的音频信号提取 的;和响应于确定复位事件在音频内容的一个或更多个部分中出现,在在确定复位事件在 音频内容的一个或更多个部分中出现时执行的一个或更多个增益平滑化动作上采取一个 或更多个行动。
[0221] 在实施例中,第一装置进一步被配置为执行W下过程:保持瞬时响度水平的直方 图,该直方图被从音频内容中的时间间隔计算的瞬时响度水平占据;确定特定响度水平是 否在直方图的高概率区域中高于阔值,特定响度水平是从音频内容的一部分计算的;和响 应于确定特定响度水平在直方图的高概率区域中高于阔值,执行W下过程:确定出现了响 度过渡;缩短在增益平滑化中使用的时间常数W加速响度过渡。
[0222] 图6B示出可通过运里描述的音频编码器实现的示例性处理流程。在图6B的块652 中,第二装置(例如,图IB的音频编码器150等)接收源音频格式的音频内容。
[0223] 在块654中,第二装置检索一个或更多个动态范围压缩曲线的定义数据。
[0224] 在块656中,第二装置生成包含音频内容和一个或更多个动态范围压缩曲线的定 义数据的音频信号。
[0225] 在实施例中,第二装置进一步被配置为执行W下过程:确定一个或更多个动态范 围压缩曲线的一个或更多个标识符;和基于一个或更多个标识符从基准数据库检索一个或 更多个动态范围压缩曲线的定义数据,等等。
[0226] 在实施例中,第二装置进一步被配置为执行W下过程:对音频内容的一个或更多 个部分计算一个或更多个对话响度水平;用音频内容的一个或更多个部分将一个或更多个 对话响度水平编码到编码的音频信号中,等等。
[0227] 在实施例中,第二装置进一步被配置为执行W下过程:在音频内容的一个或更多 个部分上执行听觉场景分析(ASA);基于音频内容的一个或更多个部分上的ASA的结果生成 一个或更多个ASA参数;用音频内容的一个或更多个部分将一个或更多个ASA参数编码到编 码的音频信号中,等等。
[0228] 在实施例中,第二装置进一步被配置为执行W下过程:确定一个或更多个复位事 件在音频内容的一个或更多个部分中出现;和用音频内容的一个或更多个部分将一个或更 多个复位事件的一个或更多个指示编码到编码的音频信号中,等等。
[0229] 在实施例中,第二装置进一步被配置为将音频内容的一个或更多个部分编码到音 频数据帖或音频数据块中的一个或更多个中。
[0230] 在实施例中,一个或更多个DRC增益中的第一 DRC增益向与特定回放环境对应的特 定扬声器配置中的一组所有信道中的第一适当子集中的各信道施加;而一个或更多个DRC 增益中的第二不同DRC增益向与特定回放环境对应的特定扬声器配置中的一组所有信道中 的第二适当子集中的各信道施加。
[0231] 在实施例中,一个或更多个DRC增益中的第一 DRC增益向第一频带施加,而一个或 更多个DRC增益中的第二不同DRC增益向第二不同的频带施加。
[0232] 在实施例中,音频内容的一个或更多个部分包含音频数据帖或音频数据块中的一 个或更多个。在实施例中,编码音频信号是视听信号的一部分。
[0233] 在实施例中,一个或更多个DRC增益在响度域中被限定。
[0234] 图6C示出可通过运里描述的音频解码器实现的示例性处理流程。在图6C的块662 中,第S装置(例如,图IA的音频解码器100、图5的音频解码器、图5A的音频解码器等)接收 包含音频内容W及一个或更多个动态范围压缩曲线(DRC)曲线和一组或更多组差分增益的 定义数据的音频信号。
[0235] 在块664中,第=装置对特定回放环境中的增益简档识别一组或更多组差分增益 之中的特定组的差分增益;第S装置还识别一个或更多个DRC曲线中的与特定组的差分增 益相关的缺省DRC曲线。
[0236] 在块666中,第S装置至少部分地基于缺省DRC曲线生成一组缺省增益。
[0237] 在块668中,至少部分地基于一组缺省增益与特定组的差分增益的组合,第=装置 在从音频信号提取的音频内容的一个或更多个部分上执行一个或更多个动作。
[0238] 在实施例中,一组缺省增益包含通过至少部分地基于缺省DRC曲线执行一组增益 生成动作生成的非差分增益。
[0239] 在实施例中,缺省DRC曲线代表缺省增益简档。在实施例中,关于缺省DRC曲线的特 定组的差分增益代表非缺省增益简档。在实施例中,音频信号不包含与非缺省增益简档对 应的非缺省DRC曲线的定义数据。
[0240] 在实施例中,特定组的差分增益包含对非缺省增益简档生成的一组非差分非缺省 增益和对由缺省DRC曲线代表的缺省增益简档生成的一组非差分缺省增益之间的增益差。 一组非差分非缺省增益与一组非差分缺省增益由编码音频信号的上游音频解码器生成。
[0241] 在实施例中,一组非差分非缺省增益或一组非差分缺省增益中的至少一组不作为 音频信号的一部分被提供。
[0242] 图6D示出可通过运里描述的音频解码器实现的示例性处理流程。在图6D的块672 中,第四装置(例如,图IA的音频编码器150、图5的音频编码器等)接收源音频格式的音频内 容;
[0243] 在块674中,第四装置至少部分地基于代表缺省增益简档的缺省动态范围压缩 (DRC)曲线生成一组缺省增益。
[0244] 在块676中,第四装置生成非缺省增益简档的一组非缺省增益。
[024引在块678中,至少部分地基于一组缺省增益和一组非缺省增益,第四装置生成一组 差分增益,该组差分增益代表关于缺省DRC曲线的非缺省增益简档。
[0246] 在块680中,第四装置生成包含音频内容W及一个或更多个DRC曲线和一组或更多 组差分增益的定义数据的音频信号,一个或更多个DRC曲线包含缺省DRC曲线,一组或更多 组差分增益包含一组差分增益
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1