元数据驱动的动态范围控制的制作方法_4

文档序号:9422875阅读:来源:国知局
,应在合成滤波器组之前即刻将DRC增益 应用于最高层的子频带,但并非在擅染/混合阶段之后进行。 6 阳18引 子频带中的DRC蜡益麻用 7 对于QMF域中的DRC增益应用,时域DRC增益可由时域采样间隔D延迟并由因子L进行下采样。D和L的值取决于配置,诸如单一速率与双速率肥-AAC。对于所有配置,必 须实现DRC增益和音频信号之间的适当时间对准。 8 阳18引 比特流语法 9 DRC比特流在表20和表21中定义。通常,DRC比特流time_domain_^c_info0 承载于主机编解码器的扩展有效载荷字段中。 10
[0191] 表20:uni_^c_in化0有效载荷的语法
[0192]
[0193] 表 21: ^c_gain_sequence0 的语法 12
2 表22:初始DRC增益值的编码
[0196]
[019引表23:DRC增益差的编码 1
[0200] 表24 :斜率坡度的编码
[0201]
[020引 表25:nNodesMax=Ndkc时的时间差的编码 1

[020引表26:归一化交叉频率和相关联的滤波器系数参数的编码 阳20引 线忡插估DRC编码
[0207] 尽管上述设及基于使用样条插值对增益值进行编码和解码,但在一些实施例中, 可使用线性插值来对增益值进行编码和应用。例如,在一个实施例中,可使用如上所述的样 条节点来针对一条声音节目内容对DRC值进行编码。在该实施例中,可从比特流中删除每 个样条节点之间的斜率值。相反,可在样条节点之间执行线性插值而不是样条插值。W运 种方式,DRC增益值的编码可通过避免生成斜率值来简化。 阳20引 基于窗口的電叠巧加DRC蜡益插估
[0209] 在一个实施例中,基于窗口的重叠相加增益插值法可用于对DRC增益值进行解 码。在该方法中,W类似于上述的方式对增益值进行编码和接收。然而,每个增益值在解码 期间用作窗口的乘法器(例如,窗口系数的向量)。经插值的增益曲线此后可通过使用重叠 相加法来获得。例如,窗口的经插值的DRC增益曲线可为增益值与窗口的乘积。使用窗口 的一个原因在于,相比于由在子频带中应用增益值的标准化解码器产生的增益曲线可生成 相同的增益曲线。此外,基于窗口的重叠相加增益插值法不生成混叠失真。下文W举例的 方式来描述该基于窗口的重叠相加增益插值法的更多深入描述。
[0210] 图9示出了用于某些对应解码器窗口形状(虚线)的DRC窗口形状(实线)。从 上到下,图9示出了示例性长窗口、由长到短的过渡窗口、短窗口和由短到长的过渡窗口。 DRC窗口可通过解码器合成窗口的平方来计算。DRC窗口可W与对应解码器合成窗口相同 的时间被应用。
[0211] W下公式示出了DRC窗口如何根据具有AAC帖尺寸N的长AAC合成窗口来计算:
[0引引 MW',。巧的=wi,"。巧("),对于n= [0,2N-U做
[0213]短窗口和过渡窗口可W类似的方式来计算。W下公式(9)示出了由从比特流导出 的DRC增益值加权的连续DRC窗口的重叠相加过程。时间索引和帖索引分别被表示为n和k。时间索引O位于当前合成窗口的起始(当前帖的第一输出样本)处。
[0214]g(n) =gDRc(k-l)WDRc(k-l,N+n)+gDRc似町邮也n)其中n= [0,N-U(9)
[0215]DRC增益继而可XMt根据W下公式(10)应用于解码器输出信号W生成最终的经压 缩的音频输出Xdkc。DRC增益并不被应用于MDCT域。 邮1引Xdrc(D) =g(n)Xmc(D),对于n=[0, N-U (10)
[0217] 当在MPEG中使用轻压缩时,多频带DRC元数据可用于将独立DRC增益值应用于单 个短块或分组短块。相比于标记"多频带",可对每个DRC增益进行编码,使其应用于短块的 整个MDCT频域。因此,每个DRC增益作为单频带DRC进行操作。如果是运种情况,DRC操 作可如上所述类似地在时域中完成。
[021引例如,如图10的上面图所示,如果针对8个短块给出5个DRC增益值,则对应DRC窗口被示出为实线。下图示出使用具有相同形状和g。到g4的对应DRC增益值的8个短DRC 窗口。DRC窗口可从使用具有参数N' =N/8的公式(8)的短窗口形状导出。通过W参数 N'代替N来对应地应用公式巧)和(10)。
[0219] 一般来讲,比特流语法允许独立选择用于单个帖的单频带或多频带DRC。利用上述 时域DRC具体实施,无论何时存在真实的多频带DRC增益信息("真实的多频带"意味着针 对不同的子频带存在不相等的DRC增益值),解码器都将切换到MDCT域DRC处理。
[0220] 该提案包括经修改的MPEG-AACDRC具体实施,该具体实施通过单频带DRC的向后 兼容的方式避免了混叠失真。尽管上述设及MPEG-AACDRC,但在其他实施例中,可使用包括 频域DRC增益值的任何类型的比特流音频。
[0221] 在上述实施例中,解码器被修改W将DRC应用于时域。在另一个实施例中,可将附 加字段添加至比特流W提高DRC增益值在时域中应用于音频信号的可变性。DRC增益值的 新字段可在比特流语法中的不同位置处定义。对于MPEG标准,一个选项是表27中所示的 填充元素中所携带的附加扩展有效载荷的定义。在该实施例中,可将程序内容的音频声道 分成DRC组,其中每个组具有独立的一组DRC信息,即将单独的独立DRC应用于每组声道。 音频声道可仅属于一个DRC组或不属于DRC组。可将分组信息添加至样本描述,其在轨道 的起始出现一次。在该实施例中,DRC组的数量被称为nDrc化annelGroups。
[0222]
[022引表27 :时域DRC扩展有效载荷
[0224] 在观察实际具体实施中随时间变化的增益时,可看出增益有时可变化非常缓慢, 而在音频信号表现出攻击时增益可表现出显著变化。用于对DRC增益值进行编码的必要比 特率通过支持用于每个所谓的化cGainInfoBlock的单个可选的时间分辨率而降低。音频 帖均匀分成多表28中所示的最多至8个运些信息块并且每个信息块可包含最多至16个增 益值。
[0225]与增益值的较大时间分辨率相关联的比特率增加进一步通过使用利用增益变化 的赌编码进行的自适应方案来减轻。DRC增益值可使用表27中定义的语法在每个音频帖中 传输。
[0226]
[0227]
[0228] 表 28:nDrcGainInfoBlocks的查找表
[0229] 条目化cGainCodingMode确定表29中所给出的信息块的增益值的数量。每帖可 存在至少一个增益值W支持随机插入。第一增益值根据表30来编码。其余增益值使用表 31或表32(根据所选择的化cGainCodingMode)进行差分编码。
[0230]
[0231] 表 29:化cGainCodingMode的查找表
[0232]
[0233] 表 30:gainlnitial的表不
[0234]
[023引 表31:化cGainCodingMode= = 1时的DRC增益差的编码
[0236]
[0237] 表32:化cGainCodingModeG垃3]时的DRC增益差的编码 [023引
[02測表33对数DRC增益值[地]的解码
[0240] 差值的非均匀分辨率是由屯、理声学引起的,诸如观察到增益变化上的偏差越不易 听到,增益变化越大。反之亦然,如果增益几乎恒定不变(并且音频包络也恒定不变),则 增益变化上的偏差更容易听到。非对称范围适用于对音频信号中的突发攻击进行快速反应 DRC增益衰减。增益增加通常较慢。
[0241] 典型的音频解码器使用重叠相加法利用与后续块50%的重叠来重建音频信号。每 个块由在任一端渐缩的窗口来加权。例如,MPEG-AAC的典型帖尺寸为1024个样本。对于 每个新帖,解码器重建2048个样本,其中将前1024个样本添加到前一个块的后1024个样 本并且结果为解码器输出。在重建块的后半部分期间均匀调度具有帖k的信息块。每个信 息块内的增益值均匀分布在信息块的持续时间内。该方案确保了所有必要DRC增益值在对 起始和末尾进行解码时并且对于插值均为可用的。
[0242] 图11示出了其中比特流的帖n包含用于合成窗口的后半部分的DRC增益。帖n 具有4个信息块,运些信息块分别具有1个、8个、2个和4个DRC增益值。DRC增益值的定 时基于增益值在每个信息块内的均匀分布来计算。随后,使用线性插值来生成每个时域音 频样本的增益值。
[0243]
[0244] 表34 :计算DRC增益值的时间位置
[0245] 增益值定时的计算在表34中给出。结果tGain[g]比]指示W采样间隔为单位的 始于当前输出帖的第一样本处的0. 0的样本位置。帖尺寸WNff。。。样本来表示。
[0246] 给出增益值和它们的定时,针对当前输出帖的所有样本的平滑增益曲线可通过如 表35所示的线性增益值的线性插值来构建。曲RCprev为前一帖的最后DRC增益值。在该 实施例中,需要下一帖的第一增益值来内插帖的增益值W用于输出。由于重叠相加过程,该 增益值是可用的,而无需在比特流之前进行额外读取。引入函数toLinearOW包括用于从W地为单位的对数值生成线性增益值的所有必要步骤。
[0247]
[024引表35:DRC增益值的插值
[0249] 最后,如表36所示,应用经插值的DRC增益。
[0巧 0]
[0巧1] 表26:DRC增益值的应用
[0巧2] 上述该实施例包括针对音频标准诸如MPEG-Audio的改进的DRC元数据编码和处 理。已解决当前标准的缺点,诸如生成混叠失真W及DRC元数据的时间分辨率不足。
[0巧3] 如上所述,多种技术可用于对DRC增益值进行编码并将其应用于一条声音节目内 容。在一些实施例中,一种用于将频域动态范围控制值RC)增益值应用于时域中的音频信 号的方法,包括:接收比特流,其中该比特流包括经编码的音频信号
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1