使用预先存在的音频增益元数据的信号削波保护的制作方法

文档序号:2823244阅读:302来源:国知局
专利名称:使用预先存在的音频增益元数据的信号削波保护的制作方法
技术领域
本申请涉及使用嵌入数字音频流的预先存在的音频元数据的音频信号的削波保护。特别地,本申请涉及将多通道音频信号下混合为较少通道时的削波保护。
背景技术
在例如数字广播环境中,在数字音频流中嵌入音频元数据是公知的概念。这种元数据是“关于数据的数据”,即,关于流中的数字音频的数据。元数据可以给音频解码器提供关于如何再现音频的信息。一种类型的元数据是动态范围控制信息,其表示时变的增益包络。这种动态范围控制元数据可用于多个目的(1)控制被再现的音频的动态范围数字传输允许高动态范围,但是收听条件不总是允许利用高动态范围。虽然高动态范围是安静的起居室条件中所希望的,它可能不适合其它条件,例如,由于高的背景噪声电平而不适合汽车音响。为了适应各种收听条件,可以在数字音频流中插入指示接收器如何减小被再现的音频的动态范围的元数据,而不是在传输之前减小音频的动态范围。后一种方法不是优选的,这是由于这可能使得接收器不能以完整动态范围来再现音频。相反,前一种方法是优选的,这是由于它允许收听者根据收听环境决定是否应用动态范围控制。这种动态范围控制元数据使得收听者能够随意决定是否进行解码信号的高质量艺术动态范围压缩。(2)在下混合操作的情况下防止削波当下混合多通道信号(例如,5. 1通道音频信号)时,通道数目减少,通常减少到两个通道。在通过立体声扬声器再现包括多于两个的通道的多通道音频信号(例如,具有5个主通道和1个低频效果通道的5. 1通道音频信号) 的情况下,典型地,执行接收器侧下混合操作,其中多通道信号被混合为两个通道。混合操作可由下混合矩阵描述,例如,在将5通道信号下混合为2通道(立体声)信号的情况下的具有2行和5列的2X5矩阵(在下混合期间通常不考虑低频效果通道)。已知将5. 1通道信号的5个主通道混合为2个通道的不同下混合方案,例如Lo/ Ro (仅左通道,仅右通道)或Lt/Rt (左总体通道,右总体通道)。下混合步骤具有数字立体声信号偶尔过载的风险,从而产生不希望的削波假信号 (clipping artifact) 0当将超出最大(或最小)可表示值的经下混合的数字信号的幅值被局限于最大(或最小)可表示值时,可发生这种削波。例如,在简单的无符号定点二进制表示的情况下,当计算出的经下混合的幅值被局限为所有位相应于1的最大值字时发生削波。在有符号的16位表示的情况下,最大值可以例如相应于字"0111111111111111"。由于在头端、发送器或内容产生侧已知用于各种下混合方案的下混合矩阵,对于在被下混合时可能导致削波的信号,可将指示接收器在混合之前衰减将要被下混合的信号的动态范围控制元数据添加到音频流,以便动态地防止削波。(3)在经提升(boost)的输出的情况下防止削波对于动态非常有限的通道上的重新传输(从机顶盒通过模拟RF链路到TV的RF输入),通常将信号提升lldB,以便在该路径上实现更好的信噪比。在这样的应用中,对于当被放大IldB时可能导致削波的信号, 可将指示接收器在应用IldB放大之前衰减信号的动态范围控制元数据添加到音频流,以便动态地防止削波。从接收音频流的设备的角度看,不清楚到来(incoming)的动态范围控制元数据用于目的(1)、即控制动态范围,目的O)、即下混合削波保护,还是目的⑴和⑵两者。通常元数据完成这两个任务,但是情况不总是如此,所以在某些情况下,元数据可能不包括下混合削波保护。另外,在根据目的C3)元数据与RF模式相关联的情况下(通常,对于RF模式使用不同的增益参数),元数据可被用于在额外(extra)放大的情况中(在下混合情况和无下混合情况两者中)防止削波。另外,由于对于某些音频编码格式元数据是可选择的,因此到来的音频流可能根本不包含动态范围控制元数据。如果动态范围控制元数据不被压缩的音频流包括,或被包括但是不包含下混合削波保护,如果多通道信号被下混合为较少通道,可能在解码信号中出现不希望的削波假信号。

发明内容
本发明描述了在不能确保利用音频元数据的削波保护时防止音频信号的削波的方法和设备。本申请的第一方面涉及保护从数字音频数据得出的音频信号(例如,经下混合的数字音频信号)免受信号削波的方法。根据该方法,确定基于接收到的音频元数据的第一增益值是否足够保护音频信号免受削波。音频元数据被嵌入第一音频流。例如,确定压缩的音频流包括的时变增益包络元数据是否足以防止下混合削波。在第一增益值不足够保护的情况下,以足够保护音频信号免受削波的增益值替代对应的第一增益值。优选地,在第一音频流中不存在与动态范围控制有关的元数据的情况下,该方法可以添加足以防止信号削波的增益值。例如,在时变增益包络元数据不提供足够的下混合削波保护或根本不存在的情况下,修正或添加时变增益包络元数据,从而其提供足够的下混合削波保护。不论是否接收到对于削波保护足够的增益值,该方法都允许削波保护,特别是下混合情况下的削波保护。根据该方法,可以尽可能如实地应用接收到的音频增益字(如果提供的话),但是当到来的增益字没有提供足够的衰减以便防止例如下混合中的削波时,可以不考虑接收到的音频增益字。当用于目的⑴的动态范围控制数据具有艺术方面时,如果到来的元数据不提供这些艺术方面,接收设备(例如,机顶盒)通常不负责引入这些艺术方面。然而目的O)的属性可以并且因此应由接收实体提供。这意味着接收设备应试图在添加削波保护的同时尽可能多地保持预期用于目的(1)的动态范围控制的动态范围控制数据。存在多种用于确定基于接收到的音频元数据的第一增益值是否足以防止信号削波的方法。根据一种优选方法,基于数字音频数据计算第二增益值,第二增益值足够保护音频信号免受削波。第二增益值可以是不导致削波的最大允许增益值。优选地,该方法以这样的方式确定第一增益值是否足够,S卩,它将基于接收到的音频元数据的第一增益值和计算出的第二增益值进行比较。该方法可将与音频数据的片段相关联的一个第一值和与音频数据的相同片段相关联的对应的第二增益值进行比较。依赖于此,可由第一和第二增益值产生适应削波保护的增益值流。优选地,依赖于比较操作从第一增益值和计算出的第二增益值中选择这样的增益值。通过选择第二计算出的增益值而不是第一增益值,以所选择的第二增益值替代第一增益值。优选地,选择一对第一增益值和第二增益值中的最小值。如果第一增益值大于对于保护足够的计算出的第二增益值,这指示存在第一增益值对于削波保护不足够的风险, 并且因此应当被对应的第二增益值替代。否则,如果第一增益值小于对于保护足够的计算出的第二增益值,这指示不存在信号削波的风险,并且应当保持第一增益值。可如下文解释地执行从第一和第二增益值中的增益值的选择在第一增益值和第二增益值两者提供小于或等于1的增益的情况下,采用两者中的最小值。这意味着或者第一增益值已经确保了削波保护,或如果不是,则用第二增益值替代第一增益值。在第二增益值的增益大于1并且第一增益值提供小于或等于1的增益的情况下,信号可被放大并且仍不会削波。然而,到来的音频流需要衰减,例如以便满足动态范围限制目的,并且因此其被保持。在第一增益值提供大于1的增益并且第二增益值提供小于或等于1的增益的情况下,到来的第一增益值将破坏削波保护,因此采用第二增益值。在第一增益值和第二增益值两者都提供大于1的增益的情况下,输入应被放大。 只要仍然没有发生削波就允许此放大,并且因此使用第一增益值和第二增益值中的较小
者ο一种可替换的用于确定第一增益值是否足够保护的方法是将第一增益值应用于音频数据,并且确定作为结果的数字音频信号(例如,经下混合的信号)是否出现削波。在第一增益值对于保护不足够的情况下,可从作为初始增益值的第一增益值开始迭代地确定足够削波保护的增益值。例如,可以确定对于如下这样的增益值音频信号是否出现削波,该增益值为根据增益值的分辨率的小于第一增益值的最接近的增益值(例如, 在第一增益值是0. 8并且增益值分辨率是0. 1的情况下,最接近的较小增益值是0. 7)。如果信号仍然削波,可以确定对于下一个较小增益值(例如,增益值0.6)音频信号是否出现削波。这可重复进行,直到发现不导致信号削波的增益值。优选地,该方法被作为编码转换处理的一部分执行,其中第一音频编码格式(例如,AAC格式和还已知为aacPlus的高效AAC (HE-AAC)格式)的第一音频流被编码转换为以第二音频编码格式(例如,Dolby Digital格式或Dolby Digital Plus格式)编码的第二音频流。第二音频流包括对于削波足够的替代的增益值或具有从其得出的增益值。由于不能在整个传输链中直到传输链中的最终音频解码器(例如,直到AVR音频 /视频接收器的解码器)始终保持承载音频数据的数字压缩格式,因此常常需要音频编码转换。在广播的情况下,这是因为,例如,对于接收设备(例如,机顶盒-STB)与传输链中的最终解码器(例如,AVR中的解码器或电视机内的音频解码器)之间的音频的传输以及无线电广播(或通过缆线对消费者的广播)可能使用不同编码方案。例如,可以通过AAC 格式或HE-AAC格式进行音频数据的无线电广播,并且然后可将音频数据编码转换为Dolby Digital格式或Dolby Digital Plus格式,以便从STB传输到AVR。因此,可以例如在STB 中执行编码转换步骤,以便从一种格式改变为另一种格式。这种编码转换步骤包括音频数据自身的编码转换,但是理想地还包括伴随的元数据、尤其是动态范围控制数据的编码转换。根据优选实施例,该方法在第二音频流中提供经编码转换的音频增益元数据,该增益元数据足够防止信号削波。该方法可能在任何如下这样的设备中非常有用,该设备将信号从一种压缩音频流格式编码转换为另一种格式,其中事先不知道由第一格式携带的时变增益控制元数据(如果有的话)是否包括下混合削波保护(例如,在AAC/HE-AAC到Dolby Digital编码转换器中,Dolby E到AAC/HE-AAC编码转换器中,或Dolby Digital到AAC/HE-AAC编码转换器中)。优选地,为了确定第一增益值是否足够保护,根据至少一种下混合方案(例如根据Lt/Rt下混合方案)对数字音频数据进行下混合。下混合得到一个或多个信号,例如,得到与右通道相关联的一个信号和与左通道相关联的一个信号。另外,可以考虑多种下混合方案,并且根据多于一种的下混合方案来下混合数字音频数据。优选地,连续确定从音频信号得出的各种信号的实际峰值,即在给定时间确定各种信号中的具有最高信号值的信号。为了计算峰值,该方法可以确定在给定时刻两个或更多个信号的绝对值的最大值。所述两个或更多个信号可以包括根据第一下混合方案下混合之后的一个或多个信号,例如,经下混合的右通道信号的样本的绝对值和同时的经下混合的左通道信号的样本的绝对值。另外,为了计算峰值,该方法还可以考虑根据第二(并且甚至第三)下混合方案下混合之后的一个或多个信号的绝对值。另外,峰值确定可以考虑下混合之前的一个或多个音频信号的绝对值,例如,5. 1通道信号的5个主要通道中的每一个在相同时刻的绝对值。应当注意,在编码转换的情况下,典型地不知道稍后是否在离散通道上重放多通道信号,或是否执行根据下混合方案的下混合。峰值相应于这些同时的信号样本值的最大值,从而指示在特定时间实例对于所有可能情况信号可以具有的最大幅值,并且这是削波保护算法应当考虑的最坏情况。动态范围控制数据典型地以一定粒度时变,该粒度通常与对应的音频编码格式的数据片段(例如,块)的长度或其整数部分有关。因此,优选地还每个数据片段计算第二增益值。因此,优选地减小峰值或连续峰值的采样速率(下采样)。可以通过确定多个连续峰值或连续的经滤波的峰值的最大值来实现。具体地,该方法可以确定与数据片段(例如数据块或帧)相关联的多个连续(经过滤)峰值的最大值。在编码转换的情况下,该方法可以确定与第二(发出的)数据流的数据片段相关联的多个连续(经过滤)峰值的最大峰值。应当注意,优选地,不仅基于发出的片段中的信号样本的连续峰值被考虑用于确定最大值,而且将影响数据片段的解码的附加(在前和在后)峰值,即与解码窗口的开始和结束处的信号样本有关的峰值也被考虑。这些峰值也与数据片段相关联。作为选择最大峰值的替代,可每个数据片段计算不同的值以便减小采样速率。
应当注意,可以对从峰值之外的音频数据得出的样本进行下采样。例如,音频数据可被下混合为单个通道(单声道),并且仅确定每个发出的数据片段的经下混合的连续样本的最大值。根据不同的示例,首先每个发出的数据片段计算各经下混合的通道信号的各最大值(下采样),并且然后计算这些最大值的峰值。基于确定的最大值,可以通过对确定的最大值求倒数来计算增益值。如果1是可被表示的最大信号值,对确定的最大值求倒数直接得到增益因子。当该增益因子被应用于 (经滤波的)峰值的最大值时,结果值等于1,即最大信号值。这意味着应用该增益的每个音频样本被保持低于或等于1,从而避免这个数据片段的削波。在1是最大信号电平的情况下,1相应于OdBFS-相对于整个数值范围的分贝;一般将OdBFS分配给最大可能电平。作为简单地对确定的最大值求倒数的替代,可以通过使最大信号值(其相应于 OdBFS)除以确定的与数据片段相关联的最大值,计算增益值。然而,与简单的求倒数相比, 计算成本较高。在编码转换的情况下,数据片段(例如,数据块或帧)的长度对于第一音频编码格式(输入流的格式)和第二音频编码格式(输出流的格式)是不同的。例如,在AAC中,块典型地包含128个样本(在HE-AAC 每个块256个样本),而在Dolby Digital中,块典型地包含256个样本。因此,当从AAC编码转换到Dolby Digital时每块的样本数目增加。 在AAC中,帧典型地包括IOM个样本(在HE-AAC中每帧2048个样本),其中在Dolby Digital中,帧典型地包括1536个样本(6个块)。因此,当从AAC编码转换到Dolby Digital 时,每帧的样本数目也增加。动态范围控制数据的粒度主要是块大小或帧大小。例如,用于 HE-AAC流的MPEG中的动态范围控制元数据“DRC”的粒度和Dolby Digital中的增益元数据“dynrng”的粒度是块大小。作为对比,Dolby Digital中的增益元数据“compr”的粒度和用于HE-AAC流的DVB(数字视频广播)中的增益元数据“heavy compression”的粒度是帧大小。另外,采样速率对于输入流(例如,32KHz或44. IKHz)和输出流(例如,48KHz)可以不同,即音频被重采样。这还改变了到来的数据片段和发出的数据片段之间的长度关系。 另外,到来的和发出的数据片段可能不对齐。另外,应当注意,以输入数据片段(例如,块或帧)传输的元数据具有动态范围控制影响区域(即,流中的增益值的应用已生效的范围), 该动态范围控制影响区域常常不与数据片段完全一样大,而是更大。这归因于使用的变换的重叠添加特性,以及常常在频谱域中应用动态范围控制这一事实。发出的音频流的动态范围控制数据也是如此。因此,为了确定哪些输入增益值影响给定的输出数据片段,如下面详细解释地,可以查看输入和输出影响长度的重叠(而不是考虑输入和输出数据片段的重叠)。由于上面讨论的原因,动态范围控制数据的编码转换应当考虑到发出的动态范围控制值可能受到多于一个到来的动态范围控制值的影响。在此情况下,当对数据流进行编码转换时,可以执行动态范围控制数据的重采样(重整)。因此,该方法可以包括对从第一音频流的接收到的音频元数据得出的增益值重采样的步骤。当第一音频流的数据片段覆盖比第二音频流的数据片段短的时间长度时,增益值被下采样。可以通过计算多个连续增益值的最小值来确定经重采样的增益值。换言之从若干输入动态范围控制增益(其与发出的数据片段相关)中选择最小的一个。这样做的动机是尽可能多地保持到来的值(在该值不导致信号削波的情况下)。然而,这常常是不可能的,因为必须对增益值重采样。因此,选择最小增益值,这趋向于减小信号幅值。然而,信号幅值的此减小被认为不太显著或讨厌。优选地,每个输出数据片段确定这样的最小值。在第一音频流中不存在与动态范围控制有关的增益元数据的情况下,该方法优选地在第二音频流(发出的流)中添加足以防止削波的增益值。这些增益值应优选地被限制, 使得它们不超过增益1。防止增益值超过1的原因是信号不应当被不必要地放大以接近削波边界。因此,在对应的计算出的第二增益值具有低于1的增益的情况下,对应的添加的增益值相应于计算出的第二增益值。在对应的计算出的第二增益值大于1的情况下,对应的添加的增益值被设为增益1。本发明的第二方面涉及用于保护从数字音频数据得出的音频信号免受信号削波的设备。该设备被配置为执行上面讨论的方法。该设备的特征相应于上面讨论的方法的特征。因此,该设备包括用于确定基于接收到的音频元数据的第一增益值是否足够保护音频信号免受削波的装置。另外,该装置包括用于在第一增益值不足够的情况下用足够保护音频信号免受削波的增益值替代第一增益值的装置。优选地,确定装置包括用于基于数字音频数据计算第二增益值的装置,第二增益值对于音频信号的削波保护是足够的。更优选地,确定装置还包括比较装置,用于比较基于接收到的音频元数据的第一增益值和计算出的第二增益值。依赖于此,从第一增益值和计算出的第二增益值中选择增益值。上文的关于本申请的第一方面的评述也适用于本申请的第二方面。本申请的第三方面涉及编码转换器,该编码转换器配置为将音频流从第一音频编码格式编码转换为第二音频编码格式。该编码转换器包括根据本申请的第二方面的设备。 优选地,编码转换器是接收第一音频流的接收设备的一部分,其中第一音频流是数字广播信号,例如,数字电视信号(例如,DVB-T, DVB-S, DVB-C)或数字无线电信号(例如,DAB信号)的音频流。例如,接收设备是机顶盒。还可以通过hternet广播音频流(例如,Internet TV或hternet无线电)。可替换地,可从数字数据存储介质,例如,DVD(数字通用盘)或蓝光盘读取第一音频流。上文的关于本申请的第一和第二方面的评述也适用于本发明的第三方面。


下面参考附图以示例方式解释本发明,其中图1示出了提供削波保护的编码转换器的实施例;图2示出了元数据重整(reframing)的优选方法;图3示出了基于接收到的音频数据确定峰值的实施例;图4示出了将到来的动态范围控制数据与计算出的足够削波保护的增益值合并的实施例;图5示出了输出增益值的选择;图6示出了将到来的动态范围控制数据与计算出的足够削波保护的增益值合并的可替换实施例;图7示出了平滑化滤波级的实施例;图8示出了提供削波保护的另一个实施例;图9示出了提供削波保护的还另一个实施例;以及图10示出了接收经编码转换的音频流的接收设备。
具体实施例方式AAC/HE-AAC 和 Dolby Digital/Dolby Digital Plus 支持元数据的概念,更具体地,携带在解码时将被可选择地应用于音频数据的时变增益的增益字的概念。出于减少数据的目的,这些增益字典型地仅每个数据片段被发送一次,例如每个数据块或帧被发送一次。在所述音频格式中,这些增益字是可选择的,即,技术上可不发送该数据。Dolby Digital/Dolby Digital Plus编码器典型地发送增益字,而AAC和HE-AAC编码器常常不发送增益字。然而,发送增益字的AAC和HE-AAC编码器的数目正在增加。本申请允许接收音频流的解码器或编码转换器在两种状况下做“正确的事”。如果提供了增益字,“正确的事” 是尽可能如实地处理接收到的增益字,但是当例如在下混合的情况下到来的增益字不能提供足以防止信号削波的衰减时,不考虑这些增益字。如果没有提供增益值,“正确的事1计算并且提供防止信号削波的增益值。图1示出了编码转换器的实施例,该编码转换器提供了防止信号削波的保护,尤其是在下混合(例如,从5. 1通道信号下混合到2通道信号)情况下防止削波的保护。编码转换器接收包含音频元数据的数字音频流1。例如,数字音频流是AAC或HE-AAC (HE-AAC version 1或HE-AAC version 2)数字音频流。数字音频流可以是DVB视频/音频流(例如DVB-T,DVB-S或DVB-C流)的一部分。编码转换器将接收到的音频流1编码转换为输出音频流14,输出音频流14被以不同的格式(例如Dolby Digital或Dolby Digital Plus) 编码。典型地,Dolby Digital解码器支持多通道信号的下混合,并且假设包括在接收到的Dolby Digital元数据中的时变增益包络包括下混合削波保护。不幸的是,比特流1(例如,AAC/HE-AAC比特流)不一定包含时变增益包络元数据,并且即使在携带这种数据的情况下,也不清楚该数据是否包括削波保护。编码转换器防止接收设备(编码转换器的下游) 中的解码器(例如,Dolby Digital解码器)在下混合信号时产生包含削波假信号的输出信号。编码转换器确保输出音频流14包含包括下混合削波保护的时变增益包络元数据。在图1中,单元2读出包含在音频流1的音频元数据中的动态范围控制增益值 3。可选择地,增益值3在单元5中被进一步处理,例如,增益值3根据经编码转换的输出音频流14的数据片段定时被重采样并且进行编码转换。文档〃 Transcoding of dynamic range control coefficients and other metadata into MPEG-4 HE AAC“ ,Wolfgang Schildbach et al. , Audio Engineering Society Convention Paper, presented at the 123rdConvention October 5-8,2007,New York.中讨论了元数据增益值的重采样和编码转换。通过引用将该论文的公开、尤其是元数据增益值的重采样和编码转换的概念结合在此。另外,申请人在2008年9月30曰提交了名称为"Transcoding of Audio Metadata" 的美国临时申请61/101497,该美国临时申请涉及元数据增益值的重采样和编码转换。通过引用将该申请的公开、尤其是元数据增益值的重采样和编码转换的概念结合在此。
与重采样并行地,音频流1中的音频数据典型地被解码器6解码为PCM (脉冲码调制)音频数据。经解码的音频数据7包括多个并行的信号通道,例如,在5. 1通道信号情况下的6个信号通道,或在7. 1通道信号情况下的8个信号通道。计算单元8基于音频数据7确定计算出的增益值9。计算出的增益值9对于在位于编码转换器下游的接收经编码转换的音频流的接收设备中尤其当在接收设备中对信号进行下混合时防止信号削波的保护是足够的。这种设备可以是AVR或电视机。计算出的增益值应当确保经下混合的信号最大达到OdBFS或更小。在单元10中将从音频流1中的元数据得出的增益值4与计算出的增益值9相互比较。单元10输出增益值11,其中在增益值流4的增益值不足以防止接收设备中的信号削波的情况下,以从增益值流9得出的增益值替代增益值流4的对应增益值。并行地,通过编码器12将音频数据7编码为输出音频编码格式,例如,Dolby Digital或Dolby Digital Plus。在单元13中组合经编码的音频数据和增益值11。作为结果的音频流提供了尤其对于信号下混合的情况防止信号削波的音频增益元数据。一般地,只要增益元数据提供防止信号削波的保护,则应当尽可能多地保持进入 (ingoing)的增益元数据。在大多数情况下,输入音频流(见图1中的1)的数据片段(例如,数据块或帧)的长度和输出音频流(见图1中的14)的数据片段(例如,数据块或帧) 的长度不同。另外,典型地,输入音频流的数据片段的开始和发出的音频流的数据片段的开始不对齐(即使数据片段长度相同)。因此,通常需要从进入的元数据到发出的(outgoing) 元数据的映射。图2示出了将到来的元数据映射到发出的元数据的优选方法。如前面讨论的,典型地,每个数据片段(例如,数据块或帧)具有动态范围控制数据的一个增益值(或多个增益值,例如,8个增益值)。然而,与输入数据片段(例如,数据块或帧)一起传输的元数据具有动态范围控制影响区域(即,流中的增益值的应用具有效果的范围),该动态范围控制影响区域常常不正好与数据片段一样大,而是更大。这是由于使用的变换的重叠-添加特性(即,使用大于数据片段的窗口,并且窗口重叠),以及由于常常在频谱域中应用动态范围控制。发出的音频比特流的动态范围控制数据常常也是如此。在图2中,实线标出输入流中的数据片段20-23的开始和结束,以及输出流中的数据片段M-26的开始和结束。在图2中,增益值的各动态范围控制影响区域30-33和34-36超出了对应数据片段的结束和开始。各影响区域30-33和34-36由虚线指示。例如,在HE-AAC中,块大小是256个样本,而用于解码的窗口具有512个样本。全部512个样本的窗口可被认为是影响区域;然而,增益值在窗口外缘处的影响小于在窗口中部的影响。因此,影响区域还可被认为是窗口的一部分。影响区域可以是从块/帧大小 (此处256个样本)直到窗口大小(此处512个样本)中选择的样本数。优选地,使用的影响区域大于数据片段(数据块或帧)的大小。为了确定哪些输入动态范围控制值影响给定的输出数据片段,优选地查看输入和输出影响区域的重叠(而不是查看输入和输出数据片段的重叠)。在图2中,确定输入流中的影响区域30-33中的哪些与给定输出数据片段M-26的影响区域34-36重叠。例如,输出流中的数据片段M的影响区域34与区域30、31、32和33重叠。因此,优选地,当确定示出的输出流中的第一数据片段M的增益值时,考虑与4个数据片段20、21、22和23关联的增益值。第一数据片段M受到4个输入数据片段20-23的影响。可替换地,该方法可以查看输入影响区域和输出信号片段的重叠,或输入数据片段和输出数据片段的重叠。可以在图1的单元5内执行这种映射或重采样处理,单元5接收输入流1的增益值3,并且将增益值3中的一个或多个映射到增益值4。图3示出了用于基于接收到的音频数据确定峰值的模块50的实施例。这种峰值确定模块50可以是图1的模块8的一部分。基于包括多个通道(此处为5. 1通道信号的 5个通道,不考虑低频效果通道)的经解码的多通道音频数据7,根据一个或多个下混合方案(即,根据一个或多个下混合矩阵)执行下混合。应当注意,编码转换器根本不知道在接收设备中是否执行下混合以及然后在接收设备中使用哪个下混合方案。因此,不知道是否在离散通道上重放多通道信号,或是否执行根据若干方案之一的下混合。编码转换器模拟所有情况并且确定最坏情况。在图3的例子中,在模块41中执行根据Lo/Ro下混合方案的下混合,在模块42 中执行根据I^0 Logic(PL)下混合方案的下混合,以及在模块43中执行根据ftx) Logic II(PLII)下混合方案的下混合。PL下混合方案和PL II下混合方案是前面讨论的Lt/Rt下混合方案的两种变型。每种下混合方案输出一右通道信号和一左通道信号。然后,计算下混合之后的信号的绝对值(见图3的模块44)。优选地,还计算多通道音频信号7的各个通道的绝对样本值(见用于确定绝对值的模块40)。还考虑通道(没有下混合)的绝对值有助于在除下混合之外的其它情况中、例如在信号稍后被以额外增益(例如,如后面讨论的, 在RF模式的情况下IldB增益)放大的情况中防止信号削波。在模块45中计算在一个时刻(at a time)的绝对值的最大值(=峰值)。连续执行最大值的计算,从而产生峰值46的流。各个样本可能由于不同的信号处理具有不同的信号延迟。这样的不同的信号延迟可被对齐(未示出)。样本值的最大值指示信号在所有情况下可以具有的最大幅值,并且从而是削波保护算法考虑的最坏情况。因此,编码转换器模拟在一个时刻接收设备中的信号的最坏情况幅值。实现防止削波的保护的动态范围控制值应当以信号最大达到OdBFS的方式来衰减(或放大)信号。应当注意,模块50可以基于比图3所示的绝对值少的绝对值(例如,不考虑未被下混合的通道的绝对值)或基于图3中未示出的附加绝对值(例如,其它下混合方案的绝对值)来确定峰值。可替换地,可以下混合通道7而不确定峰值;例如,可以组合两个作为结果的通道,并且进一步处理组合信号(而不是使用作为块45的输出的峰值46)。图4示出了对峰值46的进一步处理。图1和图4中的被以相同附图标记表示的附图元件基本相同。峰值46在单元60中经历分块化和最大值建立步骤。此处,对于给定输出数据片段(例如,块)确定最高峰值。换言之,通过从多个峰值中选择用于输出数据片段的最高峰值(它是最关键的一个)对峰值进行下采样。应当注意,优选地对于确定最大值不仅仅考虑相应于输出片段中的信号样本的连续峰值。而且还考虑将影响给定数据片段的附加(在前的和在后的)峰值,即,与解码窗口的开始和结束处的信号样本有关的峰值。 优选地,考虑窗口的所有样本。此采样的结果在模块61中被根据公式C= 1/X取倒数,其中C指的是计算出的增益值9,并且X指的是输出流14的块的对应最高峰值。结果C是这样的因子(增益),即当该增益被应用于对应音频样本时,确保数据片段(例如,数据块)的每个音频样本低于或等于最大信号电平1(相应于OdBFS)。这避免了该数据片段的削波。应当注意,最大信号电平指的是经编码转换的音频流的在接收器中的信号的最大信号电平;因此,在模块60的输出处,幅值可以高于1(当C< 1时)。计算出的增益C是防止削波的最大允许增益;还可以使用比计算出的增益C小的增益值(在这个情况下,作为结果的信号更小)。应当注意,在增益C小于1的情况下,必须应用增益c(或更小的增益),否则信号将至少在最坏情形下削波。在模块5中,到来的来自元数据的增益值3也经历重采样。从与输出数据片段相关的多个到来的增益中,选择最小增益并且将其用于进一步处理。优选地,如结合图2讨论的那样执行重采样为了确定哪些到来的增益值与输出数据片段相关,考虑输入和输出影响区域的重叠。如果到来的数据片段的影响区域和给定输出数据片段的影响区域重叠,当确定最小增益值时考虑该到来的数据片段(并且因此考虑其增益值)。作为替代,可以使用结合图2讨论的两种可替换的方法。这样做的动机是保持到来的值。然而,这是不可能的,这是由于必须根据输出流的定时对增益值重采样,因此。使用多个连续增益值中的最小增益值有助于减小倾向于被认为不太显著或讨厌的信号幅值。在到来的数据流1中存在相关动态范围控制数据的情况下,在模块10中进行此增益(优选地在块5中的重采样之后)与对于削波保护足够的计算出的增益值9的比较。模块62确定经重采样的增益值4和计算出的增益值9之间的最小值,并且使用该较小的增益值作为发出的增益值(模块62形成最小值选择器)。在不存在到来的增益值的情况下,图4中的开关63将切换到上部位置,然后模块 62确定增益1和计算出的增益值之间的最小值,并且使用该较小的增益值作为发出的增益值。因此,在不存在到来的增益的情况下,发出的增益值被局限于最大增益1。下表示出了比较模块10的操作。此处,项“I”表示到来的动态范围控制增益4(重采样之后),并且项“C”表示计算出的增益9。
KlI>1I不存在C<1min( I,C )min( I,C ) =CCOlmin( I,C ) =Imin( I,C )I在I和C两者都小于或等于1的情况下,采用最小值。这意味着或者I已经确保了削波保护,或者如果不能,则其将被C替代。在C > 1并且I < 1的情况下,信号可被放大并且仍然不会出现削波。可是到来的流需要衰减,例如以满足动态范围限制目的,并且因此保持I (在此情况下,I是I和C中的最小值)。在I > 1并且C < 1的情况下,到来的值将破坏削波保护,从而采用C(在该情况下,C是I和C中的最小值)。
16
在I和C两者都大于1的情况下,输入应被放大。只要仍然不出现削波就允许此放大,并且因此使用I和C中的较小值。在不存在到来的动态范围值的情况下,只要C ^ 1就通过使用C来确保削波保护。 在C > 1的情况下,不应修正信号(即,该信号不应被不必要地放大以接近削波边界)。因此采用1作为输出增益。在不存在到来的增益值的两种情况下,使用1和C中的最小值(而不是I和C之间的最小值)。图5以流程图形式示出了对发出的增益值11的选择。确定是否存在增益值1(见图5中的附图标记130)。如果当前存在增益值I,则发出的增益值取决于到来的增益值I和计算出的增益值C的值。如果I < 1并且C < 1,则选择的增益值相应于I和C中的最小值 (见附图标记131)。如果K 1并且C > 1,则选择的增益值相应于I (见附图标记132)。 如果I > 1并且C彡1,则选择的增益值相应于C (见附图标记133)。如果I > 1并且C > 1,则选择的增益值相应于I和C中的最小值(见附图标记134)。应当注意,在所有这四种情况中,发出的值仍相应于I和C中的最小值。因此,不必须确定I和C是否< 1。如果当前不存在增益值I,则发出的增益值取决于计算出的增益值C的值。如果 C ( 1,发出的增益值相应于C (见附图标记135)。如果C > 1,发出的增益值相应于1 (见附图标记136)。应当注意,在两种情况下,输出值仍然相应于1和C中的最小值。因此,不必须确定C是否< 1。上面讨论的实施例实现了保持到来的动态值并且仅在削波将发生的情况下修正该动态值以防止削波。在不存在动态范围控制值的情况下,给流添加足够的动态范围控制值以防止削波。模式之间的切换瞬时地并且平滑地工作,从而防止任何假信号。图6示出了图4的实施例的替换方案。图4和图6中的被以相同附图标记表示的附图元件基本相同。在图6中,用于两种不同模式、行模式和RF模式的分离的增益元数据被接收并且编码转换。在图6的实施例中,由于行模式和RF模式使用两种不同类型的元数据,计算用于行模式和RF模式的不同增益字。行模式元数据覆盖较小的值范围,并且被较频繁地发送(通常每个块一次),而RF模式元数据覆盖较大的值范围,并且较不频繁地发送 (通常每帧一次)。在RF模式中,信号被提升IldB的额外增益,当在动态非常有限的通道上(例如,通过模拟RF天线链路从机顶盒到TV的RF输入)传输信号时,这允许更高的信噪比。另外,由于与行模式的增益元数据相比RF模式增益元数据覆盖更宽的值范围,RF模式允许更高的动态范围压缩。用于行模式的增益元数据被指示为“DRC” (见附图标记3), 而用于RF模式的增益元数据被指示为“compr”(见附图标记3')。注意,在DVB中,RF模式的增益元数据被表示为“compression”或“heavy compression”。另外,图6的实施例还考虑节目基准电平(PRL),其可被作为元数据的一部分传输。PRL指示音频内容的基准响度 (例如,在HE-AAC中,PRL可以在OdB和-31. 75dB之间改变)。PRL的应用将音频的响度降低到定义的目标基准电平。依赖于音频编码格式,其它基准项(例如对话电平、对话常态化或dialnorm)是常用的。在图6中,在单元70中根据接收到的PRL对数据块的最高峰值(由单元60产生) 进行电平调整(通常,使该电平减小PRL)。为了计算与行模式相关联的增益值,在模块61 中对经电平调整的样本取倒数,从而产生计算出的增益值,该计算出的增益值确保在在接收器中以PRL调整音频信号的情况下,该块的每个音频样本低于或等于最大信号电平1。模块5中的到来的DRC数据3的重采样以及经重采样的增益值4与计算出的增益值的比较与图4相同。为了计算与RF模式相关联的增益值,在模块71中将经电平调整的样本放大lldB, 这是因为在使用RF模式的情况下,在接收器中也将信号放大lldB。因此,编码转换器模拟接收设备中的信号的最坏情况的幅值。在块61'中将经提升的样本取倒数,从而产生计算出的用于RF模式的增益值,该增益值确保在音频信号在接收器中被以PRL调整并且被提升 IldB的情况下,该块的每个音频信号低于或等于1(=最大信号幅值)。图6的实施例优选地用于输出Dolby Digital音频流的编码转换器(例如,HE-AAC 到Dolby Digital的编码转换器或AAC到Dolby Digital编码转换器)。根据Dolby Digital,在行模式中,每个编码块具有“DRC”(动态范围控制)增益值,而在RF模式中,每个帧(其包括6个块)具有“compr”增益值。然而,两种类型的增益值涉及动态范围控制。 计算出的RF模式的增益值在模块73中被从块速率下采样到帧速率。模块73对于总共6 个连续块确定计算出的增益值的最小值,每个最小值被分配给用于整个帧的计算出的增益值72。模块5'中的到来的compr增益值3'的重采样与模块5中的重采样的不同之处在于确定用于输出帧的最小值的方式。经重采样的增益值4'和计算出的基于帧的增益值72 的比较与前面的讨论相同。图6的实施例提供了不仅在下混合情况下防止削波、而且还当在RF模式中应用 IldB的额外增益时防止信号削波的保护。(否则,即使当不使用信号下混合时,被提升IldB 的信号仍可能削波)。因此,在模块50中还考虑没有下混合的通道的绝对值是有利的。应当注意,在未接收到PRL的情况下,优选地,PRL被设为默认值。为了计算增益值,可以使用平滑化级。图7示出了平滑化级80的实施例,其可被放置在模块50的输出与模块61和61'的输入之间的路径中的任意位置。优选地,平滑化级80被放置在模块50的输出处,从而基于峰值46产生经平滑化的峰值46'。平滑化级 80对平滑化级的输入信号(例如峰值信号)实施低通滤波。其目的是改进在削波保护取得效果(kick in)之后的听觉印象在一段时间的削波保护之后限制增益(ducking gain)的立刻释放将听起来讨厌。因此,如同在限幅器实现中广泛使用的,以一阶低通滤波器对峰值信号(以及由其得出的增益信号;如下)滤波,该低通滤波器优选地以200毫秒的时间常数 τ操作。当新输入值在比经平滑化的信号所实现的程度更高的程度上需要削波保护时(由于新输入值高于经平滑化的信号),其绕过平滑化级并且立刻实现。在该情况下,图7的最大值计算块81的上部输入大于下部输入。优选地,图3-7中的实施例是例如从AAC和/或HE-AAC到Dolby Digital,或从 Dolby E或Dolby Digital到AAC和/或HE-AAC的音频编码转换器的一部分。然而,应当注意,图3-7中的实施例不一定是音频编码转换器的一部分。这些实施例可以是接收到来的音频流1并且应用修正的增益值(没有编码转换)的设备的一部分。修正的增益值可被直接用于调整接收到的音频流的增益。例如,图3-7的实施例可以是AVR或电视机的一部分。图8示出了用于提供下混合保护的替换实施例。该装置接收包含在音频元数据中的或从音频元数据得出的到来的增益字90。增益字90可以相应于图1和4的增益值3或 4。另外,该装置接收音频样本91(例如,PCM音频样本)。例如,音频样本91可以是图3的模块50产生的峰值。如果音频样本91不是绝对值,可以事先确定音频样本91的绝对值。
在模块92中,根据下式通过除法来计算最大允许增益值gainmax(t)
「 π · /.χ signal max,aUowed [οι 05] gainmax (t) = ^;——
signalit)此处,项Signalmaxj allowed表示最大允许信号幅值,例如,signal·, allowed = 1。项 signal (t)表示当前音频样本91。在模块93中,最大允许增益值gainmax(t)被局限于最大增益1 如果值gainmax (t) 大于1,则gainmax(t)被设为1。然而,如果值gainmax(t)低于或等于1,不修正该值。模块93的输出被供给平滑化滤波级94。平滑化滤波级94包含低通滤波器和最小值选择器95,最小值选择器95选择其两个输入中的最小值。该操作类似于图7中的平滑化滤波级80。然而,由于滤波级94平滑化增益值而不是音频样本(通过对音频样本取倒数来得出增益值),此处使用最小值选择器95而不是最大值选择器81。平滑滤波级80当被放置在模块92 (其通过取倒数来确定增益值)上游时可作为替代被使用。类似地,平滑化滤波级94当被放置在模块61和/或61'下游时可以在图4和5中使用(由于在块61 和/或61 ‘下游增益信号被处理)。在模块93处的增益值的突然增加的情况下平滑化滤波级94平滑化信号斜率(否则音频可能听起来讨厌)。相反,在增益值的突然下降的情况下,平滑化滤波级94使得增益信号通过而不进行平滑化(否则信号将发生削波)。在最小值选择器97中将平滑化滤波级95的输出处的计算出的增益信号96和到来的增益字90进行比较。实际计算出的增益值96和实际到来的增益字90中的最小值被传递到最小值选择器97的输出。最小值选择器97的输出处的增益值98提供了下混合保护,并且可如前面讨论的那样被嵌入经编码转换的音频流。应当注意,图8中的实施例不必须是音频编码转换器的一部分。输出增益值可被直接用于调整接收到的音频流的电平。在该情况下,图8的装置可以是AVR或电视机的一部分。另外,图8中的实施例可用于在不考虑下混合的情况下防止信号削波。例如,图8 中的实施例可以接收没有在模块50中进一步预处理的常规的PCM音频样本91。在该情况下,当以输出增益值放大音频样本91时,图8中的实施例防止削波。图9示出了另一个替换实施例。图8和9中的被以相同附图标记表示的附图元件基本相同。与图8中的实施例成对比的,图9中的实施例是类似图4和6中的实施例的块方式操作版本,其中每个信号块(或类似帧的任意其它数据片段)仅执行一个除法。这减少了每次的除法的数目。如已经结合图8讨论的,可通过图3的块50产生音频样本91。如果音频样本91不是绝对值,可以事先确定音频样本91的绝对值(图9中未示出)。然后音频样本91被供给平滑化滤波级80,平滑化滤波级80相应于图7中的平滑化滤波级80。与图8成对比地,平滑化滤波级80处理音频样本而不是增益样本。因此,平滑化滤波级80使用最大值选择器81而不是最小值选择器95。在平滑化之后,在单元100中确定每个音频块的样本的最大值。然后,在块101中对该最大值取倒数,从而计算每个块的最大允许增益。 在最小值选择器97中将该增益值和当前增益值90比较,两个值中的最小值被传送到最小值选择器97的输出。最小值选择器97的输出处的增益值98提供下混合削波保护,并且可被如上面讨论地嵌入经编码转换的音频流。可以修改图9的实施例,以便当不存在到来的增益值90时以类似方式产生增益值98 如果不存在到来的增益值90,并且计算出的增益小于或等于1,则输出计算出的增益值。在计算出的增益值大于1的情况下(并且不存在到来的增益值90),输出具有增益1的增益值。这可被以图6的附加开关63实现,该开关依赖于到来的增益值90的存在而在到来的增益值90和增益1之间切换。应当注意,前面讨论的实施例相应于限幅器,其不干涉(respect)来自不同的压缩器实例的增益值。图10示出了接收由图1的编码转换器产生的经编码转换的音频流14的接收设备。模块121从音频流14中分离增益值11。该接收设备还包括解码器110,其产生经解码的音频信号120。在模块112中通过在图1中得出的增益值11调整经解码的音频信号120 的幅值。在模块113中执行可选择的下混合的情况下,由于增益值11足以防止下混合情况下的信号削波,输出信号114不会发生削波。还可以根据PRL(未示出)调整经解码的音频信号120的幅值。在增益值11还考虑如结合图6讨论的RF模式中的IldB提升的情况下, 音频信号120可被提升IldB而不发生削波(在信号下混合情况以及没有信号下混合情况两者中)。
权利要求
1.一种用于保护从数字音频数据得出的音频信号免受信号削波的方法,该方法包括 -确定基于接收到的音频元数据的第一增益值是否足够保护音频信号免受削波,接收到的音频元数据被嵌在第一数字音频流中;以及-在第一增益值不足够的情况下,用足够保护音频信号免受削波的增益值替代对应的第一增益值。
2.如权利要求1所述的方法,其中确定步骤包括步骤-基于数字音频数据计算第二增益值,第二增益值对于音频信号的削波保护是足够的;以及-比较基于接收到的音频元数据的第一增益值和计算出的第二增益值。
3.如权利要求2所述的方法,其中计算第二增益值的步骤包括 -确定最大允许增益值。
4.如权利要求2-3中任一个所述的方法,其中依赖于比较步骤,从第一增益值和计算出的第二增益值中选择增益值,其中通过选择第二计算增益值来执行增益值替代。
5.如权利要求4所述的方法,其中选择第一增益值和第二增益值对中的最小值。
6.如前面任一个权利要求所述的方法,其中在将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流期间执行该方法,第二音频流包括具有足够保护音频信号免受削波的替代的增益值或具有从其得出的增益值的音频元数据。
7.如前面任一个权利要求所述的方法,其中音频信号是经下混合的音频信号,并且该方法保护经下混合的信号免受信号削波。
8.如前面任一个权利要求所述的方法,其中确定第一增益值是否足够保护的步骤包括以下步骤根据至少第一下混合方案下混合数字音频数据。
9.如权利要求8所述的方法,其中确定第一增益值是否足够保护的步骤包括以下步骤-计算峰值,其中通过确定一个时刻的至少两个音频信号的绝对值的最大值来计算峰值,该至少两个音频信号选自包含以下的组-根据第一下混合方案下混合之后的一个或多个音频信号,-下混合之前的一个或多个音频信号,以及-根据第二下混合方案下混合之后的一个或多个音频信号。
10.如前面任一个权利要求所述的方法,其中确定第一增益值是否足够保护的步骤包括以下步骤-确定从数字音频数据得出的多个连续信号值的最大值。
11.如权利要求10所述的方法,其中确定第一增益值是否足够保护的步骤包括以下步骤-计算峰值,其中通过确定一个时刻的至少两个音频信号的绝对值的最大值来计算峰值,该至少两个音频信号选自包含以下的组-根据第一下混合方案下混合之后的一个或多个音频信号, -下混合之前的一个或多个音频信号,以及-根据第二下混合方案下混合之后的一个或多个音频信号,以及其中该多个连续信号值相应于连续峰值或连续的经滤波的峰值。
12.如权利要求10-11中任一个所述的方法,其中在将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流期间执行该方法,第二音频流包括具有足够保护音频信号免受削波的替代的增益值或具有从其得出的增益值的音频元数据,以及其中,第二音频流被以数据片段组织,以及确定与第二音频流的片段相关联的多个信号值的最大值。
13.如权利要求10-12中任一个所述的方法,其中最大信号值除以所确定的最大值。
14.如权利要求10-12中任一个所述的方法,其中取所确定的最大值的倒数。
15.如前面任一个权利要求所述的方法,其中在将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流期间执行该方法,第二音频流包括具有足够保护音频信号免受削波的替代的增益值或具有从其得出的增益值的音频元数据,以及其中第一音频流被以数据片段组织,第一音频流的每个数据片段接收至少一个增益值, 第二音频流被以数据片段组织,以及该方法还包括以下步骤 重新采样第一音频流的增益值。
16.如前面任一个权利要求所述的方法,其中在将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流期间执行该方法,第二音频流包括具有足够保护音频信号免受削波的替代的增益值或具有从其得出的增益值的音频元数据,并且其中第一音频流被以数据片段组织,第一音频流的每个数据片段接收至少一个增益值, 第二音频流被以数据片段组织,以及该方法还包括步骤-确定第一音频流的多个连续增益值的最小值。
17.如权利要求16所述的方法,其中该多个连续增益值中的每一个具有影响区域,并且这些增益值的影响区域与第二流中的增益值的影响区域重叠。
18.如前面任一个权利要求所述的方法,其中在第一音频流中没有与动态范围控制有关的元数据的情况下,添加足够保护音频信号免受削波的增益值。
19.如权利要求18所述的方法,其中在将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流期间执行该方法,第二音频流包括具有足够保护音频信号免受削波的替代的增益值或具有从其得出的增益值的音频元数据,以及其中在第一音频流中没有与动态范围控制有关的元数据的情况下,在第二音频流中添加足够保护音频信号免受削波的增益值。
20.如权利要求18-19中任一个所述的方法,其中添加的增益值局限于最大增益1。
21.如权利要求20所述的方法,该方法包括基于数字音频数据计算第二增益值的步骤,第二增益值足够保护音频信号免受削波,其中在对应的所计算出的第二增益值具有低于1的增益的情况下,添加的增益值相应于所计算出的第二增益值;以及在对应的所计算出的第二增益值具有高于1的增益的情况下,添加的增益值相应于增益1 O
22.如权利要求2-21中任一个所述的方法,其中使用平滑化滤波器产生第二增益值。
23.一种用于保护从数字音频数据得出的音频信号免受信号削波的设备,该设备包括-确定装置,用于确定基于接收到的音频元数据的第一增益值是否足够保护音频信号免受削波,接收到的音频元数据被嵌在第一数字音频流中;以及-替代装置,用于在第一增益值不足够保护的情况下,用足够保护音频信号免受削波的增益值替代第一增益值。
24.如权利要求23所述的设备,其中确定装置包括-计算装置,用于基于数字音频数据计算第二增益值,第二增益值足够保护音频信号免受削波;以及-比较装置,用于比较基于接收到的音频元数据的第一增益值和所计算出的第二增益值。
25.如权利要求23-24中任一个所述的设备,其中该设备是编码转换器的一部分,该编码转换器被配置用于将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流,第二音频流包括具有足够保护音频信号免受削波的替代的增益值或具有从其得出的增益值的音频元数据。
26.如权利要求23-25中任一个所述的设备,其中音频信号是经下混合的音频信号,并且该设备保护经下混合的信号免受信号削波。
27.—种编码转换器,被配置用于将以第一音频编码格式编码的第一音频流编码转换为以第二音频编码格式编码的第二音频流,该编码转换器包括如权利要求23-26中任一个所述的设备。
28.如权利要求27所述的编码转换器,其中第一音频流是数字广播信号。
29.一种用于保护从数字音频数据得出的音频信号免受信号削波的方法,其中在将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流期间执行该方法,并且其中在第一音频流中不存在与动态范围控制相关的元数据的情况下,将足够保护音频信号免受削波的增益值添加到第二音频流中。
30.如权利要求1-22中任一个所述的方法,其中在将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流期间执行该方法,第二音频流包括具有足够保护音频信号免受削波的替代的增益值或具有从其得出的增益值的音频元数据,以及其中-第一音频编码格式是AAC或HE-AAC,以及 -第二音频编码格式是Dolby Digital。
31.如权利要求30的方法,其中第一音频流是DVB视频/音频流的一部分。
32.如权利要求9所述的方法,其中在将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流期间执行该方法,第二音频流包括具有足够保护音频信号免受削波的替代的增益值或具有从其得出的增益值的音频元数据,以及其中-第二音频流被以数据块组织,-嵌入第一音频流的音频元数据包括指示音频内容的响度的元数据,以及 -基于数字音频数据计算第二增益值,第二增益值对于音频信号的削波保护是足够的, 第二增益值的计算包括确定第二音频流的数据块的多个峰值的最大值;以及根据指示音频内容的响度的元数据对该最大值进行电平调整,以及 -比较基于接收到的音频元数据的第一增益值和计算出的第二增益值。
33.如权利要求32所述的方法,其中指示音频内容的响度的元数据是节目基准电平元数据。
34.如权利要求32或33所述的方法,其中-第一音频流包括用于第一模式的增益元数据和用于第二模式的不同的增益元数据, 其中第二模式允许高于第一模式的动态范围压缩;-基于经电平调整的最大值计算用于第一模式的第二增益值,用于第一模式的第二增益值对于第一模式中的削波保护是足够的;-比较用于第一模式的基于接收到的音频元数据的增益值和计算出的用于第一模式的第二增益值;-通过将经电平调整的最大值放大lldB,计算用于第二模式的第二增益值,用于第二模式的第二增益值对于第二模式中的削波保护是足够的;-比较用于第二模式的基于接收到的音频元数据的增益值和计算出的用于第二模式的第二增益值。
35.如权利要求9所述的方法,其中在将以第一音频编码格式编码的第一音频流编码转换为以不同于第一音频编码格式的第二音频编码格式编码的第二音频流期间执行该方法,第二音频流包括具有足够保护音频信号免受削波的替代的增益值或具有从其得出的增益值的音频元数据,以及其中-第二音频流被以数据块组织,-第一音频流包括用于第一模式的增益元数据和用于第二模式的不同的增益元数据, 其中第二模式允许高于第一模式的动态范围压缩;-基于最大值计算用于第一模式的第二增益值,其中该最大值是第二音频流的数据块的多个峰值的最大值,并且其中用于第一模式的第二增益值对于第一模式中的削波保护是足够的;-比较用于第一模式的基于接收到的音频元数据的增益值和计算出的用于第一模式的第二增益值;-通过将该最大值或依赖于该最大值的值放大lldB,计算用于第二模式的第二增益值,用于第二模式的第二增益值对于第二模式中的削波保护是足够的;和-比较用于第二模式的基于接收到的音频元数据的增益值和计算出的用于第二模式的第二增益值。
36.如权利要求34或35所述的方法,其中通过从块速率下采样到帧速率,计算用于第二模式的第二增益值。
37.如权利要求36所述的方法,其中通过对于总数为6个的连续块确定计算出的增益值的最小值,执行下采样。
全文摘要
本发明描述了在利用接收到的音频元数据来保护免受信号削波不被保证时防止音频信号的削波的方法和设备。该方法可被用于针对将多通道信号下混合为立体声信号情况防止削波。根据该方法,确定基于接收到的音频元数据的第一增益值(4)是否足够保护音频信号免受削波。音频元数据被嵌入第一音频流(1)。在第一增益值(4)不足够保护的情况下,用足够保护音频信号免受削波的增益值替代对应的第一增益值(4)。优选地,在第一音频流(1)中不存在与动态范围控制有关的元数据的情况下,该方法可添加足够保护信号免受削波的增益值。
文档编号G10L19/00GK102203854SQ200980142689
公开日2011年9月28日 申请日期2009年10月26日 优先权日2008年10月29日
发明者A·格罗舍尔, W·A·席尔德巴赫 申请人:杜比国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1