音频元数据的编码变换的制作方法

文档序号：2823230阅读：212来源：国知局

专利名称：音频元数据的编码变换的制作方法
技术领域：
本发明涉及音频编码的领域。特别地，本发明涉及不同的音频编码方案之间的音频元数据的编码变换。
背景技术：
随着数字电视和无线电系统的不断增长，意图引导节目响度和动态范围的接收机侧控制以及控制立体声下混的元数据即“关于数据的数据”越来越受到重视。由于音频数据的发射(emission)格式或传输(transmission)格式未必与制作(production)或回传 (contribution)格式即在音频信号的创建或后处理期间使用的编码方案相同，因此必须找到将元数据从一种格式编码变换为另一种格式的手段。通过将音频编解码器HE AAC (也称为aacPlus)引入到几种新的广播系统中，需要解决如何最好地编码新的元数据以及如何将预先存在的元数据编码变换为HE AAC和从HE AAC编码变换预先存在的元数据的问题。HE AAC (高效率高级音频编码)是以481cbpS立体声在⑶音频质量附近提供全带宽的现有技术的低比特率编解码器。它已在HEAAC配置文件(profile)下在MPEG-4中被标准化。该配置文件以对存在于原MPEG-2 AAC定义中的若干缺点进行改善的方式对于解码器中的元数据的任选的应用提供增强的方式。特别地，它允许诸如DRC (动态范围控制)、 DN(对话归一化)之类的元数据的规范或从多声道到立体声的下混，所述下混被广泛用于广播中以在特定的收听环境中实现原节目材料的适当的再现。虽然诸如HE AAC之类的编解码器被广泛用于广播中，但是，在制作侧以及在接收机侧，不同的编码方案是常见的。作为例子，DolbyE编码方案被内容制作者频繁使用，而 Dolby数字编码方案(也被称为AC-3或Dolby D编码方案)被频繁用于剧场和家庭剧场解码系统中。因此，需要不同编码方案之间的音频元数据的编码变换，该编码变换确保在制作侧被初始定义的元数据以非劣化的方式到达最终的解码系统。目标一般是，当比较经受初始定义的元数据的初始编码音频流与经受编码变换的元数据的接收的音频流时，确保通过收听器检测不到感知差异或者能检测到很少的感知差异。以下发明应对该问题，并且定义用于将元数据从一种压缩比特流格式变换成不同的压缩比特流格式的方法，特别是在两种格式的成帧方式(framing)不兼容的情况下。

发明内容
本发明描述用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的方法，其中，第一和第二音频编码方案使用编码块，并且其中，各编码块具有至少一个相关联的增益值。该方法包括以下步骤基于第一增益元数据的增益值选择第二增益元数据的增益值，使得在与第二增益元数据的增益值相关联的时刻周围的时间间隔内，选择第一增益元数据的最小增益值。这种第一和第二编码方案的例子可以为Dolby E、AAC、HE AAC和/或Dolby Digital (Dolby D)及其变型，诸如Dolby Digital Plus。第一音频编码方案也可被称为元数据编码变换器的输入处的源编码方案，而第二音频编码方案也可被称为元数据编码变换器的输出处的目标编码方案。两种编码方案均限定与已编码的音频信号相关联的元数据。典型地，基本的编码方案将已编码的音频信号分段成编码块。取决于编码方案，这种编码块可包含不同数量的已编码信号采样。此外，编码块还可覆盖已编码的音频信号的不同的时间长度。通常，各编码块具有相关联的元数据，所述相关联的元数据也包含要被施加到特定编码块的音频信号的增益值。另一方面，许多音频编码方案应用所谓的采样和保持行为，所述采样和保持行为在于保持当前增益值直到接收更新的增益值的时刻。因此，在这样的情况下，当前增益值与编码块相关联，直到接收到更新的增益值。根据本发明的另一方面，用于选择第二元数据的增益值的时间间隔由上限和下限限定。该上限和下限由分别被加到与第二增益元数据的增益值相关联的时刻和从与第二增益元数据的增益值相关联的时刻被减去的时间常数来确定。换句话说，在优选的实施例中，该间隔围绕与第二增益元数据的增益值相关联的时刻而对称。该时间常数可被选择，使得它大于或等于第一音频编码方案的编码块的时间长度和第二音频编码方案的编码块的时间长度中的最大值。如果以这种方式选择时间常数，那么所描述的方法产生抵抗增益过冲和破音的经编码变换的增益值。在某些条件下，可以确保经编码变换的增益元数据决不超过源增益元数据。另一方面，时间常数也可被选择为小于第一音频编码方案的编码块的时间长度和第二音频编码方案的编码块的时间长度中的最大值。为了实现源增益元数据和目标增益元数据之间的良好的匹配，这可能是有益的。在某些情况下，可能发生没有第一增益元数据的增益值落入与第二增益元数据的增益值相关联的时刻周围的时间间隔内。作为例子，如果时间常数被选择为特别小或者如果第二音频编码方案的编码块的时间长度小于第一音频编码方案的编码块的时间长度，那么可能发生这种情况。在这样的情况下，该方法可将第二增益元数据的增益值选择为与和第二增益元数据的增益值相关联的编码块之前的编码块相关联的第二增益元数据的增益值。作为替代方案，该方法可将该时间间隔之前的第一增益元数据的增益值选择作为第二增益元数据的增益值。换句话说，编码变换器可使用音频编码方案的采样和保持行为并且保持当前增益值，直到接收更新的增益值。根据本发明的另一方面，该方法可进一步被调整以适于第二音频编码方案允许选择内插第二增益元数据的相邻增益值以形成第二增益曲线的不同的内插曲线的情况。这种音频编码方案的例子是HE AAC，所述HE AAC允许选择特别适于增益释放的线性内插曲线和特别适于增益攻击的多个突兀的内插曲线。如果第二音频编码方案提供这种功能，那么该方法还可包含以下步骤基于第一增益元数据的增益值来选择第二增益元数据的两个相邻增益值之间的适当的内插曲线。可例如基于第一增益元数据的两个相邻增益值之间的差值来选择该适当的内插曲线。如果例如第一源增益值(非常)高并且下一源增益值(非常)低，那么可选择“攻击”状内插曲线。另一方面，如果第一个和下一个源增益值相当类似，那么可选择“释放”状内插曲线。作为替代方案，如果第一增益曲线与第一增益元数据的增益值相关联，其中，可通过内插第一增益元数据的相邻增益值获得该第一增益曲线，那么可基于第一增益曲线的斜率来选择该适当的内插曲线。特别地，如果第一增益曲线的负斜率高于预定义的阈值，那么可检测增益攻击。换句话说，如果第一增益曲线陡峭地下降，那么可检测增益攻击。另一方面，如果第一增益曲线的负斜率低于预定义的阈值，那么可检测增益释放。基于第一增益曲线的检测的增益攻击或增益释放，该方法于是选择两个增益元数据的两个相邻增益值之间的适当的内插曲线。如以上已经提及的，第二编码方案可允许选择多个“攻击”内插曲线(也被称为内插曲线图案)。这些不同的内插曲线图案典型地在时间上相互延迟，并由此允许定义不同的“攻击”时间。为了使用第二编码方案的该功能，该方法可基于第一增益曲线的斜率的绝对值最大的位置而选择第二增益元数据的两个相邻增益值之间的适当的内插曲线。换句话说，该方法确定第一增益曲线的最陡的点并且选择最接近该最陡的点的第二编码方案的内插曲线图案。根据本发明的又一方面，第二增益元数据的增益值的选择可不仅基于第一增益元数据的增益值的集合，而且基于整个第一增益曲线。在这样的情况下，该方法包括以下步骤将该时间间隔内的第一增益曲线的最小值选择作为第二增益元数据的增益值。如果没有第一增益元数据的增益值落入与第二增益元数据的增益值相关联的时刻周围的时间间隔内，那么这会是特别有用的。作为计算第一增益曲线的最小值的低复杂度替代方案，将该时间间隔内的第一增益曲线的一组采样的最小值选择作为第二增益元数据的给定增益值会是有益的。第一增益曲线的该组采样可包含落入该时间间隔内的第二增益值的编码块的时刻处的第一增益曲线的采样。另外，本发明描述了用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的方法，其中，第一和第二音频编码方案具有不同的每编码块的音频采样数量，并且其中，各编码块具有相关联的增益值。此外，相邻编码块的一系列增益值被内插以定义增益曲线。该方法包括以下步骤基于第一增益元数据的增益值来选择第二增益元数据的增益值，使得第二增益曲线总是在第一增益曲线的下方。使用该条件，可以确保没有破音的源音频信号被编码变换成也没有破音的目标音频信号。此外，本发明描述了用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的方法，其中，第一和第二音频编码方案使用编码块，并且，各编码块具有相关联的增益值。另外，第二增益曲线与第二增益元数据的增益值相关联。该方法包括以下步骤选择第二增益元数据的增益值，使得在与第一音频编码方案的编码块相关联的时刻处，第二增益曲线小于或等于第一增益元数据的增益值。根据本发明的另一方面，第二增益元数据的增益值的选择可不仅基于第一增益元数据的所述一组增益值，而是基于整个第一增益曲线。在这些情况下，该方法可选择第二增益元数据的增益值，使得在与第一音频编码方案的编码块相关联的时刻处和/或在与第二音频编码方案的编码块相关联的时刻处，第二增益曲线小于或等于第一增益曲线。特别是当第二音频编码方案的编码块的时间长度小于第一音频编码方案的编码块的时间长度时，这会是有益的。对于某些编码方案，增益曲线由与相邻的增益值和窗函数相关联的段构成。典型地，通过使用编码方案的窗函数在相邻的增益值之间进行内插来获得曲线段。在这样的情况下，可通过增益值和窗函数的一组采样来确定特定时刻处的增益曲线的上述的采样。对于某些编码方案，窗函数对于曲线段的全部或子集是相同的，使得可通过增益值和窗函数的有限的一组采样来描述增益曲线。即使当使增益值选择基于源增益曲线时，这也允许所描述的方法的低复杂度实现。此外，本发明还描述了实现上述的编码变换方法的编码变换系统。这些编码变换系统可以是传输系统或消费者机顶盒的一部分。编码变换系统可利用由周围的系统提供的处理和存储器装置，但是，该编码变换系统也可包含诸如CPU之类的自身的处理装置和诸如ROM或RAM之类的存储器装置。作为例子，音频编码变换系统的实现可包含数字处理器和用于存储用于由处理器执行的指令的存储器。存储器还可存储进入的元数据和在传输之前产生的离开的元数据。特别地，编码块的增益值可被存储于存储器中用于处理。此外，优选具有存储于存储器中的第一和/或第二音频编码方案的窗函数或多个窗函数的采样。可以在用于从传输音频格式向用于在消费者的家中回放或记录的音频编码方案进行编码变换的机顶盒中实现示例性的音频编码变换系统。作为例子，可以在机顶盒中设置作为传输音频编码方案的HE AAC和作为用于回放的发射音频编码方案的Dolby Digital(Plus)之间的编码变换。可以作为用于从制作或回传音频编码格式向传输音频格式进行编码变换的头端来实现用于音频编码变换系统的另一例子。作为例子，可以在这种前端系统中设置作为制作音频方案的Dolby E和作为传输音频编码方案的HE AAC之间的编码变换。应当注意，在本文件中描述的方法和系统可被应用于诸如DolbyE、也称为Dolby D 或AC-3的Dolby Digital (Plus)、AAC (高级音频编码)和/或也称为aacPlus的HE AAC (高效率AAC)之类的多种的第一和第二音频编码方案。此外，应当注意，可以相互组合地使用在本文件中描述的方法和系统的特征。特别是，采用用于一个编码变换方向的一种方法和用于反向编码变换方向的另一方法会是有益的。

以下，参照附图描述本发明的选择的实施例图1图示典型的编码变换链。图2图示音频编解码器的典型的编码和解码结构；图3图示用于不同的音频编解码器的不同的内插增益曲线；图如图示音频编解码器的内插函数；
图4b图示与图如的内插函数相关联的窗函数；图如图示非对称窗函数及其相关联的内插函数的例子；图5图示一系列级联的经内插的增益曲线；图6示出图示第一编码变换算法的增益匹配性质的第一例子；图7a和图7b示出图示第一编码变换算法的增益匹配性质的第二例子；图8示出使用第一编码变换算法的增益元数据的编码变换的实验结果；图9a和图9b图示第二编码变换算法的增益匹配性质；图10示出使用第三编码变换算法的增益元数据的编码变换的实验结果。
具体实施例方式元数据是例如在Dolby Digital、Dolby E、AAC、HE AAC或其它音频编解码器中与多声道音频比特流一起行进的“关于音频数据的数据”。它使得广播设备不必根据传输的音频流而连续调整和压缩音频水平。它还提供关于音频流的声学动力学的具有高的艺术自由度的音频混合器。过去，与多声道音频一起工作的广播设备常具有声轨的平均水平落在其它节目制作(programming)之上或之下的问题。并且，当在具有立体声或单音频输出的电视机上回放环绕声音内容时出现问题。使用音频元数据，声音工程师可全部在后期制作阶段对于各种回放系统以不同的方式混合音频内容并且设定回放水平，因此，广播设备可递送更一致的音频信号并且确保最重要的音频要素通过。元数据提供若干参数，这些参数特别意图改变向消费者的特有收听环境递送的节目的声音。这些元数据参数被称为对话水平(也称为对话归一化或dialnorm)、动态范围控制和下混。虽然在技术上不是单独的元数据参数，但是消费者的解码器内的下混通过特定的元数据参数被实现，并且，如同dialnorm和动态范围控制那样，在监视和选择实现下混条件的元数据参数时必须小心。制作侧的声音工程师最终负责优化多声道混合以用于最好地在最佳收听环境中再现。但是，还应小心确保也解决并非最佳的收听环境。这就是在编码变换期间元数据不畸变或者仅以有限的方式畸变十分重要的原因，以便保持在制作阶段期间设计的元数据的质量。对话水平参数向家庭解码器提供归一化值。该值将音频的音量调整到预设的水平，这帮助从节目内容到节目内容和从媒体到媒体的水平匹配。对话水平不在节目材料上使任何压缩或膨胀生效(assert)，而是将音频的音量降低到标准化水平。对话水平与动态范围控制配置文件协同工作。对话水平参数在节目的轻声和大声部分之间设定一种“空带 (null band)，，。动态范围控制(DRC，有时被称为动态范围压缩或午夜模式)给予消费者用减小的动态范围收听节目音频的灵活性。动态范围的压缩使得观看者不干扰邻居而观看电视。该控制常常是任选的，并且可在诸如Dolby Digital解码器之类的多数音频解码器中被关闭。动态范围控制还被用于消费者解码器上的常见“午夜模式”特征。在较低音量下，节目的较轻声的部分(耳语和轻声对话)更加难以听到。然而，如果观看者增大音量，那么较大声的部分(爆炸、屏幕上的争吵、枪击等)变得声音太大以至于听起来不舒服。作为替代方案，在具有高水平的背景噪声的环境中，节目的较安静的部分将被环境噪声淹没。当在解码器内使动态范围配置文件生效时，解码器提高节目的较轻声部分的水平同时降低大声部分的水平，从而允许用户不必连续搜索音量控制而欣赏影片。动态范围控制典型地由两个参数或“配置文件”构成RF模式和Line模式。应当注意，这两个参数不改变比特流内的编码的音频的内容。它们被用于调整收听环境内的节目材料的极端状况以解决优选或必须以降低的动态范围收听节目的情况。RF模式被设计为用于峰值限制情况，在所述峰值限制情况中，意图通过电视上的 RF输入(诸如通过机顶盒的天线输出)递送解码的节目。它典型地允许士48. 16dB的范围中的动态范围压缩，并且也被称为低速率DRC。Line模式提供更轻的类型的压缩，并且也允许用户在家庭解码器内调整低水平提升和高水平截断参数。它典型地允许士OSdB的范围中的动态范围压缩，并且也被称为高速率DRC。提升和截断的面积的调整或“缩放”允许消费者对于他们的特定的收听环境定制音频再现。下混是允许通过更少的扬声器声道再现多声道节目的诸如DolbyDigital之类的音频编码器内的特征。简言之，下混允许消费者欣赏数字电视广播而无需完整的5. 1声道家庭剧场设置。如同有时以单声道方式监视混合以保持兼容性的立体声混合，多声道音频混合要求工程师参照具有更少的扬声器声道的混合，以确信对于下混情况的兼容性。某些元数据参数帮助实现适当的下混，从而有助于确保声音工程师/内容制作者的意图将跨越这些环境而能被译出。特别地，元数据提供对于某些扬声器信道如何被“折叠”成所得到的下混的控制。虽然声音工程师通常优化多声道混合以用于在理想收听环境中的再现，但是，在选择下混元数据参数时预览下混条件中的混合以确保与不同回放系统的兼容性也是重要的。如上面概述的那样，元数据可被用于控制解码器中的时变增益要素等，将其用作动态范围控制和/或用于防止破音(clipping)的音频信号的限制手段。与在编码器侧应用压缩相对的，在解码器侧应用压缩的目的在于，以这种方式，终端用户保留对动态范围压缩量的控制。对于深夜观看，终端用户可能会想要使用最大压缩，而具有自己的家庭剧场的 “高保真音响爱好者”可能会优选欣赏原剧场混合的全动态范围。在现代的数字广播链中，在制作、回传和传输阶段中使用几种音频格式。在原音频混合可仍为未压缩的线性PCM格式流的情况下，制作的终端结果常常是Dolby E格式流。使用Dolby E作为内容制作过程中的音频编解码器，制作者至少具有嵌入描述整体节目响度 (DialNorm)、要用于产生DRC系数的压缩器配置文件和下混的元数据参数的可能性。图1图示从制作中心到消费者的家庭的音频编码变换的示例性链100。在制作中心101处，音频流典型地处于诸如Dolby E之类的最适于制作和后处理目的的音频格式。该制作音频流然后被编码变换成诸如Dolby Digital(也称为Dolby D或AC_3)之类的最适于发射目的的格式102。如果需要音频流的传输或广播，那么该发射音频流可能需要编码变换成诸如HE AAC之类的适当的传输或广播格式103。该传输音频流可然后在网络104上被传输到消费者家庭的多个机顶盒105。由于多数的消费者设备106需要诸如Dolby Digital之类的特定的消费者音频格式以正确地呈现音频流的事实，因此，在机顶盒105处需要从传输音频流到消费者音频流的进一步的编码变换。应当注意，制作、发射、传输和消费者音频流格式中的一些可以是相同的。特别地，发射和消费者音频流格式可均为Dolby Digital。换句话说，Dolby E格式流可被编码变换成更适于在影院、家庭剧场或传统的家庭立体声中呈现内容的音频数据流。这种发射音频数据流的一个例子是Dolby Digital流。音频数据流格式之间的该编码变换即制作音频流和发射音频流之间的编码变换也触发对于元数据编码变换的需要。如果要求音频流的传输或广播，那么发射音频流例如DolbyDigital流可要求编码变换成诸如对于低比特率链路上的音频传输优化的MPEG HE-AAC音频流之类的传输音频流。并且，对于发射音频流和传输音频流之间的这种编码变换，相关联的元数据也需要被编码变换。在传输之后，音频数据流通常在接收机处被解码，在消费者的前提下该接收机可以是机顶盒(STB)。特别地，如果音频数据流是诸如环绕声音音频流之类的多声道音频流，那么将传输音频流编码变换成诸如Dolby Digital之类的消费者音频流会是有益的。通过这样，多声道信号可经由光学或同轴S/P DIF链路被转发到消费者的家庭剧场或电视机中的多声道接收机。并且，传输音频流和消费者音频流之间的该编码变换需要相关联的元数据之间的编码变换。当一种格式的音频数据流被编码变换成另一格式的音频数据流时，元数据也需要与其一起行进。DialNorm元数据的编码变换典型地不表现出可观的问题，原因是它通常仅在节目边界处改变，否则基本上保持恒定。但是，由于DRC控制信号在不同的音频格式中具有不同的成帧方式，因此DRC元数据的编码变换不是无关痛痒的。表1列出示例性的音频格式和编解码器的帧长度。
权利要求
1.一种用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的方法，其中所述第一和第二音频编码方案使用编码块；以及各编码块具有至少一个相关联的增益值；以及其中，该方法包括以下步骤基于第一增益元数据的增益值选择第二增益元数据的增益值，使得在与该第二增益元数据的增益值相关联的时刻周围的时间间隔内，选择第一增益元数据的最小增益值；如果没有第一增益元数据的增益值落入与该第二增益元数据的增益值相关联的时刻周围的所述时间间隔内，那么将该第二增益元数据的增益值选择为与和该第二增益元数据的增益值相关联的编码块之前的编码块相关联的第二增益元数据的增益值；或者紧接在所述时间间隔之前的第一增益元数据的增益值。
2.根据权利要求1的方法，其中，所述第一和第二音频编码方案的编码块覆盖已编码的音频信号的不同的时间长度。
3.根据权利要求1的方法，其中，所述时间间隔的上限和下限由分别被加到与该第二增益元数据的增益值相关联的时刻和从与该第二增益元数据的增益值相关联的时刻被减去的时间常数来确定。
4.根据权利要求3的方法，其中，所述第一和第二音频编码方案的编码块覆盖已编码的音频信号的某些时间长度，并且，所述时间常数大于或等于以下中的最大值第一音频编码方案的编码块的时间长度；和第二音频编码方案的编码块的时间长度。
5.根据权利要求3的方法，其中，所述第一和第二音频编码方案的编码块覆盖已编码的音频信号的某些时间长度，并且，所述时间常数小于以下中的最大值第一音频编码方案的编码块的时间长度；和第二音频编码方案的编码块的时间长度。
6.根据权利要求1的方法，其中，所述第二音频编码方案允许选择内插第二增益元数据的相邻增益值以形成第二增益曲线的不同的内插曲线；并且，该方法还包括以下步骤基于第一增益元数据的增益值，选择第二增益元数据的两个相邻增益值之间的适当的内插曲线。
7.根据权利要求6的方法，其中，基于第一增益元数据的两个相邻增益值之间的差值来选择所述适当的内插曲线。
8.根据权利要求6的方法，其中第一增益曲线与第一增益元数据的增益值相关联；以及通过内插第一增益元数据的相邻增益值来获得所述第一增益曲线；以及该方法还包括以下步骤基于第一增益曲线的斜率来选择第二增益元数据的两个相邻增益值之间的所述适当的内插曲线。
9.根据权利要求8的方法，还包括以下步骤如果第一增益曲线的负斜率高于预定义的阈值，那么检测增益攻击；如果第一增益曲线的负斜率低于预定义的阈值，那么检测增益释放；以及基于检测到的第一增益曲线的增益攻击或增益释放来选择第二增益元数据的两个相邻增益值之间的所述适当的内插曲线。
10.根据权利要求9的方法，其中，该方法还包括以下步骤基于第一增益曲线的斜率的绝对值最大的位置来选择第二增益元数据的两个相邻增益值之间的所述适当的内插曲线。
11.一种用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的方法，其中所述第一和第二音频编码方案使用编码块；各编码块具有至少一个相关联的增益值；以及第一增益曲线与第一增益元数据的增益值相关联；以及其中，该方法包括以下步骤将与第二增益元数据的增益值相关联的时刻周围的时间间隔内的第一增益曲线的最小值选择作为该第二增益元数据的增益值。
12.根据权利要求11的方法，其中选择第一增益曲线的最小值的步骤包含选择所述时间间隔内的第一增益曲线的一组采样的最小值。
13.根据权利要求12的方法，其中第一增益曲线的所述一组采样对应于与落入所述时间间隔内的第二增益值的编码块相关联的时刻处的第一增益曲线的采样。
14.一种用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的方法，其中所述第一和第二音频编码方案具有不同的每编码块的音频采样数量；各编码块具有至少一个相关联的增益值；以及相邻编码块的一系列增益值被内插以定义增益曲线；以及其中，该方法包括以下步骤基于第一增益元数据的增益值来选择第二增益元数据的增益值，使得第二增益曲线在第一增益曲线的下方。
15.一种用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的方法，其中所述第一和第二音频编码方案使用编码块；各编码块具有至少一个相关联的增益值；以及第一增益曲线与第一增益元数据的增益值相关联；第二增益曲线与第二增益元数据的增益值相关联；以及其中，该方法包括以下步骤选择第二增益元数据的增益值，使得在与第一音频编码方案的编码块相关联的时刻处以及在与第二音频编码方案的编码块相关联的时刻处，第二增益曲线小于或等于第一增益曲线。
16.根据权利要求15的方法，其中所述第一增益曲线由与相邻的第一增益值和第一窗函数相关联的段组成；以及所述第二增益曲线由与相邻的第二增益值和第二窗函数相关联的段组成。
17.一种用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的编码变换系统，其中所述第一和第二音频编码方案使用编码块；以及各编码块具有至少一个相关联的增益值；以及其中，该编码变换系统包括选择装置，用于基于第一增益元数据的增益值选择第二增益元数据的增益值，使得在与该第二增益元数据的增益值相关联的时刻周围的时间间隔内，选择第一增益元数据的最小增益值；以及如果没有第一增益元数据的增益值落入与该第二增益元数据的增益值相关联的时刻周围的所述时间间隔内，那么将该第二增益元数据的增益值选择为与和该第二增益元数据的增益值相关联的编码块之前的编码块相关联的第二增益元数据的增益值；或者紧接在所述时间间隔之前的第一增益元数据的增益值。
18.一种用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的编码变换系统，其中所述第一和第二音频编码方案使用编码块；以及各编码块具有至少一个相关联的增益值；第一增益曲线与第一增益元数据的增益值相关联；以及其中，该编码变换系统包括选择装置，用于将与第二增益元数据的增益值相关联的时刻周围的时间间隔内的第一增益曲线的最小值选择作为该第二增益元数据的增益值。
19.一种用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的编码变换系统，其中所述第一和第二音频编码方案具有不同的每编码块的音频采样数量；各编码块具有相关联的增益值；以及相邻编码块的一系列增益值被内插以定义增益曲线；以及其中，该编码变换系统包括选择装置，用于基于第一增益元数据的增益值来选择第二增益元数据的增益值，使得第二增益曲线在第一增益曲线的下方。
20.一种用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的编码变换系统，其中所述第一和第二音频编码方案使用编码块；各编码块具有相关联的增益值；第一增益曲线与第一增益元数据的增益值相关联；以及第二增益曲线与第二增益元数据的增益值相关联；以及其中，该编码变换系统包括选择装置，用于选择第二增益元数据的增益值，使得在与第一音频编码方案的编码块相关联的时刻处以及在与第二音频编码方案的编码块相关联的时刻处，第二增益曲线小于或等于第一增益曲线。
21.一种计算机程序产品，包括可执行指令，所述可执行指令用于当在计算机上被执行时执行权利要求1 16中的任一项的方法。
22.一种用于对接收的多媒体信号进行解码的机顶盒，该机顶盒包含接收机，用于接收第一编码方案的多媒体信号；编码变换单元，用于将第一编码方案的多媒体信号编码变换成第二编码方案的多媒体信号；以及发射机，用于传输经编码变换的多媒体信号；其中，所述编码变换单元将与动态范围控制有关的音频增益元数据从第一编码方案的第一增益元数据编码变换成第二编码方案的第二增益元数据，其中所述第一和第二音频编码方案使用编码块；以及各编码块具有至少一个相关联的增益值；以及其中，所述编码变换单元基于第一增益元数据的增益值选择第二增益元数据的增益值，使得在与该第二增益元数据的增益值相关联的时刻周围的时间间隔内，选择第一增益元数据的最小增益值；以及如果没有第一增益元数据的增益值落入与该第二增益元数据的增益值相关联的时刻周围的所述时间间隔内，那么将该第二增益元数据的增益值选择为与和该第二增益元数据的增益值相关联的编码块之前的编码块相关联的第二增益元数据的增益值；或者紧接在所述时间间隔之前的第一增益元数据的增益值。
23.一种用于对接收的多媒体信号进行解码的机顶盒，该机顶盒包含接收机，用于接收第一编码方案的多媒体信号；编码变换单元，用于将第一编码方案的多媒体信号编码变换成第二编码方案的多媒体信号；以及发射机，用于传输经编码变换的多媒体信号；其中，所述编码变换单元将与动态范围控制有关的音频增益元数据从第一编码方案的第一增益元数据编码变换成第二编码方案的第二增益元数据，其中所述第一和第二音频编码方案使用编码块；以及各编码块具有至少一个相关联的增益值；第一增益曲线与第一增益元数据的增益值相关联；以及其中，该编码变换单元将与第二增益元数据的增益值相关联的时刻周围的时间间隔内的第一增益曲线的最小值选择作为该第二增益元数据的增益值。
24.一种用于对接收的多媒体信号进行解码的机顶盒，该机顶盒包含接收机，用于接收第一编码方案的多媒体信号；编码变换单元，用于将第一编码方案的多媒体信号编码变换成第二编码方案的多媒体信号；以及发射机，用于传输经编码变换的多媒体信号；其中，所述编码变换单元将与动态范围控制有关的音频增益元数据从第一编码方案的第一增益元数据编码变换成第二编码方案的第二增益元数据，其中所述第一和第二音频编码方案具有不同的每编码块的音频采样数量；各编码块具有相关联的增益值；以及相邻编码块的一系列增益值被内插以定义增益曲线；以及其中，该编码变换单元基于第一增益元数据的增益值来选择第二增益元数据的增益值，使得第二增益曲线在第一增益曲线的下方。
25.一种用于对接收的多媒体信号进行解码的机顶盒，该机顶盒包含接收机，用于接收第一编码方案的多媒体信号；编码变换单元，用于将第一编码方案的多媒体信号编码变换成第二编码方案的多媒体信号；以及发射机，用于传输经编码变换的多媒体信号；其中，所述编码变换单元将与动态范围控制有关的音频增益元数据从第一编码方案的第一增益元数据编码变换成第二编码方案的第二增益元数据，其中所述第一和第二音频编码方案使用编码块；各编码块具有相关联的增益值；第一增益曲线与第一增益元数据的增益值相关联；以及第二增益曲线与第二增益元数据的增益值相关联；以及其中，该编码变换系统选择第二增益元数据的增益值，使得在与第一音频编码方案的编码块相关联的时刻处以及在与第二音频编码方案的编码块相关联的时刻处，第二增益曲线小于或等于第一增益曲线。
26.根据权利要求1 16中的任一项的方法，其中，所述第一和第二音频编码方案是以下中的一种Dolby Ε、Dolby Digital、AAC、HE AAC。
全文摘要
本发明涉及音频编码的领域。特别地，本发明涉及不同的音频编码方案之间的音频元数据的编码变换。本发明描述了用于将与动态范围控制有关的音频增益元数据从第一音频编码方案的第一增益元数据编码变换成第二音频编码方案的第二增益元数据的方法和系统，其中，第一和第二音频编码方案使用编码块，并且其中，各编码块具有至少一个相关联的增益值。该方法和系统基于第一增益元数据的增益值选择第二增益元数据的增益值，使得在与第二增益元数据的增益值相关联的时刻周围的时间间隔内，选择第一增益元数据的最小增益值。
文档编号G10L19/14GK102171755SQ200980138385
公开日2011年8月31日申请日期2009年9月17日优先权日2008年9月30日
发明者K·M·克劳斯, W·A·席尔德巴赫申请人:杜比国际公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：Ｗ·Ａ·席尔德巴赫
技术所有人：杜比国际公司
我是此专利的发明人