用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法

文档序号:7525125阅读:191来源:国知局
专利名称:用于对便携式装置内的音频信号的响度进行非破坏性标准化的系统和方法
技术领域
本申请总体涉及对音频信号的编码和解码,并且更具体地,涉及可用于针对较宽范围的回放装置和收听环境对音频信号进行编码和解码的技术。
背景技术
手持式和其它类型的便携式装置的日益普及已经对用于在这些装置上回放的媒 体内容的创作者和分发者产生了新的机会和挑战,同样也已经对装置的设计者和制造者产生了新的机会和挑战。许多便携式装置能够回放广泛的媒体内容类型和格式,包括通常与用于HDTV (高清电视)、Blu-ray (蓝光)或DVD (数字多功能盘)的高质量、宽带宽和宽动态范围的音频内容相关联的那些媒体内容类型和格式。便携式装置可用于在其自身的内部声换能器上或者在诸如耳机的外部换能器上回放该类型的音频内容;然而,这些便携式装置通常无法在变化的媒体格式和内容类型中以一致的响度和可理解度来再现该内容。

发明内容
本发明涉及提供用于对音频信号进行编码和解码、以在包括手持式和其它类型的便携式装置的多种装置上进行回放的改进方法。所附独立权利要求中阐述了本发明的各个方面。本发明的各种特征及其优选实施例可通过参考以下论述和附图而得到更好的理解,在附图中,相同的附图标记在多幅图中指的是相同的元件。附图和以下论述的内容仅作为示例来阐述,并且不应理解为表示对本发明的范围的限制。


图I是回放装置的示意框图。图2是编码装置的示意框图。图3至图5是转码装置的示意框图。图6是可用于实现本发明的各个方面的装置的示意框图。
具体实施例方式A.介绍本发明涉及用于对音频信息进行编码和解码,以在具有挑战性的收听环境(诸如手持式和其它类型的便携式装置的用户所遇到的收听环境)中进行回放。诸如以下所描述的公开标准描述了音频编码和解码的一些示例由高级电视业务顾问委员会有限公司(Advanced Television Systems Committee, Inc.)在 2005 年 6 月 14 日公布的 “DigitalAudio Compression Standard (AC-3, E-AC-3) ”,修订 B,文档 A/52B (此处称为 “ATSC 标准”),以及由国际标准组织(ISO)公布的IS0/IEC 13818-7,高级音频编码(AAC)(此处称为“MPEG-2 AAC标准”)和IS0/IEC 14496-3,子部分4 (此处称为“MPEG-4音频标准”)。只是作为示例而给出了遵照这些标准的编码和解码处理。本发明的原理也可用于遵照其它标准的编码系统。发明人发现,遵照一些编码标准的装置的可用特征通常不足以用于手持式和其它类型的便携式装置的典型的应用和收听环境。当这些类型的装置被用于对遵照这些标准的编码输入信号的音频内容进行解码时,所解码的音频内容通常以如下响度水平被再现该响度水平显著低于通过对专门为在这些装置上回放而准备的编码输入信号进行解码而获得的音频内容的响度水平。遵照例如ATSC标准的编码输入信号(此处称为“遵照ATSC的编码信号”)包含编码音频信息以及用于描述该信息可以如何解码的元数据。一些元数据参数标识动态范围压 缩简档,该动态范围压缩简档指定当对编码音频信息进行解码时可如何对音频信息的动态范围进行压缩。可以保持解码信号的完全动态范围,或者可以在解码时以不同的程度来对其进行压缩,以满足不同应用和收听环境的要求。其它元数据标识编码音频信息的响度的某种度量,诸如编码信号中的对话的水平或平均节目水平。该元数据可被解码器用于调整解码信号的幅度,以在回放期间实现指定的响度或参考再现水平。在一些应用中,可以指定或假设一个或多个参考再现水平,而在其它应用中,用户可对参考再现水平的设置进行控制。例如,用于对遵照ATSC的编码信号进行编码和解码的编码处理假设要以两个参考再现水平之一回放对话。一个水平是比限幅水平低31dB,其中限幅水平是最大的可能数字值或满量程(FS)值,这个比限幅水平低31dB的水平在这里标记为-31dBFS。使用该水平的解码模式有时称为“线模式(Line Mode)”,并且旨在用于适合较宽动态范围的应用和环境中。另一水平被设置为_20dBFS。使用该第二水平的解码模式有时称为“RF模式”,其旨在用在如在通过对射频(RF)信号调制而进行广播时所遇到的应用和环境中,其中需要较窄的动态范围以避免过调制。对于另一示例,遵照MPEG-2 AAC标准和MPEG-4音频标准的编码信号包括用于标识编码音频信息的平均响度水平的元数据。对遵照MPEG-2 AAC和MPEG-4音频的编码信号进行解码的处理可允许收听者指定期望的回放水平。解码器使用该期望的回放水平和平均响度元数据来调整解码信号的幅度,以实现期望的回放水平。当手持式和其它类型的便携式装置被用于根据这些元数据参数来对遵照ATSC、遵照MPEG-2 AAC以及遵照MPEG-4音频的编码信号的音频内容进行解码和回放时,动态范围和响度水平通常是不适合的,这是由于这些类型的装置所遇到的不利的收听环境或者由于因在这些装置中使用的较低操作电压而导致的电限制。遵照其它标准的编码信号使用类似类型的元数据,并且可包括用于指定期望的回放响度水平的规定。对这些信号进行解码的便携式装置通常遇到相同的问题。本发明可用于改进手持式和便携式装置的用户的收听体验,而不需要专门为这些装置准备的内容。
B.装置概述图I是包括本发明的各个方面的一种类型的接收器/解码器装置10的示意框图。装置10从信号路径11接收编码输入信号,在反格式化器12中应用适当的处理以从输入信号提取编码音频信息和相关联的元数据,将编码音频信息传递到解码器14并且沿信号路径13传递元数据。编码音频信息包括表示听觉刺激的谱内容的编码子带信号,并且元数据指定多种参数的值,这多种参数包括一个或多个解码控制参数以及用于根据动态范围压缩简档来指定动态范围压缩的一个或多个参数。术语“动态范围压缩简档”指的是诸如增益因子、压缩进行(compress attack)次数和压缩释放(compress release)次数的特征,这些特征定义了动态范围压缩器的操作特性。解码器14对编码音频信息应用解码处理以获得解码子带信号,该解码子带信号被传递到动态范围控制16。可响应于从信号路径13接收的解码控制参数来调节解码处理 的操作和功能。可用于调节解码处理的操作和功能的解码控制参数的示例是用于标识音频信道的数量和配置的参数,其中该音频信道由编码音频信息表示。动态范围控制16可选地调整解码音频信息的动态范围。该调整可响应于从信号路径13和/或从控制信号接收的元数据而被启动或关闭以及调节,其中可响应于来自收听者的输入来提供该控制信号。例如,可响应于收听者操作开关或者选择用于装置10的操作选项来提供控制信号。
在遵照例如ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准的实施中,编码输入信号包括以段或帧的序列布置的编码音频信息。各个帧包含如下编码子带信号这些编码子带信号表示具有其完全动态范围的音频信号的谱分量。动态范围控制16可不采取动作,这允许以最大的动态范围量来回放音频信号,或者动态范围控制16可修改解码子带信号,以按照不同的程度来压缩动态范围。合成滤波器组18对解码子带信号应用可由动态范围控制16调整的一组合成滤波器,并且在其输出处提供可以是数字或模拟信号的时域音频信号。增益-限制器20在本发明的一些实施中用于调整时域音频信号的幅度。增益-限制器20的输出沿着路径21传递,以用于随后由声换能器进行呈现。图2是包括本发明的各个方面的编码器/发送器装置30的示意框图。装置30从信号路径31接收表示听觉刺激的音频输入信号。装置30对音频信号应用一组分析滤波器,以获得作为输入音频信号的频域表示的子带信号或者表示输入音频信号的一组带限信号。元数据计算器34对音频输入信号和/或从音频输入信号获得的一个或多个信号(诸如来自分析滤波器组32的子带信号或音频输入信号的变型形式)进行分析,以计算指定多种参数的值的元数据,这多种参数包括编码控制参数、一个或多个解码控制参数以及用于根据动态范围压缩简档来指定动态范围压缩的一个或多个参数。元数据计算器34可对时域信号、频域信号或者时域和频域信号的组合进行分析。也可响应于从路径33接收的一个或多个元数据参数来调节由元数据计算器34执行的计算。编码器36对分析滤波器组32的输出应用编码处理,以获得包括编码子带信号的编码音频信息,该编码音频信息被传递到格式化器38。可响应于从路径33接收的编码控制参数来调节编码处理。编码处理还可生成沿着路径33的其它解码控制参数,以供在装置10中执行的处理用于对编码音频信息进行解码。格式化器38将编码音频信息和元数据中的至少一些元数据汇编成为具有适合于传输或存储的格式的编码输出信号,该元数据包括一个或多个解码控制参数以及用于指定动态范围压缩的一个或多个参数。在遵照例如ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准的实施中,编码输出信号包括以段或帧的序列布置的编码音频信息。各个帧包含如下编码子带信号这些编码子带信号表示具有其完全动态范围的音频信号的谱分量,并且具有用于以参考再现水平进行回放的幅度。反格式化器12、解码器14、合成滤波器组18、分析滤波器组32、编码器36以及格式化器38在设计和操作方面可以是传统的。一些示例包括遵照上述公开标准的相应部件。在这些标准中指定或提出的部件的实施适合用于本发明,但并非必需这些部件。这些部件的特定实施都不是必须的。图3至图5是包括上述装置10和装置30中的一些部件的转码器装置40的不同实施的示意框图。这些部件与它们的对应部件基本上相同地工作。图3所示的装置40能够将从路径11接收的编码输入信号转码成遵照相同编码标准的变型形式。在该实施中,装置40从信号路径11接收编码输入信号,在反格式化器12中应用适当的处理以从编码输入信号提取第一编码音频信息和相关联的元数据,将第一编码音频信息传递到解码器14和格式化器38,并且沿着信号路径43传递元数据。第一编码音频信息包括表示听觉刺激的谱内容的编码子带信号,并且元数据指定多种参数的值,这多种参数包括一个或多个解码控制参数以及用于根据第一动态范围压缩简档来指定动态范围压缩的一个或多个参数。解码器14对第一编码音频信息应用解码处理以获得解码子带信号。可响应于从信号路径43接收的一个或多个解码控制参数来调节解码处理的操作和功能。子带信号可以是听觉刺激的频域表示或者表示听觉刺激的一组带限信号。元数据计算器44对解码子带信号和/或从解码子带信号得到的一个或多个信号进行分析,以计算用于根据第二动态范围压缩简档来指定动态范围压缩的一个或多个参数值。例如,可通过对解码子带信号应用合成滤波器组18来得到一个或多个信号。可响应于从路径43接收的元数据来调节由元数据计算器44执行的计算。如果合成滤波器组18的输出不需要用于元数据计算,则可从该实施中省略合成滤波器组18。 图4中示出了装置40的另一实施。该实施与图3所示的实施类似,但是包括编码器36。包括编码器36允许装置40将遵照第一编码标准的、从路径11接收的编码输入信号转码成遵照第二编码标准的编码输出信号,该第二编码标准可与第一编码标准相同或不同,只要两个编码标准的子带信号兼容即可。这可在该实施中通过使编码器36对子带信号应用编码处理以获得遵照第二编码标准的第二编码音频信息来实现。第二编码音频信息被传递到格式化器38。可响应于从路径43接收的元数据来调节编码处理。编码处理还可生成沿着路径43的其它元数据,以供在装置10中执行的处理用于对编码音频信息解码。格式化器38将从路径43接收的元数据和其接收的编码音频信息汇编成具有适合于传输或存储的格式的编码输出信号。图5中示出了装置40的又一实现。该实现包括合成滤波器组18,该合成滤波器组18被应用于解码子带信号,以获得编码音频信息的时域或宽带表示。包括合成滤波器组18和分析滤波器组32允许装置40在基本上任意编码标准选择之间进行转码。合成滤波器组18的输出被传递到分析滤波器组32,分析滤波器组32生成子带信号,以供编码器36进行编码。编码器36对分析滤波器组32的输出应用编码处理,以获得第二编码音频信息,该第二编码音频信息被传递到格式化器38。编码处理还可生成沿着路径43的其它元数据,以供在装置10中执行的处理用于对编码音频信息解码。元数据计算器44可根据其对从解码器14接收的子带信号、合成滤波器组18的输出以及分析滤波器组32的输出中的任意或全部的分析来计算元数据参数值。以下更详细地描述装置10和装置30的一些方面。这些描述适用于装置40的相应特征。这些方面是按照遵照上述ATSC标准的方法和装置的特征和特性来描述的。这些具体特征和特性仅作为示例来讨论。这些实施中的根本原理直接适用于遵照其它标准的方法和装置。C.接收器/解码器上述回放问题可通过使用下述三种不同技术中的一种或多种来解决。第一技术使用增益限制并且可通过仅在装置10中的特征来实施。第二技术和第三技术使用动态范围压缩,并且其实施需要在装置10和装置30两者中的特征。 I.增益-限制器第一技术以RF模式而不是以线模式来操作装置10,以使得其利用动态范围控制16对遵照ATSC的编码输入信号进行解码,动态范围控制16提供较高的动态范围压缩水平和较高的参考再现水平。增益-限制器20提供额外的增益,从而将有效参考再现水平提高到从-14dBFS到-8dBFS的值。经验结果表明等于-lldBFS的参考水平对于很多应用给出良好结果。增益-限制器20还应用限制操作,以防止放大的数字信号超过0dBFS。限制器的操作特性可以影响再现音频的感知质量,但是没有特定限制器对本发明而言是必须的。限制器可基本上以任意可能期望的方式来实施。优选地,限制器被设计成提供“软”限制功能而非“硬”限幅功能。2.差分压缩值第二技术允许装置10在动态范围控制16中应用一个或多个修改的动态范围压缩参数。反格式化器12从编码输入信号获得差分动态范围压缩(DRC)参数值,并且沿着路径13将差分参数值与传统的DRC参数值一起传递到动态范围控制16。动态范围控制16通过对传统的DRC参数值和对应的差分DRC参数值进行算术组合来计算所需的一个或多个DRC参数值。在该情形中不需要使用增益-限制器20。由生成编码输入信号的编码器/发送器装置30在编码输入信号中提供差分DRC参数值。这在以下进行描述。如果编码输入信号不包含这些差分DRC值,则装置10可以使用根据上述第一技术的增益-限制器20。3.独特压缩简档第三技术允许装置10在动态范围控制16中应用根据新动态范围压缩简档的动态范围压缩。反格式化器12从编码输入信号获得新简档的一个或多个DRC参数值,并且沿路径13将它们传递到动态范围控制16。在该情形中不需要使用增益-限制器20。由生成编码输入信号的编码器/发送器装置30在编码输入信号中提供新动态范围压缩简档的DRC参数值。这在以下进行描述。
如果编码输入信号不包含新DRC简档的一个或多个DRC参数值,则装置10可以使用根据上述第一技术的增益-限制器20。D.编码器/发送器I.差分压缩值在装置10中通过使用从编码输入信号提取的差分DRC参数值来实施上述第二技术的处理。这些差分参数值由生成编码信号的装置30来提供。装置30提供一组差分DRC参数值,这组差分DRC参数值表示将存在于编码信号中的一组DRC参数值与新DRC简档的一组对应的基本参数值之间的差,并且是防止解码音频信号样本超过0dBFS以实现较高的参考再现水平所需的。用于计算DRC参数值的特定方法都不是本发明必须的。在由高级电视业务顾问委员会有限公司(AdvancedTelevision Systems Committee, Inc.)在 2009 年 11 月 4 日公布的 “ATSC RecommendedPractice:Techniques for Estalishiing an Maintaining Audio Loudness for Digital Television”,文档A/85 (尤其是在第9节和附录F)中以及在Robinson等人的“DynamicRange Control via Metadata”,预印号 5028,107th AES convention,纽约,1999 年 9 月中公开了遵照ATSC标准的用于计算参数值的公知方法。如果编码输出信号遵照ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准,则参考再现水平增加到从-14dBFS到-8dBFS的值。经验结果表明等于-lldBFS的参考水平对于很多应用给出良好结果。对于遵照ATSC的编码输出信号,元数据计算器34计算对于该标准中指定的对应的基本参数“compr”的差分参数值。格式化器38可将差分参数值汇编成各个编码信号帧的标记为“addbsi”(额外比特流信息)和/或“auxdata”(辅助数据)的部分。如果差分参数值被汇编成“addbsi ”部分或“auxdata”部分,则编码信号将与所有遵照ATSC的解码器兼容。不能识别差分参数值的那些解码器仍然可以通过忽略“addbsi”和“auxdata”部分而正确地对编码信号帧进行处理和解码。参考以上引用的A/52b文献文档以得到更多细节。对于遵照MPEG-2 AAC标准或MPEG-4音频标准的编码输出信号,格式化器38可将差分参数值汇编成各个编码信号帧的在两个标准中被标记为“Fill_Element”或“Data_StreanuElement”的部分。如果差分参数值被汇编成这些部分之一,则编码信号将与所有遵照MPEG-2 AAC标准和MPEG-4音频标准的解码器兼容。参考以上引用的IS0/IEC 13818-7和IS0/IEC 14496-3文档以得到更多细节。可计算差分参数值,并以大于、等于或小于对应的基本参数值在编码信号中的速率的速率来将差分参数值插入到编码信号中。差分值的速率可变化。用于表示先前的差分值是否应该再次使用的标志或比特也可包括在编码信号中。2.独特压缩简档在装置10中通过使用从编码输入信号提取的、新动态范围压缩简档的DRC参数值来实施上述第三技术的处理。这些参数值由生成编码信号的装置30来提供。装置30通过计算如下参数值来得到新DRC简档的DRC参数值这些参数值是防止解码音频信号样本超过0dBFS以得到较高的参考再现水平所需的。如果编码输出信号遵照ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准,则元数据计算器34基于参考再现水平增加到从-14dBFS到-8dBFS的值这一假设来计算DRC压缩值。经验结果表明等于-lldBFS的参考水平对于很多应用给出良好结果。格式化器38可将DRC简档的参数值汇编成各个编码信号帧的如上所述的用于差分参数的部分。帧的这些部分的使用允许编码信号与遵照各个标准的所有解码器兼容。 E.实现 包括本发明的各个方面的装置可以以多种方式来实现,这些方式包括用于由计算机或某种其它装置执行的软件,该其他装置包括耦合到与通用计算机中发现的部件类似的部件的更专用的部件(诸如数字信号处理器(DSP)电路)。图6是可用于实施本发明的方面的装置70的示意框图。处理器72提供计算资源。RAM 73是被处理器72用于进行处理的系统随机存取存储器(RAM)。ROM 74表示某种形式的持久存储装置(诸如只读存储器(ROM)),其用于存储操作装置70所需的程序并且可以用于执行本发明的各个方面。I/O控制75表示用于利用通信信道76、77接收输入信号和发送输出信号的接口电路。在所示出的实施例中,所有主要的系统部件均连接到总线71,总线71可表示多于一个物理或逻辑总线;然而,总线架构不是实现本发明必须的。
在由通用计算机系统实现的实施例中,可包括额外的部件,用于与诸如键盘或鼠标和显示器的装置接口,以及用于控制具有存储介质(诸如磁带或磁盘、或者光学介质)的存储装置78。存储介质可用于记录用于操作系统、用途以及应用的指令的程序,并且可包括实施本发明的各个方面的程序。实践本发明的各个方面所需的功能可以由以多种方式实施的部件来执行,这些部件包括分立逻辑部件、集成电路、一个或多个ASIC和/或程序控制处理器。这些部件实现的方式对本发明并不重要。本发明的软件实施可通过多种机器可读介质(诸如贯穿包括从超声频率到紫外线频率的频谱的调制通信信道或基带)或者使用基本上任何记录技术表达信息的存储介质(包括磁带、卡或盘、光卡或光盘、以及包括纸的介质上的可检测标记)来表达。
权利要求
1.一种用于对编码输入信号进行解码以生成音频输出信号的方法,其中,所述方法包括 接收包括编码音频信息和相关联的元数据的所述编码输入信号,所述相关联的元数据包括一个或多个解码控制参数以及一个或多个第一参数,所述一个或多个第一参数根据第一动态范围压缩简档来指定动态范围压缩,并且所述相关联的元数据可选地包括一个或多个第二参数,所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第一参数具有下述值根据生成所述编码音频信息的编码处理而设置所述值,以表示具有用于以第一参考再现水平进行回放的、不超过限幅水平的幅度的听觉刺激;并且其中,所述一个或多个第二参数具有下述值根据生成所述编码音频信息的编码处理而设置所述值,以表示具有用于以第二参考再现水平进行回放的、不超过所述限幅水平的幅度的所述听觉刺激,所述第二参考再现水平高于所述第一参考再现水平;对所述编码音频信息应用解码处理,以获得表示所述听觉刺激的谱内容的子带信号,其中,响应于所述一个或多个解码控制参数来调节所述解码处理; 修改所述子带信号,以获得具有改变的动态范围特性的修改子带信号,其中,如果所述元数据包括所述一个或多个第二参数,则响应于所述一个或多个第二参数来调节所述修改,或者如果所述元数据不包括所述一个或多个第二参数,则响应于所述一个或多个第一参数来调节所述修改; 对所述修改子带信号应用合成滤波器组,以获得时域音频信号;以及如果所述元数据不包括所述一个或多个第二参数,则响应于所述元数据而对所述时域音频信号施加增益并应用限制器,其中,所述增益的施加修改所述时域音频信号,以获得具有用于以所述第二参考再现水平进行回放的幅度的所述音频输出信号,并且其中,所述限制器的应用防止所述音频输出信号的幅度超过所述限幅水平。
2.根据权利要求I所述的方法,其中,所述一个或多个第二参数表示所述第一动态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。
3.根据权利要求I或2所述的方法,其中,所述编码输入信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,所述第一参考再现水平对应于低于所述限幅水平20dB的幅度,并且所述第二参考再现水平对应于低于所述限幅水平IldB的幅度。
4.一种用于对表示听觉刺激的音频输入信号进行编码的方法,其中,所述方法包括 接收所述音频输入信号; 对所述音频输入信号应用分析滤波器组,以生成表示所述音频输入信号的谱内容的子带信号; 分析从所述音频输入信号得到的一个或多个信号,以计算元数据,所述元数据包括一个或多个第一参数以及一个或多个第二参数,所述一个或多个第一参数根据第一动态范围压缩简档来指定动态范围压缩,而所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第一参数具有下述值所述值被设置为表示具有用于以第一参考再现水平进行回放的、不超过限幅水平的幅度的所述听觉刺激,并且其中,所述一个或多个第二参数具有下述值所述值被设置为表示具有用于以第二参考再现水平进行回放的、不超过所述限幅水平的幅度的所述听觉刺激;对所述子带信号应用编码处理,以获得编码音频信息;以及将所述编码音频信息和所述元数据汇编成具有适合于传输或存储的格式的编码输出信号,其中,所述一个或多个第二参数表示所述第一动态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。
5.根据权利要求4所述的方法,其中,所述编码输出信号遵照ATSC标准、MPEG-2AAC标准或MPEG-4音频标准,所述第一参考再现水平对应于低于所述限幅水平20dB的幅度,并且所述第二参考再现水平对应于低于所述限幅水平IldB的幅度。
6.一种用于对编码输入信号进行转码以生成编码输出信号的方法,其中,所述方法包括 接收包括第一编码音频信息和相关联的元数据的所述编码输入信号,所述相关联的元数据包括一个或多个解码控制参数以及一个或多个第一参数,所述一个或多个第一参数根据第一动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第一参数具有下述值根据生成所述第一编码音频信息的第一编码处理而设置所述值,以表示具有用于以第 一参考再现水平进行回放的、不超过限幅水平的幅度的听觉刺激; 对所述第一编码音频信息应用解码处理,以获得表示所述听觉刺激的谱内容的子带信号,其中,响应于所述一个或多个解码控制参数来调节所述解码处理; 分析从所述子带信号获得的一个或多个信号,以计算一个或多个第二参数,所述一个或多个第二参数根据第二动态范围压缩简档来指定动态范围压缩,其中,所述一个或多个第二参数具有下述值所述值被设置为表示具有用于以第二参考再现水平进行回放的、不超过所述限幅水平的幅度的所述听觉刺激;以及 将第二编码音频信息、所述一个或多个第一参数以及所述一个或多个第二参数汇编成具有适合于传输或存储的格式的编码输出信号,其中,所述第二编码音频信息是所述子带信号的编码表不。
7.根据权利要求6所述的方法,其中,所述一个或多个第二参数表示所述第一动态范围压缩简档和所述第二动态范围压缩简档的对应参数之间的差。
8.根据权利要求6或7所述的方法,包括对所述子带信号应用合成滤波器组以获得所述一个或多个信号,其中所述一个或多个信号被分析以计算指定动态范围压缩的所述一个或多个第二参数。
9.根据权利要求6至8中任一项所述的方法,包括对所述子带信号应用第二编码处理,以生成所述第二编码音频信息。
10.根据权利要求6至8中任一项所述的方法,其中,所述第二编码音频信息是所述第一编码首频彳目息。
11.根据权利要求6至10中任一项所述的方法,其中,所述编码输入信号遵照ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准,并且所述第一参考再现水平对应于低于所述限幅水平20dB的幅度。
12.根据权利要求6至10中任一项所述的方法,其中,所述编码输出信号遵照ATSC标准、MPEG-2 AAC标准或MPEG-4音频标准,并且所述第二参考再现水平对应于低于所述限幅水平IldB的幅度。
13.一种设备,包括用于执行根据权利要求I至12中任一项所述的方法的步骤的装置。
14.一种用于记录指令程序的存储介质,所述指令程序能够由装置执行,以执行根据权利要求I至12中任一项所述的方法的 步骤。
全文摘要
许多便携式回放装置无法以一致的响度和可理解度对具有宽带宽和宽动态范围的编码音频内容进行解码和回放,除非编码音频内容是专门为这些装置准备的。可以通过使编码内容包括一些元数据来克服该问题,该元数据根据相对于另一已知压缩简档的差分值或绝对值来指定适当的动态范围压缩简档。回放装置还可自适应地对回放音频施加增益和限制。公开了在编码器、转码器和解码器中的实现。
文档编号H03G7/00GK102754151SQ201180009098
公开日2012年10月24日 申请日期2011年2月3日 优先权日2010年2月11日
发明者哈拉尔德·H·蒙特, 杰弗里·C·里德米勒, 梅尔廷·沃尔特斯, 米夏埃尔·舒格 申请人:杜比国际公司, 杜比实验室特许公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1