用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统的制作方法

文档序号:2827161阅读:202来源:国知局
用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统的制作方法
【专利摘要】以比特流(P)为基础,通过从比特流导出m通道核心信号(Y)和多通道编码参数(α)重构n通道音频信号(X),此处1≤m<n。从比特流还导出量化核心信号的编码器侧动态范围限制的预处理动态范围控制参数,即预处理DRC参数(DRC2)。在基于预处理DRC参数消除任何编码器侧动态范围限制的同时通过根据多通道编码参数的参数合成获得n通道音频信号。在特定的实施例中,重构进一步包括量化可能的解码器侧动态范围压缩的经补偿的后处理DRC参数的使用。优选地,由不同解码器侧组件执行编码器侧范围限制消除和范围压缩。消除和压缩可以由DRC预处理器协调。
【专利说明】用于维持与参数音频编码器相关联的可逆动态范围控制信 息的系统
[0001] 相关申请的交叉引用
[0002] 本申请要求2012年5月18日提交的美国临时专利申请No. 61/649036、2012年7 月25日提交的美国临时专利申请No. 61/664507和2012年10月12日提交的美国临时专 利申请No. 61/713005的优先权,这些申请的全部内容通过引用并入此。

【技术领域】
[0003] 文中公开的本发明主要涉及视听媒体分布(distribution)。特别地,其涉及在解 码期间允许较高比特率模式和较低比特率模式两者以及无缝模式转换的自适应分布格式。 本发明进一步涉及用于根据该分布格式编码和解码信号的方法和设备。

【背景技术】
[0004] 已知参数立体声和多通道编码方法在收听质量方面可扩展且有效率,这使得它们 在低比特率应用中特别有吸引力。然而,在比特率限制具有暂时性特性(如,网络抖动、负 载变化)的情况下,可以通过使用自适应分布格式获得可用网络资源的所有好处,其中在 正常条件期间使用相对较高的比特率且在网络功能差时使用较低比特率。
[0005] 现有的自适应分布格式和相关联的编码(解码)技术可从它们的带宽效率、计算 效率、抗误码、算法延迟和进一步的在视听媒体分布中关于比特率切换事件对于正在享受 被解码的媒体的人而言有多明显的角度被提高。传统解码器可以预期仍与较新的、专用的 设备并行使用这一事实在向后兼容性必须被维持的范围内对这样的潜在提高造成限制。
[0006] 用于确保在视听信号回放期间更一致的动态范围的动态范围控制(DRC)技术 在本领域广为人知。可以参见 T.Carroll and J.Riedmiller, "Audio for Digital Tevision",published as chapter 5. 18 of E. A. Williams et al. (eds. ), NAB Engineering Handbook, 10th ed. (2007),Academic Press和其中引用的参考文献以获得概 述。这样的技术可以允许在信号本身以全动态范围广播时接收器修改视听信号的动态范围 以适应相对不复杂的回放设备,实现更加完善的设备。DRC的简单实现可以使用编码在从0 到1的间隔中的增益因子的元数据字段,解码器可以选择应用或不应用该因子。
[0007] 使用已知的DRC技术,被编码的视听信号可以和如下这样的元数据一起被传输, 该元数据使得用户能够压缩或增大(boost)回放动态范围的能力以适应他或她的偏好或 人工地使动态范围适应可用回放设备。然而,已知的DRC技术可能与自适应比特率编码方 式不兼容,并且在两个比特率之间切换可能有时会伴随动态范围不一致,在传统设备中尤 其如此。本发明解决了该顾虑。

【专利附图】

【附图说明】
[0008] 现在将参考附图描述本发明的实施例,其中:
[0009] 图1、3、7和10是根据本发明的示例实施例的音频编码系统的一般化框图。
[0010] 图2、4、6和13是根据本发明的示例实施例的音频解码系统的一般化框图。
[0011] 图5示出了在音频编码系统中的参数分析级的一部分。
[0012] 图8图解了涉及相同长度的时间块的基于预处理和后处理DRC参数的的经补偿的 后处理DRC参数值的计算。
[0013] 图9图解了涉及不同长度的时间块的基于预处理和后处理DRC参数的的经补偿的 后处理DRC参数值的计算。
[0014] 图11和12示出了在音频解码系统中的参数合成级的一部分。
[0015] 所有图都是示意的且一般仅示出解释本发明所必要的部分,而其他部分可以被省 略或仅被建议。除非另有指示,否则在不同图中的相似附图标记指代相似部分。

【具体实施方式】
[0016] I .概述
[0017] 如此处使用的,"音频信号"可以是纯音频信号或视听信号或多媒体信号中的音频 部分。
[0018] 本发明的示例实施例提出了允许以带宽经济方式的视听媒体的分布的方式和设 备。特别地,示例性实施例提出了允许传统接收器和更现代的设备两者输出具有一致的对 话水平(level)的音频部分的视听媒体分布的编码格式。特别地,示例性实施例提出了具 有自适应比特率的编码格式,其中在两个比特率之间的切换不需要伴有尖锐的对话水平变 化,否则它可能在回放期间成为音频信号或信号中的音频部分中可察觉的伪像。
[0019] 本发明的示例性实施例提供了具有在独立权利要求中阐述的特征的编码方法、编 码器、解码方法、解码器、计算机程序产品和媒体编码格式。
[0020] 本发明的第一实施例提供了用于基于比特流P重构η通道音频信号X的解码系 统。该解码系统至少可在参数编码模式中操作并包括:
[0021] ?解复用器,用于接收该比特流并输出编码核心信号?:和一或多个多通道编码参 数,该一或多个多通道编码参数共同由α指示;
[0022] ?核心信号解码器,用于接收编码核心信号并输出m通道核心信号,其中

【权利要求】
1. 一种解码系统(51 ;451 ;1351),被配置为基于比特流(P)重构η通道音频信号(X), 所述解码系统包括: 参数模式解复用器(70 ;470 ;1370),所述参数模式解复用器用于接收比特流并基于该 比特流并且在系统的参数编码模式中输出编码核心信号
和多通道编码参数(α ); 核心信号解码器(71 ;471 ;1371),所述核心信号解码器用于接收编码核心信号并基于 该编码核心信号输出m通道核心信号(Υ),1彡m < η ;以及 参数合成级(72 ;472 ;1372),所述参数合成级用于接收所述核心信号和所述多通道编 码参数,并且基于所述核心信号和所述多通道编码参数输出η通道信号, 其中参数模式解复用器被进一步配置为基于所述比特流输出量化核心信号的编码器 侧动态范围限制的预处理动态范围控制参数,即预处理DRC参数(DRC2),以及 其中解码系统能够操作以基于预处理DRC参数消除编码器侧动态范围限制。
2. 如权利要求1所述的解码系统,其中: 所述参数模式解复用器被进一步配置为基于比特流并且在系统的参数编码模式中输 出量化将被应用的解码器侧DRC的经补偿的后处理DRC参数(DRC3),其中所述解码系统能 够操作以将所述解码器侧DRC应用到以下位置之一 : i)在参数合成级或其下游中; ii )在核心信号解码器中。
3. 如权利要求2所述的解码系统, 进一步包括DRC处理器(74),所述DRC处理器能够操作以消除编码器侧动态范围限制 或其一部分,并输出经补偿的核心信号(Y。), 其中所述核心信号解码器(71)能够操作以应用所述解码器侧DRC或其一部分。
4. 如权利要求3所述的解码系统,进一步包括通信地耦合到所述核心信号解码器和所 述DRC处理器的DRC预处理器(77),所述DRC预处理器接收目标DRC水平、预处理DRC参数 (DRC2)和经补偿的后处理DRC参数(DRC3)并被配置为: 一如果所述目标DRC水平对应于关于核心信号的解码器输入DRC水平的动态范围增 大,则使得DRC处理器基于目标DRC水平消除编码器侧动态范围限制或其一部分; 一如果所述目标DRC水平对应于关于核心信号的解码器输入DRC水平的动态范围压 缩,则使得核心信号解码器基于目标DRC水平应用所述解码器侧DRC或其一部分, 其中所述DRC预处理器根据目标DRC水平确定所述一部分。
5. 如前述权利要求中任一个所述的解码系统, 其中所述参数模式解复用器被进一步配置为基于比特流并且在系统的参数编码模式 中输出经补偿的后处理DRC参数(DRC3), 该系统进一步包括: DRC下补偿器(1373),用于接收所述经补偿的后处理DRC参数和预处理DRC参数 (DRC2)并基于所述经补偿的后处理DRC参数和预处理DRC参数(DRC2)输出量化将被应用 的解码器侧DRC的经恢复的后处理DRC参数;以及 DRC处理器(1383),被配置为在系统的参数编码模式中根据经恢复的后处理DRC参数 将DRC应用到η通道音频信号, 其中由经恢复的DRC参数表达的解码器侧DRC定量地等同于核心信号的编码器侧动态 范围限制和由经补偿的后处理DRC参数表达的解码器侧DRC的组合。
6. 如权利要求5所述的解码系统,进一步包括: 离散模式解复用器(1360),用于接收比特流并基于该比特流并且在系统的离散编码 模式中输出编码的η通道信号
和量化将被应用的解码器侧DRC的后处理DRC参数 (DRC1);以及 解码器(1361),用于接收编码的比特流中包含的η通道信号
并基于该η通道信号 在系统的离散编码模式中输出η通道音频信号, 其中DRC处理器(1383)被进一步配置为在系统的离散编码模式中根据后处理DRC参 数将DRC应用到η通道音频信号。
7. 如权利要求5或6所述的解码系统,其中参数合成级包括: 预调节器(1174),用于接收核心信号和预处理DRC参数(DRC2),并输出通过消除编码 器侧动态范围限制而获得的经动态范围补偿的核心信号(Υ。);以及 参数合成处理器(1175),用于接收所述经动态范围补偿的核心信号和多通道编码参 数,并基于所述经动态范围补偿的核心信号和多通道编码参数输出η通道信号。
8. 如权利要求5或6所述的解码系统,其中所述参数合成级包括: 参数合成处理器(1275),用于接收所述核心信号和多通道编码参数并基于所述核心信 号和多通道编码参数输出中间信号(Xc);以及 后调节器(1276),用于接收所述中间信号和预处理DRC参数(DRC2),并输出通过消除 所述编码器侧动态范围限制而获得的η通道信号。
9. 如前述权利要求中任一个所述的解码系统,其中参数模式解复用器被进一步配置为 将所述预处理DRC参数(DRC2)的每个值读作表示指数的2比特字段和表示尾数的5比特 字段。
10. -种用于以比特流(Ρ)为基础重构η通道音频信号(X)的方法,该方法包括: 响应于比特流含有编码核心信号
、多通道编码参数(α)和量化核心信号的编 码器侧动态范围限制的预处理动态范围控制参数,即预处理DRC参数(DRC2),执行以下步 骤: a-Ι)将编码核心信号解码为m通道核心信号(Υ),其中1彡m<n;并且 a_2)执行参数合成以基于核心信号和多通道编码参数重构η通道信号, 其中所述方法进一步包括基于预处理DRC参数消除所述编码器侧动态范围限制。
11. 如权利要求10所述的方法,进一步包括: 响应于比特流含有编码核心信号
、多通道编码参数U)、预处理DRC参数 (DRC2)并进一步含有量化将被应用的解码器侧DRC的经补偿的后处理DRC参数(DRC3)的 条件: 执行步骤a-1,a-2和以下的至少一个: a_3)基于预处理DRC参数消除编码器侧动态范围限制或其一部分; a-4)根据经补偿的后处理DRC参数应用所述解码器侧DRC或其一部分。
12. 如权利要求11所述的方法,包括: 通过执行步骤a-1和a-2响应于所述条件; 接收目标DRC水平并将所述目标DRC水平与解码器输入DRC水平比较以确定目标DRC 水平对应于动态范围增大还是动态范围压缩;并且 基于所述比较执行以下中选定的一个: a_3)基于预处理DRC参数消除所述编码器侧动态范围限制或其一部分; a-4)根据经补偿的后处理DRC参数应用所述解码器侧DRC或其一部分。
13. 如权利要求10到12中任一个所述的方法,其中比特流进一步含有量化将被应用的 解码器侧DRC的后处理DRC参数(DRC1、DRC3), 所述方法进一步包括根据后处理DRC参数将DRC应用到η通道信号,其中,如果所述比 特流包括预处理DRC参数(DRC2)以及比特流中的所述后处理DRC参数是经补偿的后处理 DRC参数(DRC3),那么使用经恢复的后处理DRC参数以替代所述经补偿的后处理DRC参数, 其中,所述经恢复的后处理DRC参数基于经补偿的后处理DRC参数(DRC3)和预处理 DRC参数(DRC2)被获得,其中由经恢复的DRC参数表达的解码器侧DRC定量地等同于核心 信号的编码器侧动态范围限制和由后处理DRC参数表达的解码器侧DRC的组合。
14. 如权利要求13所述的方法,进一步包括: 响应于比特流含有编码η通道信号
: b)通过解码所述编码η通道信号重构η通道信号。
15. -种编码系统(1 ;301 ;701),所述编码系统被配置为将划分成时间块的η通道音 频信号(X)编码为比特流(Ρ),所述编码系统包括: 参数分析级(22 ;322 ;722),用于接收η通道信号并基于η通道信号并且在编码系统的 参数编码模式中输出m通道核心信号(Υ)和多通道编码参数(α ),1 < m < η ; 核心信号编码器(23 ;323 ;723),用于接收核心信号并基于核心信号输出编码核心信 号
; 其中所述参数分析级被进一步配置为以时间段为基础执行自适应动态范围限制并输 出量化被应用的动态范围限制的预处理动态范围参数,即预处理DRC参数(DRC2);以及 所述系统进一步包括参数模式复用器(25 ;325 ;725),该复用器能够操作以形成将在 系统的参数编码模式中从系统输出的比特流,且该比特流至少包括所述编码核心信号、所 述多通道编码参数和所述预处理DRC参数。
16. 如权利要求15所述的编码系统,进一步包括: 至少一个DRC分析器(10、21 ;710、721),能够操作以接收η通道音频信号并基于η通 道音频信号输出量化将被应用的解码器侧DRC的后处理DRC参数(DRC1);以及 DRC上补偿器(24 ;724),用于接收所述后处理DRC参数(DRC1)和预处理DRC参数 (DRC2),并基于所述后处理DRC参数(DRC1)和预处理DRC参数(DRC2)输出量化将被应用 的解码器侧DRC的经补偿的后处理DRC参数(DRC3),所述经补偿的后处理DRC参数被在参 数编码模式中包含于所述比特流中, 其中由所述后处理DRC参数表达的所述解码器侧DRC定量地等同于通过所述参数分析 级应用的所述动态范围限制和通过经补偿的后处理DRC参数量化的解码器侧DRC的组合。
17. 如权利要求16所述的编码系统,其中: 所述至少一个DRC分析器被配置为基于包含第一数量Pl > 1的时间块的信号段计算 后处理DRC参数的值; 所述参数分析级被配置为基于包含第二数量& > 1的时间块的信号段计算预处理DRC 参数的值;并且 所述第一数量小于或等于第二数量,Pl彡P2。
18. 如权利要求16或17所述的编码系统,进一步包括: 编码器(11 ;311 ;711),所述编码器用于接收η通道信号并基于所述η通道信号输出形 成在系统的离散编码模式中将从系统输出的比特流的一部分的编码η通道信号
;以 及 离散模式复用器(12 ;712),所述离散模式复用器能够操作以形成在系统的离散编码 模式中将从系统输出的比特流,所述比特流至少包括所述编码η通道信号和所述后处理 DRC参数。
19. 如权利要求15到18中任一个所述的编码系统,其中所述系统包括功能等同的两个 DRC分析器,S卩,离散模式DRC分析器(10 ;710)和参数模式DRC分析器(21 ;721)。
20. 如权利要求15到19中任一个所述的编码系统,进一步包括离散模式复用器(12 ; 712),所述离散模式复用器能够操作以接收所述后处理DRC参数和所述编码η通道信号,并 形成在离散编码模式中将从系统输出的比特流。
21. 如权利要求15到20中任一个所述的编码系统,其中所述参数分析级包括: 预处理器(527),所述预处理器用于接收η通道信号并输出动态范围受限的η通道信号 (Xc)和所述DRC参数;以及 参数分析处理器(528),所述参数分析处理器用于接收动态范围受限的η通道信号并 基于所述动态范围受限的η通道信号输出所述m通道核心信号和所述多通道编码参数。
22. 如权利要求15到21中任一个所述的编码系统,其中所述参数模式复用器被配置为 包括预处理DRC参数(DRC2)的每个值作为表示指数的2比特字段和表示尾数的5比特字 段。
23. -种用于编码被划分成时间块的η通道音频信号(X)的方法, 所述方法包括生成m通道核心信号(Υ)和多通道编码参数(α ),此处1 < m < η, 其中所述生成包括以时间块为基础执行动态范围限制并生成量化所应用的动态范围 限制的预处理动态范围控制参数,即预处理DRC参数(DRC2), 所述方法进一步包括与核心信号和多通道编码参数同时传输所述预处理DRC参数。
24. -种计算机程序产品,所述产品包括具有用于执行如权利要求10到14以及23中 任一个所述的方法的计算机可执行指令的计算机可读介质。
25. 如前述权利要求中任一个所述的系统、方法或计算机程序产品,其中η = 6且m = 2〇
【文档编号】G10L19/008GK104303229SQ201380025886
【公开日】2015年1月21日 申请日期:2013年5月2日 优先权日:2012年5月18日
【发明者】J·瑞德米勒, K·J·罗尔登, K·克约尔林, H·普恩哈根, V·麦尔考特, L·塞勒斯德姆 申请人:杜比实验室特许公司, 杜比国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1