支持后降混信号的多客体音频编解码设备的制作方法

文档序号：2823224研发日期：2009年阅读：212来源：国知局

技术简介：
本专利针对多通道音频编码解码中后降混信号与原始信号差异导致音质下降的问题，提出通过计算并传输降混信息参数（如PDG）调整后降混信号，使其更接近原始信号，同时结合功率偏置补偿和残差信号传输优化调整效果，显著提升解码音质。
关键词：多通道音频,后降混信号,PDG参数

专利名称：支持后降混信号的多客体音频编解码设备的制作方法
技术领域：
本发明涉及一种多客体音频编码和解码设备，更特别是，涉及一种可支持从外部输入的后降混信号(post downmix signal)的多客体音频编解码设备，并有效地显示与一般降混信号和后降混信号之间的关系相关的降混信息参数。
背景技术：
目前，可以有效压缩音频客体信号的基于客体的音频编码技术是人们关注的焦点。用于支持现有运动图像专家组(MPEG)环绕技术的任意降混信号的参数的量化/ 反量化体系(scheme)，可提取任意降混信号和编码器的降混信号之间的频道水平差异 CLD (Channel Level Difference)参数。此外，量化/反量化体系可使用以在MPEG环绕体系中的OdB为基准设计得心对称的CLD量化表，来执行量化/反量化步聚。当多个乐器/曲目被混合为立体声信号时，可生成领头降混信号(mastering downmix signal)，其可被放大以具有光盘(⑶)可显示的最大动态范围，并可被通过均衡器等转换。因此，领头降混信号可与立体声混音信号不同。当MPEG环绕体系的任意降混处理技术被应用到多客体音频编码设备中来支持领头降混信号时，降混信号和领头降混信号之间的CLD可由于每个客体的降混增益被非对称地提取。在这里，CLD可通过将每个客体乘以降混增益而获得。因此，只可使用一个现有CLD 量化表的一边，因此当进行CLD参数的量化/反量化时发生的量化误差可能是很重大的。因此，需要一种方法来有效编码/解码音频客体。

发明内容
技术目的本发明的一个方面，提供一种多客体音频编码和解码设备，其支持后降混信号。本发明的一个方面，还提供一种多客体音频编码和解码设备，其可基于与每个客体相乘的降混增益使非对称地提取的降混信息参数针对OdB变得均勻对称分布，可执行量化和反量化，从而可减少量化误差。本发明的一个方面，还提供一种多客体音频编码和解码设备，其可使用降混信息参数，将后降混信号调整为类似于编码操作中生成的降混信号，从而降低声音衰减。技术方案根据本发明的一个方面，提供一种多客体音频编码设备，其使用从外部输入的后降混信号来编码多客体音频。所述多客体音频编码设备可包括客体信息提取及降混生成单元，其从输入客体信号生成客体信息和降混信号；参数决定单元，其使用提取出的降混信号和后降混信号，来决定降混信息参数；和比特流生成单元，其结合客体信息和降混信息参数，来生成客体比特流。所述参数决定单元可包括功率偏置(power offset)计算单元，其将所述后降混信号定级(scale)为预设定的值，来使特定桢中的后降混信号的平均功率与降混信号的平均功率相同；和参数提取单元，其在预设定的桢中从被定级的后降混信号中提取降混信息参数。所述参数决定单元，可决定作为补偿降混信号和后降混信号之间差异的降混参数信息的PDG，且所述比特流生成单元，可传输包含有PDG的客体比特流。

所述参数决定单元，可生成对应降混信号和后降混信号之间的差异的残差信号；且所述比特流生成单元，可传输含有残差信号的客体比特流。所述降混信号和后降混信号之间的差异，可通过应用后降混增益而被补偿。根据本发明的一个方面，提供一种多客体音频解码设备，其使用从外部输入的后降混信号来解码多客体音频。所述多客体音频解码设备包括比特流处理单元，其从客体比特流中提取降混信息参数和客体信息；降混信号生成单元，其基于降混信息参数调整后降混信号，并生成降混信号；和解码单元，其使用客体信息解码降混信号并生成客体信号。所述多客体音频解码设备可进一步包括渲染单元，其使用用户控制信息对生成的客体信号执行渲染，并生成可重复输出信号。所述降混信号生成单元可包括功率偏置补偿单元，其使用从降混信息参数中提取出的功率偏置值，来定级后降混信号；降混信号调整单元，其使用降混信息参数来将定级的后降混信号转换为降混信号。根据本发明的一个方面，提供一种多客体音频解码设备，包括比特流处理单元，其从客体比特流中提取降混信息参数和客体信息；降混信号生成单元，其使用降混信息参数和后降混信号来生成降混信号；代码转换单元，其使用客体信息和用户控制信息对所述降混信号执行代码转换；降混信号预处理单元，其使用代码转换的结果来预处理所述降混信号；和运动图像专家组MPEG环绕解码单元，其使用代码转换的结果和处理的降混信号来执行MPEG环绕解码。技术效果根据本发明的一个实施例，提供一种多客体音频编码和解码设备，其支持后降混信号。根据本发明的一个实施例，还提供一种多客体音频编码和解码设备，其可基于与每个客体相乘的降混增益使非对称地提取的降混信息参数针对OdB变得均勻对称分布，可执行量化和反量化，从而可减少量化误差。根据本发明的一个实施例，还提供一种多客体音频编码和解码设备，其可使用降混信息参数，将后降混信号调整为类似于编码操作中生成的降混信号，从而降低声音衰减。

图1是示出根据本发明的一个实施例的支持后降混信号的多客体音频编码设备的框图；图2是示出根据本发明的一个实施例的支持后降混信号的多客体音频编码设备的配置的框图；图3是示出根据本发明的一个实施例的支持后降混信号的多客体音频解码设备的配置的框图；图4是示出根据本发明的另一个实施例的支持后降混信号的多客体音频解码设备的配置的框图；图5是示出在根据本发明的一个实施例的支持后降混信号的多客体音频编码设备中补偿频道水平差异CLD(Channel Level Difference)的操作的框图；图6是示出根据本发明的一个实施例的通过相反地补偿CLD补偿值来进行后降混信号的补偿的的操作的框图；图7是示出根据本发明的另一个实施例的支持后降混信号的多客体音频编码设备中的参数决定但单元的配置的框图；图8是示出根据本发明的另一个实施例的支持后降混信号的多客体音频解码设备中的降混信号生成单元的配置的框图；和图9是示出根据本发明的一个实施例的输出后降混信号空间音频客体编码 SAOC(Spatial Audio Object Coding)比特流的操作的示图。
具体实施例方式现在将参照附图对本发明的实施例进行详细描述，所述实施例的示例在附图中被示出，其中相同的参考数字始终表示相同的元素。下面将参照数字描述实施例，以对本发明进行说明。图1是示出根据本发明的一个实施例的支持后降混信号的多客体音频编码设备 100的框图。多客体音频编码设备100，可使用从外部输入的后降混信号(post downmix signal)来编码多客体音频信号。多客体音频编码设备100可使用输入客体信号101来生成降混信号和客体信息。在这种情况下，客体信息可表示从输入客体信号101预测的空间线索参数(spatial cue parameter)。此外，多客体音频编码设备100可分析降混信号和额外输入的后降混信号102，从而可生成降混信息参数，来将后降混信号102调整为类似于降混信号。降混信号可在执行编码时生成。多客体音频编码设备100可使用降混信息参数和客体信息来生成客体比特流 104。此外，输入的后降混信号102可被直接作为后降混信号103输出而无需经过特定的重放(replay)进程。在这种情况下，可通过提取降混信号和后降混信号102之间的CLD参数、使用频道水平差异(CLD)量化表来量化/反量化降混信息参数。所述CLD量化表可针对预定的中心被设计得对称。例如，多客体音频编码设备可基于应用到每个客体信号的降混增益，使不对称地提取的CLD参数针对某一预定中心变得对称。根据本发明，客体信号可能被称为客体。图2是示出根据本发明的一个实施例的支持后降混信号的多客体音频编码设备 100的配置的框图。参考图2，多客体音频编码设备100可包括客体信息提取及降混生成单元201，参数决定单元202，比特流生成单元203。多客体音频编码设备100可支持从外部输入的后降混信号(post downmix signal) 102。根据本发明，后降混信号(post downmix signal)可表不令页头降混信号(mastering downmix signal)。
客体信息提取及降混生成单元201可从输入客体信号101生成客体信息和降混信号。参数决定单元202，可分析提取出的降混信号和后降混信号102，来决定降混信息参数。参数决定单元202可计算降混信号和后降混信号102之间的信号强度差异来决定降混信息参数。此外，输入的后降混信号102可作为后降混信号103直接输出而无需特定的重放进程。例如，参数决定单元202可将后降混增益PDG(Post Downmix Gain)决定为降混信息参数。可通过将后降混信号最大程度上调整为与降混信号类似而均勻对称地分布所述PDG。具体来说，参数决定单元202可基于降混增益将不对称提取的降混信息参数相对于OdB决定地均勻对称。在这里，降混信息参数可以是PDG，降混增益可以与每个客体相乘。随后，可以以等同于CLD的量化表来量化PDG。当通过将后降混信号调整地类似于编码操作中生成的降混信号来解码后降混信号102时，声音质量有可能比使用降混信号。直接解码时严重衰减。因此，要有效地提取用来调整降混信号102的降混信息参数来减少声音的衰减。降混信息参数可以是如被用作运动图像专家组环绕MPEG Surround体系的任意降混增益ADG的CLD之类的参数。CLD参数可以被量化以传输，并可针对OdB对称，从而可减少量化误差，并降低由后降混信号引起的声音衰减。比特流生成单元203可结合客体信息和降混信息参数，来生成客体比特流。图3是示出根据本发明的一个实施例的支持后降混信号的多客体音频解码设备 300的配置的框图。参考图3，多客体音频解码设备300可包括降混信号生成单元301，比特流处理单元302，解码单元303和渲染单元304。多客体音频解码设备300可支持从外部输入的后降混信号305。比特流处理单元302可从多客体音频编码设备传输来的客体比特流306中提取降混信息参数308和客体信息309。随后，降混信号生成单元301可基于降混信息参数308调整后降混信号305，并生成降混信号307。在这种情况下，降混信息参数308可补偿降混信号307和后降混信号305之间的信号强度差异。解码单元303可使用客体信息309解码降混信号307并生成客体信号310。渲染单元304可使用用户控制信息311对生成的客体信号310执行渲染，并生成可重复输出信号312。在这种情况下，用户控制信息311可表示通过混合存储的客体信号来生成输出信号所需的渲染矩阵或信息。图4是示出根据本发明的另一个实施例的支持后降混信号的多客体音频解码设备400的配置的框图。参考图4，多客体音频解码设备400可包括降混信号生成单元401，比特流处理单元402，降混信号预处理单元403，代码转换单元404，以及MPEG环绕解码单元405。比特流处理单元402，可从客体比特流407中提取降混信息参数409和客体信息 410。降混信号生成单元410，可使用降混信息参数409和后降混信号406来生成降混信号 408。后降混信号406可被直接输出用于重放。代码转换单元404，可使用客体信息410和用户控制信息412对所述降混信号408执行代码转换。随后，降混信号预处理单元403可使用代码转换的结果来预处理所述降混信号408。MPEG环绕解码单元405可使用MPEG环绕比特流413和预处理过的降混信号411 来执行MPEG环绕解码。MPEG环绕比特流413可以是代码转换的结果。多客体音频解码设备400可通过MPEG环绕解码来输出输出信号414。图5是示出在根据本发明的一个实施例的支持后降混信号的多客体音频编码设备中补偿频道水平差异CLD(Channel Level Difference)的操作的框图。当通过将后降混信号调整为与降混信号类似而执行解码时，音质可能比直接使用编码时生成的降混信号进行解码更加严重地衰减。因此，后降混信号将被调整到最大限度类似于原始降混信号来减少声音的衰减。于此，用来调整后降混信号的降混信息参数可被有效地提取和显示。跟据本发明的一个实施例，降混信号与后降混信号之间的信号强度差异可被用作降混信息参数。被用作MPEG环绕体系的ADG的CLD可以是降混信息参数。所述降混信息参数可由表1所示的CLD量化表来进行量化。[表 1] CLD 量化表(CLD quantization table)
权利要求
1.一种多客体音频编码设备，其使用从外部输入的后降混信号来编码多客体音频。
2.如权利要求1所述的多客体音频编码设备，其包括客体信息提取及降混生成单元，其从输入客体信号生成客体信息和降混信号；参数决定单元，其使用提取出的降混信号和后降混信号，来决定降混信息参数；和比特流生成单元，其结合客体信息和降混信息参数，来生成客体比特流。
3.如权利要求2所述的多客体音频编码设备，其中，所述参数决定单元包括功率偏置计算单元，其将所述后降混信号定级(scale)为预设定的值，来使特定桢中的后降混信号的平均功率与降混信号的平均功率相同；和参数提取单元，其在预设定的桢中从被定级的后降混信号中提取降混信息参数。
4.如权利要求2所述的多客体音频编码设备，其中，所述参数决定单元，计算降混信号和后降混信号之间的信号强度差异来决定降混信息参数。
5.如权利要求4所述的多客体音频编码设备，其中，所述参数决定单元，将后降混增益 PDG决定为降混信息参数，所述PDG通过将后降混信号最大程度上调整为与降混信号类似而被均勻对称地分布。
6.如权利要求2所述的多客体音频编码设备，其中，所述参数决定单元，计算表示输入客体信号的混合量的降混增益DMG和降混频道水平差异DCLD。
7.如权利要求2所述的多客体音频编码设备，其中，所述参数决定单元，决定作为补偿降混信号和后降混信号之间差异的降混参数信息的 PDG，且所述比特流生成单元，传输包含有PDG的客体比特流。
8.如权利要求7所述的多客体音频编码设备，其中，所述参数决定单元，生成对应降混信号和后降混信号之间的差异的残差信号；且所述比特流生成单元，传输含有残差信号的客体比特流，其中，所述降混信号和后降混信号之间的差异通过应用后降混增益而被补偿。
9.如权利要求8所述的多客体音频编码设备，其中，所述残差信号，针对影响输入客体信号音质的频带而生成，且通过比特流被传输。
10.一种多客体音频解码设备，其使用从外部输入的后降混信号来解码多客体音频。
11.如权利要求10所述的多客体音频解码设备，其包括比特流处理单元，其从客体比特流中提取降混信息参数和客体信息；降混信号生成单元，其基于降混信息参数调整后降混信号，并生成降混信号；和解码单元，其使用客体信息解码降混信号并生成客体信号。
12.如权利要求11所述的多客体音频解码设备，其进一步包括渲染单元，其使用用户控制信息对生成的客体信号执行渲染，并生成可重复输出信号。
13.如权利要求11所述的多客体音频解码设备，其中，所述降混信息参数，补偿降混信号和后降混信号之间的信号强度差异。
14.如权利要求11所述的多客体音频解码设备，其中，所述降混信号生成单元包括功率偏置补偿单元，其使用从降混信息参数中提取出的功率偏置值，来定级后降混信号；降混信号调整单元，其使用降混信息参数来将定级的后降混信号转换为降混信号。
15.如权利要求14所述的多客体音频解码设备，其中，所述降混信号调整单元，使用后降混信号和PDG来补偿降混信号，所述PDG是用于补偿降混信号与后降混信号之间差异的降混参数信息。
16.如权利要求15所述的多客体音频解码设备，其中，所述降混信号调整单元，将残差信号应用到使用PDG补偿的后降混信号中，并将所述后降混信号调整为与降混信号类似，且所述残差信号是降混信号和后降混信号之间的差异，所述降混信号和后降混信号之间的差异通过应用PDG来补偿。
17.一种多客体音频解码设备，包括比特流处理单元，其从客体比特流中提取降混信息参数和客体信息；降混信号生成单元，其使用降混信息参数和后降混信号来生成降混信号；代码转换单元，其使用客体信息和用户控制信息对所述降混信号执行代码转换；降混信号预处理单元，其使用代码转换的结果来预处理所述降混信号；和运动图像专家组MPEG环绕解码单元，其使用代码转换的结果和处理的降混信号来执行MPEG环绕解码。
18.如权利要求17所述的多客体音频解码设备，其中，所述降混信号生成单元包括功率偏置补偿单元，其使用从降混信息参数中提取出的功率偏置值来定级后降混信号；降混信号调整单元，其使用降混信息参数，将定级的后降混信号转换为降混信号。
19.如权利要求17所述的多客体音频解码设备，其中，所述比特流处理单元，提取表示降混信号和后降混信号之间的信号强度差异的降混信息参数。
20.如权利要求19所述的多客体音频解码设备，其中，所述降混信息参数包括PDG，所述PDG通过将后降混信号最大程度上调整为与降混信号类似而被均勻对称地分布。
全文摘要
本发明提供了一种多客体音频编码和解码设备(100)，其支持后降混信号(103)。所述多客体音频编码设备(100)可包括客体信息提取及降混生成单元(101)，其从输入客体信号生成客体信息和降混信号；参数决定单元(202)，其使用提取出的降混信号和邮降混信号，来决定降混信息参数；和比特流生成单元(203)，其结合客体信息和降混信息参数，来生成客体比特流。
文档编号G10L19/00GK102171751SQ200980136257
公开日2011年8月31日申请日期2009年7月16日优先权日2008年7月16日
发明者姜京玉, 安致得, 徐廷一, 汉民秀, 洪镇佑, 白承权, 金光基, 金镇雄申请人:韩国电子通信研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：徐廷一
技术所有人：韩国电子通信研究院
我是此专利的发明人

上一篇：数字音频信号中的前回声衰减的制作方法
下一篇：对音频/语音信号进行编码和解码的方法和设备的制作方法

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！