多声道音频内容的编码的制作方法_3

文档序号:9794127阅读:来源:国知局
一些可以与M个中间信号126中的一些直接对应。此外,第二解码模块可以包括一个或多个立体声解码模块,每个立体声解码模块对M个中间信号126中的一个及其对应的输入音频信号124进行操作以产生一对输出音频信号,其中,每对产生的输出音频信号适合于在扬声器配置的N个声道中的两个上回放。
[0121]图2示出编码系统中的与图1的解码方案100对应的编码方案200。与具有K个声道的扬声器配置的声道对应的K个输入音频信号228 (其中,K>2)被接收组件(未示出)接收。该K个输入音频信号被输入到第一编码模块206。基于K个输入音频信号228,第一编码模块206产生K-M个输出音频信号224和适合于在具有M个声道的扬声器配置上回放的M个中间信号226,其中,]?〈1(<21。
[0122]—般地,如下面将更详细地解释的,M个中间信号226中的一些(通常是中间信号226中的2Μ-Κ个)对应于K个输入音频信号228中的相应的一个。换句话说,第一编码模块206靠使K个输入音频信号228中的一些通过来产生M个中间信号226中的一些。
[0123]M个中间信号226中的剩余的K-M个一般通过对没有通过第一编码模块206的输入音频信号228进行下混(S卩,线性组合)而产生。特别地,第一编码模块可以成对地对这些输入音频信号228进行下混。出于这个目的,第一编码模块可以包括一个或多个(通常是K-M个)立体声编码模块,每个立体声编码模块对一对输入音频信号228进行操作以产生中间信号(即,下混或和信号)和对应的输出音频信号224。根据以上讨论的两个替代方案中的任何一个,该输出音频信号224对应于中间信号,S卩,输出音频信号224是侧边信号或者连同中间信号和加权参数a—起允许侧边信号的重构的补充信号。在后一种情况下,加权参数a被包括在数据流220中。
[0124]M个中间信号226然后被输入到第二编码模块204,在该第二编码模块204中,它们被编码为M个另外的输出音频信号222。第二编码模块204—般可以根据任何已知的用于对与M个声道对应的音频内容进行编码的编码方案进行操作。
[0125]M个另外的输出音频信号222和来自第一编码模块的N-M个输出音频信号224然后通过复用组件202量化并包括在数据流220中以供传输到解码器。
[0126]在参照图1-2描述的编码/解码方案的情况下,K声道音频内容到M声道音频内容的适当下混在编码器侧(由第一编码模块206)执行。以这种方式,实现了 K声道音频内容的高效解码以供在具有M个声道(或者更一般地,N个声道)的声道配置上回放,其中,MSNSK。
[0127]下面将参照图3-8来描述解码器的示例实施例。
[0128]图3示出被配置用于多个输入音频信号的解码以供在具有N个声道的扬声器配置上回放的解码器300。该解码器300包括接收组件302、第一解码模块104、第二解码模块106,该第二解码模块106包括立体声解码模块306。第二解码模块106还可以包括高频扩展组件308。解码器300还可以包括立体声转换组件310。
[0129]下面将描述解码器300的操作。接收组件302从编码器接收数据流320(即,比特流)。该接收组件302可以例如包括用于将数据流320解复用为其组成部分的解复用组件和用于接收的数据的解量化的解量化器。
[0130]接收的数据流320包括多个输入音频信号。一般地,该多个输入音频信号可以对应于与具有K个声道的扬声器配置对应的编码的多声道音频内容,其中,K > No
[0131 ]特别地,数据流320包括M个输入音频信号322,其中,1〈Μ〈Ν。在示出的示例中,皿等于七,使得存在七个输入音频信号322。然而,根据其它示例,可以取其它数字,诸如五个。而且,数据流320包括N-M个音频信号323,Ν-Μ个输入音频信号324可以从该N-M个音频信号323解码。在示出的示例中,N等于十三,使得存在六个另外的输入音频信号324。
[0132]数据流320还可以包括另外的音频信号321,该另外的音频信号321通常对应于编码的LFE声道。
[0133]根据示例,N-M个音频信号323的一对可以对应于N-M个输入音频信号324的一对的联合编码。立体声转换组件310可以对N-M个音频信号323的这样的对进行解码以产生N-M个输入音频信号324的对应对。例如,立体声转换组件310可以通过将MS或增强的MS解码应用于N-M个音频信号323的所述对来执行解码。
[0134]M个输入音频信号322和另外的音频信号321(如果可用的话)被输入到第一解码模块104。如参照图1所讨论的,该第一解码模块104将M个输入音频信号322解码为适合于在具有M个声道的扬声器配置上回放的M个中间信号326。如该示例中所示出的,该M个声道可以对应于中心前置扬声器(C)、左前扬声器(L)、右前扬声器(R)、左环绕扬声器(LS)、右环绕扬声器(RS)、左天花板扬声器(LT)、以及右天花板扬声器(RT)。第一解码模块104还将另外的音频信号321解码为输出音频信号325,该输出音频信号325通常对应于低频效果LFE扬声器。
[0135]如以上参照图1进一步讨论的,另外的输入音频信号324中的每一个对应于中间信号326中的一个,因为它是与该中间信号对应的侧边信号或者与该中间信号对应的补充信号。举例来说,输入音频信号324中的第一个可以对应于与左前扬声器相关联的中间信号326,输入音频信号324中的第二个可以对应于与右前扬声器等相关联的中间信号326。
[0136]M个中间信号326和N-M个音频输入音频信号324被输入到第二解码模块106,该第二解码模块106产生适合于在N声道扬声器配置上回放的N个音频信号328。
[0137]第二解码模块106将中间信号326中的不具有对应的残余信号的那些中间信号映射到N声道扬声器配置的对应声道,可选地经由高频重构组件308 ο例如,与M声道扬声器配置的中心前置扬声器(C)对应的中间信号可以被映射到N声道扬声器配置的中心前置扬声器(C)。高频重构组件308类似于稍后将参照图4和5描述的那些。
[0138]第二解码模块106包括N-M个立体声解码模块306,由中间信号326和对应的输入音频信号324构成的每一对一个立体声解码模块306。一般地,每个立体声解码模块306执行联合立体声解码以产生立体声音频信号,该立体声音频信号映射到N声道扬声器配置的声道中的两个。举例来说,将与7声道扬声器配置的左前扬声器(L)对应的中间信号及其对应的输入音频信号324当作输入的立体声解码模块306产生立体声音频信号,该立体声音频信号映射到13声道扬声器配置的两个左前扬声器(“Lwide”和“Lscreen” )。
[0139]立体声解码模块306可在依赖于编码器/解码器系统按其操作的数据传输率(比特率)(即,解码器300按其接收数据的比特率)的至少两个配置中操作。第一配置可以例如对应于中等比特率,诸如每立体声解码模块306大约32-48kbps。第二配置可以例如对应于高比特率,诸如每立体声解码模块306超过48kbps的比特率。解码器300接收关于使用哪个配置的指示。例如,这样的指示可以通过编码器经由数据流320中的一个或多个比特用信号通知给解码器300。
[0140]图4示出当立体声解码模块306根据与中等比特率对应的第一配置工作时的立体声解码模块306。该立体声解码模块306包括立体声转换组件440、各种时间/频率变换组件442、446、454,高频重构(HFR)组件448、以及立体声上混组件452。立体声解码模块306被约束为将中间信号326和对应的输入音频信号324当作输入。假定中间信号326和输入音频信号324在频域(通常为修正离散余弦变换(MDCT)域)中被表示。[0141 ]为了实现中等比特率,至少输入音频信号324的带宽被限制。更确切地说,输入音频信号324是包括与直到第一频率1^的频率对应的谱数据的波形编码信号。中间信号326是包括与直到比第一频率1^大的频率的频率对应的谱数据的波形编码信号。在一些情况下,为了节省必须在数据流320中被发送的更多比特,中间信号326的带宽也被限制,使得中间信号326包括直到比第一频率Iu大的第二频率k2的谱数据。
[0142]立体声转换组件440将输入信号326、324变换为中间/侧边表示。如以上进一步讨论的,中间信号326和对应的输入音频信号324可以以中间/侧边形式或者中间/补充/a形式表示。在前一种情况下,由于输入信号已经为中间/侧边形式,所以立体声转换组件440从而使输入信号326、324通过而没有任何修改。在后一种情况下,立体声转换组件440使中间信号326通过,而作为补充信号的输入音频信号324被变换为对于直到第一频率Iu的频率的侧边信号。更确切地说,立体声转换组件440通过将中间信号326与加权参数a(其从数据流320接收)相乘并将乘法的结果与输入音频信号324相加来确定对于直到第一频率1^的频率的侧边信号。作为结果,立体声转换组件从而输出中间信号326和对应的侧边信号424。
[0143]关于这一点,值得注意的是,在中间信号326和输入音频信号324被以中间/侧边形式接收的情况下,在立体声转换组件440中没有信号324、326的混合发生。结果,中间信号326和输入音频信号324可以借助于具有不同变换大小的MDCT变换而被编码。然而,在中间信号326和输入音频信号324被以中间/补充/a形式接收的情况下,中间信号326和输入音频信号324的MDCT编码限于相同的变换大小。
[0144]在中间信号326具有有限带宽的情况下(S卩,如果中间信号326的谱内容(spectralcontent)限于直到第二频率k2的频率),该中间信号326通过高频重构组件448经受高频重构(HFR)。通过HFR—般意指参数化技术,该参数化技术基于信号的低频(在该情况下为低于第二频率1?的频率)的谱内容和在数据流320中从编码器接收的参数,重构该信号的高频(在该情况下为高于第二频率1?的频率)的谱内容。这样的高频重构技术在本领域中是已知的,并且包括例如谱带复制(SBR)技术。HFR组件448从而将输出具有直到系统中所表示的最大频率的谱内容的中间信号426,其中,高于第二频率k2的谱内容被参数化重构。
[0145]高频重构组件448通常在正交镜像滤波器(QMF)域中操作。因此,在执行高频重构之前,中间信号326和对应的侧边信号424可以首先通过通常执行逆向MDCT变换的时间/频率变换组件442被变换到时域,并然后通过时间/频率变换组件446被变换到QMF域。
[0146]中间信号426和侧边信号424然后被输入到立体声上混组件452,该立体声上混组件452产生以L/R形式表不的立体声信号428。由于侧边信号424仅具有对于直到第一频率ki的频率的
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1