多声道音频内容的编码的制作方法_4

文档序号:9794127阅读:来源:国知局
谱内容,所以立体声上混组件452不同地对待低于和高于第一频率1^的频率。
[0147]更详细地,对于直到第一频率ki的频率,立体声上混组件452将中间信号426和侧边信号424从中间/侧边形式变换为L/R形式。换句话说,立体声上混组件对于直到第一频率1^的频率执行逆向的和差变换。
[0148]对于高于第一频率Iu的频率(在这些频率处,没有谱数据提供给侧边信号424),立体声上混组件452从中间信号426参数化重构立体声信号428的第一分量和第二分量。一般地,立体声上混组件452经由数据流320接收在编码器侧出于这个目的而已被提取的参数,并使用这些参数以进行重构。一般地,可以使用任何已知的用于参数化立体声重构的技术。
[0149]鉴于以上,由立体声上混组件452输出的立体声信号428从而具有直到系统中所表示的最大频率的谱内容,其中,高于第一频率1^的谱内容被参数化重构。类似于HFR组件448,立体声上混组件452通常在QMF域中操作。因此,立体声信号428通过时间/频率变换组件454被变换到时域,以便产生在时域中表示的立体声信号328。
[0150]图5示出当立体声解码模块306根据与高比特率对应的第二配置操作时的立体声解码模块306。该立体声解码模块306包括第一立体声转换组件540、各种时间/频率变换组件542、546、554,第二立体声转换组件452、以及高频重构(HFR)组件548a、548b。立体声解码模块306被约束为将中间信号326和对应的输入音频信号324当作输入。假定中间信号326和输入音频信号324在频域(通常为修正离散余弦变换(MDCT)域)中被表示。
[0151]在高比特率情况下,关于输入信号326、324的带宽的限制不同于中等比特率情况。更确切地说,中间信号326和输入音频信号324是包括与直到第二频率1?的频率对应的谱数据的波形编码信号。在一些情况下,第二频率k2可以对应于系统所表示的最大频率。在其它情况下,第二频率k2可以低于系统所表示的最大频率。
[0152]中间信号326和输入音频信号324被输入到第一立体声转换组件540以供变换为中间/侧边表示。该第一立体声转换组件540类似于图4的立体声转换组件440。不同之处在于,在输入音频信号324为补充信号的形式的情况下,第一立体声转换组件540将补充信号变换为对于直到第二频率k2的频率的侧边信号。因此,立体声转换组件540输出中间信号326和对应的侧边信号524,这两个信号都具有直到第二频率的谱内容。
[0153]中间信号326和对应的侧边信号524然后被输入到第二立体声转换组件552。该第二立体声转换组件552形成中间信号326和侧边信号524的和与差,以便将中间信号326和侧边信号524从中间/侧边形式变换为L/R形式。换句话说,第二立体声转换组件执行逆向的和与差变换,以便产生具有第一分量528a和第二分量528b的立体声信号。
[0154]优选地,第二立体声转换组件552在时域中操作。因此,在被输入到第二立体声转换组件552之前,中间信号326和侧边信号524可以通过时间/频率变换组件542被从频域(MDCT域)变换到时域。作为替代方案,第二立体声转换组件552可以在QMF域中操作。在这样的情况下,图5的组件546和552的次序将被反过来。这是有利的,因为在第二立体声转换组件552中发生的混合将不对关于中间信号326和输入音频信号324的MDCT变换大小施加任何进一步的限制。因此,如以上进一步讨论的,在中间信号326和输入音频信号324被以中间/侧边形式接收的情况下,它们可以借助于使用不同变换大小的MDCT变换而被编码。
[0155]在第二频率k2低于所表示的最高频率的情况下,立体声信号的第一和第二分量528a、528b可以通过高频重构组件548a、548b经受高频重构(HFR)。该高频重构组件548a、548b类似于图4的高频重构组件448。然而,在该情况下,值得注意的是,第一组高频重构参数经由数据流230被接收,并且在立体声信号的第一分量528a的高频重构中被使用,以及第二组高频重构参数经由数据流230被接收,并且在立体声信号的第二分量528b的高频重构中被使用。因此,高频重构组件548a、548b输出包括直到系统中所表示的最大频率的谱数据的立体声信号的第一和第二分量530a、530b,其中,高于第二频率1?的谱内容被参数化重构。
[0156]优选地,高频重构在QMF域中执行。因此,在经受高频重构之前,立体声信号的第一和第二分量528a、528b可以通过时间/频率变换组件546被变换到QMF域。
[0157]从高频重构组件548输出的立体声信号的第一和第二分量530a、530b然后可以通过时间/频率变换组件554被变换到时域,以便产生在时域中表示的立体声信号328。
[0158]图6示出被配置用于包括在数据流620中的多个输入音频信号的解码以供在具有11.1声道的扬声器配置上回放的解码器600。该解码器600的结构总体上类似于图3中所示出的结构。不同之处在于,示出的扬声器配置的声道数量与图3相比较少,在图3中,示出了具有13.1声道的扬声器配置,其具有LFE扬声器、三个前置扬声器(中心C、左L和右R)、四个环绕扬声器(左侧Lside、左后Lback、右侧Rside、右后Rback)、以及四个天花板扬声器(左上前置LTF、左上后置LTB、右上前置RTF、和右上后置RTB)。
[0159]在图6中,第一解码组件104输出七个中间信号626,这些信号可以对应于扬声器配置的声道C、L、R、LS、RS、LT和RT。而且,存在四个另外的输入音频信号624a-d。该另外的输入音频信号624a-d每一个对应于中间信号626中的一个。举例来说,输入音频信号624a可以是与LS中间信号对应的侧边信号或补充信号,输入音频信号624b可以是与RS中间信号对应的侧边信号或补充信号,输入音频信号624c可以是与LT中间信号对应的侧边信号或补充信号,并且输入音频信号624d可以是与RT中间信号对应的侧边信号或补充信号。
[0160]在示出的实施例中,第二解码模块106包括图4和图5中所示出的类型的四个立体声解码模块306。每个立体声解码模块306将中间信号626中的一个和对应的另外的输入音频信号624a-d当作输入,并且输出立体声音频信号328。例如,基于LS中间信号和输入音频信号624a,第二解码模块106可以输出与Lside和Lback扬声器对应的立体声信号。更多的不例从该图是显然的。
[0161]此外,第二解码模块106充当中间信号626中的三个(这里,与C、L和R声道对应的中间信号)的传递通道(pass through)。依赖于这些信号的谱带宽,第二解码模块106可以通过使用高频重构组件308来执行高频重构。
[0162]图7示出旧有或低复杂度的解码器700如何对与具有K个声道的扬声器配置对应的数据流720的多声道音频内容进行解码以供在具有M个声道的扬声器配置上回放。举例来说,K可以等于十一或十三,而M可以等于七。该解码器700包括接收组件702、第一解码模块704、以及高频重构模块712。
[0163]如参照图1中的数据流120进一步描述的,数据流720—般可以包括M个输入音频信号722(参见图1和图3中的信号122和322)和K-M个另外的输入音频信号(参见图1和图3中的信号124和324)。可选地,数据流720可以包括另外的音频信号721,该另外的音频信号721通常对应于LFE声道。由于解码器700对应于具有M个声道的扬声器配置,所以接收组件702从数据流720仅提取M个输入音频信号722(和另外的音频信号721,如果存在的话),并且丢弃剩余的K-M个另外的输入音频信号。
[0164]这里通过七个音频信号示出的M个输入音频信号722和另外的音频信号721然后被输入到第一解码模块104,该第一解码模块104将M个输入音频信号722解码为与M声道扬声器配置的声道对应的M个中间信号726。
[0165]在M个中间信号726仅包括直到低于系统所表示的最大频率的某一频率的谱内容的情况下,借助于高频重构模块712可以使M个中间信号726经受高频重构。
[0166]图8示出这样的高频重构模块712的示例。高频重构模块712包括高频重构组件848和各种时间/频率变换组件842、846、854。
[0167]借助于HFR组件848使输入到HFR模块712的中间信号726经受高频重构。该高频重构优选地在QMF域中执行。因此,通常为MDCT谱的形式的中间信号726在被输入到HFR组件848之前,可以通过时间/频率变换组件842被变换到时域,并然后通过时间/频率变换组件846被变换到QMF域。
[0168]HFR组件848—般以与例如图4和图5的HFR组件448、548相同的方式操作,因为它使用输入信号的较低频的谱内容连同从数据流720接收的参数,以便参数化重构较高频的谱内容。然而,依赖于编码器/解码器系统的比特率,HFR组件848可以使用不同的参数。
[0169]如参照图5所解释的,对于高比特率情况以及对于具有对应的另外的输入音频信号的每个中间信号,数据流720包括第一组HFR参数和第二组HFR参数(参见图5的项548a、548b的描述)。即使解码器700不使用与中间信号对应的另外的输入音频信号,HFR组件848在执行中间信号的高频重构时也可以使用第一组HFR参数和第二组HFR参数的组合。例如,高频重构组件848可以使用第一组和第二组的HFR参数的下混(诸如平均或线性组合)。
[0170]HFR组件854从而输出具有扩展的谱内容的中间信号828。该中间信号828然后借助于时间/频率变换组件854被变换到时域,以便给出具有时域表示的输出信号728。
[0171]下面将参照图9-11来描述编码器的示例实施例。
[0172]图9示出被归入图2的一般结构的编码器900。该编码器900包括接收组件(未示出)、第一编码模块206、第二编码模块204、以及量化和复用组件902。第一编码模块206还可以包括高频重构(HFR)编码组件908和立体声编码模块906。编码器900可以还包括立体声转换组件910。
[0173]现在将解释编码器900的操作。接收组件接收与具有K个声道的扬声器配置的声道对应的K个输入音频信号928。例如,K个声道可以对应于如上所述的13声道配置的声道。此夕卜,通常与LFE声道对应的另外的声道925可以被接收。K个声道被输入到第一编码模块206,该第一编码模块206产生M个中间信号926和K-M个输出音频信号924。
[0174]第一编码模块206包括K-M个立体声编码模块906。该K-M个立体声编码模块906中的每一个将K个输入音频信号中的两个当作输入,并且产生中间信号926中的一个和输出
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1