通过使用空间信息来处理多声道音频信号的设备和方法

文档序号：2832942阅读：288来源：国知局

专利名称：通过使用空间信息来处理多声道音频信号的设备和方法
技术领域：
本发明涉及使用运动图像专家组(MPEG)标准等来进行的信号处理，更具体地讲，涉及一种通过使用空间信息来处理多声道音频信号的设备和方法。
背景技术：
在处理音频信号的传统方法和设备中，当恢复多声道音频信号时采用仅使用技术心理声学编码(binaural cue coding, BCC)来恢复环绕(surround)分量的空间音频编码 (SAC)。SAC公开于论文“低比特率的高质量参数空间音频编码(High-quality Parametric Spatial Audio Coding at Low Bitrates) ”，116th AES convention,Preprint,p. 6072,BCC 公幵于论文“应用于立体声和多声道音频压缩的技术心理声学编码(Binaural Cue Coding Applied to Stereo and Multi-Channel Audio compression)，，，112th AES convention, Preprint，p.5574。在以上使用SAC的传统方法中，当立体声信号被下混合时，环绕分量消失。换句话说，下混合的立体声信号不包括环绕分量。因此，由于具有大量数据的边信息应该被发送以便当恢复多声道音频信号时恢复环绕分量，所以传统方法具有信道传输效率低的缺点。另外，由于消失的环绕分量被恢复，所以恢复的多声道音频信号的声音质量降低。

发明内容
本发明的一方面提供一种使用空间信息处理多声道音频信号的设备，该设备用于使用空间信息在多声道音频信号中包括的环绕分量的恢复期间对多声道音频信号编码，并对多声道音频信号解码。本发明的一方面还提供一种使用空间信息处理多声道音频信号的方法，该方法使用空间信息在多声道音频信号中包括的环绕分量的恢复期间对多声道音频信号编码，并对多声道音频信号解码。根据本发明的一方面，提供了一种使用空间信息处理多声道音频信号的设备和方法，该设备包括主编码单元，通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合，使用多声道音频信号或下混合结果的立体声信号来产生边信息，对立体声信号和边信息编码以产生编码的结果，并将编码的结果作为编码信号发送；和主解码单元，接收编码信号，使用接收的编码信号对立体声信号和边信息解码，使用解码的边信息将解码的立体声信号上混合，并恢复多声道音频信号。
根据本发明的另一方面，提供了一种在用于处理多声道音频信号的设备中执行的使用空间信息来处理多声道音频信号的方法，该设备具有对多声道音频信号编码的主编码单元和对多声道音频信号解码的主解码单元，该方法包括通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合，使用多声道音频信号或下混合结果的立体声信号来产生边信息，对立体声信号和边信息编码以产生编码的结果，并将编码的结果作为编码信号发送给主解码单元；和接收从主编码单元发送的编码信号，使用接收的编码信号对立体声信号和边信息解码，使用解码的边信息将解码的立体声信号上混合，并恢复多声道音频信号。根据本发明的另一方面，提供了一种增加压缩效率的方法，包括通过将空间信息应用于环绕分量来将包括环绕分量的多声道音频信号下混合，使用多声道音频信号或下混合结果的立体声信号来产生边信息，对立体声信号和边信息编码以产生编码的结果，并发送编码的结果；和接收编码结果，对接收的编码信号的立体声信号和边信息解码，使用解码的边信息将解码的立体声信号上混合以便恢复多声道音频信号。根据本发明的另一方面，提供了一种多声道音频信号处理系统，包括编码单元，通过将空间信息应用于环绕分量来将包括环绕分量的多声道音频信号下混合，使用多声道音频信号或下混合结果的立体声信号来产生边信息，对立体声信号和边信息编码以产生编码的信号；和解码单元，接收编码的信号，对接收的编码的信号解码以获得立体声信号和边信息，使用解码的边信息将解码的立体声信号上混合以产生环绕分量。在下面的描述中将部分地阐明本发明另外的方面和/或优点，通过描述，其会变得更加清楚，或者通过实施本发明可以了解。

通过下面结合附图进行的详细描述，本发明的这些和/或其他方面和优点将会变得清楚和更易于理解，其中图1是根据本发明实施例的用于处理多声道音频信号的设备的方框图；图2是示出根据本发明实施例的用于处理多声道音频信号的方法的流程图；图3是图1中示出的主编码单元的例子的方框图；图4是示出图2中示出的操作20的例子的流程图；图5表示可由本发明实施例处理的多声道音频信号；图6是图3中示出的下混合器的例子的方框图；图7是图1中示出的主解码单元的例子的方框图；图8是图2中示出的操作22的例子的流程图；图9是图7中示出的上混合器的例子的方框图；图10是图3中示出的边信息产生器的例子的方框图；图11是图9中示出的运算单元的例子的方框图；和图12是图9中示出的运算单元的另一例子的方框图。
具体实施例方式现在对本发明实施例进行详细的描述，其示例表示在附图中，其中，相同的标号始终表示相同部件。下面通过参照附图对实施例进行描述以解释本发明。图1是根据本发明实施例的用于处理多声道音频信号的设备的方框图。图1的设备包括主编码单元10和主解码单元12。图2是示出根据本发明实施例的用于处理多声道音频信号的方法的流程图。图2 的方法包括对多声道音频信号编码(操作20)和对编码的多声道音频信号解码(操作22)。参照图1和图2，在操作20中，图1的主编码单元10通过将空间信息应用于通过输入端mi输入的多声道音频信号中包括的环绕分量来将多声道音频信号下混合，使用立体声信号或多声道音频信号来产生边信息，对所述立体声信号和边信息编码，并将编码的结果作为编码信号发送给主解码单元12。所述立体声信号指的是将多声道音频信号下混合的结果。空间信息公开于“头部相关传输函数(HRTF)介绍(Introduction to Head-Related Transfer Functions (HRTF))，，，Representations of HRTF in Time, Frequency, and Space, 107th AES convention, Preprint, p. 50。在操作20之后，在操作22中，主解码单元12接收从主编码单元10发送的编码信号，使用接收的编码信号对立体声信号和边信息解码，使用解码的边信息将解码的立体声信号上混合，恢复多声道音频信号，并通过输出端OUTl输出恢复的多声道音频信号。以下，将参照附图来描述用于处理多声道音频信号的设备的各种示例性构造和用于处理多声道音频信号的方法各种示例性操作。图3是图1中示出的主编码单元10的例子10A的方框图。主编码单元10A包括下混合器30、子编码器32、边信息产生器34、边信息编码器36和位打包单元38。图4是示出图2中示出的操作20的例子20A的流程图。操作20A包括使用空间信息将多声道音频信号下混合(操作50)，对立体声信号编码，产生边信息，对边信息编码 (各自为操作52、54、和56)，并将编码的结果进行位打包(操作58)。参照图3和图4，在操作50中，图3的下混合器30通过将空间信息应用于通过输入端IN2输入的多声道音频信号中包括的环绕分量来将多声道音频信号下混合，如方程1 中所示，并将下混合的结果作为立体声信号输出给子编码器32。其中，1^和Rm分别是作为下混合的结果而获得的立体声信号的左分量和右分量，W 可作为加权值而被预先确定和改变，Fi0和Fil是通过输入端IN2输入的多声道音频信号中所包括的分量之中的非环绕分量，Sjo和S"是多声道音频信号中所包括的分量之中的环绕分量，Nf是非环绕分量中包括的声道的数量，Ns是环绕分量中包括的声道的数量，Fi0和Sitl 中的‘0’是左(L)[或右㈨]分量，Fil和Sil中的‘1’是右(R)[或左(L)]分量，Hj是指示空间信息的空间滤波器的传递函数。图5表示多声道音频信号。非环绕分量60、62和64以及环绕分量66和68包括在该多声道音频信号中。这里，标号69表示听者。如在图5中所示，假设多声道音频信号的非环绕分量60、62和64由包括左(L)声道60、右(R)声道64和中央(C)声道62的前分量组成，并且多声道音频信号中所包括的环绕分量由右环绕(旧)声道66和左环绕(U)声道68组成。在这种情况下，方程1可简化为如方程2所示。
权利要求
1.一种使用空间信息产生多声道音频信号的设备，包括子解码器，从编码端下混合的信号中解码立体声信号；边信息解码器，从编码端下混合的信号中解码边信息，所述边信息与包括声道间的电平差的空间信息对应；上混合器，通过使用解码的边信息和逆头部相关传输函数(HRTF)来将解码的立体声信号上混合，以产生多声道音频信号。
2.如权利要求1所述的设备，还包括位打包单元，将从编码端下混合的信号进行位打包，以输出立体声信号和边信息。
3.一种使用空间信息产生多声道音频信号的方法，包括将从编码端下混合的信号进行位打包，以获得立体声信号和边信息，所述边信息与包括声道间的电平差的空间信息对应；对立体声信号和边信息解码；通过使用解码的边信息和逆头部相关传输函数(HRTF)来将解码的立体声信号上混合，以产生多声道音频信号。
全文摘要
一种使用空间信息处理多声道音频信号的设备和方法。该设备包括主编码单元，通过将空间信息应用于多声道音频信号中包括的环绕分量来将多声道音频信号下混合，使用多声道音频信号或下混合结果的立体声信号来产生边信息，对立体声信号和边信息编码，并将编码的结果作为编码信号发送；和主解码单元，接收编码信号，使用接收的编码信号对立体声信号和边信息解码，使用解码的边信息将解码的立体声信号上混合，并恢复多声道音频信号。
文档编号G10L19/00GK102568487SQ20121001460
公开日2012年7月11日申请日期2005年11月22日优先权日2004年12月1日
发明者吴殷美, 李时和, 苗磊, 金重会, 高祥铁申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：金重会;高祥铁;李时和;吴殷美;苗磊
技术所有人：三星电子株式会社
我是此专利的发明人