基于mdct的复合预测立体声编码的制作方法

文档序号:2819038阅读:224来源:国知局
专利名称:基于mdct的复合预测立体声编码的制作方法
技术领域
本文所公开的发明一般涉及立体声(stereo)音频编码,更准确地,涉及用于使用频域中的复合预测的立体声编码的技术。
背景技术
立体声信号的左(L)声道和右(R)声道的联合编码相比独立的L和R编码能够更加有效地进行编码。用于联合立体声编码的通常的方法是中/侧(Μ/S)编码。此处,中(M)信号是通过将L信号与R信号相加而形成的,例如,M信号可以具有以下形式M = (L+R) /2
此外,侧(S)信号是通过将两个声道L和R的信号相减来形成的,例如,S信号可以具有以下形式S = (L-R) /2在Μ/S编码的情形下,对M信号与S信号进行编码来替代对L信号与R信号进行编码。在MPEG (运动图片专家组)ACC (高级音频编码)标准(参见标准文献IS0/IEC13818-7)中,能够以时变和频变的方式来选择L/R立体声编码和Μ/S立体声编码。因此,立体声编码器可以针对一些频带的立体声信号应用L/R编码,而对其他频带的立体声信号使用Μ/S编码(频变)。此外,编码器能够随着时间在L/R编码与Μ/S编码之间切换(时变)。在MPEGAAC中,立体声编码是在频域中执行的,更具体地,是在MDCT (改进的离散余弦变换)域中执行的。这使得能够自适应地以频变方式以及时变方式选择L/R或Μ/S编码中的任一种。参数立体声编码是一种用于对作为单声道信号的立体音频信号加上少量的关于立体声参数的边信息进行有效编码的技术。它是MPEG-4音频标准(参见标准文献IS0/IEC14496-3)的一部分。能够使用任何音频编码器对单声道信号进行编码。立体声参数能够嵌入在单声道比特流的辅助部分中,因此,实现了全面的前向与后向兼容性。在解码器中,首先对单声道信号进行解码,之后,借助于立体声参数来重构立体声信号。与单声道信号具有零互相关的已解码单声道信号的去相关版本是借助于去相关器来生成的(例如,可以包括一个或更多个延迟线的适合的全通滤波器)。基本上,去相关信号与单声道信号具有相同的频谱和时间能量分布。将单声道信号与去相关信号一起输入到由立体声参数控制并且重构立体声信号的上混合(upmix)处理中。更多的信息,参见论文〃Low ComplexityParametricStereo Coding in MPEG_4〃,H. Purnhagen,Proc. of the 7thlnt. Conference on DigitalAudio Effects(DAFxi04),Naples, Italy, 0ctober5_8,2004,pages 163-168。环绕MPEG (MPEG Surround) (MPS ;参见 IS0/IEC 23003-1 以及论文 〃MPEGSurround-The IS0/MPEG Standard for Efficient andCompatible Multi-ChannelAudio Coding'J. Herre et al. , AudioEngineering Convention Paper 7084,122ndConvention, May 5-8, 2007)允许将参数立体声编码与残差编码的原理组合,以及使用所传输的残差来替换去相关信号,因此提高了感观质量。可以通过对多声道信号进行下混合以及可选地,通过提取空间线索来实现残差编码。在下混合处理期间,对表示误差信号的残差信号进行计算,然后对其进行编码与传输。在解码器中,它们可以取代去相关信号。在混合方法中,它们可以在某些频带中取代去相关信号,优选地,在相对地低的频带。根据现有的MPEG统一语音/音频编码(USAC)系统(在图I中示出了它的两个示例),解码器包括位于核心解码器的下游的复值正交镜像滤波器(QMF)组。作为该滤波器组的输出而获得的QMF表示是复合(因此,以因子2来进行过采样)并且可以被配置为下混合信号(或,等同地,中信号)M和残差信号D,对其应用具有复合输入的上混合矩阵。如下来获得L信号和R信号(在QMF域)
权利要求
1.一种用于通过复合预测立体声编码来提供立体声信号的解码器系统,所述解码器系统包括 上混合级(406、407、408、409 ; 1433),所述上混合级适于基于下混合信号(M)和残差信号(D)的第一频域表示来生成所述立体声信号,所述第一频域表示中的每一个包括在多维空间的第一子空间中表达的表示对应信号的频谱含量的第一频谱分量,所述上混合级包括 模块(408),所述模块基于所述下混合信号的所述第一频域表示来计算所述下混合信号的第二频域表示,所述第二频域表示包括在所述多维空间的第二子空间中表达的表示所述信号的频谱含量的第二频谱分量,所述第二子空间包括在所述第一子空间中没有包括的所述多维空间的一部分; 加权加法器(406、407),所述加权加法器基于所述下混合信号的所述第一频域表示和所述第二频域表示、所述残差信号的所述第一频域表示和在比特流信号中编码的复合预测系数(α )来计算侧信号(S );以及 和与差级(409),所述和与差级基于所述侧信号和所述下混合信号的所述第一频域表示来计算所述立体声信号; 第一频域修改器级(403 ;1431),所述第一频域修改器级布置在所述上混合级的上游并且能够在主动模式和被动模式下进行操作,在所述主动模式中,所述第一频域修改器级处理至少一个信号的频域表示,在所述被动模式中,所述第一频域修改器级用作直通;以及第二频域修改器级(410 ;1435),所述第二频域修改器级布置在所述上混合级的下游并且能够在主动模式和被动模式下进行操作,在所述主动模式中,所述第二频域修改器级处理至少一个信号的频域表示,在所述被动模式中,所述第二频域修改器级用作直通。
2.根据权利要求I所述的解码器系统,其中,所述频域修改器级中的至少一个是时域噪声整形TNS级。
3.根据权利要求2所述的解码器系统,所述解码器系统还适于针对每个时间帧接收与所述帧相关联的数据域,并且适于响应所述数据域的值来在主动模式或直通模式下操作所述第一频域修改器级以及在主动模式或直通模式下操作所述第二频域修改器级。
4.根据前述权利要求中任一项所述的解码器系统,还包括 去量化级(401),所述去量化级布置在所述上混合级的上游,以基于比特流信号来提供所述下混合信号(M)和所述残差信号(D)的所述第一频域表示。
5.根据前述权利要求中任一项所述的解码器系统,其中 所述第一频谱分量具有在所述第一子空间中表达的实数值; 所述第二频谱分量具有在所述第二子空间中表达的虚数值; 选择性地,所述第一频谱分量能够通过以下中的一个来获得 离散余弦变换DCT,或 改进的离散余弦变换MDCT,以及 选择性地,所述第二频谱分量能够通过以下中的一个来获得 离散正弦变换DST,或 改进的离散正弦变换MDST。
6.根据权利要求5所述的解码器,其中所述下混合信号被分割成连续的时间帧,所述连续的时间帧中的每一个与所述复合预测系数的值相关联;以及 用于计算所述下混合信号的第二频域表示的所述模块适于响应于所述复合预测系数的虚部的绝对值小于用于时间帧的预定容差而使所述模块自身无效,以使得所述模块没有针对该时间帧生成输出。
7.根据前述权利要求中任一项所述的解码器系统,其中 所述第一频谱分量是布置在变换系数的一个或更多个时间帧中的变换系数,每个块是通过对时域信号的时间片段施加变换来生成的;以及 用于计算所述下混合信号的第二频域表示的所述模块适于 从所述第一频谱分量中的至少一些中导出一个或更多个第一中间分量; 根据一个或更多个脉冲响应中的至少一部分来形成所述一个或更多个第一频谱分量的组合,以获得一个或更多个第二中间分量;以及 从所述一个或更多个第二中间分量来导出所述一个或更多个第二频谱分量。
8.根据权利要求7所述的解码器系统,其中,所述一个或更多个脉冲响应的所述部分是基于所述一个或更多个变换的频率响应特征,其中,选择性地,所述变换的所述频率响应特征取决于一个或更多个分析窗函数的特征,所述一个或更多个分析窗函数与变换一起应用到所述信号的所述时间片段上。
9.根据权利要求7或8所述的解码器系统,其中,用于计算所述下混合信号的第二频域表示的所述模块适于基于下列中的一个来获得所述第二频谱分量的每个时间帧 (a)所述第一频谱分量的同时期的时间帧; (b)所述第一频谱分量的同时期的和先前的时间帧;以及 (c )所述第一频谱分量的同时期的、先前的和随后的时间帧。
10.根据前述权利要求中任一项所述的解码器系统,其中,用于计算所述下混合信号的第二频域表示的所述模块适于计算近似第二频谱表示,所述近似第二频谱表示包括通过至少两个时间上相邻和/或频率上相邻的所述第一频谱分量的组合确定的近似第二频谱分量。
11.根据前述权利要求中任一项所述的解码器系统,所述立体声信号被表示在时域中,并且所述解码器系统还包括 切换组件(203),所述切换组件布置在所述去量化级与所述上混合级之间,所述切换组件能操作以用作以下任何一种 Ca)直通级,或 (b)和与差级, 从而,能够在直接地编码的立体声输入信号与联合地编码的立体声输入信号之间切换; 逆变换级(209),所述逆变换级适于计算所述立体声信号的时域表示;以及选择器装置(208),所述选择器装置布置在所述逆变换级的上游并且适于选择性地将所述逆变换级连接到以下任何一种 (a)在所述上混合级下游的点,从而将通过复合预测获得的立体声信号提供给所述逆变换级;或(b)在所述上混合级上游并且在所述切换组件(203)下游的点,从而将通过直接立体声编码获得的立体声信号提供给所述逆变换级。
12.根据前述权利要求中任一项所述的解码器系统,其中,用于计算所述下混合信号的第二频域表示的所述模块包括 逆变换级(306),所述逆变换级用于基于各个信号在所述多维空间中的所述第一子空间中的所述第一频域表示,计算所述下混合信号和/或所述侧信号的时域表示;以及 变换级(307),所述变换级用于基于所述信号的所述时域表示来计算所述各个信号的所述第二频域表示, 其中,优选地,所述逆变换级(306)执行逆的改进的离散余弦变换(MDCT),所述变换级执行改进的离散正弦变换(MDST)。
13.根据权利要求12所述的解码器系统,所述立体声信号被表示在时域中,并且所述解码器系统还包括 切换组件(302),所述切换组件布置在所述去量化级与所述上混合级之间,所述切换组件能够操作以用作以下任何一种 Ca)直通级,以在联合立体声编码中使用;或 (b)和与差级,以在直接立体声编码中使用; 另外的逆变换级(311),所述另外的逆变换级布置在所述上混合级中,用于计算所述侧信号的时域表不; 选择器装置(305、310),所述选择器装置布置在所述逆变换级(306、301)的上游,适于选择性地将所述逆变换级(306、301)连接到下列中的任何一个 Ca)另外的和与差级(304),所述另外的和与差级又连接到在所述切换组件(302)的下游并且在所述上混合级的上游的点;或 (b)从所述切换组件(302)获得的下混合信号和从所述加权加法器(308、309)获得的侧信号。
14.一种解码方法,所述解码方法用于通过复合预测立体声编码将输入立体声信号上混合成输出立体声信号,其中 所述输入立体声信号包括下混合声道(M)和残差声道(D)的第一频域表示以及复合预测系数U );以及 所述第一频域表示中的每一个包括在多维空间的第一子空间中表达的表示对应信号的频谱含量的第一频谱分量, 所述方法由上混合级来执行并且包括以下步骤 基于所述下混合声道的所述第一频域表示来计算所述下混合信号的第二频域表示,所述第二频域表示包括在所述多维空间的第二子空间中表达的表示所述信号的频谱含量的第二频谱分量,所述第二子空间包括在所述第一子空间中没有包括的所述多维空间的一部分; 基于所述下混合信号的所述第一频域表示和所述第二频域表示、所述残差信号的所述第一频域表示和所述复合预测系数来计算所述侧声道; 以及还包括以下步骤中的任何一个 在所述上混合步骤前执行的、对所述下混合信号的所述第一频域表示和/或所述残差信号的所述第一频域表示应用时域噪声整形TNS的步骤; 或者,在所述上混合步骤后执行的、对所述立体声信号的至少一个声道应用TNS的步骤。
15.—种包括计算机可读介质的计算机程序产品,所述计算机可读介质存储有指令,当由通用计算机执行所述指令时,所述指令执行根据权利要求14所述的方法。
全文摘要
本发明提供了用于在频域中使用复合预测来进行立体声编码与解码的方法及装置。在一种实施方式中,一种用于从通过复合预测编码编码的输入立体声信号来获得输出立体声信号并且包括有两个输入声道的第一频域表示的方法包括以下上混合步骤(i)计算第一输入声道的第二频域表示;以及(ii)基于第一输入声道的第一频域表示和第二频域表示、第二输入声道的第一频域表示和复合预测系数来计算输出声道。该方法包括在上混合前后选择性地进行频域修改。
文档编号G10L19/00GK102947880SQ201180028342
公开日2013年2月27日 申请日期2011年4月6日 优先权日2010年4月9日
发明者海科·普尔哈根, 蓬图斯·卡尔森, 拉尔斯·维尔默斯 申请人:杜比国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1