减小数目的声道解码的制作方法

文档序号:5102272阅读:237来源:国知局
专利名称:减小数目的声道解码的制作方法
技术领域
本发明涉及音频信号的解码,尤其是将原始多声道信号的参数多
声道下混(downmix)解码为比原始多声道信号声道数目更小数目的 声道。
背景技术
近来的音频编码的发展具备了基于立体声(或单声道)信号和对 应的控制数据来重建音频信号的多声道表示的能力。由于传送了附加 控制数据以基于传送的单声道或立体声声道来控制环绕声道的重建, 也称为上混(upmix),因此,这些方法本质上不同于如Dolby Prologic 之类的以前的基于矩阵的解决方案。
因此,这样的参数多声道音频解码器(例如MPEG环绕)基于M 个传送声道和附加控制数据来重构N个声道,其中N>M。所述附加 控制数据表现出比传送所有N个声道明显更低的数据速率,使编码非 常有效率,同时确保与M声道设备以及N声道设备的兼容性。
这样的参数环绕编码方法通常包括基于IID (声道间强度差)和 ICC (声道间相干)的环绕信号的参数化。这些参数描述了上混过程 中声道对之间的功率比和相关性。现有技术中也使用的参数还包括用 于在上混过程中预测中间或输出声道的预测参数。
这样的多声道编码的两个著名示例是BCC编码和MPEG环绕。 在BCC编码中,使用基于DFT (离散傅立叶变换)的具有重叠窗口 的变换,将多个音频输入声道转换为频谱表示。接着,将产生的均一 的频谱分为不重叠的部分。每个部分的带宽与等效矩形带宽(ERB) 成正比。接着,为每个部分估计被称为ICLD(声道间声级差)和ICTD (声道间时间差)的空间参数。ICLD参数描述了两个声道之间的声级差,而ICTD参数描述了不同声道的两个信号之间的时间差(相位 偏移)。对于每个声道,相对于共同参考声道给出声级差和时间差。在 获得这些参数之后,量化并编码这些参数以用于传送。
在BCC编码中,相对于一个信号参考声道来估计各个参数。在其 他参数环绕编码系统中,例如在MPEG环绕中,使用树形结构的参数 化。这就是说,不再相对于单一共同参考声道,而是相对于不同的参 考声道来估计参数,这些不同参考声道甚至可以是原始多声道信号的 声道组合。例如,对于5.1声道信号,可以在前置声道的组合之间和 后置声道的组合之间估计参数。
当然,对于参数编码方案,也非常希望具有对已经建立的音频标 准的后向兼容性。例如,对于单声道下混信号,希望也能提供一种可 能性来创建具有高保真度的立体声回放信号。这意味着,必须以可能 的最佳方式利用附加产生的参数,将单声道下混信号上混为立体声信 号。
由于人类对声源的空间位置的感知主要由信号的响度支配,即由 信号中包含的能量支配,因此,多声道编码中的一个共同问题是上混 中的能量保持。因此,在信号的再现中必须最大可能地考虑到为每个 重构的声道加以合适的响度属性,以避免人工效应的引入严重降低了 重构信号的感知质量。由于在下混过程中,信号的幅度通常被相加, 带来了干扰的可能性,该可能性由相关性或相干参数来描述。
当涉及减小数目的声道的重构(声道的数目小于多声道信号的原 始声道数目)时,由于相对于相同的单个参考声道来传送每个参数, 因此如BCC之类的方案容易处理。因此,有了参考声道的知识,可以 容易地获得上混所需的每个声道的最相关的声级信息(绝对能量度 量)。因此,不需要首先重构完整多声道信号就可以重构减小数目的声 道。因此,在BCC中,通过使用单纯变量而不是变量的积,更容易对 多声道信号的能量进行能量计算,但这只是第一步。当涉及得到减小 数目的声道的能量和相关性,而所述减小数目的声道应当尽可能接近 于原始多声道信号的部分下混时,MPEG环绕和BCC中的难度等级相当。与此相反,如MPEG环绕之类的基于树形的结构使用了这样一种 参数化,其中各声道的相关信息不包含在单个参数中。因此,在现有 技术中,重构减小数目的声道要求重构多声道信号,接着将其下混为 减小数目的声道,以不违反能量保持要求。这具有极高计算复杂度的 明显缺点。

发明内容
本发明的目的是提供一种概念,用于更有效地从参数多声道信号 中获得减小数目的声道。
根据本发明的第一方面,所述目的是通过参数计算器来实现的, 所述参数计算器用于导出上混参数,所述上混参数用于将下混信号上 混为多声道信号的中间声道表示,所述中间声道表示具有的声道多于 所述下混信号并少于所述多声道信号,所述下混信号具有与其相关联 的描述多声道信号的空间特性的多声道参数,其中,所述多声道信号 包括所述中间声道表示未包括的声道,其中,所述多声道参数包括所 述中间声道表示未包括的声道的信息,所述参数计算器包括参数重 新计算器,所述参数重新计算器使用具有所述中间声道表示未包括的 声道的信息的参数,从所述多声道参数中导出所述上混参数。
根据本发明的第二方面,所述目的是通过具有参数重构器的声道 重构器来实现的,所述声道重构器包括参数计算器,所述参数计算 器用于导出上混参数,所述上混参数用于将下混信号上混为多声道信 号的中间声道表示,所述中间声道表示具有的声道多于所述下混信号 并少于所述多声道信号,所述下混信号具有与其相关联的描述多声道 信号的空间特性的多声道参数,其中,所述多声道信号包括所述中间 声道表示未包括的声道,其中,所述多声道参数包括所述中间声道表 示未包括的声道的信息,所述参数计算器包括参数重新计算器,所 述参数重新计算器使用具有所述中间声道表示未包括的声道的信息的 参数,从所述多声道参数中导出所述上混参数;以及上混器,所述上 混器使用所述上混参数和所述下混信号来导出所述中间声道表示。
根据本发明的第三方面,所述目的是通过用于产生上混参数的方法来实现的,所述上混参数用于将下混信号上混为多声道信号的中间 声道表示,所述中间声道表示具有的声道多于所述下混信号并少于所 述多声道信号,所述下混信号具有与其相关联的描述多声道信号的空 间特性的多声道参数,其中,所述多声道信号包括所述中间声道表示 未包括的声道,其中,所述多声道参数包括所述中间声道表示未包括 的声道的信息,所述方法包括使用具有所述中间声道表示未包括的 声道的信息的参数,从所述多声道参数中导出所述上混参数。
根据本发明的第四方面,所述目的是通过音频接收机或音频播放 器来实现的,所述接收机或音频播放器具有参数计算器,所述参数计 算器用于导出上混参数,所述上混参数用于将下混信号上混为多声道 信号的中间声道表示,所述中间声道表示具有的声道多于所述下混信 号并少于所述多声道信号,所述下混信号具有与其相关联的描述多声 道信号的空间特性的多声道参数,其中,所述多声道信号包括所述中 间声道表示未包括的声道,其中,所述多声道参数包括所述中间声道 表示未包括的声道的信息,所述参数计算器包括参数重新计算器, 所述参数重新计算器使用具有所述中间声道表示未包括的声道的信息 的参数,从所述多声道参数中导出所述上混参数。
根据本发明的第五方面,所述目的是通过接收或音频播放的方法 来实现的,所述方法具有用于产生上混参数的方法,所述上混参数用 于将下混信号上混为多声道信号的中间声道表示,所述中间声道表示 具有的声道多于所述下混信号并少于所述多声道信号,所述下混信号 具有与其相关联的描述多声道信号的空间特性的多声道参数,其中, 所述多声道信号包括所述中间声道表示未包括的声道,其中,所述多 声道参数包括所述中间声道表示未包括的声道的信息,所述方法包括 使用具有所述中间声道表示未包括的声道的信息的参数,从所述多声 道参数中导出所述上混参数。
本发明是基于以下发现,即当导出用于将传送的下混信号上混为 中间声道表示的上混参数,该上混参数允许使用与多声道重构中相同 的上混算法来进行上混时,可以高效地以高保真度重构多声道信号的 中间声道表示。当使用参数重新计算器,该参数重新计算器也考虑了具有所述中间声道表示未包括的声道的信息的参数来导出所述上混参 数时,可以实现这一点。
在本发明的一个实施例中,解码器能够从5声道的多声道信号的 参数下混来重构立体声输出信号,所述参数下混包括单声道下混信号 和相关联的多声道参数。根据本发明,组合空间参数以导出用于立体 声信号的上混的上混参数,其中,所述组合也考虑了与左前置或右前 置声道不相关的多声道参数。因此,可以导出上混的立体声声道的绝 对功率,可以导出左和右声道之间的相干度量,允许对多声道信号的
高保真度的立体声重构。此外,导出ICC参数和CLD参数,允许使 用已有算法和实现方式来进行上混。使用与重构的立体声声道不相关 的声道参数允许以更高的精度保持信号中的能量。这是最重要的,因 为不受控的响度变化对回放信号的质量干扰最大。
一般地,如现有技术的方法一样,本发明概念的应用允许根据多 声道信号的单声道下混来重构立体声上混,而无需多声道信号的中间 完整表示。显然,解码器端的计算复杂度将因此显著降低。也使用与 上混中未包括的声道相关联的多声道参数(即左前置和右前置声道) 允许进行重构,而不引入任何附加人工效应或响度变化,取而代之的 是完美地保持了信号的能量。更具体而言,从许多可用多声道参数中 计算左和右重构声道之间的能量比,计算时考虑与左前置和右前置声 道不相关的多声道参数。显然,相对于重构立体声信号的收听质量, 左和右重构的(上混的)声道之间的响度比是具有支配作用的。不使 用本发明的概念,在本文所讨论的基于树形的结构中,不可能实现具 有精确正确的能量比的声道的重构。
因此,实现本发明的概念允许基于多声道参数来高质量地立体声 再现多声道信号的下混,而所述多声道参数的导出不是为了立体声信 号的精确再现。
应注意,当再现的声道数目不为2时,例如在一些回放环境的情 况下,也应以高保真度重构中心声道时,也可以使用本发明的概念。
以下将给出现有技术的多声道编码方案(尤其是基于树形的结构 的)的更详细的回顾,以概述本发明概念的显著益处。


随后参照附图描述本发明的优选实施例,其中
图1示出了基于树形的参数化示例;
图2示出了树形结构的解码方案的示例;
图3示出了现有技术的多声道编码器的示例;
图4示出了现有技术的解码器的示例;
图5示出了现有技术的下混多声道信号的立体声重构的示例; 图6示出了本发明的参数计算器的示例的框图; 图7示出了本发明的声道重构器的示例;以及 图8示出了本发明的接收机或音频播放器的示例。
具体实施例方式
以下,主要关于MPEG编码来描述本发明的概念,但是,本发明 的概念也适用于基于多声道信号的参数编码的其他方案。这就是说, 以下描述的实施例仅作为对本发明的用于树形结构的多声道系统的减 小数目的声道解码的原理的示意。应理解,对本领域技术人员而言, 对此处描述的设置和细节的修改和变形是显而易见的。因此,本发明 仅由所附专利的权利要求的范围来限定,而不由此处以实施例的描述 和解释的方式呈现的具体细节来限定。
如上所述,在一些参数环绕编码系统,例如MPEG环绕中,使用 了树形结构的参数化。图1和图2描述了这样的参数化。
图1示出了参数化标准5.1声道音频场景的两种方式,该场景具有 左前置声道2、中心声道3、右前置声道4、左环绕声道5和右环绕声道6。 可选地,也示出了低频增强声道7 (LFE)。
一般地,各声道或声道对相对于彼此通过多声道参数来表征,例 如相关性参数ICC和声级参数CLD。在以下的段落中,将简要地解释 可能的参数化,接着在图2中示意产生的树形结构的解码方案。
在图l左侧所示的示例(5-1-5,参数化)中,由CLD和ICC参数来 表征多声道信号,CLD和ICC参数描述了左环绕声道5和右环绕声道6之间、左前置声道2和右前置声道4之间以及中心声道3和低频增强声道
7之间的关系。然而,由于整体配置应被下混为单一的单声道,为了完 整地描述声道的集合,需要附加参数。因此,使用附加参数(CLD" ICC,),该附加参数将LFE扬声器7与中心扬声器3的组合与左前置声道 2和右前置声道4的组合相关联。此外,需要一个附加参数集合(CLDo、 ICCo),这些参数描述了组合的环绕声道5和6与多声道信号的其余声道 之间的关系。
在图l右侧所示的示例(5-1-52参数化)中,使用了参数,该参数 将左前置声道2和左环绕声道5、右前置声道4和右环绕声道6以及中心 声道3和低频增强声道7相关联。附加参数(CLD,和ICd)相对于右声 道4和6的组合描述了左声道2和5的组合。另一参数集合(CLDo和ICCo) 描述了中心声道3和LFE声道7相对于其余声道的组合的组合关系。
图2示意了图1的不同参数化之下的编码概念。在解码器端,在类 似树形结构中使用了所称的OTT (l至2)模块。每个OTT模块将单声 道信号上混为两个输出信号。在解码时,必须以与编码中相反的顺序 应用OTT框的参数。因此,在5-l-5,树形结构中,接收下混信号22(M) 的OTT模块20被操作为使用参数CLDo和ICQ来导出两个声道,一个是 左环绕声道5和右环绕声道6的组合,另一个声道仍是多声道信号的其 余声道的组合。
相应地,OTT模块24使用CLD,和ICQ,导出第一声道,所述第一 声道是中心声道3和低频声道7的组合声道,以及第二声道,所述第二 声道是左前置声道2和右前置声道4的组合。以相同的方式,OTT模块 26使用CLD2和ICC2导出左环绕声道5和右环绕声道6。 OTT模块27使用 CLD4导出中心声道3和低频声道7, OTT模块28使用CLD3和ICC3导出 左前置声道2和右前置声道4。最后,从单个单声道下混声道22导出声 道30的完整集合的重构。对于5-1-52树形结构,OTT模块的总体布局等 同于5-l-5i树形结构。然而,对于5-1-52的情况,单个OTT模块导出不 同的声道组合,该声道组合与图l中所概述的参数化相对应。
从图1和2中显然可见,不同参数化的树形结构只是所使用的参数 化的可视化。进一步,重要的是,应注意,与例如BCC编码方案相反,各个参数是描述不同声道之间关系的参数,而在BCC编码方案中,关 于单一参考声道而导出类似的参数。
因此,在所示的参数化中,不能使用与可视化的OTT框相关联的 参数来简单地获得各个声道,而必须附加地考虑一些或全部其余的参数。
参数化的树形结构只是图3所示的实际信号流或处理的可视化, 图3示意了由矩阵乘法实现的从传送的低数目声道所进行的上混。图3 示出了基于接收的下混的声道40的解码。下混的声道40被输入上混块 42,上混块42导出重构的多声道信号44,该多声道信号44中的声道组 成按所使用的参数化而不同。然而,重构块42所使用的矩阵的矩阵元 素是直接从树形结构中导出的。仅作为示意目的,重构块41可以进一 步被分解为预解相关矩阵46,预解相关矩阵46从传送的声道40中导出 附加解相关信号。接着,该附加解相关信号被输入至混合矩阵48,混 合矩阵48通过混合各个输入声道来导出多声道信号44。
如图4所示,减小重构的声道的数目的直接方法是简单地"剪除" 树中的一到两个框。图4通过虚线示意了树的一种可能的剪除,该剪除 在重构过程中省略了树的右手侧的OTT模块,因此,减小了输出声道 的数目。然而,使用图1和2中所示的现有技术的参数化(引入该参数 是由于该参数化在最高可能质量上提供了低比特率编码),简单的剪除 不可能获得正确表示原始多声道信号的左侧下混和右侧下混的立体声 输出。图5示出了从上述信号创建立体声输出的现有技术的方法,该方 法使用了一种显而易见的方法,首先完整地重构多声道信号,随后使 用附加下混器60将该信号下混为立体声表示。这显然具有多个缺点,
如高复杂度以及较差的声音质量。
以下,针对一般的情况,获得对上述问题的解决方案,该问题是
从单声道下混和不当然地支持向下"剪除"至立体声输出的参数化中的
参数的环绕参数来获得立体声输出。跟着是两个具体实施例,示出了
在上述参数化中本发明概念的使用。因此,提供了对从单声道下混和
不支持向下"剪除"至立体声输出的参数化中的参数的环绕参数来获得 立体声输出的问题的解决方案。以下概述参数重新计算的一般方法。特别地,它适用于从任意数 目的多声道音频声道N来计算立体声输出参数的情况。进一步假定该 音频信号由子带表示来描述,所述子带表示是使用可以是实数取值或 复数调制的滤波器组来导出的。
假设所考虑的所有信号都是与由空间参数定义的时频片(tile)相 对应的子带样本的有限向量,假设重构的多声道音频信号的子带样本y
是从音频声道的子带样本附1,^,...,附^和音频声道的解相关的子带样 本《《,…,A中根据以下矩阵上混运算来形成的
y = Rx,其中
附2
附 《
《 《
所有信号被认为是行向量。矩阵R的大小是iVx(M + I)),该矩阵 表示图3的矩阵M1和M2的组合效果,也就是上混块42的效果。用于针
对原始多声道音频信号子带样本的ND个声道实现下混版本的合适的
功率和相关性参数的一般方法是形成由A^xW下混矩阵D定义的虚拟
下混的协方差矩阵 y,Dy。
可以通过乘以复共轭转置来计算该协方差矩阵为 yDy*D = Dyy*D* = DRxxRD*
其中,从解相关器的特性和传送的参数通常可以知道内协方差矩阵 xx* °
这一点为真的一种重要的特殊情况是对于M-1,通常该内协方差 矩阵实际上等于大小为M+D的单位矩阵。由此,对于No-2的立体声输 出,在<formula>formula see original document page 18</formula>
的意义上,可以从
<formula>formula see original document page 18</formula>
中读出CLD和ICC参数。
注意,此处及以下,应用以下标记。对于复向 <formula>formula see original document page 18</formula><formula>formula see original document page 18</formula>
巧1|2如〉,(")|2, 来定义复内积和平方范数,其中星号表示复共轭。
随后,应针对图1和2中所示的不同参数化(5-1-5,和5-1-52)导出 本发明的两个实施例。在本发明的实施例中教导了为了基于单声道 下混和对应的MPEG环绕参数(多声道参数)来输出立体声信号,需 要将上混参数重新计算为可以用于从单声道信号直接上混立体声信号 的CLD和ICC参数的单个集合。
进一步假定,逐帧(即在离散的时间部分中)进行各个音频声道
的处理。因此,在提及一个声道内包含的功率或能量时,术语"功率"
或"能量"应被理解为一个特定声道的一帧内包含的能量或功率。
一般地,例如CLD和ICC这样的参数也对一个单帧有效。对于具 有k个样本值^的帧,例如,该帧内的能量E可以被表示为该帧内的子
带样本值的平方和
为上混参数的计算而传送并使用的声道声级差(CLD)定义如下, 所述上混参数用于将下混信号M上混为多声道信号的中间声道表示 (立体声):CZD = 101og
广丄、
10
其中,U和Ro表示应当针对其导出参数CLD的那一帧内的所讨论的信
号的功率。
因此,对于5-l-5,的情况,可以使用4个CLD参数C丄Z),, I二0,l,2,3来获得由单下混声道m的功率归一化的声道功率,
丄/ = (C10CUCI3),
= (C1。C11C23),
C = (c10c21),
Ay = (^2(^12

声道增益以下式子来定义
10
c, v = J-…,,n以及C,y =
最终的目标是导出在找到由
/。=/ + ^,其中/ = 使得Z^Z^+A r。=r + gc,其中r-G(。+^),使得i -i^+i^
形成的立体声声道(中间声道表示)的合适的归一化功率的估计和相 关性的意义上最优的立体声声道lo和ro,其中,中心下混权值为 《=1/V^。从这个假设计算功率给出了这样的结果
Z0="92C + 2Re〈/,《c〉,
i o =A +《2C + 2Re〈MC〉。
结果,最有利的是假定组合的左声道l和组合的右声道r与中心声 道c不相关,而不是试图结合由参数/CC , Z-O,l携带的相关性信息。
因此,由<formula>formula see original document page 20</formula>
来估计立体声输出声道的归一化功率。
导出了输出声道的功率之后,可以使用以上给出的CLD参数的定 义容易地计算出所需CLD参数。
根据本发明的概念,获得ICC参数以允许立体声上混。两个输出
声道之间的相关性由以下表达式定义
<formula>formula see original document page 20</formula>°
此处,吸引人的简化假设的集合再次是组合的左声道l和组合的右 声道r与中心声道c不相关,此外,环绕声道与前置声道不相关。这些
假设可以表示为<formula>formula see original document page 20</formula>
产生的p的估计取决于描述归一化的左/右相关性的两个ICC参数<formula>formula see original document page 20</formula>2
也可以写为
<formula>formula see original document page 20</formula>。 因此,最终的相关性值取决于多声道参数化的许多参数,允许了
信号的高保真度的重构。最终,使用以下方程来导出ICC参数
<formula>formula see original document page 20</formula>
根据本发明的概念,以高精度重构了重构的声道之间的功率分 布。然而,此外,对两个声道应用全局功率縮放可能是必要的,以确保整体能量的保持。由于声道间的相对能量分布对于重构信号的空间 感知非常重要,因此,全局縮放可能使重构信号的感知质量恶化。应 强调,全局缩放只是在由参数定义的时频片(tile)内是全局的。这意 味着,错误的缩放在参数片(tile)的縮放中将局部影响信号。换言之,
将应用取决于频率和时间两者的增益,该增益导致频谱彩色化以及时 间调制的人工效应。用于全局缩放的增益调整因子是必要的,以确保
立体声上混过程保持单下混声道m的功率。
然而,该因子由g-7^"^定义,对于5-l-5,的配置,由于
<formula>formula see original document page 21</formula>
作为另一实施例,在以下段落中,概述本发明的概念对5-1-52的 应用。为了创建高保真度的立体声信号,与树的顶部分支相对应的前 两个CLD和ICC参数集合是相关的。
首先使用两个CLD参数CIZ)X,其中Z-0,1来获得组合的左和右
声道以及中心声道的归一化声道功率
来定义声道增益。
目标是导出下混声道的功率和相关性
<formula>formula see original document page 21</formula>
其中,中心下混权值为^-i/V5。根据这个假设计算功率给出了这样
的结果
<formula>formula see original document page 21</formula><formula>formula see original document page 22</formula>
此处优选的假设是声道l和c之间以及声道r和c之间的ICC均与声 道l+r和c之间的给定的ICCo相同。这个假设导致了如下估计 Re〈/,c〉 = /CCQVZ^, Re<formula>formula see original document page 22</formula>使得归一化功率的估计变为
<formula>formula see original document page 22</formula>如在之前的实施例中一样,对于功率值Lo和Ro,可以导出所需的 CLD参数
<formula>formula see original document page 22</formula>导出相关性并最终导出icc参数的步骤从相关性值的一般定义开
<formula>formula see original document page 22</formula>由于
<formula>formula see original document page 22</formula>Re〈/小/CC,VZ^, 因此所有必要的信息都可以从5-1-52树形结构的参数中得到 最终的结果可以写为
<formula>formula see original document page 22</formula>所需增益调整因子g由以下式子定义:
可以注意到,可以进一步量化所产生的CLD和ICC参数,以实现 在解码器中使用查找表用于上混矩阵的创建,而不需要执行复杂的计 算。这进一步提高了上混过程的效率。
一般地,可以使用已有的OTT模块来进行上混。这样具有一个优 点,即可以在已有的解码场景中容易地实现本发明的概念。
一般地,可以如下描述上混矩阵
因此,在以本发明的方式导出了参数CLD和ICC之后,可以使用 标准上混模块,以高保真度对传送的下混执行立体声上混。
在本发明的另一实施例中,发明的声道重构器包括用于获得上混 参数的参数计算器,以及上混器,所述上混器使用所述上混参数和所 述下混信号来获得所述中间声道表示。
在图6中,再次概述了本发明的概念,图6示出了本发明的参数计 算器502,参数计算器502接收许多ICC参数504和许多CLD参数506。 根据本发明的一个实施例,本发明的参数计算器502也使用具有立体声 上混的声道不包括或不相关的声道的信息的多声道参数(ICC和CLD) 来获得用于重建立体声信号的单个CLD参数508和单个ICC参数510。
可以注意到,本发明的概念可以容易地适用于具有包括多于两个 声道的上混的场景。在该意义上,上混一般地被定义为多声道信号的 中间声道表示,其中,所述中间声道表示具有的声道多于所述下混信 号并少于所述多声道信号。 一种常见的场景是这样一种配置,在该配
其中:置中重构附加的中心声道。
在图7中再次概述了本发明概念的应用,图7示出了本发明的参数
计算器502以及1至2框OTT 520。如在图6中详细描述的,OTT框520接 收传送的单声道信号522作为输入。本发明的参数计算器502接收多个 ICC值5-4和多个CLD值506,以导出单个CLD单数508和单个ICC参数 510。
单个CLD和ICC单数508和510被输入OTT模块520,以控制单声道 下混信号522的上混。因此,在OTT模块520的输出,可以提供立体声 信号524作为多声道信号的中间声道表示。
图8示出了本发明的接收机或音频播放器600,接收机或音频播放 器600具有发明的音频解码器601 、比特流输入602以及音频输出604。
可以将比特流输入本发明的接收机/音频播放器600的输入602。接 着,解码器601解码该比特流,在本发明的接收机/音频播放器600的输 出604输出或播放解码的信号。
虽然本发明主要关于MPEG环绕编码来概述,但是,这当然绝不 能将应用限制在特定的参数编码场景。由于本发明概念的高度灵活性, 也可以容易地将本发明概念应用至其他编码方案,例如应用至7.1或 7.2声道配置或BCC方案。
虽然涉及MPEG编码的本发明的实施例引入一些针对通常的CLD
和ICC参数的产生的简化假设,但是,这不是强制性的。当然,也可 以不引入这些简化。
根据本发明方法的特定实现要求,可以以硬件或软件来实现本发 明的方法。所述实现可以在数字存储介质,尤其是具有电子可读控制 信号的光盘或CD上完成,所述数字存储介质可以与可编程计算机系统 协作,以执行本发明方法。 一般地,因此,本发明是具有程序代码的 计算机程序产品,所述程序代码存储在机器可读载体上,当所述计算 机程序产品在计算机上运行时,所述程序代码被操作为执行本发明的 方法。换言之,因此,本发明方法是具有程序代码的计算机程序,所 述程序代码用于在计算机程序在计算机上运行时执行至少一个本发明 的方法。虽然参照本发明的特定实施例具体地示出并描述了上述内容,但 是,本领域技术人员应理解,在不背离本发明的精神和范围的情况下, 可以对形式和细节做出各种其他改变。应理解,为了适应不同的实施 例,在不背离此处公开的以及由所附权利要求所包括的更宽的概念的 情况下,可以做出各种改变。
权利要求
1.一种参数计算器,用于导出上混参数,所述上混参数用于将下混信号上混为多声道信号的中间声道表示,所述中间声道表示具有的声道多于所述下混信号并少于所述多声道信号,所述下混信号具有与其相关联的描述多声道信号的空间特性的多声道参数,其中,所述多声道信号包括所述中间声道表示未包括的声道,其中,所述多声道参数包括所述中间声道表示未包括的声道的信息,所述参数计算器包括参数重新计算器,所述参数重新计算器使用具有所述中间声道表示未包括的声道的信息的参数,从所述多声道参数中导出所述上混参数。
2. 如权利要求1所述的参数计算器,其中,所述参数重新计算器 适于使用多声道参数,所述多声道参数描述了多声道信号的声道或声 道组合相对于多声道信号的另一声道或另一声道组合的信号特性。
3. 如权利要求2所述的参数计算器,其中,所述参数重新计算器 操作用于导出上混参数,所述上混参数描述了与所述多声道参数相同 的所述中间声道表示的声道的信号特性。
4. 如权利要求l所述的参数计算器,其中,所述参数重新计算器 适于使用具有相关性信息的相关性参数(ICC)以及具有能量信息的 声级参数(CLD),所述相关性信息和能量信息是多声道信号的声道或 声道组合相对于多声道信号的另一声道或另一声道组合的相关性信息 和能量信息。
5. 如权利要求4所述的参数计算器,适于使用多声道信号的多声 道参数,所述多声道信号包括左前置(LF)、左环绕(LS)、右前置(RF)、 右环绕(RS)和中心声道(C),其中,所述参数重新计算器操作用于 导出针对具有两个声道的中间声道表示的上混参数,所述上混参数包 括一个CLD参数和一个ICC参数。
6. 如权利要求5所述的参数计算器,其中,所述参数重新计算器 操作用于使用以下参数来导出CLD参数,所述CLD参数具有所述中 间声道表示的左和右声道的能量信息第一 CLD参数(CLDQ),具有LS和RS声道的组合以及多声道 信号的其余声道的组合的能量信息;第二CLD参数(CLD》,具有LF和RF声道的组合以及中心声 道(C)的能量信息;第三CLD参数(CLD2),具有LS和RS声道的能量信息;以及第四CLD参数(CLD3),具有LF和RP声道的能量信息。
7.如权利要求6所述的参数计算器,其中,所述参数重新计算器 操作用于根据以下方程来导出所述上混CLD参数<formula>formula see original document page 3</formula>其中,U和Ro是由以下等式导出的立体声输出声道L和R的归一化功 率<formula>formula see original document page 3</formula>其中,从所述LCD参数,按照以下等式来导出多声道信号的功率<formula>formula see original document page 3</formula>
8.如权利要求5所述的参数计算器,其中,所述参数重新计算器
9.操作用于使用以下参数来导出ICC参数第一 CLD参数(CLDo),具有LS和RS声道的组合以及多声道信号的其余声道的组合的能量信息;第二CLD参数(CLD,),具有LF和RF声道的组合以及中心声道(C)的能量信息;第三CLD参数(CLD2),具有LS和RS声道的能量信息; 第四CLD参数(CLD3),具有LF和RF声道的能量信息; 第一ICC参数(ICC2),具有LS和RS声道之间的相关性信息;以及第二ICC参数(ICC3),具有LF和RF声道之间的相关性信息。 9.如权利要求8所述的参数计算器,其中,根据以下方程来导出所述ICC参数
10. 如权利要求5所述的参数计算器,其中,所述参数重新计算 器操作用于使用以下参数来导出CLD参数第一CLD参数(CLDo),具有中心声道(C)以及多声道信号的其他声道的组合的能量信息;第二 CLD参数(CLD》,具有LF和LS声道的组合以及RF和 RS声道的组合的能量信息;ICC参数(ICQ),具有中心声道(C)与多声道信号的其他声道 的组合之间的相关性信息。
11. 如权利要求10所述的参数计算器,其中,根据以下方程来导其中,相关性估计p被定义为尸=I + /CC2c220c2c22 + /CC3 (c)qC,,)其中出所述CLD参数<formula>formula see original document page 5</formula>其中,Lo和R()是由以下等式导出的立体声输出声道L和R的归一化功率<formula>formula see original document page 5</formula>以及
12. 如权利要求5所述的参数计算器,其中,所述参数重新计算 器操作用于使用以下参数来导出所述ICC参数第一CLD参数(CLDQ),具有中心声道(C)以及多声道信号的 其他声道的组合的能量信息;第二 CLD参数(CLD,),具有LF和LS声道的组合以及RF和 RS声道的组合的能量信息;第一ICC参数(ICQ),具有中心声道(C)与多声道信号的其他 声道的组合之间的相关性信息;以及第二 ICC参数(ICC,),具有LF和LS声道的组合与RF和RS 声道的组合之间的相关性信息。
13. 如权利要求12所述的参数计算器,其中,所述参数重新计算 器操作用于使用以下方程来导出所述ICC参数.<formula>formula see original document page 5</formula>其中,相关性估计p导出为<formula>formula see original document page 6</formula>,其中<formula>formula see original document page 6</formula>
14. 如权利要求1所述的参数计算器,其中,所述参数重新计算 器操作用于使用描述多声道信号的子带表示的多声道参数。
15. 如权利要求r所述的参数计算器,其中,所述参数重新计算器操作用于使用复值多声道参数。
16. —种具有参数重构器的声道重构器,包括 如权利要求l所述的参数计算器;以及上混器,所述上混器使用所述上混参数和所述下混信号来导出所 述中间声道表示。
17. —种用于产生上混参数的方法,所述上混参数用于将下混信 号上混为多声道信号的中间声道表示,所述中间声道表示具有的声道 多于所述下混信号并少于所述多声道信号,所述下混信号具有与其相 关联的描述多声道信号的空间特性的多声道参数,其中,所述多声道 信号包括所述中间声道表示未包括的声道,其中,所述多声道参数包 括所述中间声道表示未包括的声道的信息,所述方法包括使用具有所述中间声道表示未包括的声道的信息的参数,从所述 多声道参数中导出所述上混参数。
18. —种音频接收机或音频播放器,所述接收机或音频播放器具有参数计算器,所述参数计算器用于导出上混参数,所述上混参数用 于将下混信号上混为多声道信号的中间声道表示,所述中间声道表示 具有的声道多于所述下混信号并少于所述多声道信号,所述下混信号 具有与其相关联的描述多声道信号的空间特性的多声道参数,其中, 所述多声道信号包括所述中间声道表示未包括的声道,其中,所述多 声道参数包括所述中间声道表示未包括的声道的信息,所述参数计算器包括参数重新计算器,所述参数重新计算器使用具有所述中间声道表 示未包括的声道的信息的参数,从所述多声道参数中导出所述上混参 数。
19. 一种接收或音频播放的方法,所述方法具有用于产生上混参 数的方法,所述上混参数用于将下混信号上混为多声道信号的中间声 道表示,所述中间声道表示具有的声道多于所述下混信号并少于所述 多声道信号,所述下混信号具有与其相关联的描述多声道信号的空间 特性的多声道参数,其中,所述多声道信号包括所述中间声道表示未 包括的声道,其中,所述多声道参数包括所述中间声道表示未包括的声道的信息,所述方法包括使用具有所述中间声道表示未包括的声道的信息的参数,从所述 多声道参数中导出所述上混参数。
20. —种具有程序代码的计算机程序,当在计算机上运行时,所述程序代码执行产生上混参数的方法,所述上混参数用于将下混信号 上混为多声道信号的中间声道表示,所述中间声道表示具有的声道多 于所述下混信号并少于所述多声道信号,所述下混信号具有与其相关 联的描述多声道信号的空间特性的多声道参数,其中,所述多声道信 号包括所述中间声道表示未包括的声道,其中,所述多声道参数包括 所述中间声道表示未包括的声道的信息,所述方法包括.-使用具有所述中间声道表示未包括的声道的信息的参数,从所述 多声道参数中导出所述上混参数。
21. —种具有程序代码的计算机程序,当在计算机上运行时,所 述程序代码执行接收或音频播放的方法,所述方法具有用于产生上混 参数的方法,所述上混参数用于将下混信号上混为多声道信号的中间 声道表示,所述中间声道表示具有的声道多于所述下混信号并少于所 述多声道信号,所述下混信号具有与其相关联的描述多声道信号的空 间特性的多声道参数,其中,所述多声道信号包括所述中间声道表示 未包括的声道,其中,所述多声道参数包括所述中间声道表示未包括的声道的信息,所述方法包括使用具有所述中间声道表示未包括的声道的信息的参数,从所述多声道参数中导出所述上混参数,
全文摘要
当导出用于将传送的下混信号上混为中间声道表示的上混参数,该上混参数允许使用与多声道重构中相同的上混算法来进行上混时,可以高效地以高保真度重构多声道信号的中间声道表示。当使用参数重新计算器,该参数重新计算器也考虑具有所述中间声道表示未包括的声道的信息的参数来获得所述上混参数时,可以实现这一点。
文档编号G10L19/00GK101410890SQ200680054051
公开日2009年4月15日 申请日期2006年8月18日 优先权日2006年3月29日
发明者克里斯托弗·薛林, 拉斯·维尔默斯, 耶罗恩·布里巴特 申请人:杜比瑞典公司;皇家飞利浦电子股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1