用于消除参数多通道音频编码与矩阵环绕多通道编码之间的差距的构思的制作方法

文档序号:2830121阅读:254来源:国知局
专利名称:用于消除参数多通道音频编码与矩阵环绕多通道编码之间的差距的构思的制作方法
技术领域
本发明涉及多通道音频编码和传输,具体涉及按照与立体声设备 和格式完全后向兼容的方式来编码多通道音频的技术,以允许对多通 10 道音频的高效编码。
背景技术
多通道音频信号的参数编码是当前研究的主题。 一般而言,可以 区分多通道音频信号编码的两种方法。运动图像专家组(MPEG),即15 国际标准化组织(ISO)下的分组,目前正致力于如下技术的标准化 通过向下混信号只添加少量协助信息,从立体声或甚至单声道下混信 号中重建多通道音频内容。同时,正在开发立体声到多通道上混方法,该方法不需要下混信 息中还未(隐式地)包含的任何附加辅助信息来重建原始多通道音频20 信号的空间图像。无需附加辅助信息的立体声兼容多通道传输的现有方法已在实际 应用中成为重要手段,并且主要可以特征化为矩阵环绕方法,例如 Dolby Pro Logic (Dolby Pro Logic II) and Logic-7 ,这在"Dolby Surround Pro Logic II Decoder - Principles of Operation",25 http:〃www.dolby,com/assets/pdf/tech—library/209JDolby—Surround—Pro— Logic—II—Decoder—Principles—of—Operation.pdf禾Q "Multichannel Matrix Surround Decoders for Two-Eared Listeners", Griesinger, D., 101st AES Convention, Los Angeles, USA, 1996, Preprint 4402中有详细描述。这些 方法的共同原理是利用多通道或立体声下混的专用方法,其中编码器在将环绕通道与前和中央通道混合在一起之前,向环绕通道施加相移, 以形成立体声下混信号。如下方程描绘了下混信号(Lt, Rt)的产生<formula>formula see original document page 8</formula>(1)左下混信号(Lt)包括左前信号(Lf)、中央信号(C)乘以因子 5 q、左环绕信号(Ls)的相位旋转卯度(,j,)并由因子a进行縮放、以 及右环绕信号(Rs)的相位也旋转90度并由因子b进行縮放。右下 混信号(Rt)是类似产生的。典型的下混因子是q和a为0.707, b为 0.408。对于左下混信号(Lt)和右下混信号(Rt),环绕通道的不同 符号的基本原理在于,在下混对(Lt,Rt)中将环绕通道反相位地混合 10 是有利的。该属性有助于解码器根据下混信号对来区分前和后通道。 因此,下混矩阵允许通过应用解矩阵(de-matrixing)操作,来在解码 器内从立体声下混中部分地重建多通道输出信号。但是,重建的多通道信号与原始编码器输入信号的相似程度取决于多通道音频内容的特 定属性。15 添加协助信息(也称作辅助信息)的编码方法的示例是MPEG环绕音频编码。例如,在"The Reference Model Architecture for MPEG Spatial Audio Coding", Herre, J., Purnhagen, H., Breebaart, J., Faller, C., Disch, S., Kjoerling, K., Schuijers, E., Hilpert, J., Myburg, F., Pro" 118th AES Convention, Barcelona, Spain, 2005禾口"Text of Working Draft for20 Spatial Audio Coding (SAC)", ISO/IEC JTC1/SC29/WG11 (MPEG), Document N7136, Busan, Korea, 2005中描述了该参数多通道音频编码 的高效方法。图6示出了在空间音频编码中使用的编码器的示意性概图。编码 器利用正交镜像滤波器(Quadrature Mirror Filter) 12 (QMF)将输 25入信号10 (输入l,...,输入N)划分到分离的时间频率片中。得到 的频率片(带)组称为"参数带"。对于每个参数带,由参数估计器 16确定多个空间参数14,描述空间图像的属性,例如通道对之间的电平差(CLD)、通道对之间的互相关(ICC)或信号包络信息(CPC)。随后将这些参数量化、编码并相结合地编辑为空间数据的比特流。依 据工作模式,该比特流可以覆盖从针对高质量多通道音频的几个kBit/s直到针对近似透明质量的几十个kBit/s的较宽范围的比特率。 5 除了参数提取,编码器还从多通道输入信号中产生单声道或立体声下混。此外,在立体声下混的情况下,用户可以选择常规(ITU风 格)立体声下混或与矩阵环绕系统兼容的下混。最后,利用QMF合 成组18将立体声下混转换到时域。可以将得到的下混连同空间参数或 空间参数比特流M传输至解码器。优选地,传输之前还(使用常规单i0 声道或立体声核心编码器)对下混进行编码,同时可以附加地组合(复 用)核心编码器和空间参数的比特流,以形成单个输出比特流。如图7所示的解码器在原理上执行编码器的逆过程。将输入流划 分成核心编码器比特流和参数比特流。这在图7中未示出。随后,由 QMF分析组22处理已解码的下混20,导出与编码器中应用的参数带15 相同的参数带。空间合成级24利用控制数据26 (即,传输的空间参 数)重建多通道信号。最后,利用QMF合成组27将QMF域的信号 转换到时域,QMF合成组27导出最终的多通道输出信号28。图8示出了在图6的现有技术编码器和图7的现有技术解码器内 执行的QMF分析的简单示例。将在时域中采样并具有四个采样值的20 音频采样30输入滤波器组32。滤波器组32导出各自具有四个采样值 的三个输出采样34a、 34b和34c。在理想情况下,滤波器组32导出 输出采样34a到34c,以使输出信号内的采样确实只包括与底层音频 信号30的离散频率范围有关的信息。在图8所示情况下,采样34a 具有与范围从f0到fl的频率区间有关的信息,采样34b具有频率区25 间[fl, f2]的信息,采样34c具有频率区间[f2, f3]的有关信息。虽然图8 中的频率区间并未交叠,但是在更一般的情况下,从滤波器组中输出 的输出采样的频率区间可以具有频率交叠。如上所述,当需要双通道下混时,现有技术编码器可以传递ITU 风格下混或矩阵环绕兼容下混。在矩阵环绕兼容下混(使用例如方程1中给出的矩阵化方法)情况下, 一种可能是编码器直接产生矩阵环 绕兼容下混。图9示出了使用下混后处理单元30来产生矩阵环绕兼容下混的备选方法,其中下混后处理单元30对常规立体声下混32进行处理。矩 5 阵环绕处理器30 (MTX编码器)修改常规立体声下混32,使其由参 数提取级16所提取的空间参数14引导,以与矩阵环绕兼容。对于传 输,使用QMF合成组18通过QMF合成将矩阵环绕兼容的下混34转 换到时域。通过后处理常规立体声下混来导出矩阵环绕兼容信号的优点在 10于,如果空间参数是可用的,则矩阵环绕兼容性处理在解码器端是完 全可逆的。虽然两种方法都适合传输多通道信号,但是现有技术系统存在特 定缺点。以非常有限的多通道重建质量为代价,矩阵环绕方法非常有 效(因为不需要附加参数)。 15 另一方面,由于辅助信息,参数多通道方法需要更高的比特率,在对参数表示设定极限作为最大可接受比特率时,这成为了问题。当 编码参数需要比较高的比特率时,保持在该比特率极限内的唯一可能 方法是通过增大通道的压缩来降低编码下混通道的质量。因此,结果 是音频质量的总体损失,该损失可能高得不可接受。换言之,对于参 20 数多通道方法,通常存在空间参数层所要求的最小比特率的硬限制, 这在一些情况下可能高得不可接受。虽然可以通过图9所示的现有技术编码器在原理上实现矩阵环绕 方法和空间音频方法之间的后向兼容,但是当只需要基于矩阵的解码 时,这种方法无法节省任何附加的比特率。甚至必须传输空间参数的 25完全集合,从而浪费了传输带宽。在特定应用场景中,在应用该参数方法时必须花费的比特率可能 太高,而由不传输辅助信息的方法传递的音频质量可能不够。美国专利申请2005157883示出了用于使用输入信号和参数辅助 信息来构建多通道音频信号的装置,输入信号包括从原始多通道信号中导出的第一输入通道和第二输入通道,参数辅助信息描述了原始多 通道信号的通道之间的相互关系。发明内容5 本发明的目的是提供一种多通道音频信号的更高效编码、同时与基于矩阵的编码解决方案后向兼容的构思。根据本发明的第一方面,通过一种用于处理音频信号并处理第一 参数数据的多通道音频解码器来实现上述目的,第一参数数据描述多 通道信号的第一部分,其中对于所述多通道信号的第二部分,不处理10 参数数据或处理第二参数数据;当描述所述多通道信号的相同部分时, 第二参数数据需要的信息单元比第一参数数据的少,所述解码器包括 处理器,用于从所述音频信号中导出中间信号,使用第一导出规则来 导出所述中间信号的第一部分,所述中间信号的第一部分对应于所述 多通道音频信号的第一部分,第一导出规则依据第一参数数据;使用15 第二导出规则来导出所述中间信号的第二部分,第二导出规则不使用 参数数据或使用第二参数数据。根据本发明的第二方面,通过用于产生参数表示的多通道编码器 来实现上述目的,所述参数表示描述多通道音频信号的空间属性,所 述多通道编码器包括参数产生器,用于产生空间参数;输出接口,20 用于产生所述参数表示,其中所述参数产生器或所述输出接口适于产 生所述参数表示,以使所述参数表示包括针对所述多通道信号的第一 部分的第一参数数据,并且对于所述多通道信号的第二部分,所述参 数表示中不包括参数数据或包括第二参数数据;当描述所述多通道信 号的相同部分时,第二参数数据需要的信息单元比第一参数数据的少。25 根据本发明的第三方面,通过一种用于处理音频信号并处理第一参数数据的方法来实现上述目的,第一参数数据描述多通道信号的第 一部分,其中对于所述多通道信号的第二部分,不处理参数数据或处 理第二参数数据;当描述所述多通道信号的相同部分时,第二参数数 据需要的信息单元比第一参数数据的少,所述方法包括从下混信号30中导出中间信号,使用依据第一参数数据的第一导出规则以导出所述中间信号的第一部分,所述中间信号的第一部分对应于所述多通道音 频信号的第一部分;以及使用第二导出规则导出所述中间信号的第二 部分,第二导出规则使用第二参数数据或不使用参数数据。根据本发明的第四方面,通过一种用于产生参数表示的方法来实5 现上述目的,所述参数表示描述多通道音频信号的空间属性,所述方 法包括产生空间参数;产生所述参数表示,以使所述参数表示包括 针对所述多通道信号的第一部分的第一参数数据,并且对于所述多通 道信号的第二部分,所述参数表示中不包括参数数据或包括第二参数 数据;当描述所述多通道信号的相同部分时,第二参数数据需要的信10 息单元比第一参数数据的少。根据本发明的第五方面,通过一种对多通道音频信号的空间属性 进行描述的参数表示来实现上述目的,所述参数表示包括针对所述多 通道信号的第一部分的第一参数数据,并且对于所述多通道信号的第 二部分,所述参数表示不包括参数数据或包括第二参数数据;对于所15 述多通道信号的相同部分,第二参数数据需要的信息单元比第一参数 数据的少。根据本发明的第六方面,通过具有程序代码的计算机程序实现上 述目的,当在计算机上运行时,所述程序代码执行一种用于处理音频 信号并处理第一参数数据的方法,第一参数数据描述多通道信号的第20 —部分,其中对于所述多通道信号的第二部分,不处理参数数据或处 理第二参数数据;当描述所述多通道信号的相同部分时,第二参数数 据需要的信息单元比第一参数数据的少,所述方法包括从下混信号 中导出中间信号,使用依据第一参数数据的第一导出规则以导出所述 中间信号的第一部分,所述中间信号的第一部分对应于所述多通道音25 频信号的第一部分;以及使用第二导出规则导出所述中间信号的第二 部分,第二导出规则使用第二参数数据或不使用参数数据。根据本发明的第七方面,通过具有程序代码的计算机程序实现上 述目的,当在计算机上运行时,所述程序代码执行一种用于产生参数 表示的方法,所述参数表示描述多通道音频信号的空间属性,所述方30法包括产生空间参数;以及产生所述参数表示,以使所述参数表示包括针对所述多通道信号的第一部分的第一参数数据,并且对于所述 多通道信号的第二部分,所述参数表示中不包括参数数据或包括第二参数数据;当描述所述多通道信号的相同部分时,第二参数数据需要的信息单元比第一参数数据的少。5 根据本发明的第八方面,通过一种使用空间参数来产生多通道音频信号的参数表示的代码转换器来实现上述目的,所述参数表示描述多通道音频信号的空间属性,所述代码转换器包括参数产生器,用 于产生所述参数表示,以使所述参数表示包括从空间参数中导出的针 对所述多通道信号的第一部分的第一参数数据,并且对于所述多通道10 信号的第二部分,所述参数表示中不包括参数数据或包括第二参数数 据;当描述所述多通道信号的相同部分时,第二参数数据需要的信息 单元比第一参数数据的少。本发明基于如下发现当第一导出规则用于导出参数表示中对多 通道信号的第一部分进行描述的第一参数数据,并且对于多通道信号15 的第二部分,参数表示中包括第二参数数据或不包括参数数据时,可 以由该参数表示有效地表示多通道音频信号,而当描述所述多通道信 号的相同部分时,第二参数数据需要的信息单元比第一参数数据的少。 因此,由允许以较高质量重建多通道信号的第一参数表示多通道 信号的第一部分,并且可以由允许以略低质量进行重建的第二参数表20示第二部分。因此,当两种参数数据描述多通道信号的相同部分时,由第一参数数据消耗的比特率比由第二参数数据消耗的比特率高。换 言之,对于每一信号部分,第一参数需要比第二参数多的比特率。 本发明的目的是通过逐渐改善上混信号的声音、同时将辅助信息所消耗的比特率从o提高到参数方法的比特率,消除两种现有技术领25域中的差距。即,本发明旨在消除全参数方法和矩阵环绕方法之间的比特率和感知质量中的差距。具体而言,本发明提供了一种在矩阵环 绕(无辅助信息,有限音频质量)与全参数重建(需要全辅助信息速 率,高质量)之间的某处灵活地选择"工作点"的方法。取决于各个 应用,可以动态(即,时间上变化)并响应于可允许的辅助信息速率30 来选择该工作点。通过动态地选择多通道音频信号的第一部分(多通道音频信号中 由空间音频参数表示的部分)的大小,可以在较宽范围内改变所要求 的比特率。由空间音频参数表示多通道信号的主要部分会消耗相对较 高的比特率,这有利于较高感知质量。因为对于多通道音频信号的第 5 二部分,选择的参数导出规则产生对比特率消耗较少的参数,所以可 以通过增加多通道信号的第二部分的大小来降低得到的总比特率。在 本发明的优选实施例中,对于多通道信号的第二部分,根本不传输参 数数据,这显然是最节省比特的。因此,通过相对于第二部分的大小 来动态地变换第一部分的大小,可以根据需要动态地调整比特率(或 10 感知质量)。在本发明的优选实施例中,以矩阵兼容方式导出下混信号。因此, 可以使用空间音频参数以高感知质量来再现多通道音频信号的第一部 分,并可以使用基于矩阵的方法来再现多通道信号的第二部分。这允 许对需要较高质量的信号部分进行高质量再现。同时,通过依赖于对15再现信号的质量不太重要的信号部分进行基于矩阵的再现,来降低总 体比特率。在本发明的另一优选实施例中,在所接收的下混信号的QMF表 示内,将本发明构思应用于解码器端。原理上,上混处理可以再分为三个步骤20 通过应用预去相关器矩阵,对输入信号(QMF域中接收的下混信号)进行预处理;对预处理后的信号的一部分进行去相关;以及 在混合矩阵内混合由此导出的信号(预处理后的信号和去相关后 的信号),混合操作的输出是上混信号的通道。25 预去相关器矩阵和混合矩阵都是维数为"时隙数目"与"参数带数目"的二维矩阵。在解码处理内,使用根据从空间比特流中读取的 参数而导出的值,即通过第一参数数据,来填充这些矩阵的元素。当 只接收到针对多通道信号的第一部分的第一参数数据时,使用提交的 第一参数数据只可以导出多通道信号重建中的该部分。根据本发明,30 使用矩阵兼容编码方案来导出用于导出多通道信号重建中第二部分的矩阵元素。因此,可以只基于从下混信号得到的知识来导出这些矩阵 元素,或者可以用预定值来取代这些矩阵元素。在优选实施例中,根据本发明的多通道音频解码器通过所传输的 第一参数数据的量,识别哪一部分矩阵或哪一部分多通道音频信号将 5 由依据空间参数的规则来处理,以及哪一部分将由基于矩阵的方法来 处理。在本发明的另一实施例中,音频编码器创建窗口信息,指示了哪 一部分多通道信号正由基于矩阵的方法或空间音频兼容的方法在处 理。窗口信息包括在多通道信号的参数表示中。 10 因此,本发明的解码器能够接收并处理创建的窗口信息,以向由该窗口信息指示的那部分多通道音频信号应用适当的上混规则。在本发明的优选实施例中,在信号处理期间将本发明构思应用于QMF域,g卩,应用于通过多个表示来表示信号的域,每个表示保持特定频率带有关的信息。 15 在本发明的另一优选实施例中,只向较高频率部分应用无辅助信息的方法(基于矩阵的方法),而应用(显式的)参数信息(即,第一编码和解码规则)以正确地再现低频部分。这是有利的,因为人类听力的特性是相比于高频而言更容易注意到低频中两个类似信号的较小偏差(例如,相位偏差)。 20 本发明的优点在于,实现了空间音频编码和解码方案与基于矩阵的方案之间的后向兼容,而在适当选择空间音频编码器的编码和解码规则时不必引入附加的硬件或软件。此外,实现了兼容性,而不必像其他现有技术尝试中的一样要传输附加数据。根据本发明的编码方案非常灵活,因为允许对比特率或 25质量进行无缝的调整,g卩,允许在给定信号的完全基于矩阵的编码与完全的空间音频编码之间进行平滑过渡。即,可以相对于所选比特率或相对于所需质量,调整编码方案以满足实际需要。


30 以下参照附图,描述本发明的优选实施例,附图中图1示出了本发明解码器;图2示出了根据本发明构思创建的参数比特流的示例;图2a示出了本发明的代码转换器; 图3示出了本发明的解码器; 5 图4示出了实现本发明构思的空间音频解码器的示例;图5示出了解码器端的不同编码方案的应用; 图6示出了现有技术编码器; 图7示出了现有技术解码器; 图8示出了滤波器组的框图;以及10 图9示出了现有技术编码器的另一示例。
具体实施方式
图1示出了本发明的多通道编码器。多通道编码器ioo具有参数产生器102和输出接口 104。 15 将多通道音频信号106输入编码器100中,在此处理多通道信号106的第一部分108和第二部分110。参数产生器102接收第一部分 108和第二部分110,并导出对多通道信号106的空间属性进行描述的 空间参数。将空间参数传送至输出接口 104,输出接口 104导出多通道信号 20106的参数表示112,以使参数表示112包括针对多通道信号的第一部 分108的第一参数数据,其中对于多通道信号106的第二部分110, 参数表示112中包括需要的信息少于第一参数数据的第二参数数据、 或者不包括参数数据。多通道编码器100的多种变体可以实现相同目标。例如,参数产 25 生器102可以对第一部分108和第二部分110应用两种不同的参数导 出规则,产生不同的参数集,然后传送至输出接口 104,输出接口 104 将不同的参数集组合成参数表示112。特别且优选的情况是对于第二 部分IIO,参数表示中不包括参数(因此不由参数产生器102导出), 这是因为在解码器端,解码器通过某些启发式规则来导出所需的解码 30 参数。另一可能是参数产生器102导出针对第一部分108和第二部分 110的空间音频参数的完全集合。因此,输出接口 104必须处理空间 参数,以使第二参数数据需要的比特比第一参数数据需要的比特少。 此外,输出接口 104可以向参数表示112添加附加窗口信号,该 5信号向解码器通知在编码期间多通道信号106是怎样划分成第一部分 108和第二部分110的。在多通道编码器100的优选实施例的修改方 案中,多通道编码器100可以附加地具有部分判决器,用于判决哪一 部分多通道信号106用作第一部分108,哪一部分用作第二部分110, 该判决是基于质量准则的。 10 考虑到基于参数表示112的多通道信号106的再现的感知质量,可以相对于得到的参数表示112的总比特率或相对于质量方面,导出 质量准则。主要优点在于,由参数表示消耗的比特率由此可以在时间上改变, 确保了在编码期间随时满足质量准则,同时相比于现有技术方法,允 15许在总体上降低所需的比特率。图2示出了由本发明编码器创建的参数表示112的示例。如上所述,音频信号的处理是逐块进行的,即,在一个步骤中处 理多通道信号在时域中的多个相继采样,这些采样构成所谓的帧。图 2示出了参数比特流,即,两个连续帧的参数表示。参数比特流具有 20 高质量帧120的表示和低质量帧122的表示。在高质量帧120的编码 期间,判决由参数数据表示的第一部分108必须比第二部分大,例如, 这可能是在待编码的音频场景相当复杂时的情况。此外,图2的参数 比特流是在所用的本发明编码器的优选实施例不导出针对多通道信号 106的第二部分110的任何参数数据的假设下创建的。如图2所示, 25 参数表示中包括28个空间参数ICC和ICLD,以描述高质量帧120。 例如,这28个空间参数描述多通道信号的QMF表示的低频带。低质量帧122只包括具有ICC和ICLD的21个空间参数集,这对于所需感知质量而言是足够的。图2a示出了本发明的代码转换器150。本发明的代码转换器接收 30具有空间参数全集的输入比特流152作为输入,该空间参数全集描述了多通道音频信号的第一帧154和第二帧156。代码转换器150产生比特流158,比特流158保持对多通道音频 信号的空间属性进行表示的参数表示。在图2a所示示例中,代码转换 器150导出参数表示,以使对于第一帧而言,参数160的数目只略微 5 减少。用于描述对应于输入参数156的第二帧的参数162的数目大幅 度减少,从而显著减少了得到的参数表示所需的比特率。因此,本发 明的代码转换器150可以用于对已有的空间参数比特流进行后处理, 以导出本发明的参数表示,该参数表示在传输期间需要较小比特率或 者在存储于计算机可读介质上时需要较少存储空间。应该注意,显然10 也可以实现用于沿另一方向(即,使用参数表示来产生空间参数)进 行代码转换的代码转换器。本发明的代码转换器150可以采用不同方式来实现,例如,通过 用给定规则来降低参数量,或通过附加地接收多通道音频信号以分析 可能的比特率降低,而不会超过可接受极限地干扰感知质量。15 图3示出了本发明的具有处理器202的多通道音频解码器200。处理器接收从多通道音频信号中导出的下混信号204、描述多通 道信号的第一部分的第一参数数据206、以及针对多通道信号的第二 部分的可选第二参数数据208作为输入,第二参数数据208需要的比 特比第一参数数据206需要的少。处理器202使用第一导出规则从下20 混信号204中导出中间信号210,第一导出规则用于导出中间信号的 高质量部分212,中间信号的高质量部分212对应于多通道音频信号 的第一部分。处理器202针对中间信号210的第二部分214使用第二 导出规则,第二导出规则使用第二参数数据或者不使用参数数据,第 一导出规则依据第一参数数据206。25 由处理器202导出的中间信号210由高质量部分212和第二部分214的组合而组成。多通道音频解码器200可以通过应用一些适当规则,独立地导出 哪一部分下混信号204是要利用第一参数数据206来处理的,这些规 则例如是对第一参数数据206中包括的空间参数数目进行计数。备选30地,可以通过一些附加的窗口信息向处理器202发信号通知下混信号204内高质量部分212和第二部分214的组分,该窗口信息是在编码 器端导出并附加地传输至多通道音频解码器200的。在优选实施例中,省略了第二参数数据208,并且处理器202从 下混信号204中已包含的信息中导出第二导出规则。 5 图4示出了将本发明的矩阵兼容性特征结合在空间音频解码器中的本发明的另一实施例。多通道音频解码器600包括预去相关器601、 去相关器602和混合矩阵603。多通道音频解码器600是允许依据输入预去相关器601中的输入 信号605的配置而以不同模式工作的灵活设备。 一般而言,预去相关 10 器601导出中间信号607,中间信号607用作去相关器602的输入, 并部分地按照原样传输,以与由去相关器602计算的去相关后信号一 起形成输入信号608。输入信号608是输入混合矩阵603中的信号, 混合矩阵603依据输入通道配置605而导出输出通道配置610a或 610b。15 在1到5配置中,将下混信号和可选的残留信号提供给预去相关器601,预去相关器601导出用作去相关器的输入的四个中间信号(el 到e4),去相关器导出四个去相关后信号(dl到d4),这四个信号与 直接传输的从输入信号中导出的信号m—起形成输入参数608。可以注意到,在提供了附加的残留信号作为输入的情况下, 一般20 工作在子带域中的去相关器602可以进行简单地转发残留信号的操 作,而不是导出去相关后信号。仅对于特定频带,这也可以频率选择 方式来进行。在2到5配置中,输入信号605包括左通道、右通道和可选的残 留信号。在该配置中,除了两个中间通道(el, e2),预去相关器矩阵 25601还导出左、右和中央通道。因此,至混合矩阵603的输入信号由 左通道、右通道、中央通道和两个去相关后信号(dl和d2)形成。在另一修改方案中,预去相关器矩阵可以导出用作去相关器(D5) 的输入的附加中间信号(e5),去相关器的输出是从信号(e5)导出的 去相关后信号(d5)与去相关后信号(dl和d2)的组合。在这种情况 30下,可以确保在中央通道与左和右通道之间的附加的去相关。本发明的音频解码器600在2到5配置中实施本发明的构思。所 传输的参数表示用在预去相关矩阵601和混合矩阵603中。这里,可 以采用如图5详细示出的不同方式来实现本发明构思。图5在原理上简略示出了实现为预去相关器矩阵601和混合矩阵 5603的预去相关器,省略了多通道音频解码器600的其他组件。用于执行预去相关和混合的矩阵具有表示时隙(即,信号的各个 时间采样)的列和表示不同参数带的行,即,每一行与音频信号的一 个参数带相关联。根据本发明构思,矩阵601和603的矩阵元素只有一部分是从所 10传输的参数数据中导出的,剩余的矩阵元素由解码器基于例如下混信 号的知识而导出。图5示出了一个示例,其中在给定的频率边界线622 以下,根据从比特流读取的参数620,即基于从解码器传输的信息, 导出预去相关器矩阵601和混合矩阵603的元素。在该频率边界线622 以上,在解码器中只基于下混信号的知识来导出矩阵元素。 15 可以根据对于特定应用场景而必须满足的质量和/或比特率约束, 自由地调整边界频率(或一般而言从所传输数据中导出的矩阵元素 的量)。对于在此描述的新颖编码方法,优选的是可以采用MPEG Spatial Audio Coding Reference Model 0 (MPEG空间音频编码参考模型0)中 20 描述的相同结构来执行无辅助信息的上混处理。本发明可以在于描述 了无辅助信息的上混方法,但是优选地提供了将该构思与借助于辅助 信息的上混方法进行无缝和有利组合的方法。与MPEG Spatial Audio Coding Reference Model 0相反,在无辅助信息的上混处理中,优选的是不从比特流中传输的数据中导出矩阵 25Ml (601)和M2 (603)的元素,而是通过不借助于辅助信息的不同手段,例如,通过应用只基于从下混信号中获得的知识的启发式规则。 这样,可以通过基于所传输参数只获取矩阵的一部分,并应用无辅助信息的方法的规则来填充剩余部分,在比特率和声音质量方面均实现两种技术之间的逐渐缩放。从构思上讲,这对应于传输针对特定 30矩阵部分的空间参数,而在解码器端产生其他部分的空间参数。可以采用多种不同方式来确定要从上述一种方法或另一种方法中 导出的矩阵部分,例如*通过一种方法导出给定水平边界线以下的矩阵部分,并通过另 —方法导出该边界线以上的部分; 5 *通过一种方法导出给定垂直边界线左边的矩阵部分,并通过另一方法导出该边界线右边的部分; *在两个矩阵中确定任意时间频率片,其中的元素通过一种方法导出,并通过另一方法导出剩余时间频率片的元素。 上文中详细描述了如下方法是有利的用空间参数描述多通道信 10 号中特定边界频率以下的所有频率部分,而不用空间参数表示多通道 信号的剩余频率部分。这考虑到人耳的特性相比于较高频率,对较 低频率的感知更好。当然,无论如何,本发明也不局限于将多通道信 号划分成第一部分和第二部分,因为以更高精度描述信号的更高频率 部分也可以是有利或适当的。当在较低频率区中信号只包含非常少的 15 能量时尤其如此,因为大部分能量包含在音频信号的高频域中。由于 屏蔽效应,低频部分将主要由高频部分支配,从而有利地提供了对信 号的高频部分的迸行高质量再现的可能性。依据本发明方法的特定实施要求,可以采用硬件或软件来实现本 发明方法。可以使用数字存储介质来执行该实现方式,具体是使用存20储有电可读控制信号的盘、DVD或CD,其与可编程计算机系统协作,以执行本发明方法。因此,本发明通常是计算机程序产品,其具有存 储在机器可读载体上的程序代码,当计算机程序产品在计算机上运行 时,该程序代码用于执行本发明方法。换言之,本发明方法是具有程 序代码的计算机程序,当计算机程序在计算机上运行时,它执行至少25 —种本发明方法。虽然参照具体实施例详细示出并描述了上述内容,但是本领域技 术人员将理解,在不背离本发明精神和范围的前提下可以进行形式和 细节上的多种其他改变。要理解,在不背离这里公开的以及根据所附 权利要可理解的更宽构思范围的前提上,可以进行多种改变,以适应30 不同的实施例。
权利要求
1.一种多通道音频解码器,用于处理音频信号并处理第一参数数据,所述第一参数数据描述多通道信号的第一部分,其中对于所述多通道信号的第二部分,不处理参数数据或处理第二参数数据;当描述所述多通道信号的相同部分时,第二参数数据需要的信息单元比第一参数数据的少,所述解码器包括处理器,用于从所述音频信号中导出中间信号,使用第一导出规则来导出所述中间信号的第一部分,所述中间信号的第一部分对应于所述多通道音频信号的第一部分,其中第一导出规则依据第一参数数据;以及使用第二导出规则来导出所述中间信号的第二部分,第二导出规则不使用参数数据或使用第二参数数据。
2 据,所述第一参数数据描述多通道信号的第一部分,其中对于所述多通道信号的第二部分,不处理参数数据或处理第二参数数据;当描述 所述多通道信号的相同部分时,第二参数数据需要的信息单元比第一 参数数据的少,所述解码器包括处理器,用于从所述音频信号中导出中间信号, 10 使用第一导出规则来导出所述中间信号的第一部分,所述中间信号的第一部分对应于所述多通道音频信号的第一部分,其中 第一导出规则依据第一参数数据;以及使用第二导出规则来导出所述中间信号的第二部分,第二导 出规则不使用参数数据或使用第二参数数据。 15 2.根据权利要求1所述的多通道音频解码器,用于处理对所述多通道信号的时间部分或频率部分进行描述的第一参数数据。
3.根据权利要求1所述的多通道音频解码器,用于处理包括所述 多通道音频信号的时间部分的描述的第一参数数据,其中所述描述内 只包含所述多通道音频信号的预定频率带有关的信息。
4.根据权利要求1所述的多通道音频解码器,其中所述处理器用于使用第一导出规则来导出所述中间信号的、范围从低频限到高频限 的频率部分。
5.根据权利要求4所述的多通道音频解码器,用于附加地处理对至少所述高频限进行信号通知的窗口信息。 25 ÷
6.根据权利要求4所述的多通道音频解码器,用于使用窗口估计规则从第一参数数据中至少导出所述高频限。
7.根据权利要求6所述的多通道音频解码器,其中所述窗口估计 规则包括对针对下混信号的信号部分而提交的参数数据的量进行计 数,并将所计数的参数数据量与额定的参数数据量相比较。
8. 根据权利要求1所述的多通道音频解码器,其中所述处理器用 于根据下混信号有关的信息或根据第二参数数据来计算第二导出规
9. 根据权利要求1所述的多通道音频解码器,其中所述处理器用 5 于使用预定规则作为第二导出规则。
10. 根据权利要求1所述的多通道音频解码器,用于处理包括从 以下空间音频参数列表中选择的一个或更多个空间音频参数的参数数据通道间相关ICC, 10 通道电平差CLD,通道预测系数CPC。
11. 根据权利要求l所述的多通道音频解码器,还包括去相关器, 用于使用去相关滤波器从所述中间信号中导出去相关后信号。
12. 根据权利要求l所述的多通道音频解码器,还包括上混器, 15用于计算所述多通道信号的重建,使用第一上混规则来计算所述多通道信号的重建中与所述多通道 信号的第一部分相对应的第一部分,其中第一上混规则依据第一参数 数据;以及使用第二上混规则来计算所述多通道信号的重建的第二部分,第 20 二上混规则不使用参数数据或使用第二参数数据。
13. —种用于产生参数表示的多通道编码器,所述参数表示描述 多通道音频信号的空间属性,所述多通道编码器包括参数产生器,用于产生空间参数;输出接口,用于产生所述参数表示, 25 其中所述参数产生器或所述输出接口适于产生所述参数表示,以使所述参数表示包括针对所述多通道信号的第一部分的第一参数数 据,并且对于所述多通道信号的第二部分,所述参数表示中不包括参 数数据或包括第二参数数据;当描述所述多通道信号的相同部分时, 第二参数数据需要的信息单元比第一参数数据的少。
14. 根据权利要求13所述的多通道编码器,其中所述输出接口还适于在所述参数表示中包括窗口信息,所述窗口信息指示所述多通道 音频信号的第一部分。
15. 根据权利要求13所述的多通道编码器,还包括部分判决器, 5 用于使用质量准则来判决将所述多通道信号中哪一部分用作所述第一部分。
16. 根据权利要求15所述的多通道编码器,其中所述部分判决器 用于进行判决,以使使用所述参数表示的所述多通道信号的重建质量 保持在容许质量范围内。
17.根据权利要求15所述的多通道编码器,其中所述部分判决器用于进行判决,以便不超过所述参数表示消耗的存储空间的最大量。
18.根据权利要求13所述的多通道编码器,还包括下混器,用于 从所述多通道信号中导出下混信号;以及 所述输出接口还适于输出所述下混信号。 15
19.根据权利要求18所述的多通道编码器,其中所述参数产生器用于产生针对所述多通道信号的第一部分和第二部分的空间参数全 集;所述下混器用于使用依据所述空间参数全集的全下混规则来导出 所述下混信号;以及 20 所述输出接口用于至少使用与所述多通道信号的第一部分相对应 的空间参数,产生所述参数表示。
20. —种用于处理音频信号并处理第一参数数据的方法,所述第 一参数数据描述多通道信号的第一部分,其中对于所述多通道信号的 第二部分,不处理参数数据或处理第二参数数据;当描述所述多通道 25信号的相同部分时,第二参数数据需要的信息单元比第一参数数据的 少,所述方法包括从下混信号中导出中间信号,使用依据第一参数数据的第一导出 规则以导出所述中间信号的第一部分,所述中间信号的第一部分对应 于所述多通道音频信号的第一部分;以及使用第二导出规则导出所述中间信号的第二部分,第二导出规则 使用第二参数数据或不使用参数数据。
21. —种用于产生参数表示的方法,所述参数表示描述多通道音 频信号的空间属性,所述方法包括5 产生空间参数;以及产生所述参数表示,以使所述参数表示包括针对所述多通道信号 的第一部分的第一参数数据,并且对于所述多通道信号的第二部分, 所述参数表示中不包括参数数据或包括第二参数数据;当描述所述多 通道信号的相同部分时,第二参数数据需要的信息单元比第一参数数 10 据的少。
22. —种对多通道音频信号的空间属性进行描述的参数表示,所 述参数表示包括针对所述多通道信号的第一部分的第一参数数据,并 且对于所述多通道信号的第二部分,不包括参数数据或包括第二参数 数据;对于所述多通道信号的相同部分,第二参数数据需要的信息单15 元比第一参数数据的少。
23. 根据权利要求23所述的参数表示,其存储在计算机可读存储 介质上。
24. —种具有程序代码的计算机程序,当在计算机上运行时,所 述程序代码执行一种用于处理音频信号并处理第一参数数据的方法,20 所述第一参数数据描述多通道信号的第一部分,其中对于所述多通道 信号的第二部分,不处理参数数据或处理第二参数数据;当描述所述 多通道信号的相同部分时,第二参数数据需要的信息单元比第一参数 数据的少,所述方法包括-从下混信号中导出中间信号,使用依据第一参数数据的第一导出 25规则以导出所述中间信号的第一部分,所述中间信号的第一部分对应 于所述多通道音频信号的第一部分;以及使用第二导出规则导出所述中间信号的第二部分,第二导出规则 使用第二参数数据或不使用参数数据。
25. —种具有程序代码的计算机程序,当在计算机上运行时,所 30述程序代码执行一种用于产生参数表示的方法,所述参数表示描述多通道音频信号的空间属性,所述方法包括 产生空间参数;以及产生所述参数表示,以使所述参数表示包括针对所述多通道信号 的第一部分的第一参数数据,并且对于所述多通道信号的第二部分, 5 所述参数表示中不包括参数数据或包括第二参数数据;当描述所述多 通道信号的相同部分时,第二参数数据需要的信息单元比第一参数数 据的少。
26. —种使用空间参数来产生多通道音频信号的参数表示的代码 转换器,所述参数表示描述多通道音频信号的空间属性,所述代码转 10 换器包括参数产生器,用于产生所述参数表示,以使所述参数表示包括从 空间参数中导出的针对所述多通道信号的第一部分的第一参数数据, 并且对于所述多通道信号的第二部分,所述参数表示中不包括参数数 据或包括第二参数数据;当描述所述多通道信号的相同部分时,第二 15 参数数据需要的信息单元比第一参数数据的少。
全文摘要
本发明的目的是通过逐渐改善上混信号的声音、同时将辅助信号所消耗的比特率从0提高到参数方法的比特率,消除参数多通道音频编码和矩阵环绕多通道编码之间的差距。具体而言,本发明提供了一种在矩阵环绕(无辅助信息,有限音频质量)与全参数重建(需要全参数信息速率,高质量)之间的某处灵活地选择“工作点”的方法。取决于各个应用,可以动态(即,时间上变化)并响应于可允许的辅助信息速率来选择该工作点。
文档编号G10L19/00GK101223578SQ200680025974
公开日2008年7月16日 申请日期2006年6月21日 优先权日2005年7月19日
发明者克里斯托弗·法勒, 卡斯滕·林茨迈尔, 拉尔夫·施佩尔施奈德, 约翰内斯·希尔珀特 申请人:弗劳恩霍夫应用研究促进协会;杰尔系统有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1