产生编码多通道信号的设备和方法、对编码多通道信号进行解码的设备和方法

文档序号：2829190阅读：372来源：国知局

专利名称：产生编码多通道信号的设备和方法、对编码多通道信号进行解码的设备和方法
技术领域：
本发明涉及参数音频多通道处理技术，具体涉及当存在可用于重建的多个不同参数集时对参数辅助信息的高效配置。
背景技术：
除了两个立体声通道之外，所推荐的多通道环绕表征还包括中央通道C和两个环绕通道，即左环绕通道L和右环绕通道R，此外，如果可应用，则还包括称作LFE通道(LFE＝低频增强)的超低音扬声器通道。这种参考声音格式也称作3/2(加LFE)立体声，近来也称作5.1多通道，表示有三个前通道、两个环绕通道和一个LFE通道。一般而言，这种所推荐的多通道环绕表征需要5或6个传输通道。在再现环境中，5个各自不同的位置上至少需要5个扬声器，以获得与5个正确放置的扬声器相隔确定距离的最优的所谓最佳听音位置。然而，相对于超低音扬声器的定位，可以相对自由地使用超低音扬声器。
已有多种技术用于减少传输多通道音频信号所需的数据量。这些技术也称作联合立体声技术。为此参考图5。图5示出了联合立体声设备60。例如，这种设备可以是实现强度立体声技术(IS技术)或技术心理声学编码(BCC)的设备。这种设备一般接收至少两个通道(CH1、CH2、...CHn)作为输入信号，并输出至少一个单载波通道(缩混)和参数数据(即，一个或多个参数集)。对参数数据进行定义，从而可以在解码器中计算每个原始通道(CH1、CH2、...CHn)的近似。
通常，载波通道将包括子带采样、频谱系数或时域采样等，提供了下层(underlying)信号的相对精细的表征，而参数数据和/或参数集不包括任何这种采样或频谱系数。取而代之的是，参数数据包括用于对诸如乘法加权、时移、频移等确定的重建算法进行控制的控制参数。因此，参数数据只包括信号或关联通道的相对粗略的表征。当以数字表达时，载波通道所需的数据量在60到70kbit/s的范围中，而参数辅助信息所需的数据量在每通道1.5kbit/s的量级上。参数数据的一个示例是如将在以下描述的公知的缩放因子、强度立体声信息或技术心理声学参数。
在AES preprint 3799中由J.Herre，K.H.Brandenburg和D.Lederer所著的题为“Intensity stereo coding”，1994年2月，Amsterdam中描述了强度立体声编码技术。一般而言，强度立体声的概念基于要应用于两个立体声音频通道数据的主轴变换。如果将大多数数据点设置在第一主轴周围，则可以通过在编码之前将两个信号均旋转确定角度来实现编码增益。但是，这并不总是适用于实际立体声再现技术。左和右通道的重建信号包括相同传输信号的不同加权或缩放的版本。虽然重建信号在幅度上不同，但是相对于相位信息是相同的。但是，两个原始音频通道的能量时间包络是通过典型地以频率选择形式而操作的选择性缩放操作来保持的。这与高频上的人类声音感知相对应，在高频上，主导空间提示由能量包络确定。
此外，在实际实现中，传输信号(即，载波通道)由左通道和右通道的和信号形成，而不是通过旋转两个分量来形成。此外，以频率选择方式，即，针对每个缩放因子频带(即，针对每个编码器频率部分)彼此独立，来执行这种处理(即，用于执行缩放操作的强度立体声参数的产生)。优选地，将两个通道组合，形成组合或“载波”通道。除了组合通道之外，对强度立体声信息进行确定还取决于第一通道的能量、第二通道的能量和组合或和通道的能量。
在AES convention paper 5574中的C.Faller和F.Baumgarte所著的题为“Binaural cue coding applied to stereo and multi-channel audiocompression”，2002年5月，München中描述了BCC技术。在BCC编码中，使用具有交迭窗的基于DFT的变换，将多个音频输入通道转换为频谱表征。将得到的频谱划分为非交迭部分。每个部分具有与等效矩形带宽(ERB)成比例的带宽。针对每个部分，即，针对每个频带和针对每一帧k(即，时间采样块)，来计算所谓的通道间电平差(ICLD)和所谓的通道间时间差(ICTD)。对ICLD和ICTD参数进行量化和编码，以获得BCC比特流。通道间电平差和通道间时间差是相对于参考通道而给予每个通道的。具体地，取决于要处理信号的特定划分，根据预定公式计算参数。
在解码器侧，解码器接收单声道信号和BCC比特流(即，针对通道间时间差的第一参数集和针对通道间电平差的第二参数集)。将单声道信号变换到频域，并输入到也接收已解码的ICLD和ICTD值的合成块中。在合成块或重建块中，使用BCC参数(ICLD和ICTD)执行对单声道信号的加权操作，以重建多通道信号，然后，在经过频率/时间转换之后，多通道信号代表原始多通道信号音频信号的重建。
在BCC的情况下，联合立体声模块60进行操作，以输出通道辅助信息，从而将参数通道数据量化和编码为ICLD和ICTD参数，其中原始通道之一可以用作对通道辅助信息进行编码的参考通道。通常，载波通道由参与原始通道之和形成。
当然，上述技术只为仅能够对载波通道进行解码的解码器提供了单声道表征，而无法产生用于生成多于一个输入通道的一个或多个近似的参数数据。
在美国专利申请US 2003/0219130 A1、2003/0026441 A1和2003/0035553 A1中也描述了称作BCC技术的音频编码技术。此外，见C.Faller和F.Baumgarte所著的“Binaural Cue Coding.Part.IISchemes and Applications”，IEEETransactions on Audio and SpeechProc.，Vol.11，No.6，1993年11月。此外，还见C.Faller和F.Baumgarte所著的“Binaural Cue Coding applied to Stereo and Multi-Channel Audiocompression”，Preprint，112thConvention of the Audio EngineeringSociety(AES)，2002年5月，以及J.Herre，C.Faller，C.Ertel，J.Hilpert，A.Hoelzer和C.Spenger所著的“MP3 SurroundEfficient andCompatible Coding of Multi-Channel Audio”，116thAES Convention，Berlin，2004，Preprint 6049。在下文中，将参考图6到8，更加详细地描述用于多通道音频编码的典型通用BCC方案。图6示出了用于多通道音频信号的编码/传输的通用BCC编码方案。在BCC编码器112的输入110处输入多通道音频输入信号，并在所谓的缩混块114中对其进行“缩混”，即，转换为单个和通道。在本示例中，输入110处的信号是5通道环绕信号，具有前左通道和前右通道、左环绕通道和右环绕通道、以及中央通道。典型地，缩混块通过将这5个通道简单地相加成单声道信号，来产生和信号。其它缩混方案在本领域中是公知的，所有方案均使用多通道输入信号来产生具有单通道或具有多个缩混通道的缩混信号，其中，缩混通道的数目无论如何都少于原始输入通道的数目。在本示例中，如果从5个输入通道中产生四个载波通道，则已实现了缩混操作。在和信号线路115上输出单个输出通道和/或多个输出通道。
在辅助信息线路117上输出由BCC分析块116获得的辅助信息。在BCC分析块中，可以计算ICLD、ICTD或通道间相关值(ICC值)的参数集。因此，在BCC合成块122中有用于重建的多达3个的不同参数集(ICLD、ICTD和ICC)。
典型地，和信号以及具有参数集的辅助信息以量化和编码的格式传输到BCC解码器120。BCC解码器将所传输的和信号分为多个子带，并执行缩放、延迟和进一步处理，以产生要重建的多个通道的子带。执行这种处理，从而输出121处的重建多通道信号的ICLD、ICTD和ICC参数(提示)与在输入110处进入BCC编码器112的原始多通道信号的各个提示(cue)类似。为此，BCC解码器120包括BCC合成块122和辅助信息处理块123。
下文将参考图7示出BCC合成块122的内部结构。将线路115上的和信号输入典型地实现为滤波器组FB 125的时间/频率转换块中。在块125的输出处，有N个子带信号，或者在极端情况下，如果音频滤波器组125执行从N个时域采样中产生N个频谱系数的变换，则有频谱系数块。
BCC合成块122还包括延迟级126、电平修正级127、相关处理级128和代表逆滤波器组的级IFB 129。例如，如图6所示，在级129的输出处，在5通道环绕系统的情况下，具有5个通道的重建多通道音频信号可以在一组扬声器124上输出。
图7进一步示出了通过元件125将输入信号s(n)转换到频域或滤波器组域。如节点130所示，使元件125输出的信号翻倍，以获得相同信号的多个版本。原始信号的版本数目等于要重建的输出信号中的输出通道的数目。如果在节点130处使原始信号的每个版本经历确定的延迟d1、d2、...di、dN，则结果是块126的输出处的情况，包括相同信号的但具有不同延迟的版本。延迟参数由图6中的辅助信息处理块123来计算，并如由BCC分析块116所确定的通道间时间差而推导出来。
这同样适用于乘法参数a1、a2、...ai、aN，它们也由辅助信息处理块123基于由BCC分析块116所确定的通道间电平差来计算。
ICC参数由BCC分析块116来计算，并用于控制块128的功能，从而在块128的输出处获得在经延迟和电平处理过的信号之间的所确定的相关值。要注意，级126、127和128的顺序可以不同于图7中所表示的。
还要注意，在音频信号的逐块处理中，BCC分析也是逐块执行的。此外，BCC分析也是逐频率执行的，即，以频率选择方式。这表示对于每个频带，都具有ICLD参数、ICTD参数和ICC参数。因此，穿过所有频带的至少一个通道的ICTD参数代表ICTD参数集。这同样适用于代表用于重建至少一个输出通道的所有频带的所有ICLD参数的ICLD参数集。这同样适用于ICC参数集，ICC参数集再次包括用于基于输入通道或和通道来重建至少一个输出通道的各个频带的多个单独的ICC参数。
在下文中，参考图8，图8示出了从中可以看到BCC参数的确定的情况。通常，可以在通道对之间定义ICLD、ICTD和ICC参数。但是，典型地，在参考通道与每个其它输入通道之间执行ICLD和ICTD参数的确定，从而对于每个输入通道均有独特的参数集。这也在图8B中示出。
但是，可以对ICC参数进行不同的定义。一般而言，如也在图8B中示意性示出的，在编码器中，可以在任何通道对之间产生ICC参数。在这种情况下，解码器将执行ICC合成，从而在任何通道对之间获得与原始信号中呈现的近似相同的结果。但是，建议在任何时间(即，针对每个时间帧)仅仅计算两个最强通道之间的ICC参数。图8C中表示本方案，示出了如下示例在一个时间上计算并传输通道1与2之间的ICC参数，在另一时间上计算通道1与5之间的ICC参数。然后，解码器对解码器中两个最强通道之间的通道间相关进行合成，并进一步执行启发式规则，以对剩余通道对的通道间相干进行合成。
例如，对于基于所传输的ICLD参数对乘法参数a1、...、aN的计算，参考所引用的AES convention paper 5574。ICLD参数代表原始多通道信号中的能量分布。不失一般性，图8A示出了在所有其它通道与前左通道之间有四个代表能量差的ICLD参数。在辅助信息处理块123中，从ICLD参数中推导出乘法参数a1、...、aN，从而所有重建输出通道的总能量是与所传输的和信号所呈现的相同的能量，或至少与该能量成比例。确定这些参数的一种方式是两级过程，其中，在第一级中，将左前通道的乘法因子设为1，而将图8C中其它通道的乘法因子设为所传输的ICLD值。然后，在第二级中，计算所有5个通道的能量，并将其与所传输的和信号的能量比较。接着，缩减所有通道，即，针对所有通道使用相等的缩放因子，其中，选择缩放因子，以使缩放之后的所有重建输出通道的总能量等于所传输的和信号和/或多个所传输的和信号的总能量。
对于从BCC编码器传输到BCC解码器、作为进一步的参数集的通道间相干测量ICC，要注意，可以通过对乘法因子的修正来执行相干处理，例如，将所有子带的加权因子乘以具有在20log10-6和20log106之间的值的随机数。典型地，选择伪随机序列，从而所有临界带的方差近似相等，并且每个临界带内的平均值为0。相同的序列用于每个不同帧或块的频谱系数。因此，通过对伪随机序列的方差的修正来控制音频场景的宽度。较大的方差产生较大的听觉宽度。可以在具有临界带宽度的单独的频带中执行方差修正。这允许听觉场景中同时存在多个对象，其中，每个对象具有不同的听觉宽度。伪随机序列的适合的幅度分布是对数尺度上的均匀分布，例如在美国专利公开2002/0219130 A1中所述的。
为了以兼容方式(例如，以也适合于正常立体声解码器的比特流格式)传输5个通道，可以使用G.Theile和G.Stoll所著的“MUSICAMSurroundA universal multi-channel coding system compatible withISO/IEC 11172-3”，AES Preprint，1992年10月，San Francisco中所述的所谓矩阵技术。
此外，见出版物中的B.Grill，J.Herre，K.H.Brandenburg，I.Eberlein，J.Koller和J.Miller所著的“Improved MPEG 2 Audiomulti-channel encoding”，AES Preprint 3865，1994年2月，Amsterdam中所述的多通道编码技术，其中，兼容性矩阵用于从原始输入通道中获得缩混通道。
总之，可以说BCC技术允许对多通道音频材料的高效并且向后兼容的编码，例如，如由E.Schuijer，J.Breebaart，H.Purnhagen和J.Engdegrd所著的专家出版物“Low-Complexity Parametric StereoCoding”，119thAES Convention，Berlin，2004，Preprint 6073中所述的。在这种环境下，也应该提及MPEG-4标准，特别是对参数音频技术的扩展，其中，该标准部分也是通过名称ISO/IEC 14496-32001/FDAM2(Parametric Audio)而公知的。在这方面，特别应该提及在MPEG-4标准的表8.9中名为“syntax of the ps_data()”的句法。在本示例中，应该提及句法元素“enable_icc”和“enable_ipdopd”，其中，这些句法元素用于开启和关闭ICC参数和与通道间时间差相对应的相位的传输。还应该提及句法元素“icc_data()”、“ipd_data()”和“opd_data()”。
总之，要注意一般采用一个或多个所传输的载波通道来使用这种参数多通道技术，其中，从N个原始通道中形成M个所传输的通道，以再次重建N个输出通道或K个输出通道，其中，K等于或小于原始通道的数目N。
至今，上述所有技术中的问题在于，如何在用于多通道解码的不同类型的解码器之间创建格式兼容性，例如，对于BCC解码器和参数辅助信息的不同版本。特别地，当市场上存在不同的多通道解码器，而同时具有由不同的多通道解码器产生的不同参数集的辅助信息在市场上、并因此对于只有单个解码器的用户可用时，会出现两个问题。
首先，用户希望拥有在解码时提供最优多通道声音质量的高计算能力的解码器。然而，同时，也会有在有限资源条件下进行操作的解码器，例如，移动设备(如，移动电话)中的解码器。当然，这种解码器应该提供具有仍尽可能良好的质量的多通道输出，但是也应该只具有有限的计算能力。这导致的问题是是否能够存在具有用于支持这种可缩放性(即，允许具有高复杂度并因此质量最优的解码、以及具有降低的复杂度但也具有相应降低的质量的解码)的空间重建的参数集的比特流格式。
当引入BCC编码器以及BCC比特流的新产生/版本时要考虑的另一方面是如何保持BCC比特流与BCC解码器的不同版本之间的兼容性的问题。换言之，希望新的BCC参数集以及更新的旧参数集是向后兼容的。因此，当然希望为BCC用户提供升级途径，这些用户在新的改进多通道方案随着技术发展而可用时允许引入新方案。另一方面，新的BCC比特流格式通常导致了在这些比特流与多种(较旧)BCC解码器版本之间的不兼容。
尤其要注意，多通道编码器/解码器将用于越来越多的应用领域，其中，最大计算能力不是必须可用的，而且也不总是必须要求全声音质量的。

发明内容
本发明的目的是提供一种高效灵活的构思，即，例如，所述构思允许对新参数集或旧参数集的更新进行结合，同时，可以灵活地用于多种不同应用。
本目的通过以下实现根据权利要求1的产生编码多通道信号的设备、根据权利要求15的对编码多通道信号进行解码的设备、根据权利要求21的产生编码多通道信号的方法、根据权利要求22的对多通道信号进行解码的方法、或者根据权利要求23的计算机程序。
本发明基于如下发现当将编码多通道信号编写为不仅包括至少一个传输通道或载波通道、还包括至少两个不同的参数集的数据流时，实现了对编码多通道信号的高效和向后兼容的解码，其中，将所述两个参数集写入数据流中，从而可以使用少于所述至少两个的参数集来执行输出通道的重建。根据本发明，编写数据流，从而解码器可以识别参数集中的哪一个是重建所需的，哪个参数集对于重建是可选地需要的。在这种情况下，如果外部环境要求，则解码器可以只使用重建不可缺少(即，强制性的)的参数集，并简单地忽略可选参数集。这样的结果是，当只使用重建强制需要的参数集时，解码器较快速并以有限的计算能力来进行管理，同时，另一解码器可以基于代表编码多通道信号的相同数据流，来执行高质量的多通道重建，但是，这也要求更多时间和/或更强计算能力和/或，更一般地讲，更多的解码器资源。
在本发明的优选实施例中，强制性参数集是包括通道间电平差的参数集。如已根据本发明所发现的，这些通道间电平差对于定义所有类型的再现情况下输出通道之间的基本多通道声音分布是极其重要的。通道间时间差可以分类为可选参数集，这是因为当要有通过头戴式耳机(即，来自一个传输通道的两个输出通道)的呈现、或当多通道音频表征发生在所谓的相对“干”的声学情况(即，几乎不包括回音的声学情况)下时，通道间时间差主要是相关的。因此，可以将通道间时间差分类为可选参数集。
通道间相关值在以下方面是重要的提供声源宽度，并针对用户进一步产生他或她处于具有复杂声源的场景中的印象，该场景包括许多不相关的声音分量，例如是古典交响乐团。因此，也可以将ICC参数集分类为可选参数集，这是因为ICC参数集明显对质量具有重要影响，但是，在重建中，ICC参数集通常导致了相对大的计算量，例如，这种计算量在通道间电平差的强制性参数集中并不是特别重要，这是因为实质上只需要加权操作，即，相对于计算可以高效地执行的乘法运算。
对于数据流中参数集的对编码多通道信号的向后兼容性的问题，例如，将具有更高版本号的参数集写入数据流中，从而无需这种参数集而实现由解码器进行的重建，结果，当确立了编码器无法处理第二参数集时，解码器将会仅使用第一参数集用于重建，并简单地跳过第二参数集。
在解码器侧，这表示当解码器已将该参数集识别为强制性参数集时，解码器必须完全地读取参数集并对其进行处理，然而，当解码器遇到对于重建不是强制性(即，标记为可选)的参数集时，解码器将简单地跳过比特流中属于该参数集的比特。因此，解码器不必具有关于第二参数集句法的任何知识，以能够处理编码多通道信号，而可以简单地跳过这部分，并简单地继续处理可能仍是重建所需的编码多通道信号的后续区域。
优选地，将长度信息插入标记为可选的参数集的数据流中，这允许解码器以快速和高效的方式简单地跳过与该参数集相关联的比特，并仅采用标记为强制性的参数集来进行解码。对于向后兼容性，优选的是，版本号与至少每个可选参数集相关联，该版本号由产生该参数集的编码器版本指定。因此，例如，在数据流中，最低版本的通道间电平差的参数集将标记为强制性的，而之后的编码器版本的通道间电平差的参数集获得了另一版本号，从而当确立了解码器无法处理具有更高版本号的参数集时，解码器将简单地使用具有较低版本号的相应参数集来进行重建。
最后，要注意，代表多通道信号的数据流不必也必须包含传输通道。取而代之地，如在将BCC参数编写到CD、之后进入相应通道的情况下(其中，CD已包含M(等于或大于1)个传输通道)，传输通道可以是已经产生并独立传输的。

下文中将参考附图详细解释本发明的优选实施例，其中图1a是根据本发明实施例、具有确定的数据流句法的编码多通道信号的概观图；
图1b是根据本发明实施例的图1a的控制块的具体表征；图2a是根据本发明实施例的编码器的电路框图；图2b是根据本发明实施例的解码器的电路框图；图3a到3d示出了根据本发明的参数集配置的优选实现方式；图4a到4c示出了根据本发明的参数集数据的优选实现方式；图5示出了多通道编码器的一般表征；图6是BCC编码器/BCC解码器路径的示意性框图；图7是图6的BCC合成块的电路框图；以及图8A到8C示出了参数集ICLD、ICTD和ICC的计算的典型场景的表征。
具体实施例方式
图2a示出了用于产生编码多通道信号的设备的优选实现方式，其中，编码多通道信号代表包括N个原始通道的未编码多通道信号，它们馈入装置22的输入20，装置22用于提供M个传输通道和具有至少两个参数集的参数信息。特别地，在装置22的输出23处输出的传输通道的数目M小于原始音频通道的数目N。将共同代表用于重建K个输出通道的参数信息的单独参数集施加于提供装置22的输出24a、24b、24c处。将M(其中M等于或大于1并小于N)个传输通道提供给用于编写输出侧的数据流的装置25，并将数据流施加于输出26处，就像在输出24a、24b、24c处的参数集一样。
如上所述，可以与参数信息分离地传输/存储缩混信息(M个传输通道)。
将用于编写代表编码多通道信号的数据流的装置25设计为将M个传输通道写入数据流，并进一步将第一、第二和第三参数集写入数据流，从而可以在不使用三个参数集之一、以及优选地甚至不使用三个参数集中的至少两个的情况下，进行对K个输出通道的重建。在这方面，对提供装置22的输出24a至24c处的参数集进行标记，以使一个参数集(如，第一参数集)绝对是重建所需的，而将其它两个参数集(即，第二参数集和第三参数集)定义为对于重建只是可选地需要的。
接着，如下所述，编写装置25将会把第一参数集作为强制性参数集写入数据流，并将会把第二参数集和第三参数集仅作为可选参数集写入数据流。
将图2a的输出26处的数据流馈入图2b所示的多通道解码器的数据流输入27。向读取数据流的装置28提供数据流的数据，其中，如图2a中所示的编码器一样，读取数据流的装置28也包括针对从数据流中提取的M个传输通道的逻辑输出29、以及针对数据流中包含的参数集的其它逻辑输出30a、30b。在将第一参数集标记为强制性或重建绝对需要的本发明的优选实施例中，读取装置28将会通过逻辑输出30a向重建装置31提供该第一参数集。例如，如果将读取装置28固定地设置为仅读取强制性参数集并将其提供给重建装置31，则装置28将会简单地跳过输入27处的数据流中的第二参数集，这由图2b中的中断逻辑输出30b象征性地表示。
也可以通过控制输入32向装置28提供如下控制仅从数据流中提取强制性参数集并提供给装置31，还是再附加地提取可选参数集并提供给装置31，其中，从中推导出的资源可用性信息和/或控制信息通过控制输入32而到达。
例如，资源可用性信息可以包括电池供电的解码器确立还有足够电池电能可用，从而指示读取数据流的装置28不但提取强制性参数集，还提取可选参数集，并通过相应的逻辑输出提供给重建装置31，从而，这意味着重建装置31在输出33处提供了K个输出通道，其中，K等于或小于图2a的输入20处的原始输入通道的原始数目N。要注意，优选的是数目K等于数目N，这是因为解码器将可能希望产生在数据流中编码的所有输出通道。
用于读取数据流的数据流读取装置28也操作以读入至少第一参数集，并能够在利用数据流中的可缩放性(即，在数据流中的参数集不用于重建)时跳过至少一个参数集，例如，第二参数集。接着，重建装置31可操作以使用M个传输通道和第一参数集、但不使用第二参数集来重建K个输出通道。
在本发明的实施例中，提供装置22是BCC编码器，该BCC编码器接收N个原始通道，并在输出侧提供M个传输通道和单独的参数集。可选地，提供装置22也可以是所谓的比特流代码转换器，它在输入侧接收例如由图7的元件114和116产生的、已经以非缩放格式(仅有参数集、或连同传输通道的参数集)编写的信息，并指示编写装置25相应地重写比特流，从而将参数集以可缩放形式写入数据流。这表示，为了能够理解数据流，解码器不必读入并解析数据流的所有数据，但是可以在检测到可选参数集时跳过与可选参数集相关联的数据。
因此，对于具有可缩放参数集的数据流的实际编写，存在多种可能性。在一个实施例中，根据固定数据流光栅(raster)，可以设置参数集的数据的开始。在这种情况下，与可选参数集相关联的长度信息的传输不是强制性的。但是，该固定光栅可能会通过填充比特来人为地导致扩大数据流的数据量。因此，优选地，将长度信息与每个可选参数集相关联，从而当具有该信息时，解码器将会跳过可选参数集，即，将会基于长度信息来简单地跳过优选串行数据流中的特定数目的比特，然后在数据流的正确位置处(即，当新参数集和/或新信息的数据开始时)恢复读入和分析。
例如，发信号指示新参数集的开始的可选可能性在于使同步模式在具有特定比特模式(即，不对数据进行实际分析而仅根据比特模式搜索即可识别)的实际数据之前，以向解码器发出信号，通知参数集的数据在此开始，并在后续同步模式处结束。在这种情况下，当已将参数集识别为可选参数集时，解码器将寻找与可选参数集的开始处相关联的同步模式，然后在不进行解析的情况下利用同步模式之后的比特执行模式搜索，直到遇到下一同步模式。在两个同步模式之间的比特将不会用于重建，但是将会简单忽略这些比特，而发信号指示可选参数集结束的、在后续同步模式处的数据如果不属于另一可选参数集，则可以用作根据比特流句法所规定的。
在本发明的优选实施例中，将多个通道的重建所需的至少两个参数集相对于它们的感知重要性进行分类。将对于感知(即，对于重建的多通道信号的质量)最重要的参数集标记为数据流中的强制性参数集，而仅将其它参数集标记为可选参数集。例如，也可以进一步分级为强制性、可选和只是演播(studio)重建所需的参数集，以实现三级缩放步骤，而不仅仅是两级缩放步骤。要注意，因为从标记的缺失中自动地产生各个未标记的参数集的类型，所以标记强制的、或优选地标记可选参数就足够了。
图1a示出了数据流的示意性表征，在图1a所示的实施例中，数据流首先包括控制块10；其中具有M个传输通道的数据、表示为11的块；以及针对每个参数集的块12a、12b、...、12c。在本发明的优选实施例中，如图1b示意性示出的，控制块10包括各种独条的信息段。因此，控制块10中的条目100通过名为“numBccDataMand”的字段来指示强制性参数集的数目。此外，字段101指示是否有可选参数集。标记为“OptBccDataPresent”的字段用于此目的。控制块10的另一字段利用变量“numBccDataOpt”来指示可选参数集的数目。此外，块103、104和105指示针对每个参数集的参数集i的类型和/或版本号。名为“BccDataId”的字段用于此目的。字段106、107和108的另一可选序列向标记为可选的每个参数集(即，包括在可选参数集的数目之中)给出表示为“Lengthinfo”的可选长度信息。这个长度信息给出了相应的关联参数集(例如，第一参数集)的比特长度。如将在以下所述，“Lengthinfo”也可以包括与发信号指示长度(或者可选地，实际的长度规定)所需的比特数目有关的信息。
图3a至3d示出了参数集配置的优选形式。可以针对每一帧进行参数集配置，但也可以例如，针对一组帧仅进行一次参数集配置，如在包含许多帧的文件的开始处。因此，图3a在伪代码给出了可选参数集的存在和数目的定义，其中，“uimsbf”代表“无符号整数最高有效位优先”，即，代表不包括任何符号、其最高有效位首先出现在数据流中的整数。因此，例如，在控制块10的字段100中首先代表用于指定BCC数据数目的变量numBccData。
此外，字段101用于确立到底有没有任何可选参数集(optBccDataPresent)。当这完成之后，接下来，读入可选参数集的数目(numBccDataOPt)，以获得与可选参数集有关的进一步信息或所谓的“组块”(optChunkInfo)。变量numBccDataOptM1包含代表“减1”的后缀“M1”。这通过在图3d中加入“+1”来进行平衡。
图3b示出了实施例中参数集数据标识符在字段103至105中可以具有的值的概观图。因此，变量“BccDataId”可以首先包括名称，即参数类型(即，ICLD、ICTD和ICC)，并同时具有各自的版本号V1或V2。因此，在图3b中可见，数据流实际上可以同时包含第一版本V1和之后的第二版本V2的通道间电平差，其中，适于第一版本的相应解码器可以简单地将ICLD_V1读入作为强制性参数集，并可以忽略ICLD_V2；而具有较高版本号的解码器可以简单地将ICLD_V2读入作为强制性参数集，而忽略ICLD_V1，仅将其作为该场景中可选地所需参数集。可选地，可以编写数据集，从而强制性数据集总是仅以一个版本存在于数据流中。
图3c示出了可选参数集的标识。因此，在与可选参数集有关的信息中，针对每个参数集，读入图1b的参数集标识符103至105，以获得与每个可选参数集有关的信息。此外，如图3c中的命令“OptChunkLen()”所示，如果在比特流中传输参数集，则针对可选参数集，读入参数集的长度。
对于可选参数集的长度信息的确定，见图3d，图3d示出了在本发明的优选实施例中，如何从与每个可选参数集相关联的数据中读入每个可选参数集的比特长度。
图4a中示意性示出了由解码器执行的参数集读取循环。因此，利用BccData()读入图1的块12a至12c中的实际参数集数据。
图4b中示出了长度信息的读取。例如，BccDataLenBits描述了用于发信号指示组块的实际比特长度所必需的比特数目。然后，BccDataLen实际上给出了组块具有的比特长度。该两级系统一方面比较灵活，以及另一方面节省了数据，这是因为在组块的比特长度显著变化时(这尤其适用于非常不同的类型和长度的参数集)特别有效。这将会允许对具有几乎任何长度的其它组块的将来的定义。
图4c最后示出了参数集切换，其中，对如图3b所示的参数集标识符进行评估，以使参数集与相应的重建算法相关联，从而不会发生例如将通道间电平差用作通道间时间差的情况，反之亦然。
图4c还示出了当已将参数集标识为可选的，并且不希望使用可选参数集进行解码时，跳过该参数集的比特数目(“跳过并继续”)，以在已读入所有强制性参数集时(或者在存在解码器未知的数据，例如，参数集时)开始输出，而不考虑其它的可选参数集(“停止解析，开始输出”)。因此，当已经读入了至少一个强制性组块、并无法进一步解析数据流中的信息时，这种解码器将开始输出。因此，解码器不理解的数据流内容不会引起解码器的完全错误退出。这产生了非常鲁棒的解码器。
在下文中，将基于本发明的优选实施例，更加详细地描述本发明的功能。例如，在不同的和分离的数据部分中(即，在不同缩放层中)，容纳有诸如ICLD、ICTD、ICC之类的不同类型的参数信息，以及可以在将来定义的其它参数集信息。为此目的，再次参看图4a至4c。将参数集区分为诸如通道间电平差参数集之类的强制性(必须的)参数集、以及诸如通道间时间差参数集和通道间相关值参数集之类的可选参数集。
提供了与强制性参数集的数目(numBccDataMand)、以及可选参数集的存在(optBccDataPresent)和数目(numBccDataOpt)有关的信息。通常，与强制性参数集的数目(numBccDataMand)有关的信息取决于系统规范，因此不必必须进行显式地传输，但是可以在编码器和解码器之间固定地设置。相反，优选的是显式地传输可选数据集的数目(numBccDataOpt)。如图3a所示，当存在参数(optBccDataPresent)指示可选参数集的存在时，开始对与可选参数集有关的信息的相应评估。
在本发明的优选实施例中，还提供了针对每个参数集的标识符(BccDataId)。如图3b所示，该标识符提供与参数集类型(例如ICLD、ICTD或ICC)和/或特定参数集的句法版本有关的信息。通常，隐含地指示强制性参数集的标识符，而显式地指示可选参数的标识符。但是在这种情况下，必须在编码器与解码器之间设置的是例如，所遇到的第一个参数集是强制性参数集，例如，在固定设置的场景中，该参数集包括通道间电平差参数集。可选地，也可以通过规定参数集类型的顺序，来隐含地定义参数集类型信息。
优选地，参数集将会包括参数集长度信息。提供这种参数集长度信息允许解码器在甚至不必知道参数集的确切的比特流句法的情况下，通过简单地跳过关联比特来忽略该参数集。为此目的，参看图4b。
在本发明的优选实施例中，因为在任何情况下解码器都必须解析和处理与强制性参数集有关的数据，而无法简单地将其舍弃，所以强制性参数集不包括参数集长度信息。因此，可以将解码器实现为在发现参数集、并且该参数集不包含任何其它关联信息时，假设该参数集(例如ICLD)在确定可用的参数集之中，并且由于该参数集不包括任何相应的信息，所以该参数集是强制性参数集。
对于可选参数集，根据应用情况，可以传输或不传输参数集长度信息。简单的规则可以是，为了改进编码器与解码器之间的互相可操作性，所有可选参数集均包括参数集长度信息。但是，为了节省比特，对于最后的参数集，可以不传输长度信息，这是因为由于该参数集无论如何都是最后的参数集，所以不再需要跳过这些数据、以及访问随后的参数集。当如图1a所示的数据块实际上以第一参数集12c终止时，并且当随后不再有和信号块和/或刚处理过的M个传输通道的块的控制信息等时，该过程显然是有用的。
例如，根据资源可用性信息32(图2b)，显式的信号指示可以是，可由编码器通过比特流元素来动态地发信号指示参数长度信息的传输，该比特流元素向解码器通知参数集长度信息的存在/长度，这是已基于图3d示出的。
在下文中，将论述图2b所示的解码器的解码过程的优选实施例。该优选的解码器首先检查强制性(必须的)参数集的可用性，优选地，该强制性参数集将会是通道间电平差参数集。此外，当ILD参数集的句法版本号高于解码器自身能够解码的版本号时(其中，例如，解码器支持从1至n的句法版本，则图2b的重建装置31可以不进行任何重建。在所有其它情况下，可以通过对强制性参数集进行解码来进行确定形式的有效解码过程，以及当不使用可选参数集时，仅使用强制性参数集来执行多通道合成。
但是，当解码器检测到可选参数集时，解码器可以使用该参数集或舍弃其内容。例如，对两种可能性之一的选择取决于下述场景。
如果可选参数集的句法版本号高于该参数集类型的解码器自身所安装的句法版本能力，则解码器无法处理该参数集类型，并将跳过该参数集。然而在这种情况下，在不使用该可选参数集类型执行多通道重建的情况下，仍然实现了有效的解码。但是，如果可以考虑可选参数集的内容，则根据解码器的能力，将实现更高质量的重建。
例如，要注意，使用通道间相干值的合成可能占用相当大量的计算资源。因此，例如，低复杂度的解码器可以根据资源控制信息来忽略该参数集，而能够提供更高输出质量的解码器将会提取并使用所有参数集(即，强制性和可选参数集)来进行重建。在优选实施例中，基于在相应时间处(即，动态地)的计算资源的可用性，来作出使用/舍弃参数集的决定。
本发明构思在不会干扰现有解码器的可解码性的情况下，提供了兼容地更新非强制性(即，可选)参数集类型的比特流格式的可能性，即，向后兼容性。此外，本发明在任何情况下确保，当通过提高强制性参数集的句法版本号(即，ILD信息，或可选地由图3b中的字段“BccDataId”No.4所示的)来更新句法时，较旧的解码器将产生无效输出，在最坏情况下，该无效输出甚至引起扬声器的损坏。
因此，本发明构思不同于传统比特流句法，在传统比特流句法中，解码器必须知道可用在比特流中的每个参数集的全部句法，以能够在第一位置首先读入所有参数集，然后能够利用相应的参数来驱动相应的处理器元件(如那些在图7中所示的)。当仅提取了通道间电平差作为强制性参数集时，本发明的解码器将跳过块126和128，来执行多通道重建，即使该重建质量较低。
总之，下文中将再次示出编码器的本质特征，解码器可以有利地使用该特征，以使用低数据速率的数据流来实现高效和高质量的解码。
如果对于重建后的多通道信号的质量，在K个输出通道的重建中的一参数集没有另一参数集那样重要，则将编写装置25设计为对数据集进行编写，以便在不使用较不重要的数据集的情况下也可以进行重建。
优选地，还将编写装置25设计为向参数集提供关联的标识符100至105，其中，参数集的标识符指示参数集绝对必须用于重建，或者另一参数集的标识符指示参数集可以只是可选地用于重建。
优选地，编写装置25还设计为将M个传输通道写入数据流的数据集的传输通道部分11，以将第一参数集写入第一参数集部分12a，并将第二参数集写入第二参数集部分12b，从而解码器可以无需读取和解译第二参数集部分(12b)而重建K个输出通道。
如果参数集是从以下包括通道间电平差、通道间时间差、通道间相位差或通道间相干信息的组中选择的，则将编写装置25设计为将通道间电平差参数集标记为对于解码是强制性的，以及将组中的至少一个其它参数集标记为对于解码是可选的。
优选地，将编写装置25设计为向第二参数集提供用于指示属于第二参数集的数据集中数据量的长度信息106至108，从而解码器能够基于长度信息来跳过该数据量，其中，长度信息优选地包括用于信号指示长度字段的比特长度的第一字段，以及长度字段包括给出的第二参数集的比特量的比特长度。
优选地，还将编写装置25设计为将数目信息102写入数据流，用于指示可选参数集的数目，没有这些可选参数集，解码器也可以执行对K个输出通道的重建。
优选地，还将编写装置25设计为将句法版本信息103至105与参数集相关联，从而仅在句法版本信息具有预定状态时，解码器才使用相应的参数集来执行重建。
优选地，在可应用的情况下，还可以只有针对第二参数集和其它可选参数集的句法版本信息。
此外，数据流中的参数集序列中的最后的可选参数集可以不包括任何关联长度信息。
此外，可以将编写装置25设计为在数据流中动态地信号指示参数集长度信息的存在和长度。
可以将提供装置22设计为提供M个传输通道的数据块序列，这个数据块序列是基于至少一个原始通道的时间采样块序列的。
根据情况，可以在硬件或软件中实现用于产生和/或解码的本发明方法。可以在数字存储介质上进行实现，特别是在具有可以电读出的控制信号的软盘或CD上，它们可以与可编程计算机系统合作以执行该方法。一般而言，本发明还包括计算机程序产品，计算机程序产品具有存储在机器可读载体上的程序代码，当计算机程序产品运行在计算机上时，该程序代码执行所述方法。换言之，本发明可实现为具有程序代码的计算机程序，当在计算机上运行计算机程序时，该程序代码执行所述方法。
权利要求
1.一种用于产生编码多通道信号的设备，所述编码多通道信号代表包括N个原始通道的未编码多通道信号，其中，N等于或大于2，所述设备包括提供装置(22)，用于提供从M个传输通道(23)中重建K个输出通道的参数信息(24a，24b，24c)，其中，M等于或大于1并等于或小于N，K大于M并等于或小于N，所述参数信息包括用于重建同一个输出通道的至少两个不同的参数集；以及编写装置(25)，用于编写数据流(26)，其中，所述装置(25)设计用于将所述第一和第二参数集写入数据流，从而在不使用所述第二参数集和所述M个传输通道(23)中的至少一个的情况下，来进行对所述K个输出通道中的至少一个的重建。
2.一种对编码多通道信号进行解码的设备，所述编码多通道信号代表包括有N个原始通道的未编码多通道信号，其中，由包括用于从M个传输通道中重建K个输出通道的参数信息的数据流来代表所述编码多通道信号，其中，M等于或大于1并等于或小于N，K大于M并等于或小于N，所述参数信息包括用于重建同一个输出通道的至少两个不同参数集，以及将所述第一和第二参数集写入数据流，从而在不使用所述第二参数集情况下，来进行对K个输出通道的重建，所述设备包括数据流读取装置(28)，用于读取数据流，以读入所述第一参数集(30a)，并跳过所述第二参数集(30b)。
3.根据权利要求2所述的设备，还包括重建装置(32)，用于使用所述M个传输通道和所述第一参数集，但不使用所述第二参数集，来重建所述K个输出通道。
4.根据权利要求2或3所述的设备，其中，所述第一参数集包括关联句法版本信息(103至105)，以及其中，将所述读取装置(28)设计用于读取所述关联句法版本信息，并驱动所述重建装置(31)，从而仅在所读取的句法版本信息与用于解码的设备给定的句法版本信息兼容时，才由所述重建装置执行重建。
5.根据权利要求2、3或4所述的设备，其中，所述第二参数集包括关联句法版本信息(103至105)，以及所述读取装置(28)设计用于在所读取的句法版本信息与解码设备的给定句法版本信息不兼容时，跳过所述第二参数集，以及用于在所读取的句法版本信息与给定的句法版本信息兼容时，读入所述第二参数集。
6.根据权利要求2到5之一所述的设备，其中，所述第二参数集包括长度信息，用于指示关联第二参数集的数据量，以及所述读取装置(28)设计用于在不解析所述第二参数集数据的情况下，基于所述长度信息来跳过有所述长度信息所指示的数据集中的数据量。
7.根据权利要求2到6之一所述的设备，其中，所述读取装置(28)是可控制(32)来获得资源可用性信息的，以及其中，还将所述读取装置(28)设计用于当资源可用性信息指示足够的资源时，读入所述第二参数集，以及当资源可用性信息指示不足的资源时，跳过所述第二参数集。
8.根据权利要求2到7之一所述的设备，其中，相对于重建的多通道信号的质量，在K个输出通道的重建中的一个参数集没有另一参数集重要，以及将所述数据流读取装置(28)设计用于跳过较不重要的数据集。
9.根据权利要求2到8之一所述的设备，其中，所述数据流包括具有关联标识符(100至105)的参数集，参数集的标识符指示所述参数集绝对必须用于重建，或者另一参数集的标识符指示所述参数集只是可选地用于重建，将所述数据流读取装置(28)设计用于检测所述标识符，并基于所检测的标识符，来读取所述强制性参数集和跳过可选参数集。
10.根据权利要求2到9之一所述的设备，其中，所述数据流包括第一参数集部分(12a)中的第一参数集和第二参数集部分(12b)中的第二参数集，将所述数据流读取装置设计用于相对于所述参数集部分，对所述数据流进行解译，并读入所述第一参数集部分，而跳过所述第二参数集部分。
11.根据权利要求2到10之一所述的设备，其中，参数集是从包括如下的通道间电平差、通道间时间差、通道间相位差或通道间相干信息的组中选择的，在数据流中，将通道间电平差参数集标记为解码所绝对需要的，而将所述组中的至少一个其它参数集标记为解码所可选的，以及将所述数据流读取装置(28)设计用于读入所述通道间电平差参数集，并跳过所述组中的另一参数集。
12.根据权利要求2到11之一所述的设备，其中，所述数据流包括用于指示可选参数集的数目的数目信息(102)，解码器无需所述可选参数集而执行K个输出通道的重建，将所述数据流读取装置设计用于基于所述数目信息，读入至少一个可选参数集。
13.根据权利要求2所述的设备，其中，如果可用，所述数据流中有仅针对所述第二参数集和其它可选参数集的关联句法版本信息。
14.根据前述权利要求之一所述的设备，其中，所述数据流中参数集序列中的最后的可选参数集不包括任何关联长度信息，将所述数据流读取装置(28)设计用于在读入最后的可选参数集之前不读取和解译任何长度信息。
15.根据权利要求2到14之一所述的设备，其中，在所述数据流中，动态地发信号指示参数集长度信息的存在和长度，以及将所述数据流读取装置(28)设计用于首先在所述数据流中检测参数集长度信息的存在，然后基于检测到的存在，从所述数据流中提取参数集长度信息的长度。
16.根据权利要求3到15之一所述的设备，其中，所述M个传输通道是BCC缩混通道，以及所述参数集包括BCC参数，将所述重建装置(32)设计用于执行BCC合成。
17.一种用于产生编码多通道信号的方法，所述编码多通道信号代表包括N个原始通道的未编码多通道信号，其中，N等于或大于2，所述方法包括提供(22)参数信息(24a，24b，24c)，用于从M个传输通道(23)中重建K个输出通道，其中，M等于或大于1并等于或小于N，K大于M并等于或小于N，所述参数信息包括用于重建同一个输出通道的至少两个不同的参数集；以及通过将所述第一和第二参数集写入数据流(26)来编写(25)所述数据流，从而在不使用第二参数集而使用所述M个传输通道(23)中的至少一个的情况下，来进行所述K个输出通道中的至少一个的重建。
18.一种对编码多通道信号进行解码的方法，所述编码多通道信号代表包括N个原始通道的未编码多通道信号，其中，由包括用于从M个传输通道中重建K个输出通道的参数信息的数据流来代表所述编码多通道信号，其中，M等于或大于1并等于或小于N，K大于M并等于或小于N，所述参数信息包括用于重建同一个输出通道的至少两个不同参数集，将所述第一和第二参数集写入数据流，从而在不使用所述第二参数集情况下，来进行所述K个输出通道的重建，所述方法包括读取(28)数据流，以读入所述第一参数集(30a)，并跳过所述第二参数集(30b)。
19.一种具有程序代码的计算机程序，当在计算机上运行所述计算机程序时，所述程序代码执行根据权利要求17的方法或用于执行根据权利要求18所述的方法。
全文摘要
在用于产生多个不同参数集的多通道编码器中，编写(25)数据流(26)，以使两个参数集是彼此独立地可解码的，其中，所述参数集是用于使用至少一个传输通道来重建多通道输出信号的。因此，使多通道解码器能够在读取数据流时跳过标记为可选和/或具有更高版本号的参数集，并仍然能够使用标记为强制性的数据集或具有足够低的版本号的数据集，来执行有效的多通道重建。这实现了以向后兼容性和可靠性为特征的、适合将来的更新的灵活的编码器/解码器构思。
文档编号G10L19/008GK101044550SQ200580029213
公开日2007年9月26日申请日期2005年8月29日优先权日2004年9月3日
发明者于尔根·赫勒, 拉尔夫·施佩尔施奈德, 约翰内斯·希尔珀特, 卡斯滕·林茨迈尔, 哈拉尔德·波普申请人:弗劳恩霍夫应用研究促进协会

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：于尔根.赫勒;拉尔夫.施佩尔施奈德;约翰内斯.希尔珀特;卡斯滕.林茨迈尔;哈拉尔德.波普
技术所有人：弗劳恩霍夫应用研究促进协会
我是此专利的发明人