解码音频信号的方法

文档序号：2836892阅读：257来源：国知局

专利名称：：解码音频信号的方法解码音频信号的方法[
技术领域：
]本发明涉及音频信号处理，尤其涉及用于解码音频信号的装置及其方法。[
背景技术：
]一般而言，在音频信号的情形中，音频信号编码装置将音频信号压縮成单声道或立体声类型的声道縮减混音信号，而不是压縮每一个多声道音频信号。音频信号编码装置将经压縮的声道縮减混音信号与空间信息信号一起传送至解码装置，或将经压縮的声道縮减混音信号和空间信息信号存储在存储介质中。在这种情形中，在对多声道音频信号进行声道縮减混音时提取的空间信息信号在从声道縮减混音信号中恢复原始多声道音频信号时使用。配置信息一般是不可改变的，并且包括该信息的头部仅被插入音频信号中一次。因为配置信息是通过在开头被插入在音频信号中一次来发送的，所以音频信号解码装置在从随机时基点起再现音频信号的情形中由于不存在配置信息而在解码空间信息方面有问题。音频信号编码装置将声道縮减混音信号和空间信息信号一起或分别生成到比特流中，然后将它们传送到音频信号解码装置。所以，如果非必需的信息等被包括在空间信息信号中，则信号压縮和传送效率将降低。[公开][技术问题]本发明的一个目的是提供一种用于解码音频信号的装置及其方法，藉此可通过将空间信息信号选择性地包括在头部中来从随机时基点再现音频信号。本发明的另一个目的是提供一种用于解码音频信号的装置及其方法，藉此可使用可变比特数来高效率地表示将应用参数集的时隙的位置。本发明的另一个目的是提供一种用于解码音频信号的装置及其方法，藉此可通过将执行声道缩减混音信号编排或将多声道映射到扬声器所需的信息量表示为最小可变比特数来提高音频信号压縮和传送效率。本发明的又一个目的是提供一种用于解码音频信号的装置及其方法，藉此可通过不执行声道縮减混音信号编排地将多声道映射到扬声器来减小信号编排所需的信息量。[技术解决方案〗本发明的上述目的、特征和优点将在以下的描述中阐述，并且部分将从此描述变得显而易见。将参考附图来阐述能够实现上述目的的本发明的实施例。现在将对本发明的一个优选实施例进行详细参考，其例子在附图中示出。图1是根据本发明的一个实施例的从音频信号编码装置传送到音频信号解码装置的音频信号的配置图。参考图1，音频信号包括音频描述符101、声道縮减混音信号103和空间信息信号105。在使用编码方案来再现用于广播等的音频信号的情形中，音频信号不但能够包括音频描述符101和声道縮减混音信号103还能包括辅助数据。而且，本发明包括空间信息信号105作为辅助数据。为了使音频信号解码装置不用分析音频信号就能了解音频编解码的基本信息，音频信号能够选择性地包括音频描述符101。音频描述符101被配置成具有音频解码所必需的少数的基本信息，诸如所发送的音频信号的传输率、声道的数目、经压縮的数据的采样频率、指示当前使用的编解码的标识符等。音频信号解码装置能够利用音频描述符101来了解对音频信号所作的编解码的类型。具体地，利用音频描述符101，音频信号解码装置就能够了解音频信号是否使用空间信息信号105和声道縮减混音信号103配置多声道。音频描述符101独立于包含在音频信号中的声道縮减混音信号103或空间信息信号105地定位。例如，音频描述符101定位于指示音频信号的单独字段内。在声道縮减混音信号103中不包括头部的情形中，音频信号解码装置能够利用音频描述符101来解码声道縮减混音信号103。声道縮减混音信号103是从对多声道进行声道縮减混音而生成的信号。并且，声道縮减混音信号103可从包括在音频信号编码装置中的声道縮减混音单元生成或人工生成。声道縮减混音信号103可被分类成包括头部的情形和不包括头部的情形。在声道縮减混音信号103包括头部的情形中，头部按帧为单位包括在每一帧中。在声道縮减混音信号103不包括头部的情形中，如以上描述中提及的，声道縮减混音信号103可利用音频描述符101来解码。声道縮减混音信号103采取包括每一帧包括头部的形式或是帧中不包括头部的形式。并且，声道縮减混音信号103以相同的方式包括在音频信号中直到内容结束。空间信息信号105也可被分类成包括头部107和空间信息111的情形以及仅包括空间信息111而不包括头部的情形。空间信息信号105的头部107与声道縮减混音信号103的头部的不同之处在于它不必被完全相同地插入在每一帧中。具体地，空间信息信号105能够将包括头部的帧和不包括头部的帧两者一起使用。包括在空间信息信号105的头部107中的大部分信息是通过解释空间信息111来解码空间信息111的配置信息109。空间信息111被配置成具有多个帧，每一帧都包括数个时隙。时隙表示在由时间区间划分帧的情形中的每一个时间区间。一个帧中所包括的时隙的数目被包括在配置信息109中。配置信息109包括信号编排信息、信号变换单元的数目、声道配置信息、扬声器映射信息等以及时隙数目。信号编排信息是指示在将经解码的声道縮减混音信号103恢复成多声道之前音频信号是否将被编排以便进行声道扩展混音。信号变换单元表示在通过对声道縮减混音信号103进行声道扩展混音来生成多声道时将一个声道縮减混音信号103变换成两个信号的OTT(—至二)框或将两个声道縮减混音信号103变换成三个信号的TTT(二至三)框。具体地，OTT或TTT框是通过被包括在音频信号解码装置的声道扩展混音单元(图中未示出)中在恢复多声道时使用的概念框。并且，关于信号变换单元的类型和数目的信息被包括在空间信息信号105中。声道配置信息是指示包括在音频信号解码装置中的声道扩展混音单元的配置的信息。声道配置信息包括指示音频信号是否穿过信号变换单元的标识符。音频信号解码装置能够利用声道配置信息来了解输入到声道扩展混音单元的音频信号是否穿过信号变换单元。音频信号解码装置使用关于信号变换单元的信息、声道配置信息等来将声道縮减混音信号103声道扩展混音成为多声道音频信号。音频信号解码装置通过利用包括在空间信息111中的信号变换单元信息、声道配置信息等对声道縮减混音信号103进行声道扩展混音来生成多声道。扬声器映射信息是指示在将通过声道扩展混音生成的多声道音频信号分别输出至扬声器时多声道音频信号将被映射到哪个扬声器的信息。音频信号解码装置用包含在配置信息109中的扬声器映射信息来将多声道音频信号输出到对应的扬声器。空间信息111是在生成多声道音频信号时用于通过与声道縮减混音信号结合来给出空间感的信息。空间信息包括指示音频信号之间的能量差的CLD(声道电平差)、指示音频信号之间的紧密相关性或相似性的ICC(声道间相关性)、指示利用其它信号等来预测音频信号值的系数的CPC(声道预测系数)。并且，参数集指示一组这些参数。并且，空间信息111中不但包括这些参数，还包括指示施加参数集的时隙的位置是否固定的帧标识符、施加于一个帧的参数集的数目、施加参数集的时隙的位置信息等。图2是根据本发明的另一个实施例对音频信号进行解码的方法的流程图。参考图2，音频信号解码装置接收由音频信号编码装置以比特流形式传送的空间信息信号105(S201)。空间信息信号105能以与声道縮减混音信号103的流分离的比特流的形式来传送，或可通过被包含在声道縮减混音信号103的辅助数据或扩展数据中来传送。在空间信息信号105是通过与声道縮减混音信号103组合来传送的情形中，音频信号解码装置的多路分解单元(图中未示出)将所接收到的音频信号分离成经编码的声道縮减混音信号103和经编码的空间信息信号105。经编码的空间信息信号105信号包括头部107和空间信息111。音频信号解码装置确定空间信息信号105中是否包括头部107(S203)。如果头部107被包括在空间信息信号105中，则音频信号解码装置从头部107中提取出配置信息109(S205)。音频信号解码装置确定此配置信息是否是从空间信息信号105中所包括的第一头部107中提取出的(S207)。如果配置信息109是自第一个从空间信号105中提取出的头部107提取的，则音频信号解码装置解码配置信息109(S215)并根据经解码的配置信息109来解码在配置信息109之后传送的空间信息111。如果从音频信号中提取出的头部107不是第一个从空间信息信号105中提取出的头部107，则音频信号解码装置确定从头部107中提取出的配置信息109是否与从第一头部107中提取出的配置信息109完全相同(S209)。如果配置信息109与从第一头部107中提取出的配置信息109完全相同，则音频信号解码装置使用经解码的从第一头部107中提取出的配置信息109来解码空间信息111。如果所提取的配置信息109与从第一头部107中提取出的配置信息109并非完全相同，则音频信号解码装置确定在从音频信号编码装置到音频信号解码装置的传输路径上此音频信号中是否发生差错(S211)。如果配置信息109是可变的，则即使配置信息109与从第一头部107中提取出的配置信息109并非完全相同也不是发生差错。因此，音频信号解码装置将头部107更新成可变头部107(S213)。音频信号解码装置然后对从经更新的头部107中提取出的配置信息109进行解码(S215)。音频信号解码装置根据经解码的配置信息109对在配置信息109之后传送的空间信息lll进行解码。如果不可变的配置信息109与从第一头部107中提取出的配置信息109并非完全相同，则这意味着在音频信号传输路径上发生了差错。因此，音频信号解码装置移除包括错误的配置信息109的空间信息信号105中所包含的空间信息111，或纠正空间信息111的差错(S217)。图3是根据本发明的另一个实施例的对音频信号进行解码的方法的流程图。参考图3，音频信号解码装置从音频信号编码装置接收包括声道縮减混音信号103和空间信息信号105的音频信号(S301)。音频信号解码装置将接收的音频信号分离成空间信息信号105和声道縮减混音信号103(S303)然后将分离的空间信息105和分离的声道縮减混音信号103分别发送到核心解码单元(图中未示出)和空间信息解码单元(图中未示出)。音频信号解码装置从空间信息信号105中提取出时隙数目和参数集数目。音频信号解码装置利用提取出的时隙数目和参数集数目来找到施加参数集的时隙位置。根据对应参数集的次序，将施加对应参数集的时隙的位置被表示为可变比特数。并且，通过减少表示将施加对应参数集的时隙的位置的比特数，就能够高效率地表示空间信息信号105。并且，将参考图4和图5来详细解释将施加对应参数集的时隙的位置。一旦获得了时隙位置，音频信号解码装置就通过将对应的参数集施加于对应的位置来对空间信息信号105进行解码(S305)。并且，音频信号解码装置在核心解码单元中对声道縮减混音信号103进行解码(S305)。音频信号解码装置能够通过按原样对经解码的声道縮减混音信号103进行声道扩展混音来生成多声道。但音频信号解码装置能够在对相应信号进行声道扩展混音之前编排经解码的声道縮减混音信号103的顺序(S307)。音频信号解码装置利用经解码的声道縮减混音信号103和经解码的空间信息信号105来生成多声道(S309)。音频信号解码装置利用空间信息信号105来将声道縮减混音信号103生成为多声道。如以上描述所提及的，空间信息信号105包括信号变换单元数目和用于表示声道縮减混音信号103在作声道扩展混音时穿过信号变换单元还是不穿过信号变换单元就被输出的声道配置信息。音频信号解码装置利用信号变换单元数目、声道配置信息等来对声道縮减混音信号103进行声道扩展混音(S309)。稍后将参考图6和图7来解释使用较少比特数来表示声道配置信息的方法和配置声道配置信息的方法。音频信号解码装置将多声道音频信号按预定序列映射到扬声器以输出所生成的多声道音频信号(S311)。在这种情形中，随着映射的音频信号序列增长，用于将多声道音频信号映射到扬声器的比特数减小。具体地，在按次序给多声道音频信号编号的情形中，因为第一音频信号可被映射到全部扬声器中的一个，所以将音频信号映射到扬声器所需的信息量大于映射第二或后续的音频信号所需的信息量。当第二或后续的音频信号被映射到除了被映射以之前的音频信号的之前的扬声器之外的其余扬声器之一时，映射所需的信息量就减少了。具体地，通过随着映射的音频信号序列增长而减少映射音频信号所需的信息量，就能够高效率地表示空间信息信号105。该方法也适用于在步骤S307中编排声道縮减混音信号103的情形。图4是根据本发明的一个实施例的施加参数集的时隙的位置信息的句法。参考图4，此句法涉及表示关于参数集数目的信息和关于施加参数集的时隙的信息的'Framinglnfo'401。'bsFramingType'字段403指示包含在空间信息信号105中的帧是固定帧还是可变帧。固定帧表示在其中将施加参数集的时隙位置预先设定的帧。具体地，将施加参数集的时隙的位置根据预设规则来决定。可变帧表示在其中将施加参数集的时隙位置尚未设定的帧。所以，可变帧还需要时隙位置信息才能表示将施加参数集的时隙的位置。在以下的描述中，将把'bsFramingType'403命名为指示帧是固定帧还是可变帧的(帧标识符，。在可变帧的情形中，'bsParamSlot'字段407或411指示将施加参数集的时隙的位置信息。'bsParamSlot[O]'字段407指示将施加第一参数集的时隙的位置，而'bsParamSlot[ps]'字段411指示将施加第二或后续参数集的时隙的位置。将施加第一参数集的时隙的位置被表示为初始值，而将施加第二或后续参数集的时隙的位置被表示为差值'bsDiffParamSlot[ps]'409，即'bsParamSlot[ps]'与'bsParamSlot[ps-I]'之差。在这种情形中，'ps'意思是参数集。第一参数集表示为'ps=0'。并且，'ps'能够表示从0至小于参数集总数的值的范围中的值。(i)将施加参数集的时隙位置407或409随着ps值增大而增大(bsParamSlot[ps]>bsParamSlot[ps-l])。(ii)对于第一参数集，将施加第一参数集的时隙位置的最大值对应于将时隙数目与参数集数目之差加1所得到的值，并且时隙位置表示为'nBitsParamSlot(0)'413的信息量。(iii)对于第二或后续参数集，将施加第N参数集的时隙位置比将施加第(N-1)参数集的时隙位置至少大1，并且甚至能具有将时隙数目减参数集数目所得值加上值N而得到的值。将施加第二或后续参数集的时隙位置'bsParamSlot[ps]'被表示为差值'bsDiffParamSlot[ps]'409。并且，该值被表示为'nBitsParamSlot[ps]'的信息量。所以，能够利用(i)至(iii)来找到将施加参数集的时隙位置。例如，如果有十个时隙包括在一个空间帧中，并且如果有三个参数集，则将施加第一参数集(psK))的时隙位置一直适用到将时隙总数减参数总数所得值加1得到的时隙位置。具体地，对应的位置适用属于1至最大值8之间的范围的时隙中的一个。通过考虑将施加参数集的时隙位置根据参数集号而增大，就可理解可施加其余的两个参数集的时隙位置最大分别是9和10。所以，将施加第一参数集的时隙位置407需要三比特来指示1至8，其可被表示为ceilUog2(k-i+l))。在这种情形中，'k'是时隙数目，而'i'是参数数目。如果将施加第一参数集的时隙位置407是'5'，则将施加第二参数集的时隙位置'bsParamSlot[l]'应从'5+^6'与'10-3+2-9'之间的值中选择。具体地，将施加第二参数集的时隙位置可被表示为将施加第一参数集时隙位置加1所得的值加上差值'bsDiffParamSlot[ps]'409得到的值。所以，差值406能够对应于0至3，其可被表示为2比特。对于第二或后续参数集，通过把将施加参数集的时隙位置表示为差值409而不是直接表示时隙位置，就能够减少比特数。在前面的例子中，在直接表示时隙位置的情形中，需要4比特来表示6至9中的一个。但是，将时隙位置表示为差值仅需要2比特。因此，指示将施加参数集的时隙的量nBitsParamSlot(O)'或'nBitsParamSlot(ps)'413或415的位置信息不仅可表示为固定比特数也可表示为可变比特数。图5是根据本发明的另一个实施例的通过将参数集施加于时隙来解码空间信息信号的方法的流程图。9参考图5，音频信号解码装置接收包括声道縮减混音信号103和空间信息信号105的音频信号(S501)。如果空间信息信号中存在头部107，则音频信号解码装置从包括在头部107中的配置信息109中提取出一帧中所包括的时隙数目(S503)。如果头部107未被包括在空间信息信号105中，则音频信号解码装置从包括在之前提取的头部107中的配置信息109中提取出时隙数目。音频信号解码装置从空间信息信号105中提取出将被施加于帧的参数集的数目(S505)。音频信号解码装置利用包括在空间信息信号105中的标识符来确定一帧中将施加参数集的时隙的位置是固定的还是可变的(S507)。如果该帧是固定帧，则音频信号解码装置通过根据预设规则将参数集施加于相应的时隙来对空间信息信号105进行解码(S513)。如果该帧是可变帧，则音频信号解码装置提取关于将施加第一参数集的时隙位置的信息(S509)。如以上的描述中所提及的，将施加第一参数的时隙位置最大可以是将时隙数目与参数集数目之差加1得到的值。音频信号解码装置利用关于将施加第一参数集的时隙位置的信息来获得关于将施加第二或后续参数集的时隙位置的信息(S511)。如果N是等于或大于2的自然数，则可利用将施加第N参数集的时隙位置比将施加第(N-1)参数集的时隙位置至少大1这一事实来将施加参数集的时隙位置表示为最小比特数，并且甚至可具有将时隙数目减参数集数目所得的值加上N得到的值。并且，音频信号解码装置通过将参数集施加于所得的时隙位置来对空间信息信号105进行解码(S513)。图6和图7是根据本发明的一个实施例的音频信号解码装置的声道扩展混音单元的示意图。音频信号解码装置将从音频信号编码装置接收的音频信号分离成声道縮减混音信号103和空间信息信号105，然后分别对声道縮减混音信号103和空间信息信号105进行解码。如以上描述中所提及的，音频信号解码装置通过将参数施加于时隙来对空间信息信号105进行解码。并且，音频信号解码装置使用经解码的声道縮减混音信号103和经解码的空间信息信号105来生成多声道音频信号。如果音频信号编码装置将N个输入声道压縮成M个音频信号并将这M个音频信号以比特流的形式传送到音频信号解码装置，则音频信号解码装置恢复并输出原始的N个声道。这种配置被称为N-M-N结构。在某些情形中，如果音频信号解码装置不能恢复出这N个声道，则不考虑空间信息信号105地来将声道縮减混音信号103输出成两个立体声信号。然而，在此将不再对这种情况进行进一步讨论。在其中N和M的值固定的结构将被称为固定声道结构。在其中M和N的值被表示为随机值的结构将被称为随机声道结构。在诸如5-1-5、5-2-5、7-2-7等固定声道结构的情形中，音频信号编码装置通过把声道结构包括在音频信号中来传送音频信号。音频信号解码装置然后通过读取声道结构来对音频信号进行解码。音频信号解码装置采用包括信号变换单元的声道扩展混音单元来将M个音频信号恢复成N多声道。信号变换单元是在通过对声道縮减混音信号103进行声道扩展混音来生成多声道时用来将一个声道縮减混音信号103变换成两个信号或将两个声道縮减混音信号103变换成三个信号的概念框。音频信号解码装置能够通过从包括在空间信息信号105中的配置信息109中提取出声道配置信息来获得关于声道扩展混音单元的结构的信息。如以上描述中所提及的，声道配置信息是指示包括在音频信号解码装置中的声道扩展混音单元的配置的信息。声道配置信息包括指示音频信号是否穿过信号变换单元的标识符。具体地，在经解码的声道縮减混音信号在声道扩展混音单元中穿过信号变换单元的情形中可将声道配置信息表示为分割标识符，因为信号变换单元的输入和输出信号数目会改变。并且，在经解码的声道縮减混音信号在声道扩展混音单元中不穿过信号变换单元的情形中，可将声道配置信息表示为不分割标识符，因为信号变换单元的输入被原封不动地输出。在本发明中，分割标识符将被表示为T，而不分割标识符将被表示为'O'。声道配置信息可用两种方式来表示，即横向法和纵向法。在横向法中，如果音频信号穿过信号变换单元，即，如果声道配置信息是T，则由分割或不分割标识符来顺序指示经由信号变换单元输出的下层信号是否穿过另一信号变换单元。如果声道配置信息是'O'，则由分割或不分割标识符来指示同一层或上层的下一音频信号是否穿过信号变换单元。在纵向法中，由分割或部分各标识符顺序地指示上层的全部音频信号中的每一个是否穿过信号变换单元，而不是指示上层一音频信号是否穿过信号变换单元然后指示下层一音频信号是否穿过信号变换单元。对于同一声道扩展混音单元的结构，图6示例性示出声道配置信息由横向法表示，而图7示例性示出声道配置信息由纵向法表示。在图6和图7中，信号变换单元采用例如OTT框。参考图6，四个音频信号X,至X4进入声道扩展混音单元。X!进入第一信号变换单元，然后被变换成两个信号601和603。包括在声道扩展混音单元中的信号变换单元使用诸如CLD、ICC等空间参数来变换音频信号。经第一信号变换单元变换的信号601和603进入第二变换单元和第三变换单元，从而作为多声道音频信号Yi至Y4被输出。X2进入第四信号变换单元，然后作为Ys和Y6被输出。并且，X3和X4不穿过信号变换单元地被直接输出。因为Xi穿过第一信号变换单元，所以信号配置信息被表示为分割标识符T。因为在图6中声道配置信息由横向法表示，所以如果声道配置信息被表示为分割标识符，则经由第一信号变换单元输出的两个信号601和603是否穿过另一信号变换单元被顺序地表示为分割或不分割标识符。第一信号变换单元的两个输出信号中的信号601穿过第二信号变换单元，因而被表示为分割标识符l。经由第二信号变换单元的信号被原封不动地输出，而不穿过另一信号变换单元，因而被表示为不分割标识符O。如果声道配置信息是'O'，则同一层或上层的下一音频信号是否穿过信号变换单元由分割或不分割标识符表示。所以，为上层的信号X2表示声道配置信息。将穿过第四信号变换单元的X2表示为分割标识符1。穿过第四信号变换单元的信号被直接输出为Ys和Y6，因而分别被表示为不分割标识符0。不穿过信号变换单元而直接输出的X3和X4分别被表示为不分割标识符0。因此，声道配置信息由横向法表示为110010010000。在这种情形中，为便于理解，声道配置信息是从声道扩展混音单元的配置来提取的。然而，音频信号解码装置可读取声道配置信息以通过相反的方式获得关于声道扩展混音单元的结构的样自IPl's、o参考图7，类似于图6，四个音频信号Xi至X4进入声道扩展混音单元。因为纵向法将声道配置信息从上层至下层地表示为分割或不分割标识符，所以作为最上层的第一层701的音频信号的标识符被顺序表示。具体地，因为Xi和X2分别穿过第一和第四信号变换单元，所以各自的声道配置信息为1。因为X3和X4不穿过信号变换单元，所以各自的声道配置信息为O。所以，第一层701的声道配置信息为1100。以相同的方式，如果顺序表示，则第二层703和第三层705的声道配置信息分别为1100和0000。因此，由纵向法表示的整个声道配置信息为110011000000。音频信号解码装置读取声道配置信息然后配置声道扩展混音单元。为了使音频信号解码装置能配置声道扩展混音单元，指示声道配置是由横向法表示还是由纵向法表示的标识符应被包括在音频信号中。或者，声道配置信息基本由横向法表示。然而，如果由纵向法表示声道配置信息是高效率的，则音频信号编码装置可使指示声道配置由纵向法表示的标识符被包括在音频信号中。音频信号解码装置读取由横向法表示的声道配置信息，然后就能够配置声道扩展混音单元。然而，在声道配置信息是由纵向法表示的情形中，音频信号解码装置仅在知道了声道扩展混音单元中所包括的信号变换单元数目或输入和输出声道的数目时才能配置声道扩展混音单元。所以，音频信号解码装置能够以从包括在空间信息信号105中的配置信息109中提取出信号变换单元的数目或输入和输出声道的数目的方式来配置声道扩展混音单元。音频信号解码装置从头起顺序解释声道配置信息。在检测到包括在声道配置信息中的分割标识符1的个数与从配置信息中提取出的信号变换单元数目一样多的情形中，音频信号解码装置不需要进一步读取声道配置信息。这是因为包括在声道配置信息中的分割标识符1的个数等于包括在声道扩展混音单元中的信号变换单元的数目，因为分割标识符1指示音频信号被输入到信号变换单元。具体地，如以上例子中所提及的，如果由纵向法表示的声道配置信息是110011000000，则音频信号解码装置需要读取总共12比特才能解码声道配置信息。然而，如果音频信号解码装置检测到信号变换单元的数目是4个，则音频信号解码装置对声道配置信息进行解码直到包括在声道配置信息中的数字1出现4次。艮卩，音频信号解码装置仅将声道配置信息解码到110011。这是因为尽管不再进一步使用声道配置信息，但是其余的值被表示为不分割标识符O。因此，由于音频信号解码装置不必解码6比特，解码效率就可得以提高。在声道结构是预设的固定声道结构的情形中，附加信息是非必需的，因为信号变换单元的数目或输入和输出声道的数目被包括在空间信息105中所包含的配置信息中。然而，在声道结构是其声道结构待定的随机声道结构的情形中，需要附加信息来指示信号变换单元的数目或输入和输出声道的数目，因为信号变换单元的数目或输入和输出声道的数目未被包括在空间信息信号105中。以关于信号变换单元的信息为例，在仅使用OTT框作为信号变换单元的情形中，用于指示信号变换单元的信息可被表示为最多5比特。在进入声道扩展混音单元的输入信号穿过OTT或TTT框的情形中，一个输入信号被变换成两个信号或两个输入信号被变换成三个信号。所以，输出声道的数目是将输入信号加上OTT或TTT框的数目得到的值。因此，信号变换单元的数目是将输出声道的数目减去输入信号的数目和TTT框的数目得到的值。因为一般能够使用最多32个输出声道，所以用于指示信号变换单元的信息可被表示为5比特内的值。因此，如果声道配置信息由纵向法表示，并且如果声道结构是随机声道结构，则音频信号编码装置应将信号变换单元的数目在空间信息信号105中单独表示为最多5比特。在以上的例子中，需要6比特声道配置信息和5比特用于指示信号变换单元的信息。gp，需要总共ll比特。这表明与由横向法来表示声道配置信息相比，配置声道扩展混音单元所需的比特量减少了。因此，如果声道配置信息由纵向法表示，则比特数可减少。图8是根据本发明的一个实施例的音频信号解码装置的框图。参考图8，根据本发明的一个实施例的音频信号解码装置包括接收单元、多路分解单元、核心解码单元、空间信息解码单元、信号编排单元、多声道生成单元、和扬声器映射单元。接收单元801接收包括声道縮减混音信号103和空间信息信号105的音频信号。多路分解单元803将接收单元801接收到的音频信号解析成经编码的声道縮减混音信号103和经编码的空间信息信号105，然后将经编码的声道縮减混音信号103和经编码的空间信息信号105分别发送到核心解码单元805和空间信息解码单元807。核心解码单元805和空间信息解码单元807分别对经编码的声道縮减混音信号和经编码的空间信息信号进行解码。如以上描述中所提及的，空间信息解码单元807通过从空间信息信号105中提取出帧标识符、时隙数目、参数集数目、时隙位置信息等并通过将参数集施加于对应的时隙来对空间信息信号105进行解码。音频信号解码装置可包括信号编排单元809。信号编排单元809根据预设的编排来编排多个声道縮减混音信号从而来对经解码的声道縮减混音信号103进行声道扩展混音。具体地，信号编排单元809以N-M-N声道配置将M个声道縮减混音信号编排成M'个音频信号。音频信号解码装置可根据声道縮减混音信号穿过核心解码单元805的顺序直接对声道縮减混音信号进行声道扩展混音。然而，在某些情形中，音频信号解码装置可在编排声道縮减混音信号的顺序之后执行声道扩展混音。在某些情况下，信号编排可对进入将两个声道縮减混音信号作声道扩展混音成三个信号的信号变换单元的信号执行。在对音频信号执行信号编排的情形中或在仅对TTT框的输入信号执行信号编排的情形中，指示相应情形的信号编排信息应由音频信号编码装置包括在音频信号中。在这种情形中，信号编排信息是指示在将音频信号恢复成多声道之前信号序列是否将被编排以便进行声道扩展混音、是否仅将对特定信号执行编排等的标识符。如果头部107被包括在空间信息信号105中，则音频信号解码装置使用包括在从头部107中提取出的配置信息109中的音频信号编排信息来编排声道縮减混音信号。如果头部107未被包括在空间信息信号105中，则音频信号解码装置可使用从包括在前一头部107中的配置信息109中提取出的音频信号编排信息来编排音频乂士口1曰5音频信号解码装置可以不执行声道縮减混音信号编排。具体地，音频信号解码装置能通过直接对经核心解码单元805解码并传送到多声道生成单元811的信号进行声道扩展混音而不是执行声道縮减混音信号编排来生成多声道。这是因为信号编排的期望目的可通过将生成的多声道映射到扬声器来达成。在这种情形中，通过不将关于声道縮减混音信号编排的信息插入音频信号中就能更高效率地压縮并传输音频信号。并且，解码装置的复杂度可因不另外执行信号编排而降低。信号编排单元809将经编排的声道縮减混音信号发送到多声道声道单元811。并且，空间信息解码单元809也将经解码的空间信息信号105发送到多声道生成单元811。并且，多声道生成单元811使用声道縮减混音信号103和空间信息信号105来生成多声道音频信号。音频信号解码装置包括扬声器映射单元813以将通过多声道生成单元811的音频信号输出到扬声器。扬声器映射单元813决定多声道音频信号将通过映射到哪一个扬声器来被输出。并且，一般用于输出音频信号的扬声器类型在如下的表l中示出。[表]_<table>tableseeoriginaldocumentpage15</column></row><table>5BR:右后6FLC:左前中7FRC:右前中8BC:中后9SL:左侧10SR:右侧11TC:中上12TFL:左前上13TFC:中前上14TFR:右前上15TBL:左后上16TBC:中后上17TBR:右后上18...31保留一般而言，可将最多32个扬声器映射到输出音频信号。所以，如表1所示，扬声器映射单元813以给多声道音频信号以0与31之间的数字中特定的一个(bsOutputChannelPos)的方式来使音频信号能被映射到对应于每一数字的扬声器(扩音器)。在这种情形中，因为总共32个扬声器中的一个应被选择以将从多声道生成单元811输出的多声道音频信号中的第一音频信号映射到扬声器，所以需要5比特。因为其余的31个扬声器中的一个应被选择以将第二音频信号映射到扬声器，所以也需要5比特。根据该方法，因为其余的16个扬声器中的一个应被选择以将第十七音频信号映射到扬声器，所以需要4比特。具体地，随着映射的音频信号的数目增加，指示映射到音频信号的扬声器所需的信息量就减少。这可由表示将音频信号映射到扬声器所需的比特数的ceil[log2(32-bsOutputChannelPos)]来表达。由于待编排的音频信号的数目增加，所需的比特数减少，这可适用于由信号编排单元809编排的声道縮减混音信号数目增加的情形。因此，音频解码装置将多声道音频信号映射到扬声器然后输出相应的信号。尽管本文参考本发明的优选实施例来描述和例示说明了本发明，但本领域的技术人员将清楚可在本发明中作出各种修改和变形而不会脱离本发明的精神和范围。因此，本发明旨在涵盖落入所附权利要求及其等效技术方案范围内的本发明的修改和变形。[有益效果]因此，藉由根据本发明的用于解码音频信号的装置及其方法，可将头部选择性地包括在空间信息信号中。藉由根据本发明的用于解码音频信号的装置及其方法，能以把将施加参数集的时隙的位置表示为可变比特数的方式来减少传送的数据量。藉由根据本发明的用于解码音频信号的装置及其方法，能以将执行声道縮减混音信号编排或将多声道映射到扬声器所需的信息量表示为最少可变比特数的方式来提升音频信号压縮和传送效率。藉由根据本发明的用于解码音频信号的装置及其方法，能以按顺序而不执行声道縮减混音信号编排地来对经核心解码单元解码并传送到多声道生成单元的信号进行声道扩展混音的方式来使音频信号被更高效率地压縮并传送，并降低音频信号解码装置的复杂度。[附图简述]图1是是根据本发明的一个实施例的音频信号的配置图。图2是根据本发明的另一个实施例的对音频信号进行解码的方法的流程图。图3是根据本发明的另一个实施例的对音频信号进行解码的方法的流程图。图4是根据本发明的一个实施例的施加参数集的时隙的位置信息的句法。图5是根据本发明的另一个实施例的通过将参数集施加于时隙来解码空间信息信号的方法的流程图。图6和图7是根据本发明的一个实施例的音频信号解码装置的声道扩展混音单元的示意图。图8是根据本发明的一个实施例的音频信号解码装置的框图。[最佳模式]为了实现这些及其它优势，根据本发明的一个方面，提供了一种解码音频信号的方法，包括接收包含空间信息信号和声道縮减混音信号的音频信号，利用包括在音频信号中的时隙数目和参数数目来获得时隙的位置信息，通过根据时隙的位置信息将空间信息信号施加于声道縮减混音信号来生成多声道音频信号，以及将多声道音频信号相应地编排至输出声道。可将时隙的位置信息表示为可变比特数。并且位置信息可包括初始值和差值，其中初始值指示施加第一参数的时隙的位置信息，并且其中差值指示将施加第二或后续参数的时隙的位置信息。并可将此初始值表示为使用时隙数目和参数数目中的至少一个来决定的可变比特数。并可将此差值表示为使用时隙数目、参数数目、和施加前一参数的时隙的位置信息中的至少一个来决定的可变比特数。并且此方法还包括将声道縮减混音信号编排成根据预设方法的声道縮减混音信号。并且编排声道縮减混音信号可对进入将两个声道縮减混音信号作声道扩展混音成三个信号的信号变换单元的声道縮减混音信号执行。并且如果头部被包括在空间信息信号中，则声道縮减混音信号编排可使用包括在从头部中提取出的配置信息中的音频信号编排信息来编排声道縮减混音信号。映射第i音频信号或编排第i声道縮减混音信号所需的信息量可以是等于或大于l0g2[(音频信号总数或声道縮减混音信号总数)-的值)+l]的最小整数。并且多声道音频信号的编排可进一步包括将音频信号相应地编排至扬声器。根据本发明的另一方面，提供了一种用于解码音频信号的装置，包括将音频信号声道扩展混音成多声道音频信号的声道扩展混音单元、以及根据预设编排将多声道音频信号映射到输出声道的多声道编排单元。根据本发明的另一方面，提供了一种用于解码音频信号的装置，包括对经编码的声道縮减混音信号进行解码的核心解码单元、根据预设编排来编排经解码的音频信号的编排单元、以及将经编排的音频信号作声道扩展混音成多声道音频信号的声道扩展混音单元。权利要求1.一种解码音频信号的方法，包括接收包括音频描述符的所述音频信号；使用所述音频描述符识别所述音频信号包括声道缩减混音信号和空间信息信号；使用所述空间信息信号将所述声道缩减混音信号作声道扩展混音成多声道音频信号；以及根据预定编排将所述多声道音频信号映射到输出声道，其中所述空间信息信号在每一周期或非周期时间区间上包括一头部。2.如权利要求1所述的方法，其特征在于，还包括如果所述头部被包括在所述空间信息信号中，则使用包括在所述头部中的配置信息来将所述声道縮减混音信号作声道扩展混音成所述多声道音频信号。3.如权利要求2所述的方法，其特征在于，还包括如果包括在所述空间信息信号中的所述头部与先前提取的头部不同，则检测到在所述头部中发生差错。4.如权利要求1所述的方法，其特征在于，还包括如果所述头部未被包括在所述空间信息信号中，则通过使用先前提取的配置信息来将所述声道縮减混音信号作声道扩展混音成所述多声道音频信号。5.如权利要求l、2和4中的任一项所述的方法，其特征在于，将第i音频信号映射到所述输出声道所需的信息量是等于或大于bg2[(音频信号总数)-('i'的值)+l]的最小整数。6.如权利要求1所述的方法，其特征在于，如果所述头部被包括在所述空间信息信号中，则使用从包括在所述头部中的配置信息中提取出的音频信号映射信息来执行将所述音频信号映射到所述输出声道的操作。全文摘要本发明涉及一种解码音频信号的方法，其能使音频信号被更高效率地压缩并传送。本发明方法包括以下步骤接收带有空间信息信号的音频信号，利用音频信号的时隙和参数数目来获得位置信息，通过将空间信息信号施加于声道缩减混音信号来建立多声道音频信号，以及响应于输出声道执行用于多声道音频信号的多声道阵列。文档编号G10L19/02GK101253554SQ200680031669公开日2008年8月27日申请日期2006年8月30日优先权日2005年8月30日发明者吴贤午,房熙锡,林宰显,郑亮源,金东秀申请人:Lg电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：房熙锡;吴贤午;金东秀;林宰显;郑亮源
技术所有人：LG电子株式会社
我是此专利的发明人

上一篇：在语音通信系统中产生舒适噪声的方法和设备的制作方法
上一篇：解码音频信号的方法