解码音频信号的方法和装置的制作方法

文档序号：2830058阅读：190来源：国知局

专利名称：：解码音频信号的方法和装置的制作方法
技术领域：
：本发明涉及音频信号处理，且更为具体地说，涉及用于处理能够产生伪环绕信号的音频信号的方法和装置。
背景技术：
：近来，已经开发了用于编码数字音频信号的各种各样的技术和方法，并且也制造了其相关的产品。此外，已经开发了许多方法，其中具有多信道的音频信号被使用心理声学模型编码。该心理声学模型是一种使用人类的声音识别方式的原理有效地降低在除去在编码处理的过程中不必要的信号时的数据量的方法。例如，人类的耳朵在喧闹的声音之后无法立即识别安静的声音，并且也仅仅听得见频率在20-20，000Hz之间的声音。虽然己经开发了以上所述现有的技术和方法，没有已知的用于处理音频信号以从包括空间信息的音频比特流中产生伪环绕信号的方法。
发明内容本发明提供了用于解码音频信号的方法和装置及其数据结构，其能够在音频系统中提供伪环绕效果。按照本发明的一个方面，提供了一种用于解码音频信号的方法，该方法包括从接收的音频信号中提取下混频信号和空间信息，使用该空间信息产生环绕转换信息，并且使用环绕转换信息在预先设置的呈现域中呈现下混频信号以产生伪环绕信号。按照本发明的另一个方面，提供了一种用于解码音频信号的装置，该装置包括从接收的音频信号中提取下混频信号和空间信息的多路分解部分，使用空间信息产生环绕转换信息的信息转换部分，和使用环绕转换信息在预先设置的呈现域中呈现下混频信号以产生伪环绕信号的伪环绕产生部分。按照本发明的再一个方面，提供了一种音频信号的数据结构，该数据结构包括下混频信号，其是通过下混频具有多个信道的音频信号产生的，和空间信息，其是当产生下混频信号时产生的，其中空间信息被转换为环绕转换信息，并且下混频信号在预先设置的呈现域中被呈现以借助于使用的环绕转换信息转换为伪环绕信号。按照本发明的再一个方面，提供了一种存储音频信号和具有数据结构的介质，其中该数据结构包括下混频信号，其是通过下混频具有多个信道的音频信号产生的，和空间信息，其是当产生下混频信号时产生的，其屮空间信息被转换为外绕转换信息，并且下混频信号在预先设置的呈现域中被呈现以在预先设置的呈现域中，借助于使用的环绕转换信息转换为伪环绕信号。该伴随的附图被包括以提供对本发明进一步的理解，其举例说明本发明的实施例，并且与该说明书一起解释本发明原理的作用。在附图中图1举例说明按照本发明一个实施例的信号处理系统；图2举例说明按照本发明一个实施例的伪环绕产生部分的简略方框图3举例说明按照本发明一个实施例的信息转换部分的简略方框图；图4举例说明按照本发明一个实施例用于描述伪环绕呈现过程和空间信息转换过程的简略方框图5举例说明按照本发明另一个实施例用于描述伪环绕呈现过程和空间信息转换过程的简略方框图6和图7举例说明按照本发明一个实施例用于描述信道映射过程的简略方框图8举例说明按照本发明一个实施例用于经由以信道描述滤波系数的示意图；和图9至图ll举例说明按照本发明实施例用于描述用于产生环绕转换信息的过程的简略方框图。具体实施例方式现在将详细地进行介绍本发明的实施例，其例子被在伴随的附图中举例说明。首先，本发明是通过术语描述的，该术语通常已经在其相关的技术中使用。但是，在本发明中定义了一些术语以清楚地描述本发明。因此，本发明必须基于在以下的描述中定义的术语来理解。在本发明中"空间信息"表示通过上混频下混频的信号产生多信道需要的信息。虽然将假设空间信息是空间参数来描述本发明，容易理解，该空间信息不受空间参数的限制。这里，该空间参数包括信道电平差(CLD)、信道间相干性(ICC)和信道预测系数(CPC)等。该信道电平差(CLD)表示在两个信道之间的能量差。该信道间相干性(ICC)表示在两个信道之间的互相关性。该信道预测系数(CPC)表示从两个信道预测三个信道的预测系数。在本发明中"核心编解码器"表示用于编码音频信号的编解码器。该核心编解码器不编码空间信息。本发明将假设下混频音频信号是由核心编解码器编码的音频信号来描述。此外，该核心编解码器可以包括活动图像专家组(MPEG)层-II、MPEG音频层-III(MP3)、AC-3、OggVorbis、DTS、Window媒体音频(WMA)、高级音频编码(AAC)或者高效的AAC(HE-AAC)。但是，可以不必提供该核心编解码器。在这种情况下，使用未压縮的PCM信号。该编解码器可以是现有的编解码器和在将来开发的未来的编解码器。"信道划分部分"表示可以将特定数目的输入信道划分为另一个特定数目的输出信道的划分部分，其中输出信道数目不同于输入信道的数目。该信道划分部分包括二至三(TTT)盒，其将两个输入信道转换为三个输出信道。此外，该信道划分部分包括一至二(OTT)盒，其将一个输入信道转换为两个输出信道。本发明的信道划分部分不限于TTT和OTT盒，而是容易理解，可以在其输入信道数目和输出信道数目是任意的系统中使用该信道划分部分。图1举例说明按照本发明一个实施例的信号处理系统。如图1所示，该信号处理系统包括编码设备100和解码设备150。虽然本发明将基于音频信号描述，容易理解，本发明的信号处理系统可以处理除音频信号之外的所有信号。该编码设备100包括下混频部分110、核心编码部分120和多路复用部分130。该下混频部分110包括信道下混频部分111和空间信息估算部分112。当输入下混频部分110的N个多信道音频信号X,、X2、...、XN时，取决于某个下混频方法或者任意的下混频方法产生音频信号。在这里，从下混频部分110输出到核心编码部分120的音频信号的数目小于输入多信道音频信号的数目"N"。该空间信息估算部分112从输入多信道音频信号提取空间信息，然后将提取的空间信息传送给多路复用部分130。在这里，下混频信道的数目可以是一个或者两个，或者可以是按照下混频命令的特定的数目。可以设置下混频信道的数目。此外，任意的下混频信号被可选地用作下混频音频信号。该核心编码部分120编码下混频音频信号，其经由下混频信道发送。将该编码的下混频音频信号输入给多路复用部分130。该多路复用部分130多路复用编码的下混频音频信号和空间信息以产生比特流，然后将产生的比特流传送给解码设备150。在这里，该比特流可以包括核心编解码器比特流和空间信息比特流。该解码设备150包括多路分解部分160、核心解码部分170和伪环绕解码部分1S0。该伪环绕解码部分180可以包括伪环绕产生部分200和信息转换部分300。此外，该解码设备150可以进一步包括空间信息解码部分190。该多路分解部分160接收该比特流，并且将接收的比特流多路分解为核心编解码器比特流和空间信息比特流。该多路分解部分160从接收的比特流中提取下混频信号和空间信息。该核心解码部分170从多路分解部分160接收核心编解码器比特流以解码接收的比特流，然后将解码结果作为解码的下混频信号输出给伪环绕解码部分180。例如，当编码设备IOO下混频多信道信号为单信道信号或者立体声信道信号的时候，该解码的下混频信号可以是单信道信号或者立体声信道信号。虽然本发明的实施例是基于用作下混频信道的单信道或者立体声信道描述的，容易理解，本发明不受限于下混频信道的数目。该空间信息解码部分190从多路分解部分160接收空间信息比特流，解码该空间信息比特流，并且作为空间信息输出该解码的结果。该伪环绕解码部分180起使用空间信息从下混频信号产生伪环绕信号的作用。以下是对于伪环绕产生部分200和信息转换部分300的描述，其被包括在伪环绕解码部分180中。该信息转换部分300接收空间信息和滤波信息。此外，该信息转换部分300使用空间信息和滤波信息产生环绕转换信息。在这里，该产生的环绕转换信息具有适于产生伪环绕信号的模式。该环绕转换信息在伪环绕产生部分200是特定的滤波器的情形下表示滤波系数。虽然本发明是基于用作环绕转换信息的滤波系数描述的，容易理解，该环绕转换信息不受该滤波系数限制。此外，虽然该滤波信息被假设为是头部相关的传递函数(HRTF)，容易理解，该滤波信息不限于HRTF。在本发明中，以上描述的滤波系数表示特定的滤波器的系数。例如，该滤波系数可以如下定义。原型HRTF滤波系数表示特定的HRTF滤波器的原始滤波系数，并且可以被表示为GL—L等等。转换的HRTF滤波系数表示从原型HRTF滤波系数转换的滤波系数，并且可以被表示为GL—L'等等。空间化的HRTF滤波系数是通过空间化原型HRTF滤波系数以产生伪环绕信号获得的滤波系数，并且可以被表示为FL—L1等等。主呈现系数表示为执行呈现所必需的滤波系数。并且可以被表75为HL—L等等。内插的主呈现系数表示通过内插和/或模糊化主呈现系数获得的滤波系数，并且可以被表示为HL—L'等等。按照本发明，容易理解，滤波系数不限于以上所述的滤波系数。该伪环绕产生部分200从核心解码部分170接收解码的下混频信号，和从信息转换部分300接收环绕转换信息，并且使用解码的下混频信号和环绕转换信息产生伪环绕信号。例如，伪环绕信号用来在立体声音频系统中提供虚拟多信道(或者环绕)声音。按照本发明，容易理解，伪环绕信号将在除立体声音频系统之外的任何的设备中起以上所述的作用。该伪环绕产生部分200可以按照设置模式执行各种各样类型的呈现。假设编码设备100传送单声道或者立体声下混频信号而不是多信道音频信号，并且该下混频信号被与多信道音频信号的空间信息一起发送。在这种情况下，虽然该设备150的输出信道是立体声信道而不是多信道，包括伪环绕解码部分180的该解码设备150可以提供用户具有虚拟立体声收听感受的效果。以下是按照本发明一个实施例对于音频信号结构140的描述，如图1所示。当基于有效载荷发送音频信号的时候，其可以经由每个信道或者单个信道接收。1帧的音频有效载荷由编码的音频数据字段和辅助的数据字段组成。在这里，该辅助的数据字段可以包括编码的空间信息。例如，如果音频有效载荷的数据速率是48128kbps，空间信息的数据速率可以是532kbps。这样一个例子将不限制本发明的范围。图2举例说明按照本发明一个实施例的伪环绕产生部分200的简略方框图。在本发明中描述的域包括其中解码下混频信号的下混频域，其中处理空间信息以产生环绕转换信息的空间信息域，其中使用空间信息至观r、屁频1目亏h'、」至观喊，和兵屮渝出盯域的1为外绕1百亏的揃出狄。在这里，该输出域音频信号可以是由人类听到的。该输出域指的是时域。该伪环绕产生部分200包括呈现部分220和输出域转换部分230。此外，该伪环绕产生部分200可以进一步包括呈现域转换部分210，其当下混频域不同于呈现域的时候，将下混频域转换为呈现域。以下是分别地由被包括在呈现域转换部分210中的三个域转换部分执行的三个域转换方法的描述。首先，虽然以下的实施例假设呈现域被设置为子频带域来描述，容易理解，该呈现域可以被设置为任何的域。按照第一域转换方法，在下混频域是时域的情况下，时域被转换为呈现域。按照第二域转换方法，在下混频域是离散频域的情况下，离散频域被转换为呈现域。按照第三域转换方法，在下混频域是离散频域的情况下，离散频域被转换为时域，且之后转换的时域被转换为呈现域。该呈现部分220使用环绕转换信息执行用于下混频信号的伪环绕呈现以产生伪环绕信号。在这里，以立体声输出信道从伪环绕解码部分180输出的该伪环绕信号变为具有虚拟环绕声音的伪环绕立体声输出。此外，因为从呈现部分220输出的伪环绕信号是在呈现域中的信号，当呈现域不是时域的时候需要域转换。虽然本发明在伪环绕解码部分180的输出信道是立体声信道的情况下描述，容易理解，可以应用本发明，而与输出信道的数目无关。例如，可以通过HRTF滤波方法实现伪环绕呈现方法，其中输入信号经历一组HRTF滤波器。在这里，空间信息可以是可以在混频滤波器组域中使用的值，混频滤波器组域是在MPEG环绕下定义的。该伪环绕呈现方法可以按照下混频域和空间信息域的类型如以下的实施例那样实现。为此，使得下混频域和空间信息域是与呈现域重合的。按照伪环绕呈现方法的实施例，存在一种其中在子频带域(QMF)中执行下混频信号的伪环绕呈现的方法。该子频带域包括简单子频带域和混合域。例如，当下混频信号是PCM信号并且下混频域不是子频带域的时候，呈现域转换部分210将下混频域转换为子频带域。另一方面，当下混频域是子频带域的时候，下混频域不需要被转换。有时候，为了使下混频信号与空间信息同步，需要将下混频信号或者空间信息延迟。在这里，当空间信息域是子频带域的时候，空间信息域不需要被转换。此外，为了在时域中产生伪环绕信号，该输出域转换部分230将呈现域转换为时域。按照伪环绕呈现方法的另一实施例，存在一种其中在离散频域中执行下混频信号的伪环绕呈现的方法。在这里，该离散频域表示除子频带域之外的频域。即，该频域可以包括离散频域和子频带域的至少一个。例如，当下混频域不是离散频域的时候，该呈现域转换部分210将下混频域转换为离散频域。在这里，当空间信息域是子频带域的时候，空间信息域需要被转换为离散频域。该方法用来以在离散频域中的操作代替在时域中滤波，使得操作速度可以相对迅速地执行。此外，为了在时域中产生伪环绕信号，该输出域转换部分230可以将呈现域转换为时域。按照伪环绕呈现方法的再一个实施例，存在一种其中在时域中执行下混频信号的伪环绕呈现的方法。例如，当下混频域不是时域的时候，该呈现时域转换部分210将下混频域转换为时域。在这里，当空间信息域是子频带域的时候，空间信息域也被转换为时域。在这种情况下，因为该呈现域是时域，该输出域转换部分230不需要将呈现域转换为时域。图3举例说明按照本发明一个实施例的信息转换部分300的简略方框图。如图3所示，该信息转换部分300包括信道映射部分310、系数产生部分320和积分部分330。此外，该信息转换部分300可以进一歩包括用于另外处理滤波系数的附加的处理部分(未示出)和/或呈现域转换部分340。该信道映射部分310执行信道映射，使得该输入的空间信息可以被映射给多信道信号的至少一个信道信号，然后产生作为信道映射信息的信道映射输出值。该系数产生部分320产生信道系数信息。该信道系数信息可以包括信道的系数信息或者信道间的系数信息。在这里，信道的系数信息表示大小信息和能量信息等等的至少一个，并且该信道间的系数信息表示信道间的相关信息，其是使用滤波系数和信道映射输出值计算的。该系数产生部分320可以包括信道的多个系数产生部分。该系数产生部分320使用滤波信息和信道映射输出值产生信道系数信息。在这里，该信道可以包括多信道、下混频信道和输出信道的至少一个。今后，该信道将描述为多信道，并且信道的系数信息将也描述为大小信息。虽然信道和系数信息将基于上述的实施例描述，容易理解，存在许多可允许的实施例的修改。此外，该系数产生部分320可以按照信道编号或者其它的特征产生信道系数信息。该接收信道的系数信息的积分部分330积分或加和信道的系数信息以产生积分的系数信息。此外，该积分部分330使用积分系数信息的积分系数产生滤波系数。该积分部分330可以通过进一步积分附加信息与该信道的系数来产生该积分系数。该积分部分330可以按照信道系数信息的特征积分至少一个信道的系数。例如，该积分部分330可以按照信道系数信息的特征，以下混频信道，输出信道，与输出信道相结合的一个信道，和列出的信道的组合执行积分。此外，该积分部分330可以通过另外处理该积分的系数产生附加的处理系数信息。即，该积分部分330可以通过附加的处理产生滤波系数。例如，该积分部分330可以通过另外处理该积分系数，诸如，通过应用特定函数于积分系数，或者通过合并多个积分系数来产生滤波系数。在这里，该积分系数信息是输出信道幅度信息、输出信道能量信息和输出信道相关信息中的至少一个。当空间信息域不同于呈现域的时候，该呈现域转换部分340可以使空间信息域与呈现域重合。该呈现域转换部分340可以将用于伪环绕呈现的滤波系数的域转换为呈现域。由于该积分部分330起减小伪环绕呈现的工作量的作用，其可以被省略。此外，在立体声下混频信号的情况下，在产生信道的系数信息的过程中，产生应用于左和右下混频信号的系数组。在这里，滤波系数组可以包括从各个信道发送给它们自己信道的滤波系数，和从各个信道发送给它们的相对信道的滤波系数。图4举例说明按照本发明一个实施例用于描述伪环绕呈现过程和空间信息转换过程的简略方框图。然后，该实施例举例说明解码的立体声下混频信号被接收到伪环绕产生部分410的情形。信息转换部分400可以产生在伪环绕产生部分410中传送给其自己的信道的系数，和在伪环绕产生部分410中传送给相对信道的系数。该信息转换部分400产生系数HL一L和系数HL_R，并且将该产生的系数HL—L和HL—R输出给第一呈现部分413。在这里，该系数HL一L被传送给伪环绕产生部分410的左输出端，并且该系数HL—R被传送给伪环绕产生部分410的右输出端。此外，该信息转换部分400产生系数HR—R和HR一L，并且将产生的系数HR—R和HR_L输出给第二呈现部分414。在这里，该系数HR一R被传送给伪环绕产生部分410的右输出端，并且该系数HR一L被传送给伪环绕产生部分410的左输出端。该伪环绕产生部分410包括第一呈现部分413、第二呈现部分414以及加法器415和416。此外，该伪环绕产生部分410可以进一步包括域转换部分411和412，其将下混频域与呈现域重合，当两个域互相不同时，例如，当下混频域不是子频带域时，并且呈现域是子频带域。在这里，该伪环绕产生部分410可以进一步包括反域转换部分417和418，其将呈现域，例如子频带域转换为时域。因此，用户经由具有立体声信道等的耳机听到具有虚拟多信道声音的音频。第一和第二呈现部分413和414接收立体声下混频信号和一组滤波系数。该滤波系数组被分别地应用于左和右下混频信号，并且从积分部分403输出。例如，第一和第二呈现部分413和414使用四个滤波系数HL—L、HL—R、HR一L禾nHR一R执行呈现以从下混频信号产生伪环绕信号。更具体地说，第一呈现部分413可以使用滤波系数HL—L和HL一R执行呈现，其中滤波系数HL—L被传送给其自己的信道，并且该滤波系数HL—R被传送给与其自己的信道相对的信道。第一呈现部分413可以包括子呈现部分(未示出)l-l和1-2。在这里，该子呈现部分1-1使用滤波系数HL—L执行呈现，该滤波系数HL_L被传送给伪环绕产生部分410的左输出端，并且该子呈现部分l-2使用滤波系数HL一R执行呈现，该滤波系数HL—R被传送给伪环绕产生部分410的右输出端。此外，第二呈现部分414使用滤波系数组HR—R和HR—L执行呈现，其中滤波系数HR—R被传送给其自己的信道，并且该滤波系数HR—L被传送给与其自己的信道相对的信道。第二呈现部分414可以包括子呈现部分(未示出)2-l和2-2。在这里，该子呈现部分2-l使用滤波系数HR—R执行呈现，该滤波系数HR—R被传送给伪环绕产生部分410的右输出端，并且该子呈现部分2-2使用滤波系数HR—L执行呈现，该滤波系数HR—L被传送给伪环绕产生部分410的左输出端。HL_R和HR—R在加法器416中相加，并且HL一L和HR—L在加法器415中相加。在这里，必要时，HL一R禾nHR—L变为零，这指的是交叉项的系数是零。在这里，当HL—R禾卩HR—L是零的时候，另外的两个传送不互相影响。另一方面，在单声下混频信号的情况下，可以通过具有类似于图4的结构的实施例执行呈现。更具体地说，原始单声输入被称为第一信道信号，并且通过去相关第一信道信号获得的信号被称为第二信道信号。在这种情况下，第一和第二呈现部分413和414可以接收第一和第二信道信号，并且对它们执行呈现。参考图4，其定义输入的立体声下混频信号是由"x"表示的，通过将空间信息映射给信道获得的信道映射系数是由"D"表示的，外部输入的原型HRTF滤波系数是由"G"表示的，临时的多信道信号是由"p"表示的，并且已经经历呈现的输出信号是由"y"表示的。该标记"x"、"D"、"G"、"p"和"y"可以通过如下公式1的矩阵形式表示。公式1是基于原型HRTF滤波系数表示的。但是，当修改的HRTF滤波系数用于以下的公式的时候，在以下的公式中G必须以G'代替。[公式1]<formula>formulaseeoriginaldocumentpage18</formula>在这里，当每个系数是频域的值的时候，临时的多信道信号"p"可以被通过信道映射系数"D"与立体声下混频信号"x"的乘积表示为以下的公式2。:公式2]<formula>formulaseeoriginaldocumentpage18</formula>然后，当使用原型HRTF滤波系数"G"呈现临时的多信道"p;的时候，可以通过公式3表示该输出信号"y"。<formula>formulaseeoriginaldocumentpage18</formula>然后，如果p-D.x被插入，可以通过公式4表示"y"。<formula>formulaseeoriginaldocumentpage19</formula>[公式4]Y=GDx在这里，如果定义H^GD，该输出信号"y"和立体声下混频信号:x"具有如下的公式5的关系。:公式5]H=孤—Z朋—￡因此，该滤波系数的乘积允许获得"H"。然后，可以通过将立体声下混频信号"x"和"H"相乘获得该输出信号"y"。可以通过以下的公式6获得稍后将描述的系数F(FL—Ll、FL_L2、…)。.公式<formula>formulaseeoriginaldocumentpage19</formula>￡席2图5举例说明按照本发明另一个实施例用于描述伪环绕呈现过程和空间信息转换过程的简略方框图。然后，该实施例举例说明解码的单声下混频信号被接收到伪环绕产生部分510的情形。如该图所示，信息转换部分500包括信道映射部分501、系数产生部分502和积分部分503。由于该信息转换部分500的上述的元件执行与图4的信息转换部分400相同的功能，在下面将省略其详细说明。在这里，该信息转换部分500可以产生最后的滤波系数，其域与其中执行伪环绕呈现的呈现域重合。当解码的下混频信号是单声下混频信号的时候，该滤波系数组可以包括滤波系数组HM一L和HM一R。该滤波系数HM—L用于执行单声下混频信号的呈现，以将呈现结果输出给伪环绕产生部分510的左信道。该滤波系数HM一R用于执行单声下混频信号的呈现，以将呈现结果输出给伪环绕产生部分510的右信道。该伪环绕产生部分510包括第三呈现部分512。此外，该伪环绕产生部分510可以进一步包括域转换部分511和反向域转换部分513和514。该伪环绕产生部分510的元件不同于图4的伪环绕产生部分410的元件，这是由于解码的下混频信号在图5中是单声下混频信号，该伪环绕产生部分510包括执行伪环绕呈现的一个第三呈现部分512和一个域转换部分511。该第三呈现部分512从积分部分503接收滤波系数组HM—L和HM一R，并且可以使用接收的滤波系数执行单声下混频信号的伪环绕呈现，以及产生伪环绕信号。同时，在下混频信号是单声信号的情形下，可以按照以下的二种方法通过执行单声下混频信号的伪环绕呈现获得立体声下混频的输出。按照第一方法，第三呈现部分512(例如，HRTF滤波器)不使用用于伪环绕声音的滤波系数，而是使用当处理立体声下混频的时候使用的值。在这里，当处理立体声下混频的时候使用的值可以是系数(左前=1、右前=0、...等等)，这里该系数"左前"是用于左输出，并且该系数"右前"是用于右输出。其次，在使用空间信息从下混频信号产生多信道信号的解码过程的中间，获得具有所需的信道数目的立体声下混频的输出。参考图5，其定义输入单声下混频信号是由"X"表示的，信道映射系数是由"D"表示的，外部输入的原型HRTF滤波系数是由"G"表示的，临时的多信道信号是由"p"表示的，并且已经经历呈现的输出信号是由"y"表示的，该标记"x"、"D"、"G"、"p"和"y"可以由如下公式7的矩阵形式表示。_工一—D一￡一D一iD他—D——GL工③￡GSG厄￡GCI,G厦L—工0—在公式7中的矩阵之间的关系已经在图4的解释中描述。因此，以下的描述将省略其描述。在这里，图4举例说明接收立体声下混频信号的情形，并且图5举例说明接收单声下混频信号的情形。图6和图7举例说明按照本发明一个实施例用于描述信道映射过程的简略方框图。该信道映射过程指的是一过程，其中信道映射输出值的至少一个是通过将接收的空间信息映射为多信道的至少一个信道而产生的，以与伪环绕产生部分兼容。该信道映射过程是在信道映射部分401和501中执行的。在这里，空间信息，例如，能量可以被映射给多个信道的至少二个。在这里，可以不必划分Lfe信道和中心信道C。在这种情况下，由于上述的过程不需要信道划分部分604或者705，其可以简化计算。例如，当接收单声下混频信号的时候，可以使用系数CLD1至CLD5、ICC1至ICC5等产生信道映射输出值。该信道映射输出值可以是D。Dr、De、D^EF、Dls、D&等。由于该信道映射输出值是通过使用空间信息获得的，可以按照不同的公式获得各种各样类型的信道映射输出值。在这里，可以按照由解码设备150接收的空间信息的树形结构，和在解码设备150中使用的空间信息的范围改变信道映射输出值的产生。图6和图7举例说明按照本发明一个实施例用于描述信道映射结构的简略方框图。在这里，信道映射结构可以包括表示OTT盒的至少一个信道划分部分。图6的信道结构具有5151结构。参考图6，可以使用OTT盒601、602、603、604、605和空间信息，例如CLDo、CLD,、CLD2、CLD3、CLD4、ICC0、ICQ、ICC2、ICC3等从下混频信号"m"产生多信道信号L、R、C、LFE、Ls、Rs。例如，当该树形结构具有如图6所示的5151结构的时候，可以仅使用CLD获得该信道映射输出值，如公式8所示。公式8]<formula>formulaseeoriginaldocumentpage22</formula>其中，<table>tableseeoriginaldocumentpage23</column></row><table>该信道映射输出值可以按照频带范围、参数频带和/或传送的时隙改变。在这里，如果在邻近频带之间或者在形成边界的时隙之间的信道映射输出值的差值扩大，当执行伪环绕呈现的时候，可能出现失真。为了防止上述的失真，可能在频率和时域中需要信道映射输出值的模糊化。更具体地说，防止失真的方法如下。首先，该方法可以采用频率模糊化和时间模糊化，或者此外采用任何适于伪环绕呈现的其他技术。此外，可以通过将每个信道映射输出值乘以特定的增益来防止该失真。图8举例说明按照本发明一个实施例用于描述信道的滤波系数的示意图。例如，该滤波系数可以是HRTF系数。为了执行伪环绕呈现，通过具有滤波系数GL一L的滤波器滤波来自左信道信源"L"810的信号，然后，该滤波结果I^GL—L被作为左输出传送。此外，来自左信道信源"L"810的信号由具有滤波系数GL—R的滤波器滤波，然后，该滤波结果I^GL—R被作为右输出传送。例如，左和右输出可以分别地到达用户的左耳和右耳。如此，所有左和右输出是通过信道获得的。然后，该获得的左输出被加和以产生最后的左输出(例如，Lo)，并且该获得的右输出被加和以产生最后的右输出(例如，Ro)。因此，已经经历伪环绕呈现的最后的左和右输出可以由以下的公式IO表示。Lo=L*GL—L-I-C*GC—L+R*GR—L+Ls*GLs—L+Rs*GRs一LRo=L*GL—R+C*GC—R+R*GR—R+Ls*GLs—R+Rs*GRs.-R按照本发明的实施例，用于获得L(810)、C(800)、R(820)、Ls(830)和Rs(840)的方法如下。首先，可以通过用于使用下混频信号和空间信息产生多信道信号的解码方法获得L(810)、C(SOO)、R(820)、Ls(830)和Rs(840)。例如，可以通过MPEG环绕解码方法产生该多信道信号。其次，可以通过仅与空间信息相关的公式获得L(810)、C(800)、R(820)、Ls(830)和Rs(840)。图9至图ll举例说明按照本发明实施例用于描述产生环绕转换信息的过程的简略方框图。图9举例说明按照本发明一个实施例用于描述产生环绕转换信息的过程的简略方框图。如图9所示，除信道映射部分之外，信息转换部分可以包括系数产生部分900和积分部分910。在这里，该系数产生部分900包括子系数产生部分(coef—1产生部分900—1、coef_2产生部分卯0—2、...、coef—N产生部分900一N)的至少一个。在这里，该信息转换部分可以进一步包括内插部分920和域转换部分930以便另外处理滤波系数。该系数产生部分900使用空间信息和滤波信息产生系数。以下是在特定的子系数产生部分，例如，coef_l产生部分900—1(其被称为第一子系数产生部分)中系数产生的描述。例如，当输入单声下混频信号的时候，第一子系数产生部分900_1使用从空间信息产生的值D—L产生用于多信道的左信道的系数FL—L和FL—R。该产生的系数FL—L禾卩FL—R可以由以下的公式11表示。FL—L=D—L^GL一L(用于从输入的单声下混频信号产生左输出的系数)FL_R=D_L*GL—R(用于从输入的单声信道信号产生右输出的系数)在这里，该D一L是在信道映射过程中从空间信息产生的信道映射输出值。用于获得D—L的过程可以按照编码设备传送和解码设备接收的树形结构信息改变。类似地，在coef—2产生部分900—2被称为第二子系数产生部分，并且coef_3产生部分卯0一3被称为第三子系数产生部分的情况下，第二子系数产生部分900—2可以产生系数FR—L和FR—R，并且第三子系数产生部分900—3可以产生FC—L和FC—R等等。例如，当输入立体声下混频信号的时候，第一子系数产生部分900—1使用从空间信息产生的值D—Ll和D—L2产生用于多信道的左信道的系数FL—Ll、FL—L2、FL—Rl禾QFL—R2。该产生的系数FL—Ll、FL—L2、FL—Rl和FL—R2可以由以下的公式12表示。FL—L1=D—L1*GL—L(用于从输入立体声下混频信号的左下混频信号产生左输出的系数)FL—L2-D一L2+GL一L(用于从输入立体声下混频信号的右下混频信号产生右输出的系数)FL—R1=D—L1*GL—R(用于从输入立体声下混频信号的左下混频信号产生右输出的系数)FL—R2-D—L2*GL—R(用于从输入立体声下混频信号的右下混频信号产生右输出的系数)在这里，类似于输入该单声下混频信号的情形，当输入立体声下混频信号的时候，可以通过系数产生部分900—1至900—N的至少一个产生多个系数。该积分部分910通过积分系数产生滤波系数，该积分系数是按照信道产生的。该积分部分910用于输入的单声和立体声下混频信号情况的积分可以由以下的公式13表示。在输入单声下混频信号的情况下HM一L=FL—L+FR—L+FC—L+FLS—L+FRS—L+FLFE一LHM一R=.FL—R+FR—R+FC一R+FLS—R+FRS—R+FLFE—R在输入立体声下混频信号的情况下H1_L=pl—LI+PR—LI+FC一Ll+FLS—LI+PRS—il+FLFE—LIHR_Lfl—m+PR—L2+fc—L2+FLSJj2+frs一l2+f;lfe—i'2HIiR=flRl+FRRl+FCRl+flsRl+FRSRl+_i—~—FLFE—RlHR—R=FL—R2+FR—R2+FC—R2+F!LS—R2+FRS—R2+FLFE—R2在这里，HM—L和HM—R表示在输入单声下混频信号的情况下用于伪环绕呈现的滤波系数。另一方面，HL_L、HR—L、HL—R禾PHR—R表示在输入立体声下混频信号的情况下用于伪环绕呈现的滤波系数。该内插部分920可以内插该滤波系数。此外，可以作为后处理执行滤波系数的模糊化。该时间模糊化可以在时间模糊化部分(未示出)中执行。当传送和产生的空间信息在时间轴具有宽的间隔的时候，该内插部分920内插该滤波系数，以获得在传送和产生的空间信息之间不存在的空间信息。例如，当空间信息存在于第n个参数时隙和第n+K个参数时隙(K〉1)的时候，线性内插的实施例可以由以下的公式14表示。在公式14的实施例中，可以使用产生的滤波系数，例如HL—L、HR—L、HL—R和HR—R获得在没有传送的参数时隙中的空间信息。应该理解，该内插部分920可以通过多种方法内插滤波系数。在输入单声下混频信号的情况下HM—L(n+j)=HM—L(n)*a+HM—!L(ri+k)*(l-a)H'M_R(n+j)=刚—R(n)*a+HM_R(n+k)*(1-a)在输入立体声下混频信号的情况下HL—L(n+j〉=HL—L(n)*a+HL—L(n+k)*(l-a)H.R—L(n+j)=HR—L(n)*a+HR一L(n+k)*(l-a)Hli一R(n+j)=HL—R(n)*a+HL—R(n+k)*(l-a)HR—R(n+j)=HR—一R(n〉*a+HR—R(n+k〉*(l-a)在这里，HM—L(n+j)和HM—R(n+j)表示当输入单声下混频信号的时候通过内插用于伪环绕呈现的滤波系数获得的系数。此外，HL—L(n+j)、HR—L(n+j)、HL—R(n+j)和HR—R(n+j)表示当输入立体声下混频信号的时候通过内插用于伪环绕呈现的滤波系数获得的系数。在这里，"j"和"k"是整数，0<j<k。此外，"a"是实数((Ka〈1)，并且由以下的公式15表示。<formula>formulaseeoriginaldocumentpage28</formula>通过公式14的线性内插，可以使用在第n和第n+K参数时隙中的空间信息获得在没有在第n和第n+K参数时隙之间传送的参数时隙中的空间信息。即，可以在两个参数时隙中按照公式15在由空间信息的连接值形成的直线上获得空间信息的未知值。当在时域中在邻近模块之间的系数值被迅速地改变的时候可以产生不连续的点。然后，可以通过时间模糊化部分执行时间模糊化以防止由不连续的点所引起的失真。可以与内插操作并行执行该时间模糊化操作。此外，可以按照它们的操作顺序不同地处理该时间模糊化和内插操作。在单声下混频信道的情况下，该滤波系数的时间模糊化可以由以下的公式16表示。HM—L(n)'=HM—L(n)*b+HM_L(n-1)'*(1-b)KM—R(n)'=HM—R(n)*b+HM—R(n-l)'*(l-b〉公式16描述经由1极IIR滤波器的模糊化，其中该模糊化结果可以如下获得。即，在当前的模块(n)中该滤波系数HM—L(n)和HM一R(n)分别地乘以"b"。然后，在先前的模块(n-l)中该滤波系数HM一L(n-l)'和HM一R(n-l)'分别地乘以(l-b)。该相乘的结果被相力卩，如公式16所示。在这里，"b"是恒定的(04<1)。"b"的值越小，该模糊化效应增加越多。相反地，"b"的值越大，该模糊化效应增加越少。类似于以上所述的方法，可以执行剩余的滤波系数的模糊化。使用公式16用于时间模糊化，内插和模糊化可以由公式17表示。HM一'L(n+j)'=(HM——L(n)*a+HM—L(n+k)M].-a))*b+HIM—L(n+j-1)'*(l_b)HM一R(n+j〉'=(HM—R(n)*a+HM一R(n+k)*(l-a)〉*b+HM—R(n-l-j-l)'*(1-b)另一方面，当内插部分920禾口/或时间模糊化部分分别地执行内插和时间模糊化的时候，可以获得其能量值不同于原始滤波系数的滤波系数。在那种情况下，可以进一步需要能量标准化处理以防止上述的问题。当呈现域不与空间信息域重合的时候，该域转换部分930将空间信息域转换为呈现域。但是，如果该呈现域与空间信息域重合，不需要上述的域转换。在这里，当空间信息域是子频带域并且呈现域是频域的时候，上述的域转换可以涉及其中系数被扩展或者降低到符合频率范围和用于每个子频带的时间范围的处理。图10举例说明按照本发明另一个实施例用于描述产生环绕转换信息过程的简略方框图。如图10所示，除信道映射部分之外，信息转换部分可以包括系数产生部分1000和积分部分1020。在这里，该系数产生部分1000包括子系数产生部分(coef—1产生部分1000—1、coef—2产生部分1000—2、…和coef—N产生部分1000—N)的至少一个。此外，该信息转换部分可以进一步包括内插部分1010和域转换部分1030以便另外处理滤波系数。在这里，该内插部分1010包括子内插部分1010一1、1010—2、...和1010—N的至少一个。与图9的实施例不同，在图10的实施例中，该内插部分1010内插该系数产生部分1000按照信道产生的相应的系数。例如，在单声下混频信道的情况下，该系数产生部分1000产生系数FL—L和FL一R，且在立体声下混频信道情况下，产生系数FL—Ll、FL一L2、FL—Rl禾卩FL—R2。图11举例说明按照本发明再一个实施例的用于描述产生环绕转换信息的过程的简略方框图。与图9和10的实施例不同，在图11的实施例中，内插部分1100内插各个信道映射输出值，然后系数产生部分1110使用内插结果产生信道的系数。在图9至图11的实施例中，描述了由于信道映射输出值是在频域中(例如，参数频带单元具有单个值)，而在频域中执行处理，诸如滤波系数产生。此外，当在子频带域中执行伪环绕呈现的时候，该域转换部分930或者1030不执行域转换，而是分路子频带域的滤波器系数，或者可以执行转换以调整频率分解，然后输出该转换结果。如上所述，本发明可以甚至在解码装置无法产生多信道信号的环境下，在解码装置中提供具有伪环绕声音的音频信号，该解码装置接收包括下混频信号和多信道信号的空间信息的声音比特流。对于那些本领域技术人员来说显而易见，不脱离本发明的精神或者范围，可以在本发明中进行各种各样的改进和变化。因此，本发明意欲覆盖其归入所附的权利要求和其等效范围之内所提供的本发明的改进和变化。权利要求1.一种用于解码音频信号的方法，该方法包括从接收的音频信号提取下混频信号和空间信息；使用空间信息产生环绕转换信息；和使用环绕转换信息在预先设置的呈现域中呈现下混频信号以产生伪环绕信号。2.根据权利要求l的方法，进一步包括将在呈现域中的伪环绕信号转换为在输出域中的伪环绕信号。3.根据权利要求1的方法，其中呈现域包括频域和时域的至少一个；频域包括子频带域和离散频域的至少一个；和子频带域包括简单子频带域和混合子频带域的至少一个。4.根据权利要求l的方法，进一步包括解码下混频信号，其中当解码的下混频信号的下混频域不同于预先设置的呈现域的时候，使用预先设置的域转换方法将下混频域转换为预先设置的呈现域。5.根据权利要求4的方法，其中，该下混频域的转换包括以下操作的至少一个当下混频域是时域的时候，将时域转换为预先设置的呈现域；当下混频域是离散频域的时候，将离散频域转换为预先设置的呈现域；和当下混频域是离散频域的时候，将离散频域转换为时域，且然后将时域转换为预先设置的呈现域。6.根据权利要求1的方法，其中，该预先设置的呈现域是子频带域，并且该呈现步骤包括将环绕转换信息应用于下混频信号；和将应用结果相加。7.—种用于解码音频信号的装置，该装置包括从接收的音频信号中提取下混频信号和空间信息的多路分解部分；使用空间信息产生环绕转换信息的信息转换部分；和使用环绕转换信息在预先设置的呈现域中呈现下混频信号以产生伪环绕信号的伪环绕产生部分。8.根据权利要求7的装置，其中，该伪环绕产生部分包括将在预先设置的呈现域中的伪环绕信号转换为在输出域中的伪环绕信号的输出域转换部分。9.根据权利要求7的装置，其中该预先设置的呈现域包括频域和时域的至少一个；该频域包括子频带域和离散频域的至少一个；和该子频带域包括简单子频带域和混合子频带域的至少一个。10.根据权利要求7的装置，进一步包括解码下混频信号的核心解码部分，其中该伪环绕产生部分包括当解码的下混频信号的下混频域不同于预先设置的呈现域的时候，使用预先设置的域转换方法转换下混频域为预先设置的呈现域的呈现域转换部分。11.根据权利要求10的装置，其中，该呈现域转换部分包括以下的至少一个当下混频域是时域的时候，将时域转换为预先设置的呈现域的第一域转换部分；当下混频域是离散频域的时候，将离散频域转换为预先设置的呈现域的第二域转换部分；和当下混频域是离散频域的时候，将离散频域转换为时域，且然后将转换的时域转换为预先设置的呈现域的第三域转换部分。12.根据权利要求7的装置，其中，该伪环绕产生部分包括当预先设置的呈现域是子频带域的时候，在将环绕转换信息应用于下混频信号之后，相加应用结果的加法器。13.—种音频信号的数据结构，该数据结构包括下混频信号，其是通过下混频具有多个信道的音频信号产生的；和空间信息，其是当产生下混频信号时产生的，其中，该空间信息被转换为环绕转换信息，并且该下混频信号在预先设置的呈现域中被呈现以借助于使用的环绕转换信息转换为伪环绕信号。14.根据权利要求13的数据结构，其中，在预先设置的呈现域中的伪环绕信号被转换为在输出域中的伪环绕信号。15.根据权利要求13的数据结构，其中该预先设置的呈现域包括频域和时域的至少一个；该频域包括子频带域和离散频域的至少一个；和该子频带域包括简单子频带域和混合子频带域的至少一个。16.根据权利要求13的数据结构，其中下混频信号被解码为解码的下混频信号；和当解码的下混频信号的下混频域不同于预先设置的呈现域的时候，下混频域被使用预先设置的域转换方法转换为预先设置的呈现域。17.—种存储音频信号和具有数据结构的介质，其中该数据结构包括下混频信号，其是通过下混频具有多个信道的音频信号产生的；和空间信息，其是当产生下混频信号时产生的，其中，该空间信息被转换为环绕转换信息，并且该下混频信号在预先设置的呈现域中被呈现以借助于使用的环绕转换信息转换为伪环绕信号。全文摘要提供了一种用于处理音频信号的方法和装置。用于解码音频信号的方法包括从接收的音频信号中提取下混频信号和空间信息，使用该空间信息产生环绕转换信息，并且使用环绕转换信息在预先设置的呈现域中呈现该下混频信号以产生伪环绕信号。用于解码音频信号的装置包括从接收的音频信号中提取下混频信号和空间信息的多路分解部分，使用空间信息产生环绕转换信息的信息转换部分，和使用环绕转换信息在预先设置的呈现域中呈现下混频信号以产生伪环绕信号的伪环绕产生部分。文档编号G10L19/00GK101185117SQ200680018238公开日2008年5月21日申请日期2006年5月25日优先权日2005年5月26日发明者吴贤午,房熙锡,林宰显,郑亮源,金东秀申请人:Lg电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴贤午;郑亮源;房熙锡;金东秀;林宰显
技术所有人：LG电子株式会社
我是此专利的发明人

上一篇：解码音频信号的方法和装置的制作方法
上一篇：用于编码和解码语音信号的高频带部分的方法和设备的制作方法