音频信号编码或解码的制作方法

文档序号：2832214阅读：166来源：国知局

专利名称：：音频信号编码或解码的制作方法音频信号编码或解码本发明涉及对音频信号进行编码或者对已编码音频信号进行解码.ErikSchuijers、WernerOomen、BertdenBrinker和JeroenBreebaart的"AdvancesinParamericCodingforHigh-QualityAudio(用于高质量音频的参数化编码的进展)"(Pr印Hnt5852，114thAESConvention,Amsterdam,TheNetherlands,22-25March2003)公开了一种参数化编码方案，该方案使用了用于立体图像的高效参数化表示，两个输入信号被合并成一个单声道音频信号。感觉上相关的空间方位信息(spatialcue)被明确地模拟，如图1所示。该合并的信号使用单声道参数化编码器来编码。声道间强度差(HD)、声道间时间差(ITD)和声道间互相关(ICC)等立体声参数被量化、编码并和经量化及编码的单声道音频信号一起被复用成一个比特流.在解码器侧，该比特流被解复用为一个已编码单声道信号和各立体声参数。该已编码单声道音频信号被解码，从而获得已解码单声道音频信号m，(参见图2)。使用产生感觉去相关的滤波器D、从该单声道时域信号来计算经过去相关的信号。该单声道时域信号m，和经过去相关的信号d被变换到频域，然后在一个参数处理单元中，利用IID、ITD和ICC等参数、通过分别进行缩放、相位修改和混合来处理该频域立体声信号，以便获得已解码立体声对l，和r，。最终得到的频域表示被变换回时域.本发明的一个目的是使用空间参数提供有利的音频编码或解码。为此，本发明提供一种如独立权利要求中所限定的编码方法、音频编码器、用于传送或存储的设备、解码方法、音频解码器、再现设备和计算机程序产品。在从属权利要求中限定各有利实施例。根据本发明的第一个方面，一个音频信号被编码，该音频信号包括笫一音频声道和第二音频声道，该编码包括在一个复数调制滤波器组中对第一音频声道和第二音频声道当中的每一个进行子带滤波，以便为笫一音频声道提供第一多个子带信号并为第二音频声道提供第二多个子带信号；对所述子带信号当中的每一个进行向下采样，以便提供第一多个向下采样的子带信号和第二多个向下采样的子带信号；在另一个滤波器组中对至少一个经向下采样的子带信号进行进一步的子带滤波，以便提供多个次子带(sub-subband)信号；从所迷次子带信号以及从那些没有被进一步子带滤波的经向下采样的子带信号中导出空间参数；以及导出一个单声道音频信号，该单声道音频信号包含从笫一多个经向下采样的于带信号和第二多个经向下采样的子带信号中所导出的导出子带信号.通过在子带中提供进一步的子带滤波，提高了所述子带的频率分辨率。提高频率分辨率的优点在于，可以以高效的实现方式(因为只有很少的几个频带必须被变换)获得更高的音频质量(在人类听觉系统中，单个子带信号的带宽通常比临界频带的带宽高的多)。该参数化空间编码器试图模拟双耳方位信息(cue),所述双耳方位信息在非统一频率尺度上被感知，该非统一频率尺度类似于等效矩形频带(ERB)尺度，该单声道音频信号可以从第一多个经向下采样的子带信号和第二多个经向下采样的子带信号中直接导出。然而，该单声道音频信号有利地从对应于那些被进一步子带滤波的经向下采样的子带的次子带信号中导出，在这种情况下，每个子带的次子带信号被相加以便形成新的子带信号，并且其中该单声道音频信号从这些新的子带信号以及来自没有被进一步滤波的所述第一和第二多个子带的子带中导出.根据本发明的另一个主要方面，提供了对已编码音频信号的音频解码，该已编码音频信号包括一个已编码单声道音频信号和一组空间参数，该音频解码包括解码该已编码单声道音频声道以便获得多个经向下采样的子带信号；在另一个滤波器组中进一步子带滤波所述多个经向下采样的子带信号当中的至少一个，以便提供多个次子带信号；以及从所述空间参数、次子带信号和那些没有被进一步子带滤波的子带的经向下采样的子带信号中导出两个音频声道，通过在子带中提供进一步的子带滤波，提高了所述子带的频率分辨率，从而可以获得更高质量的音频解码。本发明这些方面的其中一个主要优点在于参数化空间编解码可以和谦带复制("SBR")技术容易地结合。SBR可以从以下文献中获知MartinDietz、LarsLi恵jeryd、KristoferKjorling和OliverKunz5的"SpectralBandReplication,anovelapproachinaudiocoding(语带复制音频编解码领域中的新颖方法)"(Preprint5553，112thAESConvention,Munich,Germany,10-13May2002)以及PerEkstrand的"Bandwidthextensionofaudiosignalsbyspectralbandreplication(通过谱带复制来扩展音频信号的带宽)"(Proc.lstIEEEBeneluxWorkshoponModelbasedProcessingandCodingofAudio(MPCA-2002)，pp.53-58，Leuven，Belgium,November15,2002)。其他参考文献有MPEG-4标准ISO/IEC14496-3:2001/FDAM1，JTC1/SC29/WGH,CodingofMovingPicturesandAudio,BandwidthExtension(其描述利用SBR的音频编解码器)。SBR基于这样的概念音频信号中低频和高频之间通常具有大的相关性.因此，SBR处理包括将频谱的较低部分复制到较高部分，然后使用在比特流中编码的很少信息为频谦的较高部分调整频谱包络。这种经SBR增强的解码器的简化框图如图3所示。该比特流被解复用并被解码成核心数据(例如MPEG-2/4高级音频编码(AAC))和SBR数据。使用该核心数据，该信号在全带宽信号的一半采样频率下被解码，该核心解码器的输出借助于一个32频带复数(伪)正交镜像滤波器(QMF)组而被分析.这32个频带然后被扩展到全带宽，即64个频带，其中通过复制部分较低频带而产生高频(HF)内容.根据SBR数据调整为之产生HF内容的频带的包络。最后，借助于一个64频带复数QMF合成组，重建PCM输出信号。图3所示的SBR解码器是所谓的双速率解码器，这表示核心解码器在一半采样频率下运行，因此只使用了一个32频带分析QMF组，其中核心编码器以全采样频率运行并且分析QMF组包含64个频带的单速率解码器也是可能的，实际上，通过(伪)复数QMF组完成重建。因为复数QMF滤波器组并不是被临界采样的，因此不需要额外的规定来考虑混叠。应注意到，在Ekstrand公开的SBR解码器中，分析QMF组只包含32个频带，而合成QMF组包括64个频带，与整个音频解码器相比，核心解码器运行在一半采样频率下。但是在相应的编码器中，使用一个64频带分析QMF组来覆盖整个频率范围。虽然本发明尤其有利于立体声音频编解码，但是本发明还有利于对具有大于2个音频声道的信号进行编解码。本发明的这些和其他方面将通过以下所述的实施例变得显而易见并且得到阐述。在附图中图1显示了在参数化立体声("PS")编码器中使用的用于立体声参数提取的单元的框图2显示了在PS解码器中使用的用于立体声信号重建的单元的框图3显示了频带复制("SBR")解码器的框图；图4显示了根据本发明一个实施例的、组合的PS及经SBR增强的编码器的框图5显示了根据本发明一个实施例的、组合的PS及经SBR增强的解码器的框图6显示了一个M频带经向下采样的复数QMF分析(左)和合成组(右)；图7显示了原型滤波器的以dB为单位的幅度响应；图8显示了64个未经向下采样的复数已调制分析滤波器中的前4个的以dB为单位的幅度响应；图9显示了具有平凡(trivial)合成的Q频带滤波器组的框图；图IO显示了笫一个未经向下采样的已调制QMF滤波器和8频带复数已调制滤波器组的以dB为单位的组合幅度响应；图11显示了根据本发明一个实施例的4频带偶数堆叠滤波器组(上)和奇数堆叠滤波器組(下)的固定格式的幅度响应；图12显示了根据本发明一个实施例的基于64频带复数分析QMF的77频带非统一混合分析滤波器组；图13显示了在音频解码器中使用的基于64频带复数分析QMF的71频带非统一混合分析滤波器组；以及图14显示了复数已调制分析滤波器组的高效实现方式的框图，附围仅仅显示了那些对于理解本发明而言是必要的元件。将SBR和PS相结合潜在地产生了非常强大的编解码器.SBR和PS都是在结构非常相似(即某种形式的时频转换、处理以及最后进行频时转换)的解码器中的后处理算法.当将这两种算法相结合时，要求这两个算法能同时在例如DSP应用上运行.因此，有利的是尽可能多的为另一个编解码器重复使用一个编解码器所计算的中间结果。在将PS和SBR相结合的情况下，这导致了为PS处理重复使用复数(伪)QMF子带信号.在一个组合编码器中(参见图4)中，借助于两个64频带分析滤波器组来分析立体声输入信号.使用该复数子带域表示，PS计算单元估计立体声参数并创建一个单声道(子带)向下混合.然后该单声道向下混合被馈送到SBR参数估计单元.最后，该单声道向下混合被一个32频带合成滤波器组转换回时域，以使其能够被核心解码器解码(核心解码器仅仅需要一半带宽)。在图5所示的组合解码器中，不管使用的是双速率还是单速率系统，在包络调整之后的全带宽(64个频带)子带域信号根据所述立体声参数被转换成一个立体声子带域信号组.这两组子带信号最后被所述64频带合成QMF组转换到时域。如果仅仅将PS和SBR相结合，那么QMF滤波器的较低频带的带宽大于高质量立体声表示所需的带宽。因此，为了能够给出立体声图像的高质量表示，根据本发明的有利实施例，将执行对所述较低子带信号的进一步细分.为了更好的理解本发明，首先解释复数QMF子带滤波器的理论。OMF子带滤波器以下将描述QMF分析子带滤波器。在给出一个实数值线性相位原型滤波器p(v)的情况下，一个M频带复数已调制分析滤波器组可以由以下分析滤波器定义其中k-0，l，…，M-l。相位参数e对于接下来的分析并不重要，但是通常的选择是(N+M)/2,其中N是原型滤波器的阶数。在给出一个实数值离散时间信号x(v)的情况下，通过用hk(v)对x(v)进行滤波(巻积)而获得子带信号Vk(n)，然后使用因子M对其结果进行向下采样(参见图6的左侧).合成搮作包括首先使用因子M对QMF子带信号进行向上采样，然后使用类型U)的复数已调制滤波器进行滤波，将结果相加，以及最后获取两倍的实数部分(参见图6的右侧).然后通过适当设计实数值线性相位原型滤波器p(v)来获得对实数值信号的近乎完美的重建。在64个频带的情况下，在(上述)MPEG-4标准的SBR系统中使用的原型滤波器的幅度响应如图7所示.通过将原型滤波器p(v)的幅度响应偏移("1/2)而获得64个复数已调制分析滤波器的幅度响应。这些响应的一部分显示在图8中。应注意到，只有正频率^t滤波，除了k=0以及k-M-l之外.因此，在向下采样之前，子带信号是接近解析的，从而有利于对实数值正弦进行容易的振幅和相位修改。相位修改也可以用于笫一和最后一个频带，只要驻留在这些频带中的正弦具有大于7r/2M或者小于7c-7t/2M的频率。对于在该区域之外的频率，由于负频率的干扰，相位修改的性能急剧恶化。从上述的QMF分析滤波器开始，在本发明的各实施例中，通过进一步将经过向下采样的子带信号Vk(n)滤波成Qk次子带而获得更精细的频率分辨率。以下将导出该进一步子带滤波的特性.在复数OMF子带域中的信号修改以下，让2(")=2::^(")呷(-''—成为对离散时间信号z(n)的离散时间傅立叶变换。假设上述近乎完美的重建特性以及这样一个设计，其中p(V)的傅立叶变换P((D)基本上在频率区间[-7t/M，7t/M之外消失，这就是上述原型滤波器p(v)的情况，下一步就是考虑一个系统，其中子带信号Vk(n)在合成之前被修改。现在，通过使用滤波器Bk(①)进行滤波来修改每个子带k。使用以下的扩展定义A(fl))-5-w(-o)'forA<0(2)其中*表示复共轭，然后可以示出(忽略总体延迟，假设实数值输入和单速率系统)所得到的系统包括对应于使用以下滤波器进行滤波的滤波器组合成j]l尸(鈔一豕(fc+l/2)/M)(2(3〉一w根据有关P(ro)的特性的假设，对于(3)式中所有的k插入Bk()=l导致B((D)-1，从而对于经偏移的原型滤波器响应得到一个平方和恒等式。通过选择实数值常数Bk((D)=b^0,该系统起到均衡器的作用，其在频率7i(k+l/2)/M处内插增益值bk.具有吸引力的特征就是整个系统是时不变的，即不会有混叠，尽管其中使用了向下和向上采样。当然，这只有在与所述原型滤波器假设的偏差量之内才成立。为了导出单声道音频信号，对复数子带信号的附加子滤波不应该仅仅保持这些特性，还应该将这些特性扩展到对已滤波子带信号的操作，保持这些特性的子滤波能够利用对被称为笫M频带滤波器的修改9来执行，所述滤波器参见P.P.Vaidyanathan的"Multiratesystemsandfilterbanks(多速率系统及滤波器组)"(PrenticeHallSignalProcessingSeries,1993，sections4.6.1-4.6.2)。具有平凡合成的已调制滤波器组离散时间信号v(n)可以被一组具有脉冲响应gq(n)，q-0，l，…，Q-l的滤波器分解为Q个不同的信号，如图9所示。令相应的分析输出为yq(n),并考虑该平凡合成操作<formula>formulaseeoriginaldocumentpage10</formula>然后通过选择滤波器来获得完美重建y(n)-v(n)，其中使得<formula>formulaseeoriginaldocumentpage10</formula>其中如果n-0则8(n)-l，如果n承0则S(n)-0。对于因果滤波器，式(5)的右侧将必须被S(n-d)代替，其中d是正延迟，但是为了清楚起见省略了该直接的修改。滤波器gq(n)可以通过下式被选择成对原型滤波器g(n)的复数调制<formula>formulaseeoriginaldocumentpage10</formula>在本发明的该优选实施例中，滤波器被奇数堆叠(因子q+l/2)。该优选实施例的优点将在后面解释，当且仅当满足下式时获得完美重建<formula>formulaseeoriginaldocumentpage10</formula>该式的一个变型是实数值余弦调制<formula>formulaseeoriginaldocumentpage10</formula>其中实数值原型滤波器g(m)满足<formula>formulaseeoriginaldocumentpage10</formula>(这在考虑了(6)式中的gq(n)+gQ小q(n)时能简单的实现.)对复指数已调制滤波器组进行子滤波从上述的QMF分析滤波器开始，通过使用上面(6)或(8)式的已调制结构当中的一个将每个经向下采样的子带信号v"n)进一步滤波成Qk个次子带而获得更精细的频率分辨率.将所得到的输出信号表示为^W，并用^(")描述在子带k中采用的滤波器组。如果Qk-l，那么就没有滤波并且^(")-S(n),—个典型的应用实例是M=64，Qn=8，Qk-4(其中k-l，2)，以及Qk-l(其中k〉2)。从x(v)到的两个滤波器组的组合效果可以被描述为利用滤波器"W的滤波，其后是利用因子M的向下采样，其中尸,*(o)=。'*(Ma)(10)如果原型滤波器响应P((D)在区间卜7t/M，7t/Ml之外基本上是0的话(SBR分析滤波器就是这样的情况(参见图7))，那么滤波器"一)具有单个标称中心频率，该标称中心频率在复数已调制的情况下由下式定义叫,2;r("込j+l)/(A/込)(11)其中s是整数，其被选择成使得込(*-^2("込"+"込(*4),例如，如图IO所示，如果k-0并且Qf8，那么tDo,MOo，h…，roo，7的值是^r(U5，7,9,ll广3'-l)8似具有非统一频率分辨率的信号修改如上所述的次子带滤波器组的插入不引入进一步的向下采样，这样就保持了如上所示的仅在复数QMF情况下的信号修改的无混叠性能。考虑到下面的通常的组合操作M子带分析，在子带k中使用Qk个次子带进行进一步的子带滤波，由滤波器Ak,q((D)对每个次子带信号刃(")进行滤波，在每个子带k中通过加法进行合成，以及最后通过M频带合成组进行合成。该系统的总体转移函数由等式(3)给出，其中)-^k，(。)G(12)从而对于>71/(21\1)给出SS々'(W")G;(A/fl>)|P((W-;r(il+l/2)/A/)|3(13)这样，次子带(k，q)的吞吐量响应是G'"^一w-^+i/;y/Aof.对于||^t/(2M)，由于等式(2)所以必须多加注意'在该频率范围中，下式成立fl(必)-50(,|尸(0-C》f+fl0(-AM*|/(0>+;r/(2A/》f(14)并且假设实数次子带原型滤波器系数，则下式成立(15)因此如果如下选择修改滤波器，^(-fl))'-D)(16)则有S。Hi/W=^。(A^),并且结合式(3)所提及的平方和恒等式导致下式。，-50(,-￡、(阔《(阔(17)其中对于l(Dl^t/(2M)，其对应于次子带(0，q)的吞吐量响应G:^甸'等式(15)到(17)表明希望区分正频率和负频率。这就是为什么奇数堆叠的(复数)滤波器被用于对QMF次子带信号进行子滤波，而不是使用偶数堆叠的(复数)滤波器(参见图11).对于偶数堆叠的滤波器，不可能应用驻留在中心滤波器(即中心频率为O的滤波器)中的正弦的相位修改，因为正、负频率不可能被区分。假设原型滤波器具有限制到[-2:c/Q，27i/Q的响应G(co)频带，其中Q是频带数量，对于偶数堆叠的情况，可近似应用相位修改的下限是2tt/Q，而对于奇数堆叠的情况，可近似应用相位修改的下限是7t/Q.如导言中所述，对于PS合成，上述重要的特殊情况是均衡化和相位修改。对于均衡化，Ak，q(ffl)=ak,^0以及条件(16)简化为相位修改情况对应于AM()=exp(iotM),在该情况下，如果下式成立就满足条件(16):立体声参数估计如上所述，非统一复数滤波器组(即QMF组，接下来是进一步子带滤波)可以用来估计下述立体声参数声道间强度差(IID)，声道间相位差(IPD)和声道间互相关(ICC)。应注意到，在该实际实施例中，IPD被用作ITD的实际等效替代，在Schuijers等的论文中使用的是ITD。在组合的PS编码器中(参见图4)中，前3个复数QMF声道被子滤波，这样获得总共77个复数值信号(参见图12)。从此，根据W(")的索引，77个复数值的时间对准的左、右次子带信号被分别表示为《(")和《w。为了估计在某一子带样本位置n'处的立体声参数，所述左、右和非归一化跨声道激励被计算如下<formula>formulaseeoriginaldocumentpage13</formula>对于每个立体声元(stereobin)b，h(n)是长度为L的子带域窗口，s是防止被O除的非常小的值(例如E-le-lO)，《(")和《(")是左、右次子带域信号.在20个立体声元的情况下，从k,到kh(包括kh)以及从q,到qh(包括qJ的加法被显示在下表中。应注意到，"负"频率(例如k-0，其中q-4…7)没有包括在(20)的参数估计中。表l:在k和q上的加法的开始和结束索引<table>tableseeoriginaldocumentpage13</column></row><table><table>tableseeoriginaldocumentpage14</column></row><table>计算e，(b)、er(b)和eR(b)的加法被对准，这样，这些信号在加法中的中点与参数位置一致，因此偏移2。从表l中清楚看出，只有具有正中心频率的次子带信号和子带信号被用来估计立体声参数。对于每个立体元b，HD(记为I(b))、HC(记为C(b))和IPD(记为P(b))被如下计算制"o'。g,。激,卜，,M(21)在等式)-A^)中的角度是使用给出在-丌和7c之间的值的4象限arctangent(反正切)函数来计算的。根据目标比特率和应用，这些参数或者这些参数的一个子集被量化，并被编码到比特流的PS部分中.立体声信号合成为了将解码器中的计算成本(在RAM使用方面)保持得尽可能低，使用了一个类似的分析结构。然而，第一频带仅仅是部分复数的(参见图13)。这是通过将各中间频带对《^和^W以及^")和GW进行相加而获得的.此外，第二和第三频带是两频带实数值滤波器组，这是通过对和《(的的输出进行相加以及对6和G的输出进行相加而获得的(也参见有关已调制滤波器組的章节的讨论)'使用解码器滤波器組结构的这一简化，通过对笫一子带滤波器进行细分保持了正、负频率之间的可区分特征。该解码器分析滤波器组被显示在图l3中，应注意到，第一QMF已滤波(次)子带信号的索引根据频率被存储。单个帧的立体声(次)子带信号被如下构造<formula>formulaseeoriginaldocumentpage14</formula>其中Sk(n)是单声道(次)子带信号，dk(n)是从单声道(次)子带信号Sk(n)导出的用来合成ICC参数的单声道去相关(次)子带信号，k是子带索引，k-0，…，K-l(K是子带的总数，即K-71)，QMF子带样本索引是n-0，…，N-l，N是一个帧的子带样本的数量，a,,,a,"a",a^是搮作矩阵的尺度因子，并且Prt是相位旋转操作矩阵.该操作矩阵被定义为时间和频率的函数，并且可以从操作矢量中直接导出，这在MPEG-4标准ISO/IEC14496-3:2001/FPDAM2，JTC1/SC29/WG11,CodingofMovingPicturesandAudio,Extension2中被描述，根据图12，Sk(n)被定义为图13的结果Jo(")-乂(")A(")豕乂(")A(")"J(")A(")"(")j"")-"(")+y(")A(24)"10...70立体声参数的合成根据表l的索引进行。表l:参数索引表<table>tableseeoriginaldocumentpage15</column></row><table>14127i/64-87t/6415138Tt/64-97t/6416-171497t/64-ll7t/6418-201511tc/64-14tc/6421-241614tc/64-187c/6425-2917187t/64-237t/6430-4118237i/64-357t/6442-7019357r/64-7C该合成等式因此可以变成"(")-A扭"k(")+A"to")^(")/t(")"W(,)。6、应注意到，在表格中如果遇到了a*，那么在上面等式中Prt的符号就改变。因此这就是等式(19)，即对于负频率必须应用反向相位旋转。具有平凡合成的已调制滤波器的高效实现方式在给定具有长度为L的原型滤波器的已调制滤波器组的情况下，一种直接形式的实现方式对于每个输入样本将要求QL操作，但等式(6)中的调制是对于周期Q反周期的(antipeHodic)这一事实可以用来将所述滤波分解成长度为L的多相加窗操作，其后是对于每个输入样本的大小为Q的变换，应当注意，上述多相表示可从以下文献中获知P.P.Vaidyanathan的"Multiratesystemsandfilterbanks多速率系统及滤波器組"(PrenticeHallSignalProcessingSeries,1993，section4.3).以下根据本发明的一个优选实施例提供该多相表示的有利应用。所述变换是DFT，之后是相位旋转(twiddle)，当Q是2的幂时，其具有Qlog2Q的阶数，因此，在其中L远远大于log2Q的通常情况下能获得大量的节省.在实数已调制的情况下(8)，与围绕11=0和11=0的偶数/奇数对称性相结合的对于2Q的周期的反周期性可以被再次用于多相加窗，并且该变换内核是类型in的DCT。以下将给出该复数调制情况的详细说明。使用FFT核心处理的次子滤波(sub-subfiHering)的有效实现方式可以利用其后跟随着调制的原型滤波器的多相分解来实现'假设原型滤波器g(n)的阶数为N，其中N=mQ,m是正整数.该条件并不是限制性的，因为任意阶数的原型滤波器可以被零填充(zeropadded)，以便满足该约束条件。被设计用于复数已调制系统(6)的原型滤波器的Z变换如下G(z)-S(27)这可以表示为多相符号卯)-IJ矽"V(28)其中，)￡(29)该滤波器组的所有滤波器都是原型滤波器的频率已调制版本。滤波器gq(n)的Z变换如下其中(30)(31)从一个滤波器的输出表示为，-c，(幹)-:(32)力冬'通过识别最后的合的各分量，可以看出各多相分量处理输入信号的延迟版本，其随后被乘以一个复指数。最后，通过应用逆FFT(不需要缩放因子)来找到所有的输出信号Yq(z)，q=l...Q-l。图14显示了分析滤波器组的布局.因为(29)中的多相滤波器是非因果的，因此一个适量的延迟必须被添加到所有的多相分量中。应当注意，上述实施例说明而不是限制本发明，在不背离所附权利要求书的范围的情况下，本领域的技术人员将能够设计许多替换实施例，在权利要求书中，括号里面的任何附图标记并不限制该权利要求."包括"一词并不排除在权利要求中列出的元件或步骤之外的其它元件或步骤的存在，本发明可以通过包括若干不同元件的硬件和适当编程的计算机来实现.在列举几个装置的设备权利要求中，这些装17置当中的几个可以被同一硬件项实现，在彼此不同的从属权利要求中引述某些措施这一事实，并不表示不能使用这些措施的组合来获益。权利要求1.组合参数化立体声和谱带复制增强的音频编码器，包括分析滤波器组，用于将时域立体声输入信号转换成子带域；参数化立体声计算单元，其用于为子带域中的立体声输入信号计算参数化立体声参数以便获得参数化立体声比特流，以及用于创建子带域中的单声道向下混合；谱带复制参数估计单元，用于估计子带域中的单声道向下混合的谱带复制参数，以便获得谱带复制比特流；频时转换器，用于将单声道向下混合从子带域转换到时域中；以及核心编码器，用于对时域单声道向下混合进行编码以便获得核心比特流。2.组合参数化立体声和谱带复制增强的音频编码方法，包括将时域立体声输入信号转换成子带域；为子带域中的立体声输入信号计算参数化立体声参数，以便获得参数化立体声比特流；创建子带域中的单声道向下混合；估计子带域中的单声道向下混合的谱带复制参数，以便获得谱带复制比特流；将单声道向下混合从子带域转换到时域中；以及对时域单声道向下混合进行核心编码以便获得核心比特流。3.组合参数化立体声和谱带复制增强编码的音频信号，包括参数化立体声比特流，其包括从立体声信号导出的参数化立体声参数；谱带复制比特流，其包括从立体声信号导出的单声道向下混合的诿带复制参数；以及表示核心编码的单声道向下混合的核心比特流.4.组合参数化立体声和谱带复制增强的音频解码器，其用于对包括核心编码的音频信号、频带复制参数和参数化立体声参数的编码输入信号进行解码，该解码器包括核心解码器，用于对编码的音频信号进行解码以便获得解码的音频信号；分析滤波器组，用于将解码的音频信号时域转换成子带域；高频产生器和包络调整器，用于使用子带域中的谙带复制参数来产生全带宽音频信号；参数化立体声合成单元，用于使用参数化立体声参数将全带宽音频信号转换成子带域中的立体声音频信号；以及合成滤波器组，用于将全带宽音频信号从子带域转换到时域。5.用于对编码输入信号进行组合参数化立体声和谙带复制增强的音频解码的方法，该编码输入信号包括核心编码的音频信号、频带复制参数和参数化立体声参数，该方法包括对编码的音频信号进行核心解码以便获得解码的音频信号；将解码的音频信号时域转换成子带域；使用子带域中的谱带复制参数来产生全带宽音频信号；使用参数化立体声参数将全带宽音频信号转换成子带域中的立体声音频信号；以及将全带宽音频信号从子带域转换到时域。6.—种计算机程序产品，包括用于指示计算机执行组合参数化立体声和谦带复制增强的音频编码方法的代码，该方法包括将时域立体声输入信号转换成子带域；为子带域中的立体声输入信号计算参数化立体声参数以便获得参数化立体声比特流；创建子带域中的单声道向下混合；估计子带域中的单声道向下混合的谱带复制参数以便获得谱带复制比特流；将单声道向下混合从子带域转换到时域中；以及对时域单声道向下混合进行核心编码以便获得核心比特流.7.—种计算机程序产品，包括用于指示计算机执行对编码输入信号进行组合参数化立体声和谱带复制增强的音频解码的方法，该编码输入信号包括核心编码的音频信号、频带复制参数和参数化立体声参数，该方法包括对编码的音频信号进行核心解码以便获得解码的音频信号；将解码的音频信号时域转换成子带域；使用子带域中的谱带复制参数来产生全带宽音频信号；使用参数化立体声参数将全带宽音频信号转换成子带域中的立体声音频信号；以及将全带宽音频信号从子带域转换到时域。全文摘要本发明提供一种组合参数化立体声和谱带复制增强的音频编码方法，其包括将时域立体声输入信号转换成子带域；为子带域中的立体声输入信号计算参数化立体声参数，以便获得参数化立体声比特流；创建子带域中的单声道向下混合；估计子带域中的单声道向下混合的谱带复制参数，以便获得谱带复制比特流；将单声道向下混合从子带域转换到时域中；以及对时域单声道向下混合进行核心编码以便获得核心比特流。本发明还提供一种组合参数化立体声和谱带复制增强的音频编码器。此外，本发明还提供一种用于对编码输入信号进行组合参数化立体声和谱带复制增强的音频解码的方法以及一种组合参数化立体声和谱带复制增强的音频解码器。文档编号G10L19/008GK101540171SQ20091012860公开日2009年9月23日申请日期2004年10月28日优先权日2003年10月30日发明者E·G·P·舒贾斯,F·M·J·德邦特,H·普恩哈根,L·F·维勒莫斯,P·厄克斯特兰德申请人:皇家飞利浦电子股份有限公司;编码技术股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：L.F.维勒莫斯;P.厄克斯特兰德;H.普恩哈根;E.G.P.舒贾斯;F.M.J.德邦特
技术所有人：皇家飞利浦电子股份有限公司;编码技术股份有限公司
我是此专利的发明人