通过不同子带域之间通道进行数据处理的方法

文档序号:2829217阅读:426来源:国知局
专利名称:通过不同子带域之间通道进行数据处理的方法
技术领域
本发明涉及一种通过不同子带域之间转换的数据处理,具体来说,但不以任何方式排外,涉及一种两种类型的压缩编码/解码之间的代码转换。
背景技术
目前用于多媒体信号的数字编码格式的发展允许高的压缩率。此外,传输和访问网络的容量的增加保证每天由公众使用大量的数字多媒体内容(语音、音频、图像、视频等等)。该内容的消费在各种类型的终端上(计算机、移动终端、个人助理(PDA)、电视解码终端(“机顶盒”)等等)并通过各种类型的网络(IP、ADSL、DVB、UMTS等等)实现。这种由用户对多媒体内容的访问在这些各种终端上并经过这些网络必须以透明的方式完成。然后有人提出“universal access to multimedia content(多媒体内容的通用接入)”或表示“Universal Multimedia Access(通用多媒体接入)”的“UMA”,其示意图如图1所示。
由于终端的不同引起的主要问题之一涉及它们能够解释的编码格式的多样性。一种可能的解决方案将会是在以兼容的格式传输内容之前恢复终端的容量。根据考虑(下载、流或广播)的多媒体内容的传输的任务,该解决方案可以证实是更有效或有效性更低。在某些情况下其变得不适用,例如对于多播模式的广播或流。代码转换(或改变编码格式)的概念因此被证明很重要。该操作可能在传输链的各层发生。其可能在服务器层发生用于在存储至例如数据库中之前改变内容的格式,或者在网络的网关中发生,等等。
代码转换直接和惯用的方法包括解码内容并且重新编码以得到新的编码格式的表示。这种方法一般具有使用大量计算机能量、由于处理增加算法延迟以及有时增加多媒体信号的感观质量的辅助下降的缺点。这些参数在多媒体应用中非常重要。其改进(减少复杂性和延迟并保持质量)是这些应用成功的重要因素。该因素有时成为实现的重要条件。
以改进这些参数为目的,所谓的“智能”代码转换的原则已经形成。这类代码转换包括执行初始编码格式的最小可能的部分解码,来提取允许重建新编码格式的参数。因此通过该方法减少算法复杂性和算法延迟以及保持或者甚至增加感观质量的能力评估这种方法的成功。
在图像和视频编码中,已经完成了许多有关代码转换的工作。我们引用示例,如图片大小从CIF到QCIF,或者MPEG-2到MPEG-4格式的改变。对于语音信号的代码转换,典型的在电话中,正在进行解决关于编码格式问题的工作。另一方面,很少或者几乎没有工作解决音频信号处理。现有的工作保持限制在一个和相同格式之中减少比特率或当在非常类似的结构的某些编码格式之间转换时减少比特率的情况。主要原因在于最广泛使用的音频编码器是变换(或子带)类型,并且一般来说,这些编码器使用不同的变换或滤波器组。这样,可以理解在涉及音频领域的智能代码转换的任何其他问题能够攻克之前,用于在这些变换域或滤波器组中的信号的表示之间转换的系统实现因此是要克服的第一困难。
下面在简要提示感观音频子带编码的原理之后,给出音频代码转换的定义和其引起的主要问题。
现有专为各种类型的应用和广泛的比特率以及质量而设计的大量类型的语音编码。这些编码可以称为构造器(或“专用”),或者由国际组织确定的其它标准。此外,这些都具有共同的基本结构并且依靠同样的原理。
感观频率音频编码的基本原理包括通过利用人类听觉系统的特性减少信息的比特率。音频信号的非相关分量被除去。该操作利用所谓的“掩蔽”的现象。由于这种掩蔽效果的说明主要在频域实现,信号的表示在频域实现。
具体的,编码和解码系统的基本示意图如图2a和2b所示。参照图2a,数字音频输入信号Se首先由一组分析滤波器20分解。得到的频谱分量之后由模块22量化然后编码。该量化采用感观模块24的结果从而来自该处理的噪音听不到了。最后,由模块26执行各种编码参数的多路复用并且从而构建了一个音频帧Sc。
参照图2b,以双重方式执行解码。由模块21进行音频帧的解复用,各种参数被解码然后信号的频谱分量由模块23解量化。
最后,通过一组合成滤波器25重构暂时音频信号。
因此任何感观音频编码系统的第一部分包括一组分析滤波器20,用于时间/频率变换。大量的滤波器组和变换已经被开发并用于音频编码器。可以建议利用伪QMF(正交镜像滤波器)滤波器组、混合滤波器组、MDCT(修正离散余弦变换)变换器组。在本文中MDCT变换目前证明是最有效的。这是最新最有效的音频编码算法的基础,例如那些在来自法国电信的UIT-T标准G.722.1的TDAC编码器/解码器(“时域混叠消除”的标准)中,用于MPEG-4AAC,TwinVQ和BSAC,Dolby AC-3标准的那些算法。
虽然已经分别开发这些各种变换,可以通过类似的通用数学方法以及从各种观点说明这些变换调制余弦滤波器组、重叠正交变换(或“LOT”)以及更一般的对于具有最大抽取的滤波器组,也就是说用临界采样。滤波器组的临界采样的特性在于子采样/过采样因子等于子带的数目。
图3a和3b分别示出了在根据第一编码格式的编码器CO1和根据第二编码格式的解码器DEC2之间,传统代码转换和智能代码转换在通信链中的示意图。在传统代码转换的情况下,由根据第一格式(图3a)的解码器模块DEC1执行完整的解码操作,接着由根据第二格式的编码器模块CO2的再编码,从而最终以第二编码格式结束。
在图3b的示例中,图3a的两个模块DEC1和CO2在另一方面以一个集成后的模块31代替,该集成后的模块31被称为“智能”代码转换模块。
图4表示的是合并入智能代码转换的实现的操作的详细情况。这主要包括在模块31中集成了传统代码转换的合成滤波器组BS1和分析滤波器组BA2的功能模块从而最后在一个系统中子带域之间直接转换。
各种类型滤波器组(不同的大小,尤其是按照子带的数目,以及不同的结构)的编码器的使用是主要和首先要克服的问题。因此这涉及一帧的整组采样从初始滤波器组的域到目标滤波器组的域的转换。这种转换是在任何智能音频代码转换系统中完成的第一步操作。
下面的表1总结了关于在众所周知的基于转换的音频编码器中使用的滤波器组的类型,以及其特性。可以看到,除了最广泛采用的MDCT(修正离散余弦变换)变换以外,还有伪QMF(正交镜像滤波器)组。此外,他们都形成最大抽取和调制余弦组的族的一部分,其正好或几乎满足完全重构的特性。
表1在音频编码中应用最广泛的滤波器组及其特性

表1显示出AAC和AC-3格式之间的转换目前引起大量兴趣。
下面的表2重复说明表1中的某些类型的子带编码,详细说明其一些应用。
表2用于音频信号和语音信号的子带编码器的示例及其主要应用的一些示例。


在现有技术的音频代码转换中,文献US-6,134,523介绍了对于由MPEG-1层I或层II编码的音频信号在编码域减少比特率的处理。即使该处理类似于音频代码转换处理,但是其在编码器格式之间不能实施任何改变并且子带的信号改变保留为一个并且相同变换域的表示,即伪QMF滤波器组的表示。这里,所述信号根据新的比特分配非常简单的重新量化。
此外,在文献US-2003/0149559中,建议在代码转换操作期间减少心理声学模型的复杂性。这样,从而在代码转换期间不必采取计算掩蔽阈值的操作,该新系统使用存储在失真模板数据库中的值。即使该过程处理代码转换的问题,其仍然远离关于在滤波器组域之间的转换的目标。
在文献US-2003/014241中,提出一种用于在MPEG-1层II和MPEG-1层III音频编码格式之间的代码转换的系统。具体来说,MPEG-1层II格式采用伪QMF分析滤波器组而MPEG-1层3格式采用相同的滤波器组接着对所述滤波器组的输出子带信号应用大小为18的MDCT变换。有人称为“混合滤波器组”。该文献中提出的这种转换系统在于在MPEG-1层II帧的子带采样的反量化之后施加这种转换。因此该系统得益于两种编码格式的相似性。
关于在本发明的意义之中广受欢迎的目的,注意下面的说明
●这种现有技术只能应用于这种特殊情况的代码转换。
●这种技术不是真正在新的不同的子带域中执行转换的处理。其简单包含级联新的缺少的分析滤波器组,其使得可能增加频率分辨率。
在转换域中的多速率处理和滤波在图像和/或视频数据处理的其它情况中已经知道,尤其是通过该会议“2-D Transform-Domain ResolutionTranslation”,J.-B.Lee和A.Eleftheriadis,IEEE Trans.On Circuit and Systemsfor Video Technology(IEEE学报,视频技术电路和系统),Vol.10,No.5,2000年8月。
说明了一种在变换后的域(TDF表示“变换域滤波器”)中线性滤波处理的概述。具体来说,该概述建立在下述情况下即第一变换(反向)T1和第二变换(正向)T2是相同大小。该概述首先在于扩展所述处理到变换不是相同大小的情况。然后这种处理称为“非一致TDF”(或NTDF)。之后扩展到除了滤波,在变换后的域中加入多速率处理操作(子采样和过采样)的情况,这产生“多速率TDF”(MTDF)。
推荐的应用为改变变换域中的分辨率(TDRT代表“变换域分辨率转换”),特别是图像和视频应用(CIF和QCIF图像格式之间的转换),其中变换是DCT(代表“离散余弦变化”)。因此,该引用仅仅对变换后的域中的滤波感兴趣。提出的这种处理仅仅限于没有重叠的变换的情况,例如DCT、DST等等,但是通常不能应用于有重叠的变换例如MLT(代表“调制重叠变换”)以及,更一般的,应用于任何类型的具有最大抽取的滤波器组,这些滤波器甚至具有有限或无限冲激响应。
关于不同大小的DCT域之间的变换,仍旧是用于图像和视频的代码转换,可以引用下面的文献作为参考“Direct Transform to Transform Computation″,A.N.Skodras,IEEE Signal Processing Letters(IEEE信号处理快报),Vol.6,No.8,1999年8月,页码202-204。
在该文献中提出用于在DCT域中为图像子采样的不同大小的DCT变换之间转换的处理。该处理的应用之一是代码转换。此外,该处理限于由两个相邻的各自大小为N/2的变换矢量构成一个大小为N的变换矢量。
文献US-2003/0093282中介绍了在MDCT域中和DFT(离散傅立叶变换)域中信号表示之间转换的处理。
这是为了将音频信号转换成可以方便修改的表示而开发的。具体的,与DFT滤波器组相反,TDAC滤波器组是更实用的并且在音频编码器中用的很多。此外,由于存在频谱混叠部分,该变换域中的信号分量执行处理或修改既不充分也不足够灵活。另一方面,当对音频信号作修改,例如时标变化或基音平移时,DFT表示更有用。因此该参考文献提出了一种用于MDCT和DFT域之间转换的直接处理代替采用传统的处理,传统的处理在于通过逆MDCT合成暂时信号,然后应用DFT。因此该处理允许在编码的域直接进行修改。该文献还提出用于在DFT和MDCT域之间转换的双处理,其在修改之后需要重编码音频信号的情况下将很有用。
在该参考文献中,与传统变换过程相比在复杂性方面没有减少。此外,证明内存的少量增加允许数据的存储。
然而,●在该参考文献中提出的的处理解决特殊情况。其仅限于在MDCT和DFT域之间变换的情况,反之亦然。
●该处理限于这两个滤波器组是相同大小的情况。
还可以引用出版物“An Efficient VLSI/FPGA Architecture for Combining anAnalysis Filter Bank following a Synthesis Filter Bank”,Ravindra Sande,Anantharaman Balasubramanian,IEEE International Symposium on Circuits andSystems(IEEE电路和系统国际讨论会),Vancouver,British Columbia,Canada,2004年5月23日到26日。
该出版物公开了一种用于实现由具有L个子带的合成滤波器组后面接着具有M个子带的分析滤波器组构成的系统的有效的结构,其中M和L一个是另一个的倍数。该结构对于以VLSI(“超大规模集成”)集成技术或FPGA(“现场可编程门阵列”)或并行处理器实现有效。其需要更少的逻辑块、低电耗以及使得可以扩展并联的级数。在基于子带的一个处理接着另一个子带处理的情况下以及并且在不需要中间的合成信号的情况下可以应用该提子网掩码处理。
然而●上述的处理做限制性假设,即考虑的滤波器组是调制的并且可以分解成为多相结构。
●该处理仅限于其中M和L一个是另一个的倍数的特殊情况。
应当指出,用于在子带域之间转换的该方案的结构展示了与复用转换问题某些相似性,尤其是在“Multirate Systems and Filter Banks”(多速率系统和滤波器组),P.P.Vaidyanathan,Prentice Hall,Englewood Cliffs,NJ,1993,第148-151页中介绍的复用转换。
具体的,在从TDM到FDM(表示从“时域复用”到“频域复用”)的复用转换中,采用了合成滤波器组。为了重构交错时域信号(也就是说执行从FDM到TDM的复用反变换操作),采用分析滤波器组。因此TDM->FDM->TDM系统的结构等于是合成滤波器组和分析滤波器组的级联,这正好对应也在传统代码转换系统中使用的结构。在这些复用变换系统中一般提出的问题是在TDM->FDM->TDM操作之后没有失真地重构初始信号。这主要涉及在这些滤波器组中,消除由于采用非理想带通滤波器引起的串音干扰现象引起的失真。合成滤波器和分析滤波器的一种明智的设计如同在下述参考文献中所示“Multirate Systems and Filter Banks”(多速率系统和滤波器组),P.P.Vaidyanathan,Prentice Hall,Englewood Cliffs,NJ,1993,第259-266页,该设计使得可能克服该问题。在这些滤波器的设计建议中,给出了合并合成滤波器组和分析滤波器组的处理,从而考虑提出一种智能变换系统。
然而●在该文献建议的多路复用结构中,合成滤波器组和分析滤波器组具有相同的子带数目(M=L)。
●没有构建一个合并合成滤波器组和分析滤波器组的复用变换系统,正如在代码转换中。这两个滤波器组是独立左级联。

发明内容
本发明寻求相对上述现有技术改进其状况。
为了该目的,本发明提出了一种由计算机资源实现的通过在不同子带域之间转换来处理数据的方法,在于在同一处理中紧缩包括将含有第一数目L个单独的子带分量的第一矢量应用到一组合成滤波器,然后应用到一组分析滤波器,以获得包括第二数目M个单独的子带分量的第二矢量。
在本发明意义内的方法包括以下步骤,在确定第三数目K,即第一数目L和第二数目M之间的最小公倍数之后
a)如果第三数目K不同于第一数目L,通过第一矢量的串/并变换进行区块排列以得到p2个多相分量矢量,其中p2=K/L,b)选择的包括K×K维方阵T(z)的矩阵滤波应用到所述p2多相分量矢量以获得第二矢量的p1个多相分量矢量,其中p1=K/M,以及c)如果第三数目K不同于第二数目M,通过并/串变换进行区块排列以得到所述第二矢量。
这样,本发明尤其提出,但如下所示并不排除,从任何第一类型编码到任何第二类型编码的代码转换。还可以理解子带的各自的数目M和L是任何自然整数并且在最通用的情况下不需要成比例的关系。
这样,本发明的意思中的方法可以有利地应用于从第一类型的压缩编码/解码到至少一种第二类型的压缩编码/解码的代码转换。该应用典型地在于同一处理中紧缩有如下步骤-根据所述第一类型,以包括第一数目L个单独子带分量的第一矢量的形式至少部分解码恢复数据,-将第一矢量应用到根据所述第一类型的合成滤波器组,然后应用到根据第二类型的分析滤波器组,以及-恢复包括第二数目M个单独子带分量的第二矢量并且该第二矢量可以应用到后来的根据第二类型的编码步骤。
本发明的目的还在于一种计算机程序产品,存储在通信网络中例如服务器、网关、或其它终端的一项设备的内存中,并且包括用于实现如本发明所述方法的全部或部分的指令。
本发明的目的还在于一种用于通信网络的设备例如服务器、网关、或其他终端,,并且包括用于实现本发明所述方法的计算机资源。


本发明的其他特征和优点将在研究下面的详细说明和附图之后变得明显,其中图1示出了对多媒体内容(UMA)的通用访问的概念;图2a和2b示出了分别在编码和解码过程中的感观频率音频压缩系统的基本方案;
图3a和3b图示了分别使用传统代码转换和智能代码转换的通信链;图4示出了上述的传统代码转换的框图(图的上部分)和智能代码转换的框图(图的下部分);图5a和5b图示了说明暂时信号的合成和用新滤波器组的分析(图5a)与两个子带域之间的直接转换(图5b)等效的框图;图6示出了子带域之间的传统转换的多速率区块图;图7示出了本发明意义内的子带域之间转换的系统的多速率区块图;图8示出了本发明意义内的在转换系统中滤波的方法;图9示出了在M=pL的特定情况下本发明意义内的转换系统的多速率区块图;图10示出了在M=pL的特定情况下本发明意义内的转换系统中滤波的方法;图11示出了在L=pM的特定情况下本发明意义内的转换系统的多速率区块图;图12示出了在L=pM的特定情况下的转换系统中滤波的方法;图13示出了以LPTV系统为例,L=pM的情况下的转换系统中滤波的方法,其中输入比特率与输出比特率不同;图14示出了在LPTV系统M=pL的情况下的转换系统图,其中输入比特率与输出比特率不同;图15示出了在M和L不以特定比例关系相关的一般情况下以LPTV系统为例,本发明意义内的转换系统的图;图16示出了在N=3的情况下通过变换和叠加运算(术语OLA代表“重叠和相加”)的本发明意义内的转换系统的实施;图17示出了本发明意义内在对应于变换和具有叠加OLA的实施方式中的的转换系统,用于允许飞速处理的高效实施;图18示出了在M=pL的特定情况下,本发明意义内在对应于变换和叠加OLA的实施方式中的转换系统,用于允许飞速处理的高效实施;图19示出了在L=pM的特定情况下,本发明意义内在对应于变换和叠加OLA的实施方式中的转换系统,用于允许飞速处理的高效实施;图20a和20b分别示出了本发明意义内的与子带域之间的转换结合在一起的滤波以及等效的整个系统;图21a和21b分别示出了传统的和本发明意义内的采样频率变化(或“重采样”)与子带域之间的转换的结合;图22示出了本发明意义内结合了重采样的子带域之间的转换的系统的多速率区块图;图23示出了本发明意义内的系统,以LPTV应用了结合有重采样的转换的LPTV系统为例;图24示出了对应于变换和叠加OLA的优选实施方式,用于允许图23的转换系统飞速处理的高效实施;图25示出了本发明的可能应用的插入通信网络的网关GW中的代码转换;图26示出了直接插入服务器SER的代码转换;以及图27示出了在特定情况的编码格式下本发明意义内的转换系统的参数表。
具体实施例方式
在下面以本发明普通代表的方式描述子带域之间转换的方法。
由第一压缩编码系统使用并由其滤波器限定的L-带合成组,其表示为Fk(z),0≤k≤L-1,以及在第二压缩系统中使用并由其滤波器限定的M-带分析滤波器组,其表示为Hn(z),0≤n≤M-1。如下所述,假设在两个压缩系统中使用的两个滤波器组为优先最大抽取系统(或“临界采样系统”)。
用X(z)=[X0(z)X1(z)...XL-1(z))]T和Y(z)=[Y0(z)Y1(z)...YM-1(z)]T来表示分别代表第一和第二滤波器组的域中的信号的子带的信号矢量。
图5a和5b示出子带域之间转换的原理。包括查找相当于合成组BS1和分析组BA2(图5a)的级联的系统51,该系统51用于在子带信号矢量X(z)和Y(z)之间转换(图5b)的系统51。目的是合并这两个滤波器组之间的一定数学计算运算以降低算法复杂性(即,计算运算的数量和所需内存的数量)。另一目的在于将由该变换带来的算法延迟降低到最小。
通过使用多速率块,图5a中的方案可以表示为图6中的图,其中分析滤波器组在合成滤波器组之后。具有L子带的合成滤波器组在各子带k,0≤k≤L-1中由按照因子L的过采样的运算组成,所述过采样之后是合成滤波器Fk(z)的滤波。对应于输入矢量X(z)的第k分量的子带信号首先被过采样然后由滤波器Fk(z)滤波。随后通过0≤k≤L-1的这些滤波结果相加得到在该合成组的输出合成的暂时信号 该暂时信号随后构成具有M子带的分析组的输入。在各子带n,0≤n≤M-1上,由分析滤波器Hn(z)进行滤波,随后是按照因子M的过采样运算。然后在该分析组的输出处获得在z变换的域中用Y(z)表示的大小为M的子带信号的矢量。在该传统转换系统中通常必须要进行时域信号的合成,这是与本发明意义中的下述转换系统相比的区别之处。
现在根据普通表达描述本发明意义中的转换系统。
用M和L的最小公倍数K(即,K=1cm(M,L))以及p1和p2表示自然整数,从而K=p1M且K=p2L. (1)认为U(z)=[X0T(z),X1T(z),...Xp2-1T(z)]T]]>是通过信号矢量X(z)分解为p2多相分量而得到的矢量,并且认为V(z)=[Y0T(z),Y1T(z),...Yp1-1T(z)]T]]>是通过信号矢量Y(z)分解为p1多相分量而得到的矢量。
用g(z)表示合成和分析滤波器之间的乘积,大小为M×L的矩阵。该矩阵的元素可以写为如下Gnk(z)=Hn(z)Fk(z),0≤n≤M-1,0≤k≤L-1.(2)并且,矩阵形式为g(z)=h(z)fT(z),(3)其中,h(z)=[H0(z)H1(z)...HM-1(z)]T和f(z)=[F0(z)F1(z)...FL-1(z)]T分别是第二滤波器组的分析滤波器的矢量和第一滤波器组的合成滤波器的矢量。
用下面公式表示子带域之间的转换V(z)=T(z)U(z) (4)转换矩阵T(z)的大小为K×K。其可以按如下表示T(z)=[v(z)g(z)]|↓k, (5)其中,v(z)是大小为p1×p2的矩阵,其元素定义为如下
vij(z)=ziM-jL,0≤i≤p1-1且0≤j≤p2-1(6)运算表示克罗内克(kronecker)积,从而 运算↓K表示按因子K的抽取,相当于在K个样本中仅有一个样本被保留的子采样。
如下所述,转换系统可以示意性地表示为如图7所示,其中示出了系统有利地是所谓的“线性周期时变”或者LPTV系统。
在图7中,输入框71包含超前zp2-1和系列延迟,接着是按照因子p2的抽取72_p2-1至72_0,该输入框被解释为用于排列p2输入矢量的各序列的机制,表示为X[n],如单个矢量U[k]的K个区块。后面的矢量U[k]应用到滤波矩阵T(z)(模块74),并且结果是与矢量U[k]大小相同的矢量V[k]。
符号X(z)简单地涉及矢量X根据其z变换的表达式,而符号X[n]为矢量X在时域中的表达式,这点对于本领域技术人员来说是惯例。
图7的最后一框73_p1-1至73_0最终能够串行地设置矢量V[k]的各大小为M的p1连续子矢量,从而产生输出矢量Y[r]。
图7的输入和输出框最终与图8的在框81中进行排列并随后在框82串行设置的机制几乎相同,图8总结了本发明意义内的主要方法步骤。
优选地,本发明意义内的转换系统具有最小延迟。
具体地,子带域转换系统的目的之一是使引起的算法延迟最小。因此,必须引入超前减少延迟。如果-在合成滤波器组的输入处增加超前/延迟za,a∈Z,-并且在两个滤波器组之间增加超前/延迟zb,b∈Z,那么上述公式(5)变为T(z)=[[zaL+bziM-jLg(z)]|↓K]0≤i≤p1-10≤j≤p2-1---(8)]]>
指数eij=aL+b+(iM-jL),0≤i≤p1-1,0≤j≤p2-1在下面两个极值之间变化当i=0,j=p2-1时,emin=aL+b-([p2-1)L=aL+b-K+L, (9)和当i=p1-1,j=0时,emax=aL+b+(p1-1)M=aL+b+K-M, (10)矩阵T(z)的元素滤波器都是因果滤波器,如果并且仅如果emax≤K-1, (11)即aL+b≤M-1. (12)本发明意义内的转换系统因此可以用各种延迟并且通过做出关于参数a和b的不同选择构造,但是条件是优选地满足不等式(12)。
参数a和b因此被看作调整参数,其可以对用于子带域之间转换的系统所引起的算法延迟方面起作用。
对于具有最小算法延迟的转换系统,应当引入最大可能超前。因此优选地以下述方式做出a和b的选择emax=K-1, (13)即aL+b=M-1. (14)对于该选择,公式(8)变为T(z)=[[zaL+bziM-jLg(z)]|↓K]0≤i≤p1-10≤j≤p2-1---(8)]]>否则T(z)=[v(z)g(z)]|↓K(16)其中,在这里,v(z)是元素按如下定义的矩阵vij(z)=zM-1+iM-jL,0≤i≤p1-1且0≤j≤p2-1.(17)关系式(16)因此是转换矩阵T(z)的通用公式,其能够将由本发明意义内的转换系统所引起的算法延迟减少到最小。
接下来,应当考虑具有最小延迟的转换系统的情况。
如果使用符号eij=M-1+(iM-jL),其中0≤i≤p1-1且0≤j≤p2-1,那么在公式(15)的基础上给出矩阵T(z)的矩阵元素[zeijg(z)]|↓K的下面解释
注意到,关系式(18)中考虑的多相分量对应于类型1至K阶的分解,如前述参考文件″Multirate Systems and Filter Banks″,P.P.Vaidyanathan,PrenticeHall,Englewood Cliffs,NJ,1993中所描述的。
该解释因此能够从乘积滤波器Gnk(z)=Hn(z)Fk(z)(0≤n≤M-1且0≤k≤L-1)和通过增加延迟构造的相应滤波器的类型1至K阶的多相分量直接构造矩阵T(z)。
为了更清楚地表达矩阵T(z)的元素,写出T(z)=[Tml(z)]0≤m,l≤K-1(19)因此,矩阵T(z)的元素滤波器当0≤m,l≤K-1可以写为 在后的公式(20)中,整数i,n和j,k与l和m的关系如下 且n=m-iM,(21) 且k=l-jL,(22)其中, 表示实数x的整数部分。
符号Gnkr(z)(其中0≤r≤K-1)表示从类型1至K阶的分解得到的滤波器Gnk(z)的多相分量数r。
如果合成滤波器和分析滤波器具有有限冲激响应(或“FIR”),可以直接确定多相分量Gnkr(z)(其中0≤r≤K-1)。在一个或两个滤波器组使用递归滤波器(具有无限冲激响应或“IIR”)的情况下,乘积滤波器Gnk(z)也具有无限冲激响应。在来自参考文件″Traitement du signal audio dans le domaine codétechniques et applications″[Audio signal processing in the coded domaintechniques and applications],A.Benjelloun Touimi,doctoral thesis from the écolenationale supérieure des télécommunications de Paris,May 2001的题为“Polyphase decomposition of recursive filters(递归滤波器的多相分解)”的附录A中描述用于进行该分解的通用过程。
以下描述在M=pL的特定情况下的本发明意义内的方案。
在M=pL的情况下,出现K=1cm(M,L)=M且p1=1同时p2=p。那么公式(4)变为Y(z)=T(z)U(z).(23)其中,U(z)=[X0T(z),X1T(z),···Xp-1T(z)]T]]>是矢量信号X(z)的p阶的多相分量的矢量。
在该情况下的转换矩阵是大小为M×M,并且可以写为T(z)=[[zpL-1g(z)]|↓M,[z(p-1)L-1g(z)]|↓M,...,[zL-1g(z)]|↓M](24)因此,根据合成和分析滤波器的乘积的矩阵g(z)的类型1至M阶的分解,该矩阵是分别由通用指数(p-k)L-1(其中0≤k≤p-1)的多相分量的行矢量。
更清楚地,矩阵T(z)的元素滤波器可以写为如下Tml(z)=Gmj(p-k)L-1(z),0≤m,l≤M-1---(25)]]>其中,j和k是通过下面的关系式由l获得的整数 且j=l-kL,(26)符号Gmjr(z)(其中0≤r≤M-1)表示由M阶的分解得到的滤波器Gmj(z)的普通标号r的多相分量。
下面给出了转换系统的方案,其中图9为多速率表达,图10示出了滤波方法的主要步骤。
下面描述在L=pM的特定情况下的本发明意义内的方案。
在该特定情况下,出现K=1cm(M,L)=L且p1=p同时p2=1。那么公式(4)变为V(z)=T(z)X(z),(27)其中,V(z)=[Y0T(z),Y1T(z),···,Yp-1T(z)]T]]>是矢量信号Y(z)的p阶的多相分量的矢量。
在该情况下的转换矩阵是大小为L×L,并且可以写为
T(z)=[zM-1g(z)]|↓L[z2M-1g(z)]|↓L···[zpM-1g(z)]|↓L---(28)]]>根据合成和分析滤波器的乘积矩阵g(z)的类型1至L阶的分解,该矩阵是分别包含通用标号(k+1)M-1(其中0≤k≤p-1)的多相分量的列矢量。
更清楚地,矩阵T(z)的元素滤波器可以写为如下Tml(z)=Gil(k+1)M-1(z),0≤m,l≤L-1,---(29)]]>其中,i和k是通过下面的关系式从m获得的整数 且i=m-kM.(30)符号Gilr(z)(其中0≤r≤L-1)表示从L阶的分解得到的滤波器Gil(z)的通用标号r的多相分量。
参数a和b的可能选择包括采用a=0且b=M-1。在优先满足等式(14)的条件下可以设想其他选择,从而获得具有最小延迟的系统。
下面给出了在L=pM的特定情况下的转换系统的方案,其中图11为多速率表达,并且图12示出了滤波方法的主要步骤。
现在根据线性周期时变系统的方案将描述本发明意义内的转换系统。在该情况下,合成和分析组的滤波器优先地是临界采样滤波器。
图7给出的转换系统的方案显示,这是在下述参考文件意义内的线性周期时变或“LPTV”系统“Multirate Systems and Filter Banks(多速率系统和滤波器组)”,P.P.Vaidyanathan,Prentice Hall,Englewood Cliffs,NJ,1993中的章节10.1。
为了确定该系统的周期并找到清楚说明其性质的等效结构,首先按以下设定特定情况L=pM且M=pL。
用fs表示时域中信号的采样频率,并且用fs1和fs2分别表示在第一和第二滤波器组的域中的采样频率。而且用Ts,Ts1和Ts2分别表示相应的采样周期。这些参数满足下列关系式fs1=fsL,]]>fs2=fsM---(31)]]>
在L=pM的特定情况下,考虑图7的方案和转换矩阵的公式(28),可以从中推导出转换系统是周期pTs2=Ts1]]>的线性周期时变系统。用图13的结构可以表达。其特征是由下式定义的p传递矩阵Ak(z)(其中0≤k≤p-1)的组Ak(z)=[z(k+1)M-1g(z)]|↓L,0≤k≤p-1(32)该系统在输入和输出不具有相同的比特率。输入的比特率是fs1,并且输出的比特率是fs2=pfs1.]]>传递矩阵Ak(z)以采样频率fs1运算,并且系统整体工作好像在系统输出处开关130(图13)以循环方式以该相同频率fs1从一个矩阵框Ak(z)的输出到另一个的输出之间转换。
注意到,在时刻nTs2,系统的输出Y[n]等于在时刻 的矩阵Ak(z)的输出,其中k=n modp。
在M=pL的其他特定情况下,考虑在该情况下采用的转换矩阵的公式(24),图7的方案变为图14的方案。
该转换系统可以被视为LPTV系统,其中周期pTs1=Ts2,]]>特征是由关系式(33)定义的p矩阵Ak(z)(其中0≤k≤p-1)的组并接下来对所有其输出的求各Ak(z)=[z(p-k)L-1g(z)]|↓M,0≤k≤p-1(33)在该系统的输入,比特率是fs1=pfs2,]]>且输出比特率是fs2。传递矩阵Ak(z)以采样频率fs2工作,并且系统整体工作好像在系统的输入处开关140(图14)以循环方式以该相同的频率fs2从一个矩阵Ak(z)的输入到另一个矩阵的输入之间转换。
另外指出,在时刻nTs2,转换系统Y[n]的输出等于在各时刻由X[(n-1)p+k+1]反馈的Ak(z)(其中0≤k≤p-1)的输出的和((n-1)p+k+1)Ts1=(n-1)Ts2+(k+1)Ts1.]]>现在描述在M和L不必通过比例关系相关的普通情况下的系统的工作方式。考虑图7的方案和上面给出的两个特定情况L=pM且M=pL的说明由关系式(15)给出的矩阵T(z)的形式,普通情况下的转换系统可以概括为图15所示的表达。普通系统包括周期各为p2Ts1的多个p1线性周期时变子系统。来自该组的阶数i(其中0≤i≤p1-1)的LPTV子系统的特征是下面的p2传递矩阵Aij(z)Aij(z)=[zM-1ziM-jLg(z)]|↓K,0≤j≤p2-1(34)这些子系统的整个组并行运算,并且其输出之一被周期性地选择作为周期为p1Ts1的系统的输出。整个系统也是周期为KTs的线性周期时变系统。具体地K=p2L=p1M,且Ts=Ts1L=Ts2M---(35)]]>因此,p1Ts2=p2Ts1=KTs]]>在图15的输入和输出分别表达的两个开关151和152以频率 操作,该频率也是传递矩阵Aij(z)的操作频率。
在时刻nTs2,系统Y[n]的输出等于在时刻nTs2,LPTV子系统i的输出,其中i=n modp1。在时刻kTs1,系统X[k]的输入转向各p1LPTV子系统中第j子系统的输入,其中j=k modp2。
在该系统输入比特率是fs1,且输出比特率是fs2,这使得本发明意义内的转换系统能够飞速处理输入数据。
回想滤波器Aij,nk(z)(其中0≤n≤M-1且0≤k≤L-1)的表达式,传递矩阵Aij(z)的元素取决于eij,因此取决于标号i和j,并且可以写为Aij,nk(z)=Gnkeij(z),]]>如果0≤eij≤K-1(37)且Aij,nk(z)=z-1GnkK+eij(z),]]>如果eij≤0 (38)下面描述本发明意义内的转换系统的有利实施。
用N1表示滤波器Fk(z)(其中0≤k≤L-1)的长度,并且用N2表示滤波器Hn(z)(其中0≤n≤L-1)的长度。这些符号仅在这些滤波器具有有限冲激响应并对于两个滤波器组的每个具有相同长度的情况下使用。
下面的表达式将用于基于T(z)的矩阵滤波模块的输入和输出的矢量U(z)=[U0(z)U1(z)...UK-1(z)]T(39)
且V(z)=[V0(z)V1(z)...VK-1(z)]T(40)基于矩阵滤波的实施从公式(4)和图8的转换系统的方案代表直接得出。因而,矢量V[k]的分量的各信号Vm[k]是通过滤波器Tml(z)的每个信号Ul[k]的滤波结果的和,其中0≤m≤K-1,0≤l≤K-1。
在有限冲激响应合成和分析滤波器组的情况下,矩阵T(z)的所有元素滤波器也是有限冲激响应滤波器。通常,在该情况下可以使用基于卷积相乘特性的快速滤波处理。
在无限冲激响应滤波器的情况下,表示在实施中能够分解出矩阵T(z)的元素之间的一定分母。
现在描述使用重叠变换的实施。这里假设合成和分析组的滤波器是有限冲激响应并且为最大抽取类型。
转换矩阵T(z)表达如下T(z)=Σn=0N-1Pnz-n---(41)]]>其中,Pn是大小为K×K的矩阵,并且N相当于T(z)的元素的滤波器Tml(z)的最大长度。
在最普通的情况下,该长度N通过下面的表达式给出 其中,r0通过下式给出r0=(N1+N2-2)mod K.(43)接下来,考虑情况之间的变化,长度N使用下面的定义 通过矩阵T(z)的滤波运算可以写为如下
V[n]=Σi=0N-1PiU[n-i]---(45)]]>考虑大小为NK×K的通过下式定义的矩阵PP=P0P1···PN-1---(46)]]>系统因此可以通过矩阵变换P来构造,接下来是叠加运算。该实施与重叠变换″LT″的合成部分相似,所述重叠变换″LT″具体描述在″Signal Processingwith Lapped Transforms(重叠变换的信号处理)″,H.S.Malvar,Artech House,Inc.1992。
图16示出了N=3的特定情况。矩阵P将被称为“转换变换矩阵”。
在子带域之间转换的计算过程可以总结如下1.U[n]的构建基于输入至转换系统的p2连续矢量并对应于第一滤波器组的子带信号X[k]的矢量。
2.通过转换变换矩阵P变换矢量U[n]以获得矢量W[n]W[n]=PU[n].(47)3.如图16中示出的N连续矢量W[n-N+1],...,W[n-1]和W[n]上的叠加的运算。该运算的输出是矢0量V[n]。
4.将矢量V[n]的大小为M的连续子矢量串行设置以获得第二滤波器组的域的子带信号Y[r]的矢量。
下面描述根据优选实施方式基于LPTV系统的表达的实施。
以下示出的方法提供了在该方法的实施中的计算机资源(软件或硬件)的处理和高效利用中的平行性。因此至少在有限冲激响应滤波器组的情况下,这是一个当前优选的实施方式。
大小为NM×L的矩阵Bij,(其中0≤i≤p1-1且0≤j≤p2-1)是与上面定义的传递矩阵Aij(z)的每个相关的变换后的矩阵。如果这些矩阵表达为Aij(z)=Σn=0N-1Bij,nz-n,]]>其中矩阵Bij,n大小为M×L,那么矩阵Bij可以按下如下定义
Bij=[Bij,0TBij,1T···Bij,N-1T]T---(48)]]>因为各传递矩阵Aij(z)包含取决于eij的值并且相同长度的滤波器,那么相应的矩阵Bij也取决于eij。矩阵Bij包含零子矩阵并且其形式按如下给出·当0≤eij≤K-1,о如果0≤eij≤r0-1那么Bij=[Bij,0TBij,1T···Bij,N-3TBij,N-2T0L×M]T---(49)]]>о如果r0≤eij≤K-1那么Bij=[Bij,0TBij,1T···Bij,N-3T0L×M0L×M]T---(50)]]>·当eij<0,о如果0≤K+eij≤r0-1那么Bij=
T---(51)]]>注意到,仅当K+emin≤r0-1时存在该情况。现在,emin=M+L-1-K,从而该情况的存在条件是r0≥M+L。
о如果r0≤K+eij≤K-1那么Bij=
T---(52)]]>其中,0L×M表示大小为L×M的零矩阵。
有利地,矩阵Bij的零区块使得通过该矩阵输入矢量变换中的计算减少。
应当注意P的子矩阵Pn和子矩阵Bij,n之间的下述关系式Pn=[Bij,n]0≤i≤p1-10≤j≤p2-1,0≤n≤N-1---(53)]]>图17中示出了在子带域之间转换的计算过程,并且按如下进行1.各新的输入矢量X[k]指向特征是变换后的矩阵Bij的子系统的公共内存,其中0≤i≤p1-1,从而j=k modp2。
2.对于各固定的i,其中,0≤i≤p1-1a、对于j=k modp2,对矢量X[k]应用变换Bij。在该变换中,优点在于矩阵Bij的零区块。
b、对于j=0,...,p2-1从步骤2.a得到的所有变换矢量求和。
c、在从步骤2.b得到的和矢量上进行叠加“OLA”(代表“重叠并相加”),以构造LPTV子系统i的输出Yi[n]。
3.转换系统的输出Y[n]对应于LPTV子系统i的输出Yi[n],从而i=n modp1。
用(N-1)M个元素的重叠对长度为NM的矢量进行步骤2.c的叠加。
注意到,该过程仍然是基于图15的方案的原理。
在M=pL的特定情况下,Aj(z)=Σn=0N-2Bj,nz-n,]]>其中0≤j≤p-1,并且用Bj表示相应的变矩阵。该矩阵具有下面的形式 其中,j0=p-[r0+1L]]]>如图18所示,在子带域之间转换的计算步骤按如下进行1、各新的输入矢量X[k]指向特征为变换矩阵Bj的子系统的内存,从而j=k modp。
2、对于j=k modp,对矢量X[k]应用变换Bj。
3、对步骤2得到的矢量,即通过特征为变换矩阵Bj的子系统的输出进行求和,其中0≤j≤p-1。
4、转换系统的输出Y[n]对应于在从步骤3得到的和矢量上进行叠加后的结果。
在L=pM的特定情况,写为Ai(z)=Σn=0N-2Bi,nz-n,0≤i≤p-1]]>并且用Bi表示相应的变换矩阵。该矩阵具有下面的形式
其中i0=[r0M]-1.]]>图19中示出了在子带域之间转换的计算步骤,并且优先地按如下进行1、各新的输入矢量X[k]指向特征为传递矩阵Ai(z)的所有子系统的公共内存,其中0≤i≤p-1。
2、对于各固定的i,从而0≤i≤p-1,对矢量X[k]应用变换Bi,随后进行叠加以得到矢量Yi[n]。
3、转换系统的输出Y[n]对应于特征为传递矩阵Ai(z)的子系统的输出Yi[n],从而i=n modp。
下面描述广泛用于音频编码中的滤波器组。在图27中给出了在使用该编码格式的滤波器组之间转换的各种情况的转换系统的参数,其中通过上面的公式(56)给出了参数N。
对于余弦调制FIR滤波器组之间的转换,滤波器组的特征是通过低通的原型滤波器H(z)的余弦调制获得分析和合成滤波器。对于具有M带的滤波器组,通过下面给出分析和合成滤波器的冲激响应的表达式hk[n]=h[n]cos[πM(k+12)(n-N-12)-θk],0≤k≤M-1---(57)]]>fk[n]=h[n]cos[πM(k+12)(n-N-12)-θk],0≤k≤M-1---(58)]]>其中0≤n≤N-1,且θk=(2k+1)π4,]]>并且h[n]是长度为N的原型滤波器的冲激响应。
如果额外满足下面的条件,该类型的滤波器组拥有完全重构属性-滤波器的长度为N=2mM,其中m是整数,-合成滤波器为fk[n]=hk[N-1-n],-原型滤波器具有线性相位h[n]=h[N-1-n],并且-原型滤波器H(z)的2M阶的多相分量另外满足功率互补条件(powercomplementarity condition),从而使其能够被设计为原型滤波器。
等式(57)、(58)和上述条件能够完整地表达余弦调制和完全重构滤波器组的特征。
这些余弦调制和完全重构滤波器组是当代音频编码器的所有滤波器组的基础。甚至MPEG-1/2层I&II编码器的伪-QMF滤波器组都与该种类有关,假设原型滤波器充分好地设计为考虑满足完全重构。
对于不同大小的MDCT变换之间的转换,建立余弦调制和完全重构滤波器组的特定情况,一个实例是TDAC滤波器组,其中N=2M且m=1。后面的一个可以被认为是MLT变换(代表“调制重叠变换”),其已被称为MDCT(代表“修正DCT”)。该变换用于大多数现代频率音频编码器中(MPEG-2/4AAC,PAC,MSAudio,TDAC等)。
通过下式给出合成和分析滤波器组的表达式fk[n]=2Mh[n]cos[πM(k+12)(n+N-12)],0≤k≤M-1,0≤n≤2M-1---(59)]]>且hk[n]=fk[2M-1-n](60)为了保证完全重构,窗h[n]必须满足对称条件h[l]=h[2M-1-l],以及功率互补条件h2[l]+h2[l+M]=1。
通过下面的正弦窗给出满足这些条件的原型滤波器的可能且简单的选择h[n]=sin[(n+12)π2M],0≤n≤2M-1---(61)]]>该窗的选择使用在TDAC和G.722.1编码器中。另一选择包含采用由凯塞一贝塞尔窗(Kaiser-Bessel窗或者“KBD”)衍生出的窗,如在MPEG-4 AAC,BSAC,Twin VQ和AC-3编码器的情况下。
应当理解,公式(59)和(60)以及窗h[n]的选择完整地定义了对应于MDCT变型的滤波器组。
考虑在MPEG-1的PQMF滤波器组和MDCT之间的转换,在MPEG-1/2层I&II编码器中的滤波器组是具有M=32带的伪-QMF。这些分析和合成滤波器按如下定义hk[n]=h[n]cos[πM(k+12)(n-16)]---(62)]]>fk[n]=32h[n]cos[π32(k+12)(n+16)]---(63)]]>
其中0≤k≤31且0≤n≤511。
原型滤波器的冲激响应的系数h[n]可以在下面的参考文件中找到″Introduction to Digital Audio and Standards″,M.Bosi,R.E.Goldberg,pp 92-93,Kluwer Academic Publishers(2002)。
在MPEG-1音频层I-II标准中提供的值对应于窗(-1)lh(2lM+j),其中0≤j≤2M-1,且0≤l≤m-1。
下面描述根据将与滤波处理结合的子带域之间的转换的本发明的技术方案。
在代码转换运算中,能够在将解码后的信号重新编码成新格式之前,对解码后的信号进行中间处理。多媒体信号处理(音频、图像和视频)的几种情况基于线性滤波。可以引用下面的例子·用于重新采样的图像或视频滤波(从CIF格式切换到QCIF格式)。
·用于声音空间化的通过HRTF滤波器(“头部相关传递函数”)的音频滤波。这是结合代码转换和空间化的有趣情况之一。可能的应用典型地是在电信会议音频桥中的处理。
参考图5a的方框图,在两个合成和分析滤波器组以及所等效的系统之间引进滤波器S(z)。在图20a和20b中示出了方框图。
结合有滤波的转换系统可以通过图5b中示出的一个和相同类型的方案来模拟。然而,其特征是由下式定义的新的滤波器矩阵 T~(z)=[v(z)⊗g~(z)]|↓k---(64)]]>其中, 是大小为M×L的矩阵,其元素通过下式给出G~nk(z)=Hn(z)S(z)Fk(z),0≤n≤M-1,0≤k≤L-1---(65)]]>在上面的表达式(64)中,矩阵v(z)对应于公式(17)的定义。更清楚地,公式(64)可以写为T~(z)=[[zM-1ziM-jLg~(z)]|↓K]0≤i≤p1-10≤j≤p2-1---(66)]]>现在描述结合有采样频率变化的子带域之间的转换。
这里考虑在合成的暂时信号被第二分析组重新分析之前对合成的暂时信号进行采样频率的变化的情况。本发明意义内的系统因此结合子带域之间的转换和采样频率的变化,如图21a和21b中所示。
在图21a中,考虑按照有理数因子 改变采样频率的系统,其中Q和R是假设为互质的自然整数,因此gcd(Q,R)=1,这不丢失一般性。
在该系统中,滤波器SPB(z)是低通滤波器,其标准化后的截止频率为f~c=min(π/Q,π/R)]]>并且通频带增益为Q。
这里将K′定义为QL和RM的最小公倍数(K′=1cm(QL,RM)),并且q1,q2为两个自然整数,从而K′=q1RM且K′=q2QL.(67)注意到,q1和q2是互质的。
在该情况下,考虑由信号矢量X(z)分解为q2多相分量得到的矢量U^(z)=[X^0T(z),X^1T(z),···,X^q2-1T(z)]T]]>以及由信号矢量Y(z)分解为q1多相分量得到的矢量V^(z)=[Y^0T(z),Y^1T(z),···,Y^q1-1T(z)]T.]]>结合有采样频率变化的转换系统可以通过图22的图表来模拟。其特征是按如下定义的大小为q1M×q2L的滤波器矩阵 T^(z)=[v^(z)⊗g^(z)]|↓K′---(68)]]>其中 是大小为M×L的矩阵,其元素通过下式给出G^nk(z)=Hn(zR)SPB(z)Fk(zQ),0≤n≤M-1,0≤k≤L-1---(69)]]>并且 是其元素按如下定义的矩阵v^ij(z)=ziRM-jQL,0≤i≤q1-1,0≤j≤q2-1---(70)]]>同时也符合下面的关系式V^(z)=T^(z)U^(z)---(71)]]>根据公式(69), 解释为按照因子R过采样的滤波器Hn(z)、和滤波器SPB(z)以及按照因子Q过采样的滤波器Fk(z)的卷积的结果。
为了减少整个系统的延迟,可以选择其元素是按如下定义的矩阵 v^(z)=zcmax+iRM-jQL,0≤i≤q1-1,0≤j≤q2-1---(72)]]>其中cmax=max{n∈N从而h≤RM-1且n是被gcd(L,R)可除尽的}。
对矩阵 的公式可以给出与上述相同的解释。因而,滤波器 其中0≤m≤q1M-1且0≤l≤q2L-1,,该矩阵的元素可以按如下写为 其中,0≤m≤q1M-1且0≤l≤q2L-1,并且e′ij=cmax+iRM-jQL。整数i,n和j,k通过下式从l和m直接获得 且n=m-iM,(74) 且k=l-jL,(75)在用 替代矩阵T(z)并且考虑以其为特征的参数时对于子带域之间转换的系统给出的相同开发和说明对于该新的结合系统保持有效。系统采用线性周期时变系统(LPTV)的形式。也可以在该应用中设想上述实施的优选过程以及特定情况中的系统简化。然而,注意到与本系统不同的特定情况涉及RM和QL是彼此的倍数的情况。
在该情况下,根据图23的系统用矩阵 运算,从而A^ij(z)=[zcmaxziRM-jQLg^(z)]|↓K′]]>0≤i≤q1-1且0≤j≤q2-1(76)在使用重叠变换的实施的情况下,优选地在合成和分析滤波器组以及用于重新采样的低通滤波器具有有限冲激响应的假设下,从而A^ij(z)=Σn=0N′-1B^ij,nz-n]]>其中矩阵 的大小为M×L,如图24中示出的矩阵 的下面定义可以通过下式给出Bij^=[B^ij,0TB^ij,1T···B^ij,N′-1T]T,]]>0≤i≤q1-1且0≤j≤q2-1. (77)
通常,应当理解本发明给出用于将信号表示从一个子带域转换(或变换)到另一个的一般方案。如上所述,该方法优先地应用在两个压缩系统所使用的滤波器组是最大抽取类型的情况下。
虽然上述详细的说明基本上是关于音频编码的,但是可以对于多媒体信号的所有子带或基于变换的编码器都设想上述实施方式,尤其是在视频、图像、语音编码等中使用的那些编码器。这些实施方式也可以表现为合成组和分析组的级联的任何设备实施,尤其是在下面的例子中·子带语音的质量改进,接下来是子带回波消除,反之亦然。
·回波消除或子带噪音抑制算法,接下来是子带编码器。
·子带解码器,接下来是回波消除或子带抑制算法。
·用于通过例如SBR(代表“谱带复制”)重构音频中的高频带的处理,因为该处理实施分析组并且其输入是音频解码器的输出。
应当理解,本发明的应用绝不局限于两种不同编码格式之间的简单代码转换。
然而,下面将描述对音频代码转换的一些应用。
音频编码格式之间的代码转换在关于现有终端以及传输和访问网络的当前多样性方面变得越来越重要。
根据音频内容的服务和交付情况,代码转换可以插入传输链中的不同点。接下来,区分一些可能的情况。
广播涉及使用各种类型音频编码器的数字广播系统。因而,在欧洲(DVB标准),需要MPEG-2BC音频层II编码器。另一方面,在美国,提倡Dolby AC-3编码器。在日本,选择MPEG-2 AAC编码器。如图25所示,代码转换机制TRANS优选地在网络RES的网关GW中,该网络RES用于将来自服务器SER的音频内容发送到配置有解码器DEC1的第一终端TER1和配置有另一解码器DEC2的另一终端TER2的目的地。
在所谓的多播流应用中,单一内容由于传输网络RES中的带宽优化而优选地发送到几个终端TER1,TER2。对于各终端用户在网络的最后节点的层级上进行私人适配。如前面的图25所示,这些用户可以具有支持不同解码器的终端,因此在网络节点中进行代码转换是有用的。
在单播流的情况下,可以在服务器SER进行代码转换TRANS(图26)以使内容适用于终端TER1,TER2的容量。服务器SER已经接收并分析关于终端容量的信息。
在“下载”模式中,以给定编码格式存储音频内容。实时进行代码转换从而在下载前与用户的各请求的终端兼容。
在组通信(电话会议、音频会议等)中,涉及的终端在编码器/解码器方面具有不同容量。在集中式电话会议架构中,实施音频桥,代码转换可以插在桥的层级。
下面的表3表示了根据应用领域音频编码格式之间的一些可能的、有利的代码转换。
表3感兴趣的代码转换及其应用领域的一些类型的实施例。

图27示出了用于这些特定情况的编码格式下本发明意义内的转换系统的参数。
权利要求
1.一种由计算机资源实现通过在不同子带域之间转换来处理数据的方法,在于在同一处理中紧缩包括将含有第一数目L个单独的子带分量的第一矢量(X(z))应用到合成滤波器组,然后应用到分析滤波器组,以获得含有第二数目M个单独的子带分量的第二矢量(Y(z)),其特征在于,所述方法包括以下步骤,在确定第三数目K,即第一数目L和第二数目M的最小公倍数以后a)如果第三数目K不同于第一数目L,通过第一矢量的串/并转换进行区块排列以得到p2个多相分量矢量,其中p2=K/L,b)选择的涉及K×K维方阵T(z)的矩阵滤波应用到所述p2个多相分量矢量以获得第二矢量的p1个多相分量矢量,其中p1=K/M,以及c)如果第三数目K不同于第二数目M,通过并/串转换进行区块排列以得到所述第二矢量。
2.根据权利要求1所述的方法,其特征在于,所述步骤a)的串/并转换相当于对第一矢量(X(z))应用超前zp2-1,接下来是一组以因子p2子采样的延迟,以获得所述p2个多相分量矢量,对应第一矢量(X(z))的p2阶的分解。
3.根据权利要求1和2之一所述的方法,其特征在于,所述步骤c)中的并/串转换包括施加给p1个多相分量矢量的按照因子p1的过采样,对应于p1阶的分解,所述分量用于形成第二矢量(Y(z))。
4.根据权利要求1至3中之一所述的方法,其特征在于,所述方阵T(z)是通过对由p1×p2个各自由zlM-jLg(z)表示的子矩阵进行按照因子K的抽取产生的,其中-zX根据X的符号表示超前或延迟,-i在0和p1-1之间,-j在0和p2-1之间,并且-g(z)是M×L维矩阵,该矩阵是由h(z).fT(z)的乘积产生的,其中h(z)和f(z)是分别与分析滤波器组和合成滤波器组关联的传递函数的矢量,符号MT表示矩阵M的转置矩阵。
5.根据权利要求4所述的方法,其特征在于,超前zM-1也应用到所有p1×p2子矩阵,来获得所述矩阵T(z)的元素,所述元素各自对应因果滤波器并且一起定义具有最小算法延迟的转换系统。
6.根据权利要求5所述的方法,其特征在于,所述矩阵T(z)的元素表示为由Gnk(z)=Hn(z)Fk(z)给出的乘积滤波器Gnk(z)的K阶的多相分量的函数,其中-n在0和M-1之间而k在0和L-1之间,并且-Hn(z)和Fk(z),分别与分析滤波器组和合成滤波器组关联的传递函数的矢量的第n和第k分量。
7.根据权利要求5所述的方法,其特征在于,分析滤波器组和合成滤波器组之间,还提供了一个补充滤波器S(z),矩阵T(z)的元素表示为由Gnk(z)=Hn(z)S(z)Fk(z)给出的乘积滤波器Gnk(z)的K阶的多相分量的函数,其中-n在0和M-1之间而k在0和L-1之间,并且-Hn(z)和Fk(z),分别与分析滤波器组和合成滤波器组关联的传递函数的矢量的第n和第k分量。
8.根据权利要求6和7之一所述的方法,其特征在于,矩阵T(z)的元素滤波器Tml(z)由下式表示 其中eij=(M-1)+(iM-iL),并且-在符号Gnkx(z)中,x对应多相分量数,由乘积滤波器Gnk(z)的K阶分解产生,-i对应比值m/M的整数部分,-j对应比值l/L的整数部分,-数字n由n=m-iM给定,而-数字k由k=l-jL给定。
9.根据权利要求8所述的方法,其特征在于,如果第二数目M是第一数目L的倍数,矩阵T(z)的元素滤波器Tml(z)表示为Tml(z)=Gmj(p-k)L-1(z),]]>m和l在0和M-1之间,并且其中-p=M/L,-k是l/L的整数部分,并且-数字j由j=l-kL给定。
10.根据权利要求8所述的方法,其特征在于,如果第一数目L是第二数目M的倍数,矩阵T(z)的元素滤波器Tml(z)表示为Tml(z)=Gil(k+1)M-1(z),]]>m和l在0和L-1之间,并且其中-k是m/M的整数部分,并且-数字i由i=m-kM给定。
11.根据上述权利要求之一所述的方法,其特征在于,采用线性周期时变型的转换系统,并且周期T由T=K·Ts定义,其中Ts=Ts1/L=Ts2/M,其中Ts1和Ts2是在合成滤波器组和分析滤波器组的域中在临界采样下各自的采样周期。
12.根据权利要求11所述的方法,其特征在于,采用p1线性周期时变子系统,各周期为p2·Ts1,并且以周期p1·Ts2周期性地选择连续子系统的输出。
13.根据权利要求12所述的方法,其特征在于,整个转换系统的输入的比特率是1/Ts1,而其输出比特率是1/Ts2,用于飞速处理输入数据。
14.根据权利要求12和13之一所述的方法,结合权利要求8,其特征在于,标号i在0和p1-1之间的各子系统包括p2个传递矩阵Aij(z),j在0和p2-1之间,所述传递矩阵的元素是滤波器Aij,nk(z),其中n在0和M-1之间而k在0和L-1之间,从而如果0≤eij≤K-1,Aij,nk(z)=Gnkeij(z),]]>并且如果eij<0,Aij,nk(z)=z-1GnkK+eij(z).]]>
15.根据上述权利要求之一所述的方法,其特征在于,合成滤波器组和分析滤波器组的滤波器具有有限冲激响应,所述选择的矩阵滤波表示为由NK×K维的矩阵P的叠加变换,从而P=P0P1···PN-1]]>子矩阵Pn是K×K维并且矩阵T(z)满足如下关系T(z)=Σn=0N-1Pnz-n]]>其中N对应T(z)的元素滤波器的最大长度。
16.根据权利要求15所述的方法,其特征在于,所述T(z)的元素滤波器的长度的最大值N由下面表达式确定 其中-r0由关系式r0=(N1+N2-2)mod K确定,-N1和N2是合成滤波器组和分析滤波器组各自的长度,-符号mod n表示对数字n的模,-符号 表示实数x的整数部分。
17.根据权利要求15和16之一所述的方法,其特征在于,包括以下步骤,用于子带域之间的转换-在p2个第一连续矢量X[k]的基础上,在合成滤波器组的子带域中构造矢量U[n],-对矢量U[n]应用变换后的转换矩阵P,以获得矢量W[n]=P·U[n],-对N个连续矢量W[n-N+1],W[n-N+2],...,W[n-1],W[n]进行叠加,以形成矢量V[n],-串行排列矢量V[n]的连续子矢量,这些子矢量各自的维数对应第二数目M,以形成所述第二矢量(Y[r])。
18.根据权利要求17所述的方法,其特征在于,包括以下步骤-在合成滤波器组的子带域中表示的第一矢量 应用到包括变换矩阵Bij的子系统,其中i在0和p1-1之间并且j=k mod p2,-对于范围在从0到p1-1各个固定i*对矢量X[k]应用矩阵Bij的变换,j=k mod p2,各矩阵Bij表示如下Bij=Bij,0TBij,1T···Bij,N-1TT,]]>其中对于在0和N-1之间的任意n,元素Bij,n使得Aij(z)=Σn=0N-1Bij,nz-n]]>且Pn=[Bij,n]0≤i≤p1-10≤j≤p2-1;]]>*对于j=0,...,p2-1,变换所产生的所有矢量进行求和;*对求和产生的矢量进行叠加,以在标号为i的子系统的输出构建矢量Yi[n],-在整个转换系统的输出得到对应标号为i的子系统的矢量Yi[n]的矢量Y[n],从而i=n mod p1,符号mod n表示对数字n的模。
19.根据权利要求18所述的方法,其特征在于,矩阵Bij包括L×M维的零区块,从而-对于0≤eij≤K-1,·如果0≤eij≤r0-1,则Bij=Bij,0TBij,1T···Bij,N-3TBij,N-2T0L×MT]]>·如果r0≤eij≤K-1,则Bij=Bij,0TBij,1T···Bij,N-3T0L×M0L×MT]]>-对于eij<0,·如果0≤K+eij≤r0-1,则Bij=0L×MBij,1T···Bij,N-3TBij,N-2TBij,N-1TT]]>·如果r0≤K+eij≤K-1,则Bij=0L×MBij,1T···Bij,N-3TBij,N-2T0L×MT]]>其中*0L×M表示L×M维的零区块,并且 其中-N1和N2是合成滤波器组和分析滤波器组各自的长度,-符号mod n表示对数字n的模,-符号 表示实数x的整数部分。
20.根据权利要求19所述的方法,其特征在于,如果第一数目M是第二数目L的倍数,从而M=pL,矩阵Aij成为Aj(z)=Σn=0N-2Bj,nz-n,]]>其中-0≤j≤p-1,-并且Bj是变换矩阵,其表示为 其中 符号 表示实数x的整数部分。
21.根据权利要求20所述的方法,其特征在于,包括以下步骤-合成滤波器组的子带域中表示的第一矢量X[k]应用到含有变换矩阵Bj的子系统,其中j=k mod p,-对于0≤j≤p-1的任意j,对应用变换矩阵Bj产生的矢量进行求和,-通过对所述求和产生的矢量进行叠加在整个转换系统的输出获得矢量Y[n],-符号mod n表示对数字n的模。
22.根据权利要求19所述的方法,其特征在于,如果第二数目L是第一数目M的倍数,从而L=pM,矩阵Aij成为Ai(z)=Σn=0N-2Bi,nz-n,]]>其中-0≤i≤p-1,并且-Bi是变换矩阵,其表示为 其中 符号 表示实数x的整数部分。
23.根据权利要求22所述的方法,其特征在于,包括以下步骤-在合成滤波器组的子带域中表示的第一矢量X[k]应用到包括传递矩阵Ai(z)的子系统,其中0≤i≤p-1,-对于任何固定的i,0≤i≤p-1,对矢量X[k]应用矩阵Bi的变换,并且叠加以得到输出矢量Yi[n],-得到对应矢量Yi[n]的整个转换系统的输出矢量Y[n],其中i=n mod p,-符号mod n表示对数字n的模。
24.根据权利要求4至23之一所述的方法,其特征在于,所述分析滤波器组和合成滤波器组的滤波器是余弦调制且有限冲激响应类型,其中,分析滤波器和/或合成滤波器由低通原型滤波器H(z)的余弦调制得到,从而对于具有M个带的滤波器组,可以按下式分别表示分析滤波器和/或合成滤波器的冲激响应,分别形成传递函数h(z)和/或f(z)的矢量hk[n]=h[n]cos[πM(k+12)(n-N-12)-θk],0≤k≤M-1]]>和/或fk[n]=h[n]cos[πM(k+12)(n-N-12)+θk],0≤k≤M-1]]>其中-θk=(2k+1)π4,]]>-h[n]是长度为N的原型滤波器的冲激响应,-n是0≤n≤N-1。
25.根据权利要求24所述的方法,其特征在于,-滤波器的长度N由N=2mM给定,其中m是整数,-合成滤波器由fk[n]=hk[N-1-n]给定,-原型滤波器具有线性相位并且满足关系h[n]=h[N-1-n]的关系,并且-原型滤波器H(z)的2M阶的多相分量满足功率互补条件。
26.根据权利要求25所述的方法,其特征在于,N=2M,并且合成滤波器组和分析滤波器组的表达式为fk[n]=2Mh[n]cos[πM(k+12)(n+M+12)]]]>其中0≤k≤M-1,0≤n≤2M-1,并且hk[n]=fk[2M-1-n],并且此外对于l在0和2M-1之间,原型滤波器h[n]的冲激响应还满足以下条件-h[l]=h[2M-1-l]以及-h2[l]+h2[l+M]=1。
27.根据权利要求26所述的方法,其特征在于,所述原型滤波器的冲激响应由以下关系式给出h[n]=sin[(n+12)π2M],0≤n≤2M-1.]]>
28.根据权利要求27所述的方法,其特征在于,所述合成滤波器组具有伪QMF类型的格式,具有M=32个带,而分析滤波器组是MDCT类型,或者反之亦然,分析滤波器和合成滤波器分别定义为hk[n]=h[n]cos[π32(k+12)(n-16)],]]>fk[n]=32h[n]cos[π32(k+12)(n+16)]]]>其中0≤k≤31并且0≤n≤511。
29.根据权利要求4和5所述的方法,其特征在于,如果在合成滤波器组和分析滤波器组之间以有理数因子Q/R进行重采样,大小为q1M×q2L的滤波器矩阵 定义为T^(z)=[v^(z)⊗g^(z)]|↓K']]>其中 是大小为M×L的矩阵,其元素由下式给定G^nk(z)=Hn(zR)SPB(z)Fk(zQ),0≤n≤M-1,0≤k≤L-1,]]> 是其元素优先以下式定义的矩阵v^ij(z)=zcmax+iRM-jQL,0≤i≤q1-1,0≤j≤q2-1]]>其中cmax=max{n∈N从而h≤RM-1且n是被gcd(L,R)可除尽的},并且SPB(z)优选是截止频率f~c=min(π/Q,π/R)]]>且带通增益为Q的低通滤波器。
30.根据上述权利要求之一所述的将第一类型的压缩编码/解码代码转换到至少一个第二类型的压缩编码/解码方法的应用,其特征在于,在同一处理中紧缩有如下步骤-根据所述第一类型,以包括第一数目L个单独子带分量的第一矢量(X(z))的形式至少部分解码以恢复数据,-将第一矢量应用到根据所述第一类型的合成滤波器组,然后应用到根据第二类型的分析滤波器组,以及-恢复包括第二数目M个单独子带分量的第二矢量(Y(z)),并且该第二矢量可以应用于后来的根据第二类型的编码步骤。
31.一种计算机程序产品,存储在通信网络中例如服务器、网关、或其它终端的一项设备的内存中,其特征在于,包括用于实现如权利要求1至29之一所述方法的全部或部分的指令。
32.一种用于通信网络的设备例如服务器、网关、或其他终端,其特征在于,其包括用于实现如权利要求1至29之一所述方法的计算机资源。
全文摘要
本发明涉及通过第一数目L到第二数目M的子带分量的不同子带域之间的通道进行数据处理。在确定第三数目K,即第一数目L和第二数目M之间的最小公倍数以后,a)如果K不同于L,输入矢量X(z)通过串/并转换进行区块排列以得到p
文档编号G10L19/16GK101069233SQ200580034793
公开日2007年11月7日 申请日期2005年8月23日 优先权日2004年9月16日
发明者阿卜杜勒拉蒂夫·本杰罗恩图伊米 申请人:法国电信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1