变换系数的整数近似方法以及编码器和译码器的制作方法

文档序号:6473059阅读:224来源:国知局
专利名称:变换系数的整数近似方法以及编码器和译码器的制作方法
现有技术在要求纯粹整数运算的运动图像序列的频域编码中,DCT(离散余弦变换)的整数近似得到应用。通过所述的整数运算排除了编码器和译码器之间由于不同的计算精度而产生的偏差。
对于视频编码标准H.26L的测试模型建议了一种大小4×4的整数余弦变换。在[1]中建议了一个将耦合到运动补偿上的块大小用于所述变换的方案。为此附加地需要大小8×8和16×16的整数余弦变换,其中,由于有限可使用的数字范围,譬如32比特,而只能在有限的范围中选择所述的系数。譬如在[2]中发表了大小8×8的正交的整数余弦变换。
存在着各种各样的假设用于通过整数余弦变换来近似DCT。在[3]和[4]中示出了一种通过整数值代替DCT不同数额的系数的方法。
在[5]中在使用哈达玛变换的条件下采用一种用于近似DCT的方法。通过将哈达玛变换与一个正交的转换矩阵相乘可以产生所述的DCT。通过由具有整数系数的正交矩阵来代替实数的转换矩阵来生成DCT的整数近似。
本发明优点按权利要求1以及从属权利要求的步骤的方法譬如给块大小8×8和16×16提供整数的变换矩阵,这些块大小近似地具有运动图像序列的像点块的频域编码用的DCT特性,并因此实现了提高编码效率。
在纯粹的整数运算中使用本发明的措施可以进行所述的编码。通过按本发明来选择所述的变换系数,在尤其是32比特的有限的数字范围中可以采用不同可能的整数系数的最大值,这些系数是对非整数DCT系数的一种良好的近似。鉴于具有以上数字范围的所变换系数的量化和标准化,将变换的整数系数选择小于25。由于所述的整数运算而可以通过表格值来实现这些系数。
本发明的特别有利之处在于,所有基矢量的系数具有同一个标准,这导至在量化和标准化时可以采用一个统一的标准化因子和量化因子。在按[3]和[4]的方法中与此相反地,所说明整数变换的偶数和奇数的基本函数具有不同的标准,使得这些矩阵不满足对正交性的要求。在[5]中未说明了导至譬如大小16×16的DCT的正交整数近似的解决方案。
实施例说明在阐述本身的发明之前首先阐述几个前提。
N×N-DCT的正交的整数近似必须满足以下的条件TN·TNT=kN·IN---(1)]]>TNT·TN=kN·IN---(2)]]>式中,IN表示大小N×N的单位矩阵,而kN是整数的常数。
大小8×8的本发明正交的整数变换在系数27的数字范围之内具有最微小的最大近似误差emax=max{e(t0),e(t1),...,e(t7)},(3)具有e(tm)=|1-tICT,mk8·tDCT,m|,---(4)]]>式中,以m=0,....,7的tDCT,m和tICT,m表示DCT或ICT(整数余弦变换)的系数。所述的文献迄今未说明块大小16×16的DCT的整数近似,即满足N=16的方程(1)和(2)的变换。按本发明的所述整数变换满足这些条件,以至于与在[4]中所述的解决方案相反地所有的基矢量具有同一的标准。这尤其意味着在量化和标准化所变换的系数时的一个优点,因为可以将一个统一的标准化因子和量化因子用于所有的系数。
在考虑N=8的正交性条件(1)和(2)的情况下,通过由7个整数值代替8×8-DCT的系数的7个不同的实数数额来生成大小8×8的整数近似T8, 按[5]借助大小16×16的一个转换矩阵可以从大小16×16的哈达玛变换HBRO中生成所述的DCT。BRO在这里代表譬如从[6]中公开的哈达玛变换的基矢量的比特逆序。通过整数的正交的转换矩阵Cn来代替实数的转换矩阵,使得适用T16,BRO=C16·HBRO(5)C16是一种具有块对角结构的稀少占位的矩阵,C16=C^1C^10C^20C^4C^8---(6)]]> 表示一个单个的整数系数, 是一个整数正交的n×n矩阵。对于矩阵Cn的子矩阵适用以下的构造规范C^2n=B1,nB2,n-JnB2,nJnJnB1,nJn.---(7)]]>Jn是镜面对称的单位矩阵,譬如J2=0110,]]>并且B1,n以及B2,n描述整数的n×n矩阵,该n×n矩阵的系数尽可能好地近似实数转换矩阵的特性。
对于C^1=17]]>可以建立转换矩阵的不同整数正交的近似,并因此确定具有k16=16。172的大小为16×16的正交的整数余弦变换。这些整数余弦变换(ICT)的恒定的基矢量-相同部分-的系数因此分别具有值17。可以如下来从此值17中导出变化部分的子矩阵的系数,即所述值17的平方给出所述子矩阵的每个行的平方系数值的总和。从中对于最低变化部分的系数按绝对值得出值15和8,因为172=152+82。第二最低变化部分的系数值相应地得出譬如为12,9和8,而第三最低变化部分的系数值得出譬如为13,10,4和2。为了说明起见,以下给出了矩阵C16的和因此甚至TICT,16的可能解中的一个。所述的矩阵 可以选为C^1=17]]>C^2=158-815]]>C^4=12098012-89-98120-8-9012]]> 在相应地重组T16,BRO的行矢量之后,则得出正交的整数变换矩阵 按照DCT交替地,偶数和奇数对称地延续所述的行矢量。一个其它可能的正交的16×16整数变换矩阵具有以下的形式 它是如下构造的所述的偶数行0214相当于以前已示出的TICT,8的偶数行,其中,通过所述系数的镜面对称来实现行长度从8到16的延续。奇数行1215可如下来获得有序的哈达玛矩阵 正交变换矩阵A的构造 在Matlab表示法中A=[zeros(8),zeros(8);zeros(8),C8];Tn=A*H16.
在C8矩阵2,2,5和16的行中的系数值分别乘平方和累加后,又得出所述相同部分17的平方。
T16的奇数的基本函数得出为(又是Matlab表示法)T16(2216,)=Tn([9 13 11 15 10 14 12 16],)。
这就是说,Tn的第9行进入T16的第2行,Tn的第13行进入T16的第4行,如此等等。
除了较高的变换增益之外,这个矩阵T16的优点是借助以前所说明的高度对称的矩阵的构造。因此在块之内像点信息的变换编码用的编码器中或相应的译码器中,一种有效的实施是可能的。
通过量化之后的输入信号的方差与用变换矩阵TN所变换的,并然后量化的信号的方差之比,给出了具有N个基矢量的正交变换的变换增益。通常以dB说明该变换增益。在文献中常常通过一阶的自回归过程来模拟实际的图像信号。通过信号方差和相关系数的规定完全说明了这个模型。在最佳量化和编码的前提下可以直接规定这个信号模型的变换增益。对于所述的对于图像信号为典型的相关系数0.95,对于所述的DCT得出9.46dB的变换增益、对于在第一实施例中所介绍的16×16矩阵得出8.17dB、以及对于较后的16×16矩阵得出8.86dB。
用本发明的方法可以构造用于运动图像序列的频域编码/译码的编码器和译码器。它们的变换设备必须有为了以下目的的特性,即按所介绍的方法步骤备好变换系数,或从这些系数中可以重构原来的运动图像序列。
对于大小8×8和16×16的ICT矩阵可以开发快速的算法,这些算法使必要的加法和乘法的数量最小化。


图1中说明了这种算法的一个实例,该算法在流程图形中示意地示出了所述的两个变换。图1中由具有标记T8和T16的方框来标志所述大小8×8和16×16的ICT矩阵。由于T16的偶数的基本函数准确地相当于T8的基本函数,所以所述的T8块是完全纳入所述的T18块中的。长度16的输入信号的系数用x0,x1,x2,...,xF来表示,并毗连在图形的左侧边上。输出信号的系数是0y,1y,2y,...,yF。图形中的节点表示加法。通过在所述棱边上的相应的数字来表示与常数的相乘。在棱边上的负号意味着减法代替加法。为了使示图保持更加清晰,已在由方框所标志的节点上断开了所述的图形,并在所述的主图形旁绘制了其它曲线的一个部分。相对应的节点分别具有同一的标记。
在下表中列出了8×8变换和16×16变换用的必要的加法和乘法数目。为了作比较,所述的表含有关于按[7]的快速离散余弦变换用的加法和乘法数目的数据。
按图1的用于快速实施T16和T8的流程图形含有几个多次出现的元素。这种规律性反映所述变换之内的对称性。所述的图形划分为4个阶段,这些阶段以节点的垂直平面为特征。以下用阶段1至4来表示这些阶段。
在第一阶段中分别加减两个输入系数,使得又得出16个系数。x0和xF、x1和xE、x2和xD等等的总和形成代表偶数基本函数的T8块的输入系数。所述的差值毗连在图中所标记的节点0-7上。从这些差值中得出所述的奇数部分。从这些加减法中产生的星形结构如下来进行重复,在阶段2上在用T8所标记块的输入端上用8个系数代替16个系数;然后在阶段3上用4个上部的系数(T8的偶数基本函数),和在阶段4上在输出端y0和yF之前用两个系数。这种结构是与离散余弦变换的快速实施等效的。
不表示纯粹的加减法的,而是含有加权系数的星同样多次地出现。因此两个用四个系数加权的星从图1中所标记的节点3-4,2-5,1-6和0-7离开,该四个系数仅在加权的设置上互相区分。在具有另外的加权和两个系数的输出端y4和yC之前,这种结构进行重复。
对于T16的奇数的基本函数得出这些加权结构的变型。在阶段3上在这里产生四种结构,该四种结构分别具有两个带加权系数的输出端和两个具有纯粹的加/累加的输出端。这些结构之间的差别在于所述加权的分布。在这些结构中的三个上,只有两个节点形成所速的输入端。也就是产生了畸形的星。
参考文献[1]ITU电信标准化部门,“New integer transforms forH.26L”,研究组16,问题15,会议J,(Osaka,日本),ITU,2000年5月。ITU电信标准化部门,“Addition of 8*8 transform toH.26L”,研究组16,问题15,会议I,(Red Bank,新泽西),ITU,1999年10月。W.Cham,“Development of integer cosine transforms bythe principle of dyadic symmetry”,IEE会议纪要,卷136,页276-282,1999年8月。W.Cham和Y.Chan,“An order-16 interger consinetransform”,IEEE会议纪要,信号处理,卷39,页1205-1208,1991年5月。R.Srinivasan和K.Rao,“An approximation to the discretecosine transform for n=16”,信号处理5,页81-85,1983。A.K.Jain,Fundamentals of digital image processing.Englewood Cliffs,NJPrentice Hall,1989.W.H.Chen,C.H.Smith,以及S.C.Fralick,“A FastComputatial Algorithm for the Discrete Cosine Transform”,IEEE通信会议纪要,卷COM-25,号9,1977年9月,页1004-1009。
权利要求
1.尤其为编码像点块而获取整数近似的余弦变换系数的方法,其中,如下来选择所述的变换系数-对于所述的变换系数预定一个有限的数值范围,-通过考虑正交性条件如下来选择子矩阵的基矢量的系数,使得其平方之总和得出相同部分系数的平方,-从这些系数中推导出变化部分的系数。
2.按权利要求1的方法,其特征在于,将一个统一的标准化因子和/或量化因子用于所有的系数。
3.按权利要求1或2的方法,其特征在于,将耦合到运动补偿的块大小用于所述的变换。
4.按权利要求1至3之一的方法,其特征在于,借助一种转换矩阵从相同矩阵大小的,譬如16×16的哈达玛变换中生成所述的整数余弦变换矩阵。
5.按权利要求1至4之一的方法,其特征在于,对于所述相同部分用的基矢量的系数总是选择值17。
6.按权利要求4和5的方法,其特征在于,将所述最低变化部分用的基矢量的系数在绝对值上选择为15和8。
7.按权利要求4和5或6的方法,其特征在于,将所述第二最低变化部分用的基矢量的系数在绝对值上选择为12,9和8。
8.按权利要求4和5或6或7的方法,其特征在于,将所述第三最低变化部分用的基矢量的系数在绝对值上选择为13,10,4和2。
9.按权利要求4和5或6或7的方法,其特征在于,将所述第三最低变化部分用的基矢量的系数在绝对值上选择为16,5,2和2。
10.用于运动图像序列的频域编码的编码器,具有一个变换设备,该变换设备被提供用来为一个运动图像序列建立多个通过权利要求1至9所述的方法步骤而备好的变换系数。
11.用于运动图像序列的频域译码的译码器,具有一个变换设备,该变换设备被提供用来从已经通过权利要求1至9所述的方法步骤而建立的变换系数中重构一个运动图像序列。
12.按权利要求1至9之一的方法,其特征在于,将基本对称的算法用于所述的近似变换,其中,输入方面的变换系数分阶段地分别被施加到一个加法节点上或减法节点上,并对必要的乘法相应地进行加权。
全文摘要
预给定一个有限的数值范围用于获取整数近似的余弦变换系数。在考虑所述的正交性条件下如下来选择子矩阵用的基矢量的系数,使得其平方之总和得出相同部分系数的平方。从这些系数中导出变化部分的系数。通过这些措施得出以下的优点,即在所述的量化和标准化时可以将一个统一的标准化因子和/或量化因子用于所有的系数。
文档编号G06F17/14GK1466854SQ01816608
公开日2004年1月7日 申请日期2001年7月27日 优先权日2000年8月12日
发明者C·迈尔, C 迈尔, M·维恩 申请人:罗伯特-博希股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1