变换及后续量化的实现的制作方法

文档序号:7691169阅读:175来源:国知局
专利名称:变换及后续量化的实现的制作方法
技术领域
本发明涉及数字数据的处理。更具体地说,它涉及实现离散余弦 变换(DCT)近似法和量化的方法,所述变换和所述量化相继要应用 到数字数据,具体说是数字图像数据上,以便压缩该数字数据。它同 样涉及实现反量化和反离散余弦变换(IDCT)近似法的方法,其中, 为了将数字数据解压缩,所述量化要接着所述反变换应用到压缩数字 数据上。最后,本发明涉及分别适于执行所述压縮和所述解压缩的编 码器和解码器。
背景技术
已知现代技术中顺序使用DCT和量化来压缩数字数据,例如为 了实现有效传输该数字数据。具体地说,数字图像数据的压缩一般通 过使用DCT及随后对通过DCT获得的DCT系数进行量化而实现。
在一维数字数据的DCT中,将具有预定编号的源值的相应序列 变换成变换系数。在视频编码中,源值可以是例如像素值或预测误差 值。每个所得的变换系数代表源数据中存在的一定频率范围。值f() 到系数F ()的DCT定义如下
<formula>formula see original document page 8</formula><formula>formula see original document page 9</formula>
在此等式中,N是一个源值序列中源值的预定编号。 为实现压缩,图像数据通常以二维数字数据块形式提供。对于此 类数据,DCT定义如下
<formula>formula see original document page 9</formula>
DCT是可分解的运算。这意味着二维DCT可通过两个连续的一 维DCT运算来进行计算。由于一维DCT的复杂性与N相关,而二维 DCT的复杂性与1S^相关,因此,最好使用一维DCT运算。对于具有 N*N大小的图像数据,所有DCT运算的总的复杂性与快速DCT的 ]^或]SAog(N)相关。因此,还涉及许多非普通乘法运算的大变换的计 算十分复杂。此外,额外要求的比特精度会增加字宽。由于复杂性原 因,DCT每次通常只对小的数值块执行,例如4x4或8x8数值块, 这种数值块可以用具有值f()的矩阵形式表示。图l显示了所述4x4 矩阵1的DCT。
首先,将矩阵1的每行单独变换成一次变换矩阵2。在所示矩阵 1中,每行的单独变换由包括相应行所有值的双向箭头表示。随后, 将一次变换矩阵2的每列单独变换成包括变换系数F()的最终变换矩 阵3。在所示矩阵2中,每列的单独变换由包括相应列所有值的双向 箭头表示。
上述等式定义的DCT也可写成矩阵形式。为此,首先将F(i)写成更合适的形式
F(i) = Nf kx)A(i, x),i = 0,1,…,N -1
x=0
A(i, x) = , —C(i)cos ^-~
Vn L2N J
矩阵A是DCT基本函数矩阵。随后可通过以下等式计算二维 DCT:
Y=AXAT,
其中,矩阵X表示源值矩阵,矩阵Y表示DCT中产生的变换系 数。矩阵的指数T表示矩阵的转置。
在DCT后,通过对DCT系数进行量化实现实际的压缩。量化是 用依赖于量化参数qp的量化值除去变换系数来实现的
Y'("j)-Y(U)/Q(qp)(U),
其中,Q(qp)是量化矩阵,Y'(i,j)由量化系数组成。最简单的量化形式 是均匀量化,其中,用常数填充量化矩阵,例如
Q(qp)(U) = qp
量化系数构成了压缩数字数据,在经过编码和可能的进一步处理步骤 后,它具有例如具有便于传输所述数据的形式。
当要在存储和/或传输后再现压缩数据时,首先要将它再次解压缩。
解压缩是逆向执行压缩期间执行的运算。因此,第一步是通过将量化系数乘以量化矩阵值,将所述量化系数Y'(i, j)反量化 Y(i,j):Y'(U)Q(qp)(i,j)
接着,第二步是通过反向离散余弦变换(IDCT)对经过反量化 但仍是变换系数的Y(i,j)执行反变换
X=ATYA,
其中,矩阵Y在DCT中表示变换系数,矩阵X表示重新得到的源值 矩阵。
如果对所有计算采用无限精度,则X将精确地包含原像素值。但 实际上,至少在量化和反变换后将系数转换为整数值。因此,无法完 全重建原像素。压缩率越高,则与原像素的偏差就越大。
如果直接实现上述DCT和IDCT,则每次转换需要执行几次乘法、 加法和/或减法。然而,这些运算一方面需要大量的处理器时间,另一 方面,相对于某些体系结构中的电路区,乘法是代价很高的运算。为 能够传送例如高质量的运动图像,需要处理转换过程,使得所需乘法 步骤较少,而又不会降低通过解压缩重新得到的数据质量。
由于DCT在许多图像编码标准中还是核心运算,因此,它已得 到广泛运用,并且文献中已描述了所述问题的各种解决方案。这些解 决方案一般特征是"蝶形运算"和/或将算子矩阵的一些计算组合到 DCT过程最后的量化步骤中。
例如,美国专利5523847描述了用于彩色图像压缩的一种数字图 像处理器。为减少DCT中非普通乘法运算的次数,该文档中提出以 某种降低非普通乘法次数的方式分解变换矩阵,非普通乘法是非2次 幂的乘法或除法。普通乘法可通过比特移位实现,因此,称之为"普 通"。更具体地说,变换矩阵通过分解成对角因子矩阵和比例因子矩
ii阵(scaled factor),这样,对角因子矩阵可被吸收到以后的量化步骤 中,比例因子矩阵可与具有最少非普通乘法次数的数据矢量相乘。另 外,建议用有理数乘法来近似其余的非普通乘法运算,这是因为计算 随后可只通过加法、减法和移位操作来实现。然而,这导致在DCT 过程中出现这样一个问题,即,由于采用了近似法,精确的反变换可 能就不存在了。因此,重复DCT-IDCT过程可能导致图像质量严重降 低。例如,当图像在采用了 DCT压缩的通信链路上多次传输时,就 可能出现这种情况。Gisle Bjontegaard的"H.26L测试;溪型长期编号7 ( TML-7 )草案 0" ( "H.26L Test Model Long Term Number 7 (TML-7) draft0" , ITU Video Coding Experts Group, 13th Meeting, Austin, Texas, USA 2-4 April, 2001 )文档中介绍了另一种方法。此文档描述了一种DCT解决 方案,该解决方案构成用于ITU-T建议H.26L的压缩方法的当前测试 模型。根据该文档,可使用与4 x 4 DCT具有基本相同编码属性的整数 变换,而不使用DCT。在整数变换中,通过四个对带预定加权系数的 像素求和的线性等式分别从四个源数据像素得到四个变换系数。变换 之后或之前是量化/反量化过程,该过程执行正常的量化/反量化。此 外,需要进行归一化,这是因为传输具有归一化分布的数据比传输随 机数据更有效。由于变换不包含归一化,因此,量化/反量化还执行归 一化,它是在反变换后最终通过移位完成的。量化/反量化使用32个 不同质量的参数(QP)值,这些值排列方式为 一个QP到下一QP 之间的步长大约增加12%。这种方法的缺点是需要32位算术和大量 运算次数。另一文档源于引用的TML-7文档"用于H.26L、处理DCT变 换和量化的16 4立体系结构"("A16國bit architecture for H.26L, treating DCT transforms and quantization", Document VCEG—M16, Video Coding Experts Group (VCEG) 13th meeting, Austin, USA, 2-4 April,2001, by Jie Liang, TracTran, and Pankaj Topiwala)。此VCEG-M16 文档主要是研究4x4变换,提出了用于H.26L标准的4点快速近似 法,并命名为binDCT。此binDCT可只用加法和右移运算实现。所提 出的解决方案可实现为完全可逆的,以便实现无损编码。所提出的binDCT是基于周知的以Chen-Wang平面旋转为基础的 DCT矩阵分解。对于binDCT的16位实现,移位方案用于得到DCT 的快速近似。每个采用的提升(lifting)步骤是双正交变换,并且其逆 也具有筒单的提升结构。这意味着要执行逆提升步骤,要减去正向变 换时增加的内容。这样,即使在提升步骤中浮点乘法结果舍入为整数, 但只要对正向变换和反变换均应用相同的过程,则仍可以完美地重建 原信号。为了得到快速实现,进一步用k/2m格式的有理数近似浮点提升 系数(其中k和m是整数),这可以只通过移位运算和加法运算来实 现。为进一步降4氐基于提升(lifting-based)的快速DCT的复杂性, 应用比例提升结构来表示平面旋转。可在量化阶段吸收比例因子。VCEG-M16文档所提出的解决方案只需要^f叚定源值是9位值的 16位运算,并且比TML-7文档的解决方案需要较少的运算。更具体 地说,对于四个数据值的一维DCT,它需要10次加法和5次移位。以下给出了与图像数据压缩相关的其它文档的实例,但只简单论 及其内容2001年2月13日授予的美国专利6189021建议在六阶段DCT快 速算法的固有乘法阶段对两个一维DCT运算之一采用一组比例加权 系数,从而可以省略所述一维DCT运算中另一运算的DCT快速算法 的相应阶段。1992年7月7日授予的美国专利5129015利用了类似于DCT、 但采用了较简单的算术而无需乘法运算来压缩静止图像的方法。1996年11月5日授予的美国专利5572236涉及用于彩色图像压 缩的数字图像处理器,它通过重新安排DCT过程,使非普通乘法合并成一个过程步骤,从而使DCT过程中的非普通乘法次数降到最少。 2001年5月3日公开的PCT申请WO 01/31906涉及称为局部零 树编码的基于变换的图像压缩框架。发明内容本发明目的是减少常规DCT和IDCT所需的运算,同时消除执 行非普通乘法的必要性。本发明的另一目的是提供已知方法的替代方 法,这种方法比常规DCT或IDCT需要较少的运算。本发明还有一个 目的是保证解压缩后数字数据具有高质量。就数字数据压缩而言,本发明的目的通过一种方法来实现,该方 法包括在第 一 步骤中筒化预定的变换矩阵,以便在应用到数字数据上 时所需运算4交少。在第二步骤中,用有理数来近似构成无理数的简化 变换矩阵的元素。在第三步骤中,扩展的预定量化以补偿用有理数来 近似简化变换矩阵的元素。例如,扩展的预定量化可包括在预定变换 矩阵简化中除去的运算,然后对所包括的运算加以调整,以对用有理 数来近似筒化变换矩阵的元素进行补偿。随后可将采用近似元素和扩 展量化的简化变换矩阵作为实现将要施加到待压缩数字数据上的变 换和量化序列。就压缩数字数据的解压缩而言,本发明的目的可通过一种方法来 实现,在该方法中,根据用于压缩的建议方法中的预定变换矩阵处理 预定的反变换矩阵。另外,根据用于压缩的建议方法中的预定量化扩 展来扩展预定的反量化。然后可以将所得的扩展反量化和所得的含近 似元素的简化反变换矩阵用作将要应用到压縮数字数据上以实现解 压缩的反量化和反变换序列的基础。最后,本发明的目的通过编码器和解码器来实现,所述编码器包 括近似DCT的相应变换器和相应的量化装置;所述解码器包括相应 的反量化装置和近似IDCT的相应的变换器。本发明基于如下思想如果一方面将各种运算从变换矩阵中提取出来并融入量化过程中,另 一方面用所述有理数近似不构成有理数的剩余项,则可大大减少DCT所需的运算次数。但是,为确保能够正 确执行解压缩,还建议在移到量化过程中的运算中对近似进行补偿。本发明的优点在于,和例如TML-7和VCEG-M16相比,由于它 能够降低所需运算次数并因此节省处理器时间,从而实现了快速变换 计算。本发明仍然取得了很接近VCEG-M16文档中解决方案的质量。 而且因为本发明通过对所执行的近似运算加以补偿,从而将变换运算 的反属性纳入了考虑,因此可避免处理数据的质量下降,特别是在低 比特率的情况下。因此,比之于例如美国专利5523847,本发明的另 一优点是取得了更佳的反变换精度。从所附属权利要求书中可明白本发明的优选实施例。 简化预定变换矩阵以便在应用到数字数据上时所需运算较少的 建议步骤最好包括将预定的变换矩阵分解成两个因子矩阵, 一个是构成对角矩阵的因子,另一个是构成简化变换矩阵的因子矩阵。对角矩 阵然后包括从简化变换矩阵中除去的运算。有利地是,近似简化变换矩阵剩余项的有理数由分母为2n的分数 给出,其中n是整数。此类有理数尤其适用于二进制算术,这是因为 除以或乘以2n的乘法或除法可通过比特移位运算实现。因此,釆用所 提出的近似法,可避免DCT中的所有乘法。于是,对于给定的变换矩阵如4x4 DCT矩阵,以及为近似简化 矩阵中剩余项的选定的有理数,可为每个为对一维或二维数字数据值 进行变换而必须执行的一维变换确定一组只包括加法、减法和比特移 位的等式。对量化步骤中近似的调整最好确保所加变换具有反变换。这可通 过确保ATA4来实现,其中,在这种情况下,矩阵A是这样一个矩阵, 从其中提取的所有运算在对剩余项作近似及对提取的运算中的近似 作4卜偿后将被重新包括在筒化变换矩阵中。这确保可以很好的质量完 成对IDCT的近似。对于给定的变换矩阵,例如4x4DCT矩P车,以及为近似简化矩 阵中的剩余项而选定的有理数,则也可以以普通的方式来计算对提取 的运算中特定值必须作的调整。然而,在诸如8x8变换的更大变换中,可能还必需调整对简化矩阵的近似,这是因为在优化实现中近似DCT变换系数可导致不完 整的正反向变换对,从而导致像素值"溢出"到非邻近像素,即2个 像素外的像素。这会使图像冲莫糊。通过正确选择近似值,从单位矩阵 正反向变换得到的矩阵的非对角元素会变零。在非常大的矩阵中,可 能无法充分调整近似值。在此类情况下,可调整近似值以产生最小平 方意义上的最优结果。此外,需要采用优化来将解限制到Dirichlet集 上,即某些有理数。对于所提出的量化步骤,最好是通过将预定的量化系数序列乘以 为简化变换矩阵而从变换矩阵提取的矩阵来确定量化矩阵。所提取的 矩阵包括从预定变换矩阵中提取的运算,并可加以调整,以对用有理 数来近似简化变换矩阵中的剩余项进行补偿。所提出的方法可以同样用于一维和二维变换。对于要应用到二维 数字数据上的二维变换,对预定的变换矩阵和筒化变换矩阵转置执行 简化和近似。随后,这两个矩阵用作实现变换的基础。在这种情况下 扩展的量化包括从两个所述矩阵中除去的运算,这些运算可加以调整 以补偿在两个所述矩阵中的近似值。所给出的优选实施例不仅可用于根据本发明的用于实现变换和 量化的方法,而且可以相应的方式用于实现反变换和反量化的方法, 用于才艮据本发明的编码器和解码器。实际上,如果变换的算子矩阵是单位矩阵,象DCT变换矩阵, 则为变换计算的变换矩阵通常可以以转置形式用于反变换,而无需执 行任何单独的计算。这种情况下,扩展量化中包括的运算同样可同时 用于扩展预定反量化。本发明可用于任何用途的任何种类的数字数据压缩,例如,可用于诸如GSM (全5求移动通信系统)或UMTS (通用移动电信系统)的
移动通信系统中。
例如,本发明可实现为MPEG编解码器的一部分。 通过与附图相结合的如下详细说明,可明白本发明的其它目的和
特性。但要理解,附图只用于说明而不是限制本发明,至于本发明的
限制条件,则应参考所附权利要求书。


下面,本发明将参照附图作更详细的说明,附图中 图l显示了应用到4x4值矩阵上的DCT;以及 图2以图示方式显示了根据本发明实施例的,用于压缩和解压缩 数字数据的编码器和解码器的方框图。
具体实施例方式
图1在上面已经做了描述。
图2的方框图包括可实施本发明的示例系统的部件。在图2的左 侧显示了编码器4。编码器4是能够提供和发送视频数据的第一单元 的一部分,例如,移动通信系统中用户i殳备的一部分。编码器4包括 连接在其输入和输出之间的DCT变换器41、量化装置42和加法装置 43。在图2的右侧显示了解码器5。解码器5是能够接收和显示视频 数据的第二单元的一部分,例如,同样是移动通信系统中用户设备的 一部分。解码器5包括连接在其输入和输出之间的装置53、反量化装 置52和IDCT变换器51。
如果要从第一单元将视频数据发送到第二单元,例如,经通信网 络,则将视频数据作为数字数据提供给第一单元的编码器4。在编码 器4中,数字数据首先由DCT变换器41进行变换,然后由量化装置 42进行量化。量化后,数据还要由附加处理装置43做进一步处理。 此处理包括可能在进一步压缩之前将量化数据进行编码以便传输,但这与本发明无关,因此在本文档中并涉及。处理过的数据随后从包括编码器4的第 一单元发送到包括解码器 5的第二单元。第二单元接收数据,并将其转发给解码器5。在解码 器5中,第一步是在装置53中执行某种处理,该处理是编码器4的 方框43中处理的逆处理。因此,该处理(本文档中未涉及)可包括 解码,随后可能是解压缩的第一步。处理过的数据随后由反量化装置 52进行反量化,并且还要通过IDCT变换器51进行IDCT。由IDCT 51 提供的重新获得的视频信号由解码器5输出,以便由第二单元显示给 用户。现在将推导出图2所示编码器4的DCT变换器41和量化装置42 的根据本发明的实施例。对于源于本发明背景中所述的DCT和量化 的本实施例,假定将要对输入数字数据进行压缩以获得包括4x4个 数值的数字数据块。可同样说明由图2所示解码器5的反量化装置52 和IDCT变换器51执行相应解压缩的根据本发明的实施例。要注意的是,在给出的等式中,同一分母可用于不同矩阵的不同 等式中。对于每个等式,至少在应用于另一种矩阵之前采用了对应的 分母,将标出各矩阵的种类。根据用于DCT的上述等式Y=AXAT, 4x4正向DCT变换可计 算如下<formula>formula see original document page 18</formula>其中,Y是期望的变换矩阵,X是包含4x4源值Xij (ij = 1 - 4)的 矩阵,以及A是4x4 DCT变换矩阵。矩阵A的值a、 b和c可从上 述A (i,x)的定义轻松获得<formula>formula see original document page 19</formula> /8)
在用于正向DCT的等式中,矩阵A可加以分解,得到对角矩阵 B和简化变换矩阵C。可以对A的转置形式AT执行相应的分解。如 果d还可表示为d = c/b,则正向DCT可写为
<formula>formula see original document page 19</formula> 其中,0表示相应的两个矩阵按项(entry-wize)相乘,而不是整个矩 阵相乘。
在将组合D及其转置形式DT合并成E后,最终的DCT为<formula>formula see original document page 20</formula>
下一步,将系数d转换成可由分母为2n的有理分数表示的定点格 式。考虑八个小数位时的d值为0.41421356。 d的两个可能定点近似 值为3/8=0.375和7/16=0.4375,这两个值均可通过相同次数的加法和 移位运算来实现。诸如13/32、 27/64和53/128等更精确的近似值需要 更多的加法和移位,但实际上并不能显著改善取得的压缩效果。。因 此,将比3/8更接近d的7/16选为d的定点格式。
在将系数d转换到定点表示法后,b必须调整为使变换具有反变 换。反变换存在的条件由以下等式给出
在d来近似后对已从因子B和C重组的矩阵A求上述等式的解 时,调整后的b的条件为
矩阵E因此可通过用此新值替代系数b的旧值而进行调整。 现在,可在提取了矩阵E的编码器4的DCT变换器41中实现简 化的DCT。也就是说,实现是基于等式YC=CXCT,其中,矩阵C包 括近似的系数d,从而产生修改后的DCT系数Yc。矩阵E将与随后 的量化步骤相结合,以下将对此加以解释。
<formula>formula see original document page 20</formula>简化DCT的实际实现可取决于特定的变换器体系结构,其中, 总运算量少或根本无乘法可能是最重要的。
现在将提出可在简化DCT变换器的实现中采用的三组不同的等 式。等式适合执行基于上述简化DCT变换矩阵C的4点一维简化 DCT。在矩阵C中,将系数d选择为d = 7/16。在每组等式中,X[i], i = 0-3构成了要进行变换的四个值的序列,并且Y[i], i-0-3构成了 四个变换值的序列,其中,e和f是辅助变量。
所提出的第一组等式为: e = X
+ X [3] f=X[l] + X[2] <formula>formula see original document page 2</formula>这组等式中的两次除法实际上是比特移位操作。这组等式因此需 要执行8次加法、2次乘法和2次移位,总共12次运算。
所提出的第二组等式为: e = X
+ X[3] f=X[l] + X[2]
<formula>formula see original document page 2</formula>第二组等式只使用加法和移位,并产生与笫 一组等式相同的结 果。同样,除法实际上是比特移位操作。这组等式需要执行10次加
法和4次移位,总共14次运算。运算的次数大于第一组等式,但如 果乘法是代价很高的运算,则相应的复杂性仍然更低。另外,乘法的 结果要求更大的动态范围。
所提出的第三组等式为
<formula>formula see original document page 22</formula>
第三组等式可使用加法和乘法,或者加法和移位。它需要执行8 次加法和4次乘法,或者10次加法和4次移位,总共分别为12次或 14次运算。这组等式与第一组和第二组等式产生的结果不同。Y [1] 和Y [3]的结果比其它两组等式的结果大16倍,因此,结果的动态范 围需要也大得多。然而,在本发明的一些实施例中,由于特定实施例 中移位的复杂性或者由于结果的精确度会稍微降低,因此,不将结果 向低位移可能会有利。由于采用第三组等式时, 一些结果会大16倍, 因此,矩阵E中的值"ab"和"b2,,分别除以16和162。
所给定的任何一组等式可通过应用到要变换的各组值而用来对 二维数据进行变换。
简化的变换之后是自适应量化步骤。量化的实现取决于所用的 DCT。在上述TML-7文档中,使用了均匀量化。在快速DCT中,由 于一些DCT乘法与量化乘法相结合,因此,必须使用非均勻量化。文档VCEG-M16的上述binDCT还将除法用于量化,且只需要16位 运算。但是,除法通常是较慢的运算。因此,在所给出的实施例中, 量化装置42中实现了仅使用乘法的均匀量化。
如上所述,可^f吏用除法执行量化,这样
Y'(U卜Y(i,j)/Q(qp)(i,j)。
由于除法是高成本运算,可使用乘法代替。为此,量化矩阵R计
算为
R(qp)(i,j)=1.0/Q(qp)(i,j),
在此之后,可使用乘法执行量化 Y'(U—Y(i,j)R(qp)(U)。
在文档TML-7所提出的量化中,量化系数大致如下所示。也可 使用其它系数。
a(qp)=
2.5000, 2.8061, 3.1498, 3.5354, 3.9684, 4.4543, 4.9998, 5.1620, 6.2992, 7.0706, 7.9364, 8.9082, 9.9990, 11.2234, 12.5978, 14.1404, 15.8720, 17.8155, 19.9971, 22.4458, 25.1944, 28.2795, 31.7424, 35.6293, 39.9922, 44.8894, 50.3863, 56.5562, 63.4817, 71.2552, 79.9806, 89.7745。
为了能够吸收在量化中从DCT提取的矩阵E,用于量化参数qp 的量化矩阵R计算为
R(qp)(U)-E(U)/a(qp)
最终的量化系数Y'(i, j)现在可根据在简化DCT中通过以下等式得到的变换系数Yc(i, j)来确定
Y'(U)-Yc(i,j).R(qp)(U)士f,
其中,根据TML-7文档,f是帧内块的1/3和帧间块的1/6,并且具有 相同的标记Yc(i,j)。帧内块是仅依据当前图像内的值编码的宏块,而 帧间块是还依据其它图像内的值编码的宏块。每个宏块由几个子块组 成,例如,所给出的示例4x4数值块,这些数值块单独进行DCT变 换和量化。
但是,首先量化要更改为只使用定点值。为此,R和f的值在量 化前要与2n相乘并将结果舍入为整数值,从而转换为定点值。n是用 于定点值的小数位数。通过选择11=17, R的系数可用16位表示,因 此量化中只需要16位乘法。更具体地说,需要产生32位结果的16 位乘法。
随后,可根据以下等式在编码器4的量化装置42中实现定点量

Y'(i,JHYcaj),R(qp)(U)士f)/2n,
其中,R和f只包括定点值。Y'(i, j)的值由量化装置42输出为所需的 压缩数字图像数据。
对于图2所示解码器5中的压缩数字图像数据的解压缩,以对应 于编码器4的量化装置42和DCT变换器41的方式实现反量化装置 52和IDCT变换器53 。基本IDCT从基本DCT计算为
X = ATYA,
其中,矩阵X包含所需的重新获得的源值,矩阵A是原DCT变换矩阵,并且矩阵Y包含如本发明背景中所述通过解压缩获得的反量化 值。
根据此等式,反变换可对应于正向变换利用提取的矩阵E用公式
表示为
X = C丁(Y②E)C
其中,矩阵C和CT与用于编码器4的方框41中的筒化的DCT矩阵C
和CT相对应。
此等式的矩阵E可在IDCT前的反量化步骤中吸收。 这可以类似于在量化中吸收矩阵E那样实现。反量化系数是量化
系数的相反值。
包括矩阵E的量化参数qp反量化矩阵Q可计算为
Q(qp)(i,j) = E(i,j),a(qp)
压缩系数Y'(i, j)因此可根据以下等式反量化为反量化系数X'(i,
j):
X'(U"Y'(U).Q(qp)(i,j)
在此等式中,X'(i,j)对应于以上反变换等式X-CT(Y0E)C中的项 Y E。
在使用定点数时,Q的值在反量化前通过与2n相乘并将结果舍入 为整数值而转换为定点值。通过为反量化选择n=5,反量化中的所有 计算可只使用16位运算完成。随后,根据以下等式在解码器5反量 化装置52中实现定点反量化
X'(i,J"Y(U),Q(qp)(U),其中,Q仅包含定点数。在反量化后,X'(i,j)的值应通过2n进行归一化,但归一化会延迟到最终IDCT完成后进行,以便取得更好的精度。 随后可根据以下等式,在解码器5的IDCT变换器51中实现简 化的反变换X = CTX'C之后,X的定点值根据以下等式转换为整数值其中,通过简单的算法比特移位来实现除以2n。IDCT变换器51的实际实现可包括一组等式,这组等式只包括加 法、减法和移位,对应于针对DCT变换器41给出的那些等式。根据本发明的另 一实施例,8x8 DCT和IDCT可如下所示实现。 根据DCT等式,Y = AXAT, 8x8正向DCT变换可计算如下Y<formula>formula see original document page 26</formula>其中,Y是期望的变换矩阵;X是如上述4x4实施例中那样包含8x 8源值Xij(i,j二l-8)的矩阵;A是8 x 8DCT变换矩阵,在等式的右侧处于写入打开状态;以及AT是A的转置。矩阵A中的值a、 b、 c、 d、 e、 f和g可根据A(i, x)的上述定义轻松获得a = l/(2V^) b = l/2.cos(7i/16) c = 1/2,(3tu/16) d = l/2.cos(5;i/16) e = l/2.cos(7jt/16) f = 1/2.cos(ti /8) g = l/2,cos(3 i /8)在正向DCT的等式中,矩阵A可进行分解,得到对角矩阵B和 简化变换矩阵C。可以对A的转置形式AT执行对应的分解。如果我 们使用符号Xy-x/y,正向DCT可写为Y=BCXC力=3000000o一_111111110b0000001db%—%-100f000001&-&_1_1-&&1000b0000、一l-4i—%00000001一l_111一i一l100000b00db一leb一Cb—%1-db000000f0gf一l1一gf一gf1一lgf0000000b一—一l14—% X*CT*B由于B是对角矩阵,因此,在4x4的情况下,上述等式可写为Y=D (CX<5) DT =333a3aaabbbbbbbbffffffffbbbbbbbbaaaaabbbbbbbbffffffffbbbbbbbb (cx<5) bfbabfbabfbbfbbfbabfbbfbbfbabfbabfbabfbabfbbfbbfbabfbabfb其中,②用于表示两个相应的矩阵按项相乘,而不是整个矩阵相乘。 在将D及其转置形式DT合并成E后,最终的DCT为T11i11111 _、一 , a么ab af aba2 abaf abi%一吒、一lab b2 bf b2abb2af b2i_&—1一l&1af bf f2 bfaf bff2 bf%-i-41、(8abb2 bf b2abb2bf b2i-1—l11—1-11a2 ab af aba2 abaf ab—1-%、1-4ab b2 bf b2abb2bf b2%_11—gf-&1-1af bf f2 bfaf bff2 bf丄%—44一l1一44—、」ab b2 bf b2ab b2bf b2,E下一步,系数Cb、 db、 eb和gf会转换成可由分母为2n的有理分数 表示的定点格式。接近的近似值为cb = 7/8、 db = 9/16、 eb=3/16和 g尸7/16。在将系数Cb、 db、 eb和gf转换成定点表示后,要调整b和f,使 变换具有反变换。反变换存在的条件再次由以下等式给出 ATA=I。在cb、 db、 eb和gf来近似后为已从因子B和C重组的矩阵A求 上述等式的解时,调整后的b和f的条件为矩阵E因此可通过用这些新值代替系数b和f的旧值而加以调整。 但是,要满足条件ATA-I, cb、 db和eb必须选择不同的值,否 则,乘积ATA以非零非对角元素为特征。8xg情况下的必要条件为db國cb+ eb(db+ cb)=0,此式可以通过选择cb=15/16、 db=9/16和eb=l/4来满足。现在,简化DCT同样可以在提取了矩阵E的编码器4的DCT变 换器41中实现。也就是说,实现基于等式YC=CXCT,其中,矩阵C 包括近似的系数cb、 db、 eb和gf,从而得到修改后的DCT系数矩阵 Yc。矩阵E将与后续量化步骤相结合,这类似于上述4x4DCT的情 况。根据本发明的第三实施例,可通过优选变换中的分数,为条件 ATA-I调整近似值。要这样选择分数,使矩阵ATA的非对角元素在 实现意义上尽可能接近于零。优化解限于Dirichlet集合,即某些有理数。根据本发明的第四实施例,通过优选变换中的分数,为条件ATA =I调整快速DCT算法的近似值。至此,通过对本发明实施例的说明,阐明了用于压缩数字数据的有效的替代实现方案。所述实现方案可以以比已知实现方案更精确或 更快或者二者兼备的方式来实现。因此,虽然已说明并指出了应用到优选实施例上的本发明的根本 创新特征,但应理解,本领域的技术人员可在不脱离本发明的精神的 情况下对所述设备和方法的形式和细节作各种省略、替代和更改。例 如,已明确表示,以实质相同的方式冲丸行实质上相同的功能以实现相 同的结果的元素和/或方法步骤的所有组合均在本发明范围之内。而 且,应认识到,本发明的任何公开形式或实施例显示和/或描述的结构开的或描述的或建议的形式或实施例中。因此,本发明范围仅受所附 权利要求书限定。
权利要求
1. 一种用于解码编码的图像数据的方法,该方法包括接收量化变换系数;反量化量化变换系数;只应用加法、减法和比特移位运算而对反量化变换系数进行反变换处理。
2. 如权利要求1所述的方法,其中反量化只用16比特运算来进行。
3. 如前述权利要求之一所述的方法,其中将反量化系数乘以定点 数来进行反量化。
4. 如前述4又利要求之一所述的方法,该方法还包括 在反变换处理之后进行比特移位运算。
5. 如前述权利要求之一所述的方法,其中反变换处理是正交的。
6. 如前述权利要求之一所述的方法,其中反变换处理是单一的。
7. 如前述权利要求之一所述的方法,其中对量化变换系数的块乘 以 一组定点反量化数来进行它的反量化。
8. 如前述权利要求之一所述的方法,其中反变换处理和反量化处 理的元素通过以下步骤获得将反离散余弦变换矩阵分解成矩阵的乘积,其中至少 一个矩阵是 对角矩阵,并且其中至少一个矩阵是包括构成无理数的元素的非对角 的简化反变换矩阵;利用有理数来近似构成无理数的所述非对角的简化反变换矩阵 的元素,以形成另外的筒化反变换矩阵;调整对角矩阵的元素,以补偿所述利用有理数对所述非对角的简 化反变换矩阵的元素的近似,使得当重组矩阵由所述另外的简化反变 换矩阵和调整的对角矩阵组成时,重组矩阵和重组矩阵的转置的乘积 等于单位矩阵;以及根据量化参数和对角矩阵的调整元素计算反量化矩阵的元素。
9. 如权利要求8所述的方法,还包括对反量化矩阵的每个元素执行比特移位运算,以获得定点反量化 数的矩阵。
10. 如前述权利要求之一所述的方法,其中反变换处理相当于下 面给出的变换矩阵<formula>formula see original document page 3</formula>其中,d是分母等于2n的有理数,其中n是整数。
11. 一种用于编码图像数据的方法,所述方法包括 只应用加法、减法和比特移位运算,而对图像数据的块执行前向变换处理以形成变换系数的块;以及 量化所述变换系数。
12. 如权利要求11所述的方法,其中只用16比特算术运算来执 行量化。
13. 如权利要求11或12所述的方法,其中,将变换系数乘以定 点数并通过比特移位运算来执行量化。
14. 如权利要求11至13其中之一所述的方法,其中所述变换处 理是正交的。
15. 如权利要求11至14其中之一所述的方法,其中,所述变换 处理是单一的。
16. 如权利要求11至15其中之一所述的方法,其中,以定点反 量化数的块相乘,而对量化变换系数的块执行量化。
17. 如权利要求11至16其中之一所述的方法,其中变换处理和 量化处理的元素通过以下步骤获得将离散余弦变换矩阵分解成矩阵的乘积,其中至少 一个矩阵是对 角矩阵,并且其中至少一个矩阵是包括构成无理数的元素的非对角的筒化变换矩阵;利用有理数来近似构成无理数的所述非对角的简化变换矩阵的元素,以形成另外的筒化变换矩阵;调整对角矩阵的元素,以补偿所述利用有理数对所述非对角的简 化变换矩阵的元素的近似,使得当重组矩阵由所述另外的简化变换矩 阵和调整的对角矩阵组成时,重组矩阵和重组矩阵的转置的乘积等于 单位矩阵;以及根据量化参数和对角矩阵的调整元素而计算量化矩阵的元素。
18. 如权利要求17所述的方法,还包括对量化矩阵的每个元素执行比特移位运算,以获得定点量化数的 矩阵。
19. 如权利要求11至18其中之一所述的方法,其中变换处理相 当于下面给出的变换矩阵<formula>formula see original document page 4</formula>其中,d是分母等于2n的有理数,其中n是整数。
20. —种用于解码编码的图像数据的设备,所述设备包括 用于反量化量化变换系数的装置;只应用加法、减法和比特移位运算,而对反量化变换系数执行反 变换处理的装置。
21. 如权利要求20所述的设备,其中所述设备还包括 只用16比特算术运算来执行反量化处理的装置。
22. 如权利要求20或21所述的设备,其中所述设备还包括用于将反量化系数乘以定点数来执行反量化的装置。
23. 如权利要求20至22其中之一所述的设备,其中所述设备还 包括用于在反变换处理之后进行比特移位运算的装置。
24. 如权利要求20至23其中之一所述的设备,其中所述反变换 处理是正交的。
25. 如权利要求20至24其中之一所述的设备,其中,所述反变 换处理是单一的。
26. 如权利要求20至25其中之一所述的设备,其中,以一组定 点反量化数相乘,而对量化变换系数的块执行反量化。
27. 如权利要求20至26其中之一所述的设备,其中所述设备包 括用来获得反变换处理和反量化处理的元素的装置,所述获得通过以 下步骤来进行将反离散余弦变换矩阵分解成矩阵的乘积,其中至少 一个矩阵是 对角矩阵,并且其中至少一个矩阵是包括构成无理数的元素的非对角的简化反变换矩阵;利用有理数来近似构成无理数的所述非对角的简化反变换矩阵 的元素,以形成另外的简化反变换矩阵;调整对角矩阵的元素,以补偿所述利用有理数对所述非对角的简 化反变换矩阵的元素的近似,使得当重组矩阵由所述另外的筒化反变 换矩阵和调整的对角矩阵组成时,重组矩阵和重组矩阵的转置的乘积等于单位矩阵;以及根据量化参数和对角矩阵的调整元素计算反量化矩阵的元素。
28. 如权利要求27所述的设备,其中所述设备还包括用于对反量化矩阵的每个元素执行比特移位运算,以获得定点反 量化数的矩阵的装置。
29. 如权利要求20至28其中之一所述的设备,其中反变换处理相当于下面给出的变换矩阵<formula>formula see original document page 6</formula>其中,d是分母等于2n的有理数,其中n是整数。
30. —种用于编码图像数据的设备,所述设备包括 用于只应用加法、减法和比特移位运算,而对图像数据的块执行前向变换处理以形成变换系数的块的装置;以及 用于量化变换系数的装置。
31. 如权利要求30所述的设备,其中所述设备还包括 用于只用16比特算术运算来执行量化处理的装置。
32. 如权利要求30或31所述的设备,其中所述设备还包括 用于将变换系数乘以定点数来执行量化的装置。
33. 如权利要求30至32其中之一所述的设备,其中所述变换处 理是正交的。
34. 如权利要求30至33其中之一所述的设备,其中,所述变换 处理是单一的。
35. 如权利要求30至34其中之一所述的设备,其中,以定点反 量化数的块相乘,而对量化变换系数的块执行量化。
36. 如权利要求30至35其中之一所述的设备,其中所述设备包 括用来获得变换处理和量化处理的元素的装置,所述获得通过以下步 骤来进行将离散余弦变换矩阵分解成矩阵的乘积,其中至少 一个矩阵是对 角矩阵,并且其中至少一个矩阵是包括构成无理数的元素的非对角的 简化变换矩阵;利用有理数来近似构成无理数的所述非对角的简化变换矩阵的元素,以形成另外的简化变换矩阵;调整对角矩阵的元素,以补偿所述利用有理数对所述非对角的筒 化变换矩阵的元素的近似,使得当重组矩阵由所述另外的简化变换矩 阵和调整的对角矩阵组成时,重组矩阵和重组矩阵的转置的乘积等于单位矩阵;以及根据量化参数和对角矩阵的调整元素计算量化矩阵的元素。
37. 如权利要求36所述的设备,其中所述设备还包括用于对量化矩阵的每个元素执行比特移位运算,以获得定点量化 数的矩阵的装置。
38. 如权利要求30至37其中之一所述的设备,其中变换处理相 当于下面给出的变换矩阵<formula>formula see original document page 7</formula>其中,d是分母等于2n的有理数,其中n是整数。
39. —种用于解码编码的图像数据的设备,所述设备被配置为用于反量化量化变换系数;只应用加法、减法和比特移位运算,而对反量化变换系数执行反 变换处理。
40. —种用于编码图像数据的设备,所述设备;f皮配置为用于 只应用加法、减法和比特移位运算,而对图像数据的块执行前向变换处理以形成变换系数的块;以及 量化变换系数。
全文摘要
本发明涉及相继要应用到数字数据上以压缩该数字数据的DCT近似法和量化。为改善变换,建议简化预定变换矩阵以便在应用到数字数据上时所需运算较少。另外,构成无理数的简化变换矩阵的元素用有理数来近似。通过扩展预定量化以对用有理数来近似简化变换矩阵的元素进行补偿,从而使这些措施得到补偿。如果简化变换矩阵和扩展量化用作实现的基础,则可相应实现高质量的快速变换。相应地,对压缩数字数据的解压缩中采用的IDCT的近似法也可得到简化。
文档编号H04N1/41GK101261619SQ20081009210
公开日2008年9月10日 申请日期2002年8月27日 优先权日2001年8月30日
发明者A·哈拉普罗, K·希梅利乌斯 申请人:诺基亚有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1