用于媒体编码的4x4变换的制作方法

文档序号:6349351阅读:180来源:国知局
专利名称:用于媒体编码的4x4变换的制作方法
技术领域
本发明涉及数据压缩,且更特定来说,涉及包含变换的数据压缩。
背景技术
数据压缩广泛用于多种应用中以减少对数据存储空间、发射带宽或两者的消耗。数据压缩的实例应用包括可见或可听媒体数据编码,例如,数字视频、图像、语音及音频编码。数字视频编码(例如)用于广泛范围的装置中,其包括数字电视、数字直接广播系统、无线通信装置、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、视频游戏装置、蜂窝式或卫星无线电电话等等。数字视频装置实施例如MPEG-2、MPEG-4或H. 264/MPEG-4先进视频编码(AVC)等视频压缩技术以更有效地发射及接收数字视频。大体来说,视频压缩技术执行空间预测、运动估计及运动补偿以减少或移除视频数据中所固有的冗余。特定来说,帧内编码依赖于空间预测来减少或移除给定视频帧内的视频中的空间冗余。帧间编码依赖于时间预测来减少或移除邻近帧内的视频中的时间冗余。对于帧间编码,视频编码器执行运动估计以跟踪在两个或两个以上邻近帧之间的匹配的视频块的移动。运动估计产生运动向量,其指示视频块相对于一个或一个以上参考帧中的对应视频块的位移。运动补偿使用运动向量以从参考帧产生预测视频块。在运动补偿之后,通过从原始视频块减去预测视频块而形成残余视频块。视频编码器接着应用变换,继之以量化及无损耗统计编码过程,以进一步减小通过视频编码过程产生的残余块的位速率。在一些情况下,所应用的变换包含离散余弦变换(DCT)。通常,将DCT应用于大小为二的幂的视频块,例如,4像素高乘4像素宽的视频块(其通常被称为“4X 4视频块”)。这些DCT因此可被称为4X4DCT,因为这些DCT被应用于4X4视频块以产生DCT系数的4X4矩阵。由将4X4DCT应用于残余块所产生的DCT系数的4X4矩阵接着经历量化及无损耗统计编码过程以产生位流。统计编码过程(也被称为“熵编码”过程)的实例包括上下文自适应性可变长度编码(CAVLC)或上下文自适应性二进制算术编码(CABAC)。视频解码器接收经编码的位流且执行无损耗解码以解压缩用于块中的每一者的残余信息。通过使用残余信息及运动信息,视频解码器重建构经编码的视频。

发明内容
大体来说,本发明是针对用于使用可相对于常规4X4DCT提供增加的编码增益的4X4离散余弦变换(DCT)的近似的一个或一个以上实施方案来编码例如媒体数据等数据的技术。根据本发明的技术所应用的4X4DCT的实施方案涉及在经缩放因子与内部因子之间的各种关系。术语“经缩放因子”指代经由因式分解移除的在4X4DCT的实施方案外部的因子。术语“内部因子”指代在因式分解之后保留的在4X4DCT的实施方案内部的因子。4X4DCT的一个实例实施方案为正交的,其意味着表示4X4DCT的系数矩阵在乘以此矩阵的转置时等于单位矩阵。4X4DCT的另一实例实施方案为接近正交的(或近似正交的)。通过遵守以下详细描述的各种关系,所述技术促进在两种情况下选择导致正交与接近正交4 X 4DCT实施方案的矩阵系数,所述实施方案在应用于数据时可相对于常规4 X 4DCT促进增加的编码增益。在一个方面中,一种设备包含4X4离散余弦变换(DCT)硬件单元,其实施具有奇数部分的正交4X4DCT,所述奇数部分应用与经缩放因子(ξ )有关的第一内部因子及第二内部因子(C、S)以使得经缩放因子等于第一内部因子(C)的平方加第二内部因子⑶的平方的总和的平方根,其中4X4DCT硬件单元将4X4DCT实施方案应用于媒体数据以将媒体数据从空间域变换到频域。在另一方面中,一种方法包含通过4X4DCT硬件单元将正交4X4离散余弦变换(DCT)实施方案应用于媒体数据以将媒体数据从空间域变换到频域,其中正交4X4DCT实施方案包括奇数部分,所述奇数部分应用与经缩放因子(I)有关的第一内部因子及第二内部因子(C、S)以使得经缩放因子等于第一内部因子(C)的平方加第二内部因子⑶的平方的总和的平方根。在另一方面中,一种设备包含用于将正交4X4离散余弦变换(DCT)实施方案应用于媒体数据以将媒体数据从空间域变换到频域的装置,其中正交4X4DCT实施方案包括奇数部分,所述奇数部分应用与经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)以使得经缩放因子等于第一内部因子(C)的平方加第二内部因子(S)的平方的总和的平方根。在另一方面中,一种非暂时性计算机可读存储媒体存储指令,所述指令在由处理器执行时引起处理器通过4X4DCT硬件单元将正交4X4离散余弦变换(DCT)实施方案应用于媒体数据以将媒体数据从空间域变换到频域,其中正交4X4DCT实施方案包括奇数部分,所述奇数部分应用与经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)以使得经缩放因子等于第一内部因子(C)的平方加第二内部因子(S)的平方的总和的平方根。在另一方面中,一种设备包含4X4反离散余弦变换(IDCT)硬件单元,其实施具有奇数部分的正交4X4DCT的IDCT,所述奇数部分应用与经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)以使得经缩放因子等于第一内部因子(C)的平方加第二内部因子(S)的平方的总和的平方根,其中4X4IDCT硬件单元将4X4IDCT实施方案应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域。在另一方面中,一种方法包含通过4X4IDCT硬件单元将正交4X4DCT的4X4反离散余弦变换(IDCT)应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域,其中正交4X4DCT包括奇数部分,所述奇数部分应用与经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)以使得经缩放因子等于第一内部因子(C)的平方加第二内部因子(S)的平方的总和的平方根。在另一方面中,一种设备包含用于将正交4X4DCT的4X4反离散余弦变换(IDCT)应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域的装置,其中正交4X4DCT包括奇数部分,所述奇数部分应用与经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)以使得经缩放因子等于第一内部因子(C)的平方加第二内部因子⑶的平方的总和的平方根。在另一方面中,一种非暂时性计算机可读存储媒体存储指令,所述指令在由处理器执行时引起处理器通过4X4IDCT硬件单元将正交4X4DCT的4X4反离散余弦变换(IDCT)应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域,其中正交4X4DCT包括奇数部分,所述奇数部分应用与经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)以使得经缩放因子等于第一内部因子(C)的平方加第二内部因子⑶的平方的总和的平方根。在另一方面中,一种设备包含4X4离散余弦变换(DCT)硬 件单元,其中DCT模块实施具有奇数部分的非正交4X4DCT,所述奇数部分应用按以下方程式与经缩放因子(ξ )
有关的第一变量及第二变量(C、S)
,C + S_8] ξ = ^,其中变量ω及ψ表示无理内部变换因子且变量C及S表示在非正交4X4DCT的整数实施方案中代替变量ω及ψ使用的二元有理内部变换因子,且其中4X4DCT硬件单元将4X4DCT实施方案应用于媒体数据以将媒体数据从空间域变换到频域。在另一方面中,一种方法包含通过4 X 4DCT硬件单元将非正交4X4离散余弦变换(DCT)应用于媒体数据以将媒体数据从空间域变换到频域,其中非正交4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(I)有关的第一变量及第二变量(C、S)
e C + jS-
L 」ωΛ-ψ ,其中变量ω及ψ表示无理内部变换因子且变量C及S表示在非正交4X4DCT的整数实施方案中代替变量ω及ψ使用的二元有理内部变换因子。在另一方面中,一种设备包含用于通过4X4DCT硬件单元将非正交4X4离散
余弦变换(DCT)应用于媒体数据以将媒体数据从空间域变换到频域的装置,其中非正交
4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(ξ)有关的第一变
量及第二变量(C、S) e C + S# =其中变量ω及ψ表示无理内部变换因子且变量C及S表示在非正交4X4DCT的整数实施方案中代替变量ω及ψ使用的二元有理内部变换因子。在另一方面中,非暂时性计算机可读存储媒体存储指令,所述指令在由处理器执行时引起处理器通过4X4DCT硬件单元将非正交4X4离散余弦变换(DCT)应用于媒体数据以将媒体数据从空间域变换到频域,其中非正交4X4DCT包括奇数部分,所述奇数部分
应用按以下方程式与经缩放因子(I)有关的第一变量及第二变量(C、S)
e C + 5 =-
L J ω+ψ,
其中变量ω及ψ表示无理内部变换因子且变量C及S表示在非正交4X4DCT的 整数实施方案中代替变量ω及ψ使用的二元有理内部变换因子。在另一方面中,一种设备包含4X4反离散余弦变换(IDCT)硬件单元,其中DCT硬件单元实施具有奇数部分的非正交4X4DCT的反DCT,所述奇数部分应用按以下方程式与
经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)
,C + S =-
lwju」 ω+y/,其中变量ω及ψ表示无理内部变换因子且变量C及S表示在非正交4X4DCT的整数实施方案中代替变量ω及ψ使用的二元有理内部变换因子,且其中4X4IDCT硬件单元将4X4IDCT实施方案应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域。在另一方面中,一种方法包含通过4X4IDCT硬件单元将4X4反离散余弦变换(IDCT)应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域,其中4X4IDCT包含具有奇数部分的非正交4X4DCT的IDCT,所述奇数部分应用按以下方程式与经缩放因
子(I)有关的第一内部因子及第二内部因子(C、S)
ε C + Sζ =-其中变量ω及ψ表示无理内部变换因子且变量C及S表示在非正交4X4DCT的整数实施方案中代替变量ω及ψ使用的二元有理内部变换因子。在另一方面中,一种设备包含用于通过4X4IDCT硬件单元将4X4反离散余弦变换(IDCT)应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域的装置,其中4X 4IDCT包含具有奇数部分的非正交4X 4DCT的IDCT,所述奇数部分应用按以下方程式与
经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)
e C + (S9 =-
ω七 ψ,其中变量ω及ψ表示无理内部变换因子且变量C及S表示在非正交4X4DCT的整数实施方案中代替变量ω及ψ使用的二元有理内部变换因子。在另一方面中,一种非暂时性计算机可读存储媒体存储指令,所述指令在由处理器执行时引起处理器通过4X4IDCT硬件单元将4X4反离散余弦变换(IDCT)应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域,其中4Χ 4IDCT包含具有奇数部分的非正交4X4DCT的IDCT,所述奇数部分应用按以下方程式与经缩放因子(ξ)有关的第一
内部因子及第二内部因子(C、S)e C S[_],其中变量ω及ψ表示无理内部变换因子且变量C及S表示在非正交4X4DCT的整数实施方案中代替变量ω及ψ使用的二元有理内部变换因子。在另一方面中,一种设备包含4X4离散余弦变换(DCT)硬件单元,其实施具有奇数部分的非正交4X4DCT,所述奇数部分应用按以下方程式与经缩放因子(ξ)有关的第一内部因子及第二内部因子(Α、Β)匕 A + B^TTITV ,其中经缩放因子(ξ)等于第一内部因子㈧加第二内部因子⑶的总和除以一加一除以二的平方根,且其中4X4DCT硬件单元将4X4DCT实施方案应用于媒体数据以将媒体数据从空间域变换到频域。在另一方面中,一种方法包含通过4 X 4DCT硬件单元将非正交4X4离散余弦变换(DCT)应用于媒体数据以将媒体数据从空间域变换到频域。非正交4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(I)有关的第一内部因子及第二内部因子(Α、Β)
- A + B ξ=Χ^ ,其中经缩放因子(ξ)等于第一内部因子㈧加第二内部因子⑶的总和除以一加一除以二的平方根。在另一方面中,一种设备包含用于通过4X4DCT硬件单元将非正交4X4离散
余弦变换(DCT)应用于媒体数据以将媒体数据从空间域变换到频域的装置,其中非正交
4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(ξ)有关的第一内
部因子及第二内部因子(Α、Β)e A + B卜I7T77 ,其中经缩放因子(ξ)等于第一内部因子㈧加第二内部因子⑶的总和除以一加一除以二的平方根。在另一方面中,一种非暂时性计算机可读存储媒体存储指令,所述指令在由处理器执行时引起处理器通过4X4DCT硬件单元将非正交4X4离散余弦变换(DCT)应用于媒体数据以将媒体数据从空间域变换到频域。非正交4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(ξ)有关的第一内部因子及第二内部因子(Α、Β)
匕 A~l· Bξ=ΥΤ 7 ,其中经缩放因子(ξ)等于第一内部因子㈧加第二内部因子⑶的总和除以一加一除以二的平方根。在另一方面中,一种设备包含4X4反离散余弦变换(IDCT)硬件单元,其中
4X4IDCT硬件单元实施具有奇数部分的非正交4X4DCT的IDCT,所述奇数部分应用按以下
方程式与经缩放因子(ξ)有关的第一内部因子及第二内部因子(Α、Β)
£ A -l· B其中经缩放因子(ξ)等于第一内部因子㈧加第二内部因子⑶的总和除以一加一除以二的平方根,且其中4X4IDCT硬件单元将4X4IDCT实施方案应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域。在另一方面中,一种方法包含通过4X4IDCT硬件单元将4X4反离散余弦变换(IDCT)应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域。IDCT包含具有奇数部分的非正交4X4DCT的IDCT,所述奇数部分应用按以下方程式与经缩放因子(ξ )有关的第一内部因子及第二内部因子(A、B)
亡 A + B
卜,其中经缩放因子(ξ)等于第一内部因子㈧加第二内部因子⑶的总和除以一加一除以二的平方根。在另一方面中,一种设备包含用于通过4X4IDCT硬件单元将4X4反离散余弦变
换(IDCT)应用于代表媒体数据的DCT系数以将媒体数据从频域变换到空间域的装置。IDCT
包含具有奇数部分的非正交4X4DCT的IDCT,所述奇数部分应用按以下方程式与经缩放因
子(ξ)有关的第一内部因子及第二内部因子(Α、Β) £ Α-\- Bξ=τ^ ,其中经缩放因子(ξ)等于第一内部因子㈧加第二内部因子⑶的总和除以一加一除以二的平方根。在另一方面中,一种非暂时性计算机可读存储媒体存储指令,所述指令在由处理
器执行时引起处理器通过4X4IDCT硬件单元将4X4反离散余弦变换(IDCT)应用于代表
媒体数据的DCT系数以将媒体数据从频域变换到空间域。IDCT包含具有奇数部分的非正交
4X4DCT的IDCT,所述奇数部分应用按以下方程式与经缩放因子(ξ )有关的第一内部因子
及第二内部因子(Α、Β)
£ A + B其中经缩放因子(ξ)等于第一内部因子㈧加第二内部因子⑶的总和除以一加一除以二的平方根。在随附图式及以下描述中陈述技术的一个或一个以上方面的细节。本发明中所描述的技术的其它特征、目标及优点从描述及图式且从权利要求书将为显而易见的。


图I为说明视频编码及解码系统的框图。图2为更详细说明图I的视频编码器的框图。图3为更详细说明图I的视频解码器的框图。图4Α到图4C为各自说明根据本发明的技术所建构的经缩放4X4DCT-II的实施方案的图。图5为说明编码装置在应用根据本发明的技术所建构的4X4DCT实施方案时的示范性操作的流程图。图6为说明编码装置在应用根据本发明的技术所建构的4X4DCT-III实施方案时的实例操作的流程图。图7Α到图7C为说明根据本发明的技术所建构的三种不同4X4DCT-II实施方案中的每一者的相对于位速率的峰值信噪比的曲线的图。
具体实施例方式大体来说,本发明是针对用于使用表示为根据各种关系所选择的系数的4X4矩阵的一个或一个以上4X4离散余弦变换(DCT)来编码数据的技术。可应用所述技术以压缩多种数据,其包括可见或可听媒体数据,例如,数字视频、图像、语音及/或音频数据,且借此将表示此数据的这些电信号变换为压缩信号以用于电信号的更有效处理、发射或归档。通过遵守根据本发明的技术所定义的各种关系,可为系数矩阵选择系数以使得4X4DCT的正交及接近正交实施方案在应用于数据时可促进增加的编码增益。依据离散数据单元表示以上所表示的大小,S卩,4X4。为说明起见,通常依据视频块描述视频数据(尤其在关于视频压缩时)。视频块通常指代视频帧的任何大小的部分,其中视频帧指代一系列图片或图像中的一图片或图像。每一视频块通常包含多个离散像素数据,其指示例如红色、蓝色及绿色的色彩分量(所谓的“色度”分量)或亮度分量(所谓的“亮度”分量)。每一像素数据集合包含在视频块中的单一 1X1点,且可被当作关于视频块的离散数据单元。因此,4X4视频块(例如)包含四行的像素数据,其中每一行中具有四个离散的像素数据集合。可将η位值指派到每一像素以规定色彩或亮度值。
通常依据DCT能够处理的数据(不管是音频、语音、图像还是视频数据)块的大小来描述DCT。举例来说,如果DCT可处理4X4数据块,则DCT可被称为4X4DCT。此外,DCT可经表示为特定类型。八个不同类型的DCT中的最常用类型的DCT为类型II的DCT,其可经表示为“DCT-II”。通常,当泛指DCT时,此用语指代类型II的DCT或DCT-II。DCT-II的反操作被称为类型III的DCT,其可类似地表示为“DCT-III”,或由于通常将DCT理解为指代DCT-II,因此表示为“ IDCT”其中“ IDCT”中的“ I ”表示反操作。以下对DCT的提及符合此记法,其中对DCT的泛指指代DCT-II,除非另外规定。然而,为了避免混淆,包括DCT-II的DCT在下文主要用所指示的对应类型(II、III等)来指代。本发明中所描述的技术涉及编码器及/或解码器两者,其使用4X4DCT-II的一个或一个以上实施方案以促进数据的压缩及/或解压缩。此外,经由应用这些4 X 4DCT-II实施方案所完成的压缩及解压缩允许表示数据的电信号的物理变换,使得可使用物理计算硬件、物理传输媒体(例如,铜、光纤、无线或其它媒体)及/或存储硬件(例如,磁盘或光盘或磁带,或多种固态媒体中的任一者)更有效地处理、传输及/或存储信号。可仅在硬件中配置实施方案或可在硬件与软件的组合中配置实施方案。4X4DCT-II的实施方案可为正交或接近正交的。术语“正交”大体上指代矩阵的性质,其中矩阵在乘以矩阵的转置时等于单位矩阵。术语“接近正交”指代其中此正交性质被放松而使得不必需严格正交性的情况。在此方面,“接近正交”暗示近似正交或松散正交。然而,接近正交矩阵不符合正交的技术定义,且从纯粹技术角度来说,这些接近正交矩阵可被当作非正交的。为了说明本发明中所描述的4X4DCT-II的正交实施方案,考虑包括4X4DCT模块的设备。4X4DCT模块实施根据本发明中所描述的技术建构的正交4X4DCT-II。此正交4X4DCT-II实施方案包括奇数部分及偶数部分。4X4DCT-II的所谓的“奇数部分”指代4X4DCT-II实施方案的输出奇数编号系数的部分。4X4DCT-II的所谓的“偶数部分”指代4X4DCT-II实施方案的输出偶数编号系数的部分。根据本发明的技术,奇数部分应用与经缩放因子(ξ)有关的第一内部因子C及第二内部因子S以使得所述经缩放因子等于第一内部因子(C)的平方加第二内部因子(S)的平方的总和的平方根。术语“内部因子”指代在因式分解之后保留的在4X4DCT的实施方案内部的因子。术语“经缩放因子”指代经由因式分解移除的在4X4DCT的实施方案外部的因子。内部因子通常由于需要在实施方案复杂性方面可为代价大的乘法而增加实施方案复杂性。举例来说,与较简单的加法运算相比,乘法可需要三倍或三倍以上的计算操作(例如,时钟循环)来完成。可实施特定乘法器以更有效地(例如,在较少时钟循环中)执行乘法,但这些乘法器实施方案通常消耗显著更多的芯片或硅表面积且也可汲取大量电力。因此通常避免乘以因子的乘法,尤其是在功率敏感装置中,例如,大部分移动装置,其包括蜂窝式电话(所谓的“智能型”蜂窝式电话)、个人数字助理(PDA)、膝上型计算机(所谓的“迷你笔记型计算机”)及其类似物。因式分解为可借以从4X4DCT-II实施方案移除一个或一个以上内部因子且用外部因子加以替换的过程。接着可通常以最小的花费或最小的复杂性增加将外部因子并入于(例如)关于视频编码器的随后量化操作中。
无论如何,以上所提到的第一内部因子C及第二内部因子S与经缩放因子(ξ)之间的以上关系提供了未用于4X4DCT-II的先前实施方案中的内部因子的特定值。举例来说,分别用于内部因子C及S的值2及5不过度增加实施方案复杂性,且与涉及C及S的I及2的值的已知4X4DCT实施方案相比改善了编码增益。视频编码器接着将具有内部因子2及5的4X4DCT-II实施方案应用于媒体数据以便将媒体数据从空间域变换到频域。通过应用此正交4X4DCT-II实施方案,在与包括I及2的内部因子的标准DCT-II实施方案相比时,所述技术促进了编码增益(其为表示压缩效率的术语)。就DCT-II实施方案来说,正交性通常为所要的,因为其为可逆的。作为一个实例,此可逆性质允许视频编码器应用正交4 X 4DCT实施方案以从视频数据的残余块产生DCT系数。视频解码器可接着应用4X4反DCT-II (IDCT)实施方案以便在数据极小损耗(如果存在)的情况下从DCT-II系数重建构视频数据的残余块。考虑到视频编码的主要目标为数据的保存,所以例如H. 264视频编码标准等各种编码标准均采用4X4DCT的正交实施方案。虽然正交性通常在理论上为所要的,但视频、音频或通用编码管线实际上涉及会引入所谓的“噪声”的许多步骤,所述噪声在大多方面实际上防止准确地重建构由正交4X4DCT-II实施方案提供的值。考虑到整数算术实施方案,接近正交变换与严格正交整数变换相比可改善编码效率,同时也减小实施方案复杂性。实际上,放松正交性质会将噪声引入到系统中,但可改善编码增益,同时也减小实施方案复杂性。为了说明本发明中所描述的4X4DCT-II的接近正交实施方案,考虑设备的4 X 4DCT模块实施根据本发明中所描述的技术建构的此接近正交4 X 4DCT-II。此接近正交4 X 4DCT-II实施方案也包括奇数部分及偶数部分。在此情况下奇数部分应用按以下方程式
与经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)
C + S[_5] ξ=^。在此方程式中,变量ω及ψ表示原始(无理)内部变换因子,例如,(ω)可为三乘常数PiU)除以八的余弦,且(Ψ)可为三乘常数PiU)除以八的正弦。变量(C)及(S)表示替换(ω)及(Ψ)的整数(或二元有理)内部变换因子。方程式⑵指示经缩放因子(ξ )等于第一内部因子(C)加第二内部因子⑶的总和除以(ω)加(ψ)。此方程式可识别类似于关于正交实施方案所定义的以上关系的C及S的特定内部因子值,但导致不同的外部因子。然而,由于以上所提到的原因,不同外部因子通常不增加实施方案复杂性,而是通常提供原始变换因子的更准确近似。其也可提供比常规4X4DCT-II实施方案且甚至在一些情况下比以上所述的正交4X4DCT-II实施方案改善的编码增益。因此,控制单元将此接近正交4X4DCT-II应用于媒体数据以便将媒体数据从空间域变换到频域,结果可能得到改善的编码增益。图I为说明视频编码及解码系统10的框图。如图I中所示,系统10包括源硬件装置12,其将经编码的视频经由通信信道16发射到接收硬件装置14。源装置12可包括视频源18、视频编码器20及发射器22。目的地装置14可包括接收器24、视频解码器26及视频显示装置28。在图I的实例中,通信信道16可包含任何无线 或有线通信媒体,例如,射频(RF)频谱或一个或一个以上物理传输线,或无线及有线媒体的任何组合。信道16可形成基于包的网络(例如,局域网、广域网或例如因特网的全球网络)的一部分。通信信道16通常表示用于将视频数据从源装置12发射到接收装置14的任何适当的通信媒体或不同通信媒体的集合。源装置12产生用于发射到目的地装置14的视频。然而,在一些状况下,装置12、14可以大体上对称方式操作。举例来说,装置12、14中的每一者可包括视频编码及解码组件。因此,系统10可支持在视频装置12、14之间的单向或双向视频发射(例如)以用于视频串流、视频广播或视频电话。对于其它数据压缩及编码应用,装置12、14可经配置以发送且接收或交换其它类型的数据,例如,图像、语音或音频数据,或视频、图像、语音及音频数据中的两者或两者以上的组合。因此,为实现说明的目的提供视频应用的以下论述,且不应认为其限制如本文中广泛描述的本发明的各种方面。视频源18可包括例如一个或一个以上摄影机等视频俘获装置、含有先前俘获的视频的视频档案,或来自视频内容提供者的实况视频馈入。作为另一替代例,视频源18可产生基于计算机图形的数据作为源视频,或实况视频及计算机产生的视频的组合。在一些状况下,如果视频源18为相机,则源装置12及接收装置14可形成所谓的相机电话或视频电话。因此,在一些方面中,源装置12、接收装置14或两者可形成无线通信装置手持机,例如,移动电话。在每一状况下,经俘获、预先俘获或计算机产生的视频可由视频编码器20编码以用于从视频源装置12经由发射器22、信道16及接收器24发射到视频接收装置14的视频解码器26。显示装置28可包括多种显示装置中的任一者,例如,液晶显示器(LCD)、等离子显示器或有机发光二极管(OLED)显示器。视频编码器20及视频解码器26可经配置以支持可缩放视频编码,以实现空间、时间及/或信噪比(SNR)可缩放性。在一些方面中,视频编码器20及视频解码器22可经配置以支持精细粒度SNR可缩放性(FGS)编码。编码器20及解码器26可通过支持基层及一个或一个以上可缩放增强层的编码、发射及解码来支持各种程度的可缩放性。对于可缩放视频编码,基层载运具有最小质量等级的视频数据。一个或一个以上增强层载运额外位流以支持更高的空间、时间及/或SNR等级。视频编码器20及视频解码器26可根据例如MPEG-2、MPEG-4、ITU-T H. 263或ITU-TH. 264/MPEG-4先进视频编码(AVC)等视频压缩标准操作。尽管图I中未展示,但在一些方面中,视频编码器20及视频解码器26可分别与音频编码器及音频解码器整合,且包括适当MUX-DEMUX单元或其它硬件及软件以处置对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,则MUX-DEMUX单元可符合ITU H. 223多路复用器协议,或例如用户数据报协议(m)P)等其它协议。在一些方面中,对于视频广播,可应用本发明中所描述的技术以增强H. 264视频编码以用于(例如)经由无线视频广播服务器或无线通信装置手持机使用仅前向链路(FLO)空中接口规范(作为技术标准TIA-1099公开的“用于陆地移动多媒体多播的仅前向链路空中接口规范(Forward Link Only Air Interface Specification for TerrestrialMobile Multimedia Multicast),,( “FLO规范”))在陆地移动多媒体多播(TM3)系统中递送实时视频服务。FLO规范包括定义适合于FLO空中接口的位流语法及语义以及解码过程的实例。或者,可根据例如DVB-H(手持型数字视频 广播)、ISDB-T (陆地整合服务数字广播)或DMB (数字媒体广播)等其它标准来广播视频。因此,源装置12可为移动无线终端、视频串流服务器或视频广播服务器。然而,本发明中所描述的技术不限于任何特定类型的广播、多播或点对点系统。在广播的状况下,源装置12可将若干信道的视频数据广播到多个接收装置,其中的每一者可类似于图I的接收装置14。视频编码器20及视频解码器26各自可实施为一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。因此,视频编码器20及视频解码器26中的每一者可至少部分地实施为集成电路(IC)芯片或装置,且包括于一个或一个以上编码器或解码器中,其中的任一者可整合为相应移动装置、订户装置、广播装置、服务器等等中的组合编码器/解码器(CODEC)的一部分。另外,源装置12及接收装置14各自可包括(适用时)用于发射及接收经编码视频的适当调制、解调、频率转换、滤波及放大器组件,其包括足以支持无线通信的射频(RF)无线组件及天线。然而,为实现易于说明的目的,图I中未展示这些组件。视频序列包括一系列视频帧。视频编码器20对个别视频帧内的像素的块操作以便编码视频数据。视频块可具有固定或变化大小,且可根据规定的编码标准而大小不同。每一视频巾贞包括一系列片段。每一片段可包括一系列宏块,宏块可经布置为子块。例如,ITU-TH. 264标准支持各种二元块大小下的帧内预测,例如,对于亮度分量的16乘16、8乘8、4乘4及对于色度分量的8X8,以及各种块大小下的帧间预测,例如,对于亮度分量的16乘16、16乘8、8乘16、8乘8、8乘4、4乘8及4乘4及对于色度分量的对应缩放的大小。较小视频块通常可提供较好分辨率,且可用于视频帧的包括更高细节等级的位置。大体来说,通常可将宏块(MB)及各种子块视为表示视频块。另外,可将片段视为表示一系列视频块,例如,MB及/或子块。每一片段可为可独立解码的单元。在预测之后,可对二元或非二元大小的残余块执行变换,且可在使用帧内_16X 16预测模式的情况下将额外变换应用于色度分量或亮度分量的4X4块的DCT系数。图I的系统10的视频编码器20及/或视频解码器26可经配置以分别包括4X4DCT-II及其反操作(例如,4X4DCT-III)的实施方案,其中4X4DCT-II遵守本发明中所描述的用于选择4X4大小DCT的DCT-II矩阵系数的技术的各种关系中的一者。虽然ITU-TH. 264标准支持各种块大小下的帧内预测,例如,对于亮度分量的16乘16、8乘8、4乘4及对于色度分量的8X8,但为了改善编码效率而对此标准的修订当前在进行中。一个修订标准可被称为ITU-T H. 265或简单地称为H. 265 (有时被称为下一代视频编码或NGVC)。如下文关于图7A到图7C所描述,遵守根据本发明的技术所陈述的各种关系中的一者的类型II的4X4DCT(“DCT-II”)可改善如依据峰值信噪比(PSNR)所测量的编码效率。因此,ITU-T H. 265及其它演进中的标准或规范可考虑这些DCT-II以便改善编码效率。根据本发明中所描述的技术,可以遵守可与常规实施方案相比促进改善的编码增益的各种关系中的一者的方式产生4X4DCT-II的实施方案。第一关系是针对4X4DCT-II的正交实施方案而定义且以下关于方程式(I)加以陈述ξ= Vc2+ 52 ’(I)其中C及S表示4X4DCT-II实施方案的“奇数”部 分中的第一内部因子及第二内部因子,且(ξ )表示应用于4 X 4DCT-II实施方案的“奇数”部分的经缩放因子。4 X 4DCT-II的所谓的“奇数部分”指代4X4DCT-II实施方案的输出奇数编号系数的部分。4X4DCT-II的所谓的“偶数”部分指代4X4DCT-II实施方案的输出偶数编号系数的部分。术语“内部因子”指代在因式分解之后保留的在4X4DCT的实施方案内部的因子。术语“经缩放因子”指代经由因式分解移除的在4X4DCT的实施方案外部的因子。内部因子通常由于需要在实施方案复杂性方面可为代价大的乘法而增加实施方案复杂性。举例来说,与较简单的加法运算相比,乘法可需要三倍或三倍以上的计算操作(例如,时钟循环)来完成。可实施特定乘法器以更有效地(例如,在较少时钟循环中)执行乘法,但这些乘法器实施方案通常消耗显著更多的芯片或硅表面积且也可汲取大量电力。因此通常避免乘以因子的乘法,特别在功率敏感装置中,例如,大部分移动装置,其包括蜂窝式电话(所谓的“智能型”蜂窝式电话)、个人数字助理(PDA)、膝上型计算机(所谓的“迷你笔记型计算机”)及其类似物。因式分解为可借以从4X4DCT-II实施方案移除一个或一个以上内部因子且用外部因子加以替换的过程。接着可通常以最小的花费或最小的复杂性增加将外部因子并入于(例如)关于视频编码器的随后量化操作中。无论如何,以上关于方程式(I)所提到的第一内部因子C及第二内部因子S与经缩放因子(ξ )之间的以上关系提供了未用于4X4DCT-II的先前实施方案中的内部因子的特定值。举例来说,分别用于内部因子C及S的值2及5不过度增加实施方案复杂性,且与涉及C及S的I及2的值的已知4X4DCT实施方案相比,改善了编码增益。视频编码器接着将具有内部因子2及5的4X4DCT-II实施方案应用于媒体数据以便将媒体数据从空间域变换到频域。通过应用此正交4X4DCT-II实施方案,在与包括I及2的内部因子的标准DCT-II实施方案相比时所述技术促进了编码增益(其为表示压缩效率的术语)。就DCT-II实施方案来说,正交性通常为所要的,因为其为可逆的。作为一个实例,此可逆性质允许视频编码器应用正交4 X 4DCT实施方案以从视频数据的残余块产生DCT系数。视频解码器可接着应用4X4反DCT-II (IDCT)实施方案以便在数据损耗极小(如果存在)的情况下从DCT-II系数重建构视频数据的残余块。例如H. 264视频编码标准等若干编码标准采用4X4DCT的正交实施方案。虽然正交性通常在理论上为所要的,但视频、音频或通用编码管线实际上涉及会引入所谓的“噪声”的许多额外步骤(例如缩放或量化),所述噪声在大多方面实际上防止准确重建构由正交4X4DCT-II实施方案提供的值。结果,放松正交性质以实现接近正交(就技术上来说,其为非正交)可为可能的。考虑到整数算术实施方案,这些接近正交变换与严格正交整数变换相比可改善编码效率,同时也减小实施方案复杂性。大体来说,放松正交性质将噪声引入到系统中,但可改善编码增益,同时也减小实施方案复杂性。为了说明4X4DCT-II的接近正交实施方案,作为一个实例,考虑包括控制单元的设备。控制单元实施根据本发明中所描述的技术的接近正交4X4DCT-II。此接近正交4 X 4DCT-II实施方案也包括奇数部分及偶数部分。在此种情况下奇数部分应用按以下方程式⑵与经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)(2) ω+ψ
在方程式⑵中,变量ω及ψ表示原始(无理)内部变换因子,例如,(ω)可为三乘常数PiU)除以八的余弦,且(Ψ)可为三乘常数PiU)除以八的正弦。变量(C)及
(S)表示替换(ω)及(Ψ)的整数(或二元有理)内部变换因子。方程式⑵指示经缩放因子(ξ)等于第一内部因子(C)加第二内部因子⑶的总和除以(ω)加(ψ)。此方程式可识别类似于以上关于正交实施方案所定义的关系的C及S的特定内部因子值,但导致不同的外部因子。然而,由于以上所提到的原因,不同外部因子通常不增加实施方案复杂性,而是通常提供原始变换因子的较准确近似。其也可与常规4X4DCT-II实施方案相比且甚至在一些情况下与以上所述的正交4X4DCT-II实施方案相比提供改善的编码增益。因此,控制单元将此接近正交4X4DCT-II应用于媒体数据以将媒体数据从空间域变换到频域,结果为具有潜在改善的编码增益。根据本发明中所描述的技术建构的以上所得到4X4DCT-II实施方案表示与直接4X4DCT-II实施方案相对比的经缩放4X4DCT-II实施方案。所述实施方案为“经缩放的”,因为其已经历因式分解以移除内部因子且因此输出需要应用额外外部因子以正确计算4X4DCT的经缩放系数。所谓的“直接”DCT-II实施方案输出不需要任何另外运算(例如乘以外部因子的乘法)以正确计算4X4DCT的系数。存在能够产生经缩放4X4DCT-II实施方案的许多不同因式分解。一个替代因式分解产生不同的经缩放4X4DCT-II实施方案,可根据本发明的技术从所述经缩放4X4DCT-II实施方案导出另一关系以产生接近正交实施方案,所述接近正交实施方案与通常由遵照H. 264的视频编码器使用的常规DCT-II相比改善了编码增益。为了关于用以产生经缩放4X4DCT-II的替代因式分解说明接近正交实施方案,作为一个实例,考虑包括控制单元的设备。控制单元根据本发明中所描述的技术实施接近正交4X4DCT-II。类似于以上所述的实施方案,此接近正交4X4DCT-II实施方案包括奇数部分及偶数部分。在此种情况下奇数部分应用按以下方程式(3)与经缩放因子(ξ)有关的第一内部因子及第二内部因子(Α、Β)
f, A~\~ B, I、卜⑶方程式(3)指示经缩放因子(ξ)等于第一内部因子㈧加第二内部因子⑶的总和除以一加一除以二的平方根。此方程式可分别识别内部因子A及B的特定值7及5。使用替代因式分解且用以上所提到的内部因子建构的此所得的接近正交4X4DCT-II实施方案与常规H. 2644X4DCT-II实施方案相比可更准确地表示直接4X4DCT-II的无理内部因子,且借此与常规4X4DCT-II实施方案相比提供改善的编码增益。因此,控制单元将此接近正交4X4DCT-II应用于媒体数据以将媒体数据从空间域变换到频域,结果为具有潜在改善的编码增益。
图2为更详细说明图I的视频编码器20的框图。视频编码器20可至少部分地形成为一个或一个以上集成电路装置,其可共同地被称为集成电路装置。在一些方面中,视频编码器20可形成无线通信装置手持机或广播服务器的一部分。视频编码器20可执行视频帧内的块的帧内及帧间编码。帧内编码依赖于空间预测以减少或移除给定视频帧内的视频中的空间冗余。帧间编码依赖于时间预测以减少或移除视频序列的邻近帧内的视频中的时间冗余。对于帧间编码,视频编码器20执行运动估计以跟踪在邻近帧之间匹配的视频块的移动。如图2中所示,视频编码器 20接收待编码的视频帧内的当前视频块30。在图2的实例中,视频编码器20包括运动估计单元32、参考帧存储器34、运动补偿单元36、块变换单元38、量化单元40、反量化单元42、反变换单元44及熵编码单元46。可应用回路内或回路后解块滤波器(未图示)以对块滤波以移除成块假影。视频编码器20还包括求和器48及求和器50。图2说明用于视频块的帧间编码的视频编码器20的时间预测组件。尽管为易于说明的目的图2中未展示,但视频编码器20也可包括用于一些视频块的帧内编码的空间预测组件。运动估计单元32比较视频块30与一个或一个以上邻近视频帧中的块以产生一个或一个以上运动向量。可从参考帧存储器34检索一个或一个以上邻近帧,所述参考帧存储器34可包含任何类型的存储器或数据存储装置以存储从先前编码块重建构的视频块。可针对可变大小的块,例如,16 X 16、16 X 8、8 X 16、8 X 8或更小的块大小执行运动估计。运动估计单元32 (例如)基于速率失真模型而识别邻近帧中的最紧密匹配当前视频块30的一个或一个以上块,且确定在邻近帧中的块与当前视频块之间的位移。在此基础上,运动估计单元32产生一个或一个以上运动向量(MV),其指示在当前视频块30与来自用于编码当前视频块30的参考帧的一个或一个以上匹配块之间的位移的量值及轨迹。一个或一个以上匹配块将用作预测性(或预测)块以供帧间编码待编码块。运动向量可具有二分之一或四分之一像素精确度或甚至更精细的精确度,从而允许视频编码器20以比整数像素位置更高的精确度跟踪运动且获得更好的预测块。当使用具有分数像素值的运动向量时,在运动补偿单元36中进行内插运算。运动估计单元32使用例如速率失真模型等某些准则识别视频块的最佳块分割及一个或一个以上运动向量。举例来说,在双向预测的状况下可存在一个以上的运动向量。使用所得的块分割及运动向量,运动补偿单元36形成预测视频块。视频编码器20通过在求和器48处从原始的当前视频块30减去由运动补偿单元36产生的预测视频块来形成残余视频块。块变换单元38应用产生残余变换块系数的变换。如图2中所示,块变换单元38包括4X 4DCT-II单元52,其实施根据本发明中所描述的技术建构的4X4DCT-II。4X4DCT-II单元52表示硬件模块,所述硬件模块在一些情况下执行软件(例如执行软件代码或指令的数字信号处理器或DSP),其实施具有由以上所识别的三种关系中的一者定义的内部因子的4 X 4DCT-II。块变换单元38将经缩放4 X 4DCT-II单元52应用于残余块以产生残余变换系数的4X4块。4X4DCT-II单元52通常将残余块从表示为残余像素数据的空间域变换到表示为DCT系数的频域。变换系数可包含DCT系数,其包括至少一个DC系数及一个或一个以上AC系数。量化单元40量化(例如,舍入)残余变换块系数以进一步减小位速率。如上所提及,量化单元40通过并入有在因式分解期间所移除的内部因子来考虑经缩放4X4DCT-II单元52的经缩放性质。即,量化单元40并入有以下关于图4A到图4C的实施方案70A-70C所示的外部因子。由于量化通常涉及乘法,因此将这些因子并入到量化单元40中可不增加量化单元40的实施方案复杂性。在此方面,从经缩放4X4DCT-II单元52移除因子在不增加量化单元40的实施方案复杂性的情况下减小DCT-II单元52的实施方案复杂性,从而导致关于视频编码器20的实施方案复杂性的净减小。熵编码单元46熵编码量化系数以更进一步减小位速率。熵编码单元46执行统计无损耗编码,在一些情况下被称为熵编码。熵编码单元46模型化量化DCT系数的概率分布且基于模型化的概率分布来选择码簿(例如,CAVLC或CABAC)。使用此码簿,熵编码单元46以压缩量化DCT系数的方式选择用于每一量化DCT系 数的码。为说明起见,熵编码单元46可选择用于频繁出现的量化DCT系数的短码字(依据位)及用于较不频繁出现的量化DCT系数的较长码字(依据位)。只要短码字使用比量化DCT系数更少的位,则平均来说熵编码单元46压缩量化DCT系数。熵编码单元46输出熵编码系数以作为发送到视频解码器26的位流。大体来说,视频解码器26执行反操作以从位流解码且重建构经编码视频,如将参看图3的实例描述。重建构单元42及反变换单元44分别重建构量化系数及应用反变换以重建构残余块。求和单元50将重建构的残余块加到由运动补偿单元36产生的运动补偿预测块以产生重建构的视频块以存储于参考帧存储器34中。重建构的视频块由运动估计单元32及运动补偿单元36用于编码随后视频帧中的块。图3为更详细说明图I的视频解码器26的实例的框图。视频解码器26可至少部分地形成为一个或一个以上集成电路装置,其可共同地被称为集成电路装置。在一些方面中,视频解码器26可形成无线通信装置手持机的一部分。视频解码器26可执行对视频帧内的块的帧内及帧间解码。如图3中所示,视频解码器26接收已由视频编码器20编码的经编码视频位流。在图3的实例中,视频解码器26包括熵解码单元54、运动补偿单元56、重建构单元58、反变换单元60及参考帧存储器62。熵解码单元64可存取存储于存储器64中的一个或一个以上数据结构以获得可用于编码的数据。视频解码器26也可包括回路内解块滤波器(未图示),其对求和器66的输出进行滤波。视频解码器26还包括求和器66。图3说明用于视频块的帧间解码的视频解码器26的时间预测组件。尽管图3中未展示,但视频解码器26也可包括用于一些视频块的帧内解码的空间预测组件。熵解码单元54接收经编码的视频位流且从位流中解码经量化残余系数及经量化参数,以及其它信息,例如,宏块编码模式及运动信息(其可包括运动向量及块分割)。运动补偿单元56接收运动向量及块分割及来自参考帧存储器62的一个或一个以上重建构的参考帧以产生预测视频块。重建构单元58反量化(即,解量化)经量化块系数。反变换单元60将反变换(例如,反DCT)应用于系数以产生残余块。更特定来说,反变换单元60包括经缩放4X4DCT-III单元68,反变换单元60将其应用于系数以产生残余块。作为图2中所示的经缩放4X4DCT-II单元52的反操作的经缩放4X4DCT-III单元68可将系数从频域变换到空间域以产生残余块。类似于以上的量化单元40,重建构单元58通过在实施方案复杂性极小增加(如果有的话)的情况下将在因式分解期间所移除的外部因子并入到重建构过程中来考虑4X4DCT-III单元68的经缩放性质。从经缩放4X4DCT-III单元68移除因子可减小实施方案复杂性,借此导致视频解码器26的复杂性的净减小。接着通过求和器66将预测视频块与残余块求和以形成经解码的块。可应用解块滤波器(未图示)以对经解码的块进行滤波以移除成块假影。经滤波的块接着置于参考帧存储器62中,所述参考帧存储器62提供用于随后视频帧的解码的参考帧且还产生经解码的视频以驱动显示装置28(图I)。图4A到图4C为各自说明根据本发明的技术所建构的经缩放4X4DCT-II的实施方案的图。图4A为说明根据本发明的技术所建构的经缩放正交4X4DCT-II实施方案70A的图。图4B为说明根据本发明的技术所建构的经缩放接近正交4X4DCT-II实施方案70B的图。图4C为说明根据本发明的技术所建构的经缩放接近正 交4X4DCT-II替代实施方案70C的图。图2的实例中所示的4X4DCT单元52可并入有一个或一个以上这些实施方案70A-70C。首先参看图4A的实例,4X4DCT-II实施方案70A包括蝶形单元72、偶数部分74A及奇数部分74B。蝶形单元92可表示硬件或硬件与软件的组合,其用于将输入X(l,…,X3路由或以其它方式转发到适当偶数部分74A及奇数部分74B(“部分74”)。蝶形单元92通常组合例如2x2DCT-II实施方案的较小DCT的结果,其在此种状况下可分别由偶数部分及奇数部分74表示。偶数部分74A为4X4DCT-II实施方案70A的输出偶数DCT系数X。及X2的2x2部分。值得注意地,这些偶数系数Xtl及X2乘以为二分之一(1/2)的外部因子,所述外部因子可以且通常由量化单元40应用。奇数部分74B为4X4DCT-II实施方案70A的输出奇数DCT系数X1及X3的2x2部分。奇数部分74B包括表示为C及S的两个内部因子,所述两个内部因子C及S按照根据本发明的技术定义的以上所提到方程式(I)而与应用于奇数系数&及&的外部因子有关。将一除以二的平方根(I/ V 2)的额外外部因子乘以一除以以上方程式(I)中所提到的关系以导致关于奇数系数X1及X3所示的外部因子。方程式(I)中所提到的关系可通过首先考虑正交性质而导出,所述性质由以下方程式⑷数学地陈述C1C = I。(4)变量C在此种情况下指代任何矩阵,而Ct表示矩阵C的转置。变量I表示单位矩阵。因此,如果矩阵的转置乘矩阵本身等于单位矩阵,则矩阵展现出正交性质。假定由于以上所提到的原因在媒体编码实施方案中优选的经缩放矩阵,矩阵C可被分成表示为C'的整数经缩放变换及缩放因子或外部因子的对角矩阵D,如以下方程式
(5)中所提到C = C' D。(5)以来自方程式(5)的C' D代入方程式(4)中的C导致以下方程式(6)(C' D)T(C/ D)=DC' tC' D = I,(6)其可简化为以下方程式(J)中所示的数学方程式C C = D-2。(7)方程式(J)提供用于选择缩放因子以使得所得的整数变换保持正交的机制。举例来说,在4X4DCT-II实施方案的状况下,此DCT-II通常仅应用表示三乘常数Pi除以八的余弦及三乘常数Pi除以八的正弦的因子的近似。假定这些两个因子将由作为矩阵C'的系数的整数C及S替换且使用以上正交性条件,以上方程式(I)表示标准化因子,以使得设计4X4DCT-II的正交近似的任务可限于找到成对的整数(C、S),以使得满足以下方程式⑶及(9)gC0S(x),&(8)^Cf+S2 =sin(亨)。(9)在这些假定下,导致展示为4X4DCT-II实施方案70A的整数经缩放变换。
以下表I说明与H. 264视频编码标准中所采用的4X4DCT-II实施方案相比较的经选择用于整数C及S的各种值及所得的近似误差。表I
参数近似误差复杂性IZ
C S Vc2+ S2 cos^-Sin(T1)-T^F(x*C,y*S)、
J__2 45__-0.06453020.0294523__I 移位__H.264 中采用
25 V29__0.0112928-0.00459716I 加法+2 移位动态范围中+2 位
37 V58 -0.01123590.00473452加法+1移位动态范围中+3位
13 — -0.00193195~0.0008026092 加法+2 移位’动态范围中+4 位
17 41 VT97Q -0.000331590.0001374193 加法+2 移位动态范围中+5 位值得注意地,当将变量C及S分别设定到2及5时,所得的实施方案70A的复杂性增加,但在三乘常数Pi除以八的余弦及三乘常数Pi除以八的正弦的近似中存在少得多的误差,所述情况促进编码增益。与基础H. 264实施方案相比,复杂性仅涉及额外加法及移位,但不涉及任何在运算意义上代价大的乘法。因此,通过实施方案70A并入有分别用于变量C及S的值2及5,在实施方案复杂性增加最少的情况下潜在地提供最佳编码增益,本发明中所描述的技术仅以复杂性的微小增加促进增加的编码增益。虽然以上关于类型II的DCT加以描述,但图4A的实例中所示的实施方案70A也可表示类型III的DCT或反DCT实施方案。由实施方案70A形成反DCT涉及颠倒输入及输出以使得输入由图4A右侧上的实施方案接收且输出在实施方案的左侧输出。在左侧输出之前,输入接着首先由偶数部分及奇数部分74且接着由蝶形72处理。为易于说明的目的,鉴于此IDCT实施方案可经描述为实施方案70A的镜像,未在单独的图中展示与实施方案70A相反的此IDCT实施方案。图4B为说明根据本发明的技术所建构的经缩放接近正交4X4DCT-II实施方案70B的图。4X4DCT-II实施方案70B包括类似于图4A的蝶形单元72的蝶形单元76,及偶数部分78A及奇数部分78B( “部分78”)。偶数部分78A类似于偶数部分74A。奇数部分78B也类似于奇数部分74B,不同在于正交性条件已放松,从而导致在内部因子C、S与经缩放因子ξ之间的不同关系,即,以上关于方程式(2)所表示的关系。为了根据由方程式(2)所表示的关系导出图4Β的实例实施方案70Β,首先考虑虽然正交性通常在理论上确保4X4DCT-II的直接反实施方案,但实际上大部分缩放因子(在整数变换之后)变为无理数,其难以使用整数乘法器精确地实施。此外,量化通常在4X4DCT变换的应用之后,且此量化添加噪声,其可防碍反正交DCT-II实施方案的直接应用。此外,考虑整数算术实施方案,这些接近正交变换与严格正交整数变换相比可改善编码效率,同时也减小实施方案复杂性。因此,放松在直接实施方案与反实施方案之间的此正交性失配的程度实际上可改善编码增益。为了特征化失配的程度,根据以下方程式(10)定义距单位矩阵的距离的范数Il CtC-I Il。(10)使用与以上关于方程式(4)的记法相同的记法,方程式(10)简单地指示距单位矩阵的距离的范数可定义为矩阵的转置乘矩阵减去单位矩阵。假定CtC保持对角的,则可根据以下方程式(11)计算平均绝对距离^ =^tr(IcrC-Zl)1(11)
其中平均绝对距离由变量δΝ表示且N等于矩阵的大小。通过放松正交性性质,编码增益可改善,但关于平均绝对差的对编码增益的分析过于取决于正经历压缩的图像的特定模型或统计数据。因此,可经由分析与找到在匹配DCT-II的基本函数方面潜在最佳的整数变换有关的不同量度来确定放松正交性性质的程度。关于此形式的评估的更多信息可在由Y · A ·雷兹尼克(Y. A. Reznik)、A · T ·海因茨(A.T.Hinds)及J*L·米歇尔(J.L. Mitchell)创作的题为“借助共同因子来改善定点算法的精度(Improved Precision of Fixed-Point Algorithms by Means of CommonFactors)”(会刊ICIP 2008,加利福尼亚圣地亚哥(San Diego, CA))的文章中找到,所述文章的全部内容就如同在本文中完全陈述一样以引用的方式并入本文中。根据此并入的参考文献,用于产生最佳匹配设计的一种技术被称为“基于公因子
的近似”。使用此技术,可如下导出以下方程式(12)
C + S卜·“⑷’(12)使得可如下导出以下方程式(13)及(14)C/卜 cos(l),及(13)
5/^ = Sin(^)0(14)方程式(12)确保对于经缩放因子ξ,C及S的对应近似的误差具有相同的量值但相反的正负号。在这些假定下,导致展示为4X4DCT-II实施方案70B的整数缩放变换。以下表2说明经选择用于整数C及S的各种值及所得的近似误差。表权利要求
1.一种设备,其包含 4X4离散余弦变换DCT硬件单元,其实施具有奇数部分的正交4X4DCT,所述奇数部分应用与经缩放因子(I)有关的第一内部因子及第二内部因子(C、S)以使得所述经缩放因子等于所述第一内部因子(C)的平方加所述第二内部因子(S)的平方的总和的平方根, 其中所述4 X 4DCT硬件单元将所述4 X 4DCT实施方案应用于媒体数据以将所述媒体数据从空间域变换到频域。
2.根据权利要求I所述的设备, 其中所述内部因子C等于一,且 其中所述内部因子S等于二。
3.根据权利要求I所述的设备, 其中所述内部因子C等于二,且 其中所述内部因子S等于五。
4.根据权利要求I所述的设备, 其中所述内部因子C等于三,且 其中所述内部因子S等于七。
5.根据权利要求I所述的设备, 其中所述内部因子C等于五,且 其中所述内部因子S等于十二。
6.根据权利要求I所述的设备, 其中所述内部因子C等于十七,且 其中所述内部因子S等于四十一。
7.根据权利要求I所述的设备, 其中所述4 X 4DCT硬件单元将所述4 X 4DCT实施方案应用于所述媒体数据以确定一个或一个以上DCT系数,且 其中所述设备进一步包含量化单元,所述量化单元使用一个或一个以上DCT系数的所述经缩放因子(I)来确定经量化DCT系数。
8.根据权利要求I所述的设备,其中所述4X4DCT硬件单元包含处理器,所述处理器执行软件以实施所述正交4 X 4DCT。
9.一种方法,其包含 通过4X4离散余弦变换DCT硬件单元将正交4X4DCT实施方案应用于媒体数据以将所述媒体数据从空间域变换到频域, 其中所述正交4X4DCT实施方案包括奇数部分,所述奇数部分应用与经缩放因子(I)有关的第一内部因子及第二内部因子(C、S)以使得所述经缩放因子等于所述第一内部因子(C)的平方加所述第二内部因子(S)的平方的总和的平方根。
10.根据权利要求9所述的方法, 其中所述内部因子C等于一,且 其中所述内部因子S等于二。
11.根据权利要求9所述的方法, 其中所述内部因子C等于二,且其中所述内部因子S等于五。
12.根据权利要求9所述的方法, 其中所述内部因子C等于三,且 其中所述内部因子S等于七。
13.根据权利要求9所述的方法, 其中所述内部因子C等于五,且 其中所述内部因子S等于十二。
14.根据权利要求9所述的方法, 其中所述内部因子C等于十七,且 其中所述内部因子S等于四十一。
15.根据权利要求9所述的方法, 其中应用所述正交4 X 4DCT实施方案包括将所述正交4 X 4DCT实施方案应用于所述媒体数据以确定一个或一个以上DCT系数,且 其中所述方法进一步包含使用一个或一个以上DCT系数的所述经缩放因子(I)来确定经量化DCT系数。
16.—种设备,其包含 用于将正交4X4离散余弦变换DCT实施方案应用于媒体数据以将所述媒体数据从空间域变换到频域的装置, 其中所述正交4X4DCT实施方案包括奇数部分,所述奇数部分应用与经缩放因子(I)有关的第一内部因子及第二内部因子(C、S)以使得所述经缩放因子等于所述第一内部因子(C)的平方加所述第二内部因子(S)的平方的总和的平方根。
17.根据权利要求16所述的设备, 其中所述内部因子C等于一,且 其中所述内部因子S等于二。
18.根据权利要求16所述的设备, 其中所述内部因子C等于二,且 其中所述内部因子S等于五。
19.根据权利要求16所述的设备, 其中所述内部因子C等于三,且 其中所述内部因子S等于七。
20.根据权利要求16所述的设备, 其中所述内部因子C等于五,且 其中所述内部因子S等于十二。
21.根据权利要求16所述的设备, 其中所述内部因子C等于十七,且 其中所述内部因子S等于四十一。
22.根据权利要求16所述的设备, 其中所述用于将所述4 X 4DCT实施方案应用于所述媒体数据的装置包含用于应用所述4X4DCT实施方案以确定一个或一个以上DCT系数的装置,且其中所述设备进一步包含用于使用一个或一个以上DCT系数的所述经缩放因子(I)来确定经量化DCT系数的装置。
23.一种非暂时性计算机可读存储媒体,其存储指令,所述指令在由处理器执行时致使所述处理器 通过4X4离散余弦变换DCT硬件单元将正交4X4DCT实施方案应用于媒体数据以将所述媒体数据从空间域变换到频域, 其中所述正交4X4DCT实施方案包括奇数部分,所述奇数部分应用与经缩放因子(I)有关的第一内部因子及第二内部因子(C、S)以使得所述经缩放因子等于所述第一内部因子(C)的平方加所述第二内部因子(S)的平方的总和的平方根。
24.—种设备,其包含 4X4离散余弦变换DCT硬件单元,其中DCT模块实施具有奇数部分的非正交4X4DCT,所述奇数部分应用按以下方程式与经缩放因子(I)有关的第一变量及第二变量(C、S)^=C + S0}+W , 其中变量《及V表示无理内部变换因子且变量C及S表示在所述非正交4X4DCT的整数实施方案中代替变量《及V使用的二元有理内部变换因子,且 其中所述4 X 4DCT硬件单元将所述4 X 4DCT实施方案应用于媒体数据以将所述媒体数据从空间域变换到频域。
25.根据权利要求24所述的设备, 其中所述内部因子C等于一,且 其中所述内部因子S等于二。
26.根据权利要求24所述的设备, 其中所述内部因子C等于二,且 其中所述内部因子S等于五。
27.根据权利要求24所述的设备, 其中所述内部因子C等于五,且 其中所述内部因子S等于十二。
28.根据权利要求24所述的设备, 其中所述4 X 4DCT模块将所述非正交4 X 4DCT实施方案应用于所述媒体数据以确定一个或一个以上DCT系数,且 其中所述设备进一步包含量化单元,所述量化单元使用所述一个或一个以上DCT系数的所述经缩放因子(I)来确定经量化DCT系数。
29.根据权利要求24所述的设备,其中所述4X4DCT硬件单元包含处理器,所述处理器执行软件以实施所述非正交4 X 4DCT。
30.一种方法,其包含 通过4X4离散余弦变换DCT硬件单元将非正交4X4DCT应用于媒体数据以将所述媒体数据从空间域变换到频域, 其中所述非正交4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(I)有关的第一变量及第二变量(C、S)£ C + S 4=- co+V, 其中变量《及V表示无理内部变换因子且变量C及S表示在所述非正交4X4DCT的整数实施方案中代替变量《及V使用的二元有理内部变换因子。
31.根据权利要求30所述的方法, 其中所述内部因子C等于一,且 其中所述内部因子S等于二。
32.根据权利要求30所述的方法, 其中所述内部因子C等于二,且 其中所述内部因子S等于五。
33.根据权利要求30所述的方法, 其中所述内部因子C等于五,且 其中所述内部因子S等于十二。
34.根据权利要求30所述的方法, 其中应用所述非正交4 X 4DCT包含将所述非正交4 X 4DCT应用于所述媒体数据以确定一个或一个以上DCT系数,且 其中所述方法进一步包含使用所述一个或一个以上DCT系数的所述经缩放因子(€ )来确定经量化DCT系数。
35.一种设备,其包含 用于通过4X4离散余弦变换DCT硬件单元将非正交4X4DCT应用于媒体数据以将所述媒体数据从空间域变换到频域的装置, 其中所述非正交4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(I)有关的第一变量及第二变量(C、S)e C + Sey+Y , 其中变量《及V表示无理内部变换因子且变量C及S表示在所述非正交4X4DCT的整数实施方案中代替变量《及V使用的二元有理内部变换因子。
36.根据权利要求35所述的设备, 其中所述内部因子C等于一,且 其中所述内部因子S等于二。
37.根据权利要求35所述的设备, 其中所述内部因子C等于二,且 其中所述内部因子S等于五。
38.根据权利要求35所述的设备, 其中所述内部因子C等于五,且 其中所述内部因子S等于十二。
39.根据权利要求35所述的设备, 其中所述用于应用所述非正交4X 4DCT的装置包含用于将所述非正交4X 4DCT应用于所述媒体数据以确定一个或一个以上DCT系数的装置,且其中所述设备进一步包含用于使用所述一个或一个以上DCT系数的所述经缩放因子(I)来确定经量化DCT系数的装置。
40.一种非暂时性计算机可读存储媒体,其存储指令,所述指令在由处理器执行时致使所述处理器 通过4X4离散余弦变换DCT硬件单元将非正交4X4DCT应用于媒体数据以将所述媒体数据从空间域变换到频域, 其中所述非正交4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(I)有关的第一变量及第二变量(C、S) 其中变量《及V表示无理内部变换因子且变量C及S表示在所述非正交4X4DCT的整数实施方案中代替变量《及V使用的二元有理内部变换因子。
41.一种设备,其包含 . 4X4离散余弦变换DCT硬件单元,其实施具有奇数部分的非正交4X4DCT,所述奇数部分应用按以下方程式与经缩放因子有关的第一内部因子及第二内部因子(A、B) e 一 A-Y B 其中所述经缩放因子(I)等于所述第一内部因子(A)加所述第二内部因子(B)的总和除以一加一除以二的平方根,且 其中所述4 X 4DCT硬件单元将所述4 X 4DCT实施方案应用于媒体数据以将所述媒体数据从空间域变换到频域。
42.根据权利要求41所述的设备, 其中所述内部因子A等于三,且 其中所述内部因子B等于二。
43.根据权利要求41所述的设备, 其中所述内部因子A等于七,且 其中所述内部因子B等于五。
44.根据权利要求41所述的设备, 其中所述内部因子A等于二十九,且 其中所述内部因子B等于四十一。
45.根据权利要求41所述的设备, 其中所述4 X 4DCT硬件单元将所述非正交4 X 4DCT实施方案应用于所述媒体数据以确定一个或一个以上DCT系数,且 其中所述设备进一步包含量化单元,所述量化单元使用所述一个或一个以上DCT系数的所述经缩放因子(I)来确定经量化DCT系数。
46.根据权利要求41所述的设备,其中所述4X4DCT硬件单元包含处理器,所述处理器执行软件以实施所述非正交4 X 4DCT。
47.—种方法,其包含 通过4X4离散余弦变换DCT硬件单元将非正交4X4DCT应用于媒体数据以将所述媒体数据从空间域变换到频域, 其中所述非正交4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(€)有关的第一内部因子及第二内部因子(A、B)
48.根据权利要求47所述的方法, 其中所述内部因子A等于三,且 其中所述内部因子B等于二。
49.根据权利要求47所述的方法, 其中所述内部因子A等于七,且 其中所述内部因子B等于五。
50.根据权利要求47所述的方法, 其中所述内部因子A等于二十九,且 其中所述内部因子B等于四十一。
51.根据权利要求47所述的方法, 其中应用所述非正交4 X 4DCT包括将所述非正交4 X 4DCT应用于所述媒体数据以确定一个或一个以上DCT系数,且 其中所述方法进一步包含使用所述一个或一个以上DCT系数的所述经缩放因子(€ )来确定经量化DCT系数。
52.—种设备,其包含 用于通过4X4离散余弦变换DCT硬件单元将非正交4 X 4DCT应用于媒体数据以将所述媒体数据从空间域变换到频域的装置,其中所述非正交4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子(I)有关的第一内部因子及第二内部因子(A、B)
53.根据权利要求52所述的设备, 其中所述内部因子A等于三,且 其中所述内部因子B等于二。
54.根据权利要求52所述的设备, 其中所述内部因子A等于七,且 其中所述内部因子B等于五。
55.根据权利要求52所述的设备, 其中所述内部因子A等于二十九,且 其中所述内部因子B等于四十一。
56.根据权利要求52所述的设备,其中所述用于应用所述非正交4X 4DCT的装置包含用于将所述非正交4X 4DCT应用于所述媒体数据以确定一个或一个以上DCT系数的装置,且 其中所述设备进一步包含用于使用所述一个或一个以上DCT系数的所述经缩放因子(I)来确定经量化DCT系数的装置。
57. 一种非暂时性计算机可读存储媒体,其存储指令,所述指令在由处理器执行时致使所述处理器 通过4X4离散余弦变换DCT硬件单元将非正交4X4DCT应用于媒体数据以将所述媒体数据从空间域变换到频域, 其中所述非正交4X4DCT包括奇数部分,所述奇数部分应用按以下方程式与经缩放因子K)有关的第一内部因子及第二内部因子(A、B)
全文摘要
本发明大体来说是描述提供用于媒体编码的4×4变换的技术。描述遵守这些技术的许多不同的4×4变换。作为一个实例,一种设备包括4×4离散余弦变换DCT硬件单元。所述DCT硬件单元实施具有奇数部分的正交4×4DCT,所述奇数部分应用与经缩放因子(ξ)有关的第一内部因子及第二内部因子(C、S)以使得所述经缩放因子等于所述第一内部因子(C)的平方加所述第二内部因子(S)的平方的总和的平方根。所述4×4DCT硬件单元将所述4×4DCT实施方案应用于媒体数据以将所述媒体数据从空间域变换到频域。作为另一实例,一种设备实施非正交4×4DCT以改善编码增益。
文档编号G06F17/14GK102713895SQ201080023551
公开日2012年10月3日 申请日期2010年6月4日 优先权日2009年6月5日
发明者尤里娅·列兹尼克 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1