用于编码/解码图像的方法和设备的制造方法_3

文档序号：8208073阅读：来源：国知局

，则能降低用于每一码元的比特流的尺寸，因为通过向具有高出现频率的码元分配小数目比特并向具有低出现频率的码元分配大数目比特，来表示码 JLi〇
[0073] 量化后的系数由反量化模块220反量化并由逆变换模块230逆变换。作为对量化后的系数的反量化/逆变换的结果，能生成重构的残差块。
[0074] 在帧内模式的情况下，帧内预测模块240能通过使用当前块周围的已编码块的像素的值执行空间预测，来生成预测块。在帧间模式的情况下，运动补偿模块250能通过使用运动向量和参考画面缓冲器270中存储的参考画面执行运动补偿，来生成预测块。
[0075]加法器255将残差块和预测块相加到一起。相加的块经过滤波器模块260。滤波器模块260能向重构的块或重构的画面应用解块滤波器、SA0、和ALF中的至少一个。滤波器模块260输出重构图像（即，重构的图像）。重构图像能被存储在参考画面缓冲器270中并能用于帧间预测。
[0076]图3是示意性示出了当编码图像时图像的分区结构的图。
[0077] 在高效视频编码（HEVC)中，在编码单元中执行编码以便有效分区图像。
[0078] 参考图3,在HEVC中，图像300在最大编码单元（其后称为IXU)中顺序分区，并基于LCU来确定分区结构。分区结构意味着用于有效编码LCU310内的图像的编码单元（其后称为CU)的分布。能基于一个CU是否将被分区为四个CU(其每一个的宽度尺寸和高度尺寸从一个CU降低一半），来确定该分布。同样，分区的CU能被递归分区为四个CU，其每一个的宽度尺寸和高度尺寸从分区的CU降低一半。
[0079] 这里，⑶的分区能被递归执行至多（up to)预定深度。关于深度的信息是指示⑶ 的尺寸的信息，并且存储关于每一 CU的深度的信息。例如，LCU的深度能够是0,并且最小编码单元（S⑶）的深度能够是预定最大深度。这里，IXU是具有上述最大⑶尺寸的⑶，并且S⑶是具有最小⑶尺寸的⑶。
[0080] 只要从IXU 310执行宽度尺寸和高度尺寸一半的分区，⑶的深度就增加1。还没有对其执行分区的CU对于每一深度具有2NX 2N尺寸，并且对其执行分区的CU从具有2NX 2N 尺寸的CU被分区为其每一个具有NXN尺寸的四个CU。只要深度增加1，N的尺寸就降低一半。
[0081] 参考图3,具有最小深度0的IXU的尺寸能够是64X64像素，并且具有最大深度 3的S⑶的尺寸能够是8X8像素。这里，具有64X64像素的IXU能用深度0表示，具有 32X32像素的⑶能用深度1表示，具有16X 16像素的⑶能用深度2表示，并且具有8X8 像素的S⑶能用深度3表示。
[0082] 此外，关于特定⑶是否将被分区的信息能通过用于每一⑶的1比特的分区信息表示。该分区信息能被包括在除了 SCU之外的所有CU中。例如，如果CU不被分区，则能存储分区信息0。如果CU被分区，则能存储分区信息1。
[0083] 其间，从LCU分区的CU能包括预测单元（PU)(或预测块（PB)) (S卩，用于预测的基本单元）、和变换单元（TU)(或变换块（TB))(即，用于变换的基本单元）。
[0084] 图4是示出了可在⑶中包括的PU的形式的图。
[0085] 从IXU分区的⑶之中的、不再分区的⑶被分区为一个或多个PU。该行为自己也被称为分区。预测单元（其后称为PU)是对其执行预测的基本单元，并在跳跃模式、帧间模式和巾贞内模式的任一个中编码。PU能取决于每一模式按照各种形式来分区。
[0086] 参考图4,在跳跃模式的情况下，能在CU内无需分区而支持与CU具有相同尺寸的 2Nx2N 模式 410。
[0087] 在帧间模式的情况下，能在⑶内支持8种分区的形式，例如，2Nx2N模式410、2NxN 模式 415、Nx2N 模式 420、NxN 模式 425、2NxnU 模式 430、2NxnD 模式 435、nLx2N 模式 440、和 nRx2N 模式 445。
[0088] 在帧内模式的情况下，能在⑶内支持2Nx2N模式410和NxN模式425。
[0089] 图5是示出了可在⑶中包括的TU的形式的图。
[0090] 变换单元（其后称为TU)是为了⑶内的空间变换和量化/反量化（缩放）处理而使用的基本单元。TU能具有长方形或正方形形式。从LCU分区的CU之中的、不再分区的 ⑶能被分区为一个或多个TU。
[0091]这里，TU的分区结构能够是四叉树结构。例如，如图5中所示，一个⑶510能取决于四叉树结构被分区为一个或多个，由此形成具有各种尺寸的TU。
[0092]其间，在HEVC中，如同H. 264/AVC中那样，能执行帧间预测（其后称为帧内预测）编码。这里，能通过从位于当前块附近的相邻块导出用于当前块的帧内预测模式（或预测方向性），来执行编码。
[0093] 如上所述，通过基于帧内预测模式执行预测而获得的信号的预测图像能具有与原始图像的差值。具有预测图像和原始图像之间的差值的残差图像能在经历频域变换和量化之后经受熵编码。这里，为了增加频域变换的编码效率，能取决于块的尺寸，而选择性和适应性应用取决于帧内预测模式的整数变换、离散余弦变换（DCT)、离散正弦变换（DST)、或 DCT/DST。
[0094]此外，为了增加诸如PowerPoint中的文档图像或演讲图像的、屏幕内容中的编码效率，能使用变换跳跃算法。
[0095] 如果使用变换跳跃算法，则编码器对具有预测图像和原始图像之间的差值的残差图像（或残差块）进行直接量化，而无需频率变换处理，并对残差块执行熵编码。此外，解码器对残差块执行熵解码，并通过对熵编码后的块执行反量化（缩放）而生成重构的残差块。因此，已对其应用变换跳跃算法的块跳过频率变换/逆变换处理。
[0096] 在量化/反量化处理中，能取决于块内的变换系数的地点而不同地应用缩放因子，以便改进图像的主体画面质量。相反，存在当执行量化/反量化时不管块内的变换系数的地点、而相同地应用缩放因子的方法。能通过比特流的序列参数集（SPS)或画面参数集 (PPS)来用信号通知是否应用该方法。
[0097] 作为该处理的实施例，能如下执行用于变换系数的缩放处理。
[0098] 用于夺换系数的缩放处理
[0099] 在该情况下，输入如下。
[0100] -当前变换块的宽度；nW
[0101]-当前变换块的高度；nH
[0102] -具有元素cu的变换系数的阵列；(nWxnH)阵列d
[0103]-用于当前块的亮度信号和色度信号的索引；cldx
[0104] 如果cldx为0,则这意味着亮度信号。如果cldx为1或cldx为2,则这意味着色度信号。此外，如果cldx为1，则这意味着色度信号中的Cb。如果cldx为2,则这意味着色度信号中的Cr。
[0105]-量化参数；qP
[0106] 在该情况下，输出如下。
[0107]-缩放后变换系数的阵列：(nWxnH)阵列dij
[0108] 通过 log2TrSize = (Log2(nW)+Log2(nH))?l 来导出参数"log2TrSize"。取决于cldx而不同地导出参数移位。如果clx为0(在亮度信号的情况下），则从"shift = BitD印thY+l〇g2TrSize - 5"来导出参数移

完整全部详细技术资料下载

当前第3页1 2 3 4