使用基于根据树结构确定的编码单元的预测单元的视频编码方法和视频编码设备以及使...的制作方法

文档序号:7850148阅读:233来源:国知局
专利名称:使用基于根据树结构确定的编码单元的预测单元的视频编码方法和视频编码设备以及使 ...的制作方法
技术领域
本发明涉及在空间区域和变换区域之间执行变换的视频编码和视频解码。
背景技术
随着开发和提供用于再现和存储高分辨率或高质量视频内容的硬件,对于有效地对高分辨率或高质量视频内容编码或解码的视频编解码器的需求日益增加。在传统的视频编解码器中,基于具有预定尺寸的宏块根据有限编码方法对视频编码。此外,传统的视频编解码器通过使用具有相同尺寸的块对宏块执行变换和逆变换,从而对视频数据编码和解码。

发明内容
技术问题本发明提供通过使用分层预测分块在空间区域和变换区域之间执行变换的视频编码和视频解码。技术方案根据本发明的一方面,提供了一种通过使用基于具有树结构的编码单元的预测单元对视频解码的方法,所述方法包括以下操作接收关于编码的视频的比特流并解析比特·流;从比特流提取指示作为用于对视频的画面解码的数据单元的编码单元的尺寸和可变深度的编码单元结构信息、以及关于画面的具有树结构的编码单元的编码深度和编码模式的信息;基于编码单元结构信息和关于编码深度和编码模式的信息确定具有树结构的编码单元,基于当前编码单元的深度确定分块类型,并基于编码单元和分块类型对所述画面解码。有益效果因为在考虑图像的特性的同时分层调整编码单元,并且在考虑图像的尺寸的同时增加编码单元的最大尺寸,所以可提高图像压缩效率。因为编码器发送编码的视频数据以及关于编码深度和编码模式的信息,所以解码器可在根据具有树结构的编码单元确定至少一个编码深度之后对每条编码的图像数据解码,从而可提高图像的编码和解码效率。


图I是根据本发明实施例的通过使用基于具有树结构的编码单元的预测单元对视频编码的设备的框图。图2是根据本发明实施例的通过使用基于具有树结构的编码单元的预测单元对视频解码的设备的框图。图3是用于描述根据本发明实施例的编码单元的概念的示图。图4是根据本发明实施例的基于编码单元的图像编码器的框图。
图5是根据本发明实施例的基于编码单元的图像解码器的框图。图6是示出根据本发明实施例的根据深度的更深的编码单元以及分块的示图。图7是用于描述根据本发明实施例的编码单元和变换单元之间的关系的示图。图8是用于描述根据本发明实施例的与编码深度相应的编码单元的编码信息的示图。图9是根据本 发明实施例的根据深度的更深的编码单元的示图。图10至图12是用于描述根据本发明实施例的编码单元、预测单元和变换单元之间的关系的不图。图13是用于描述根据表I的编码模式信息的编码单元、预测单元或分块和变换单元之间的关系的示图。图14是示出根据本发明实施例的通过使用基于具有树结构的编码单元的预测单元对视频编码的方法的流程图。图15是示出根据本发明实施例的通过使用基于具有树结构的编码单元的预测单元对视频解码的方法的流程图。最佳模式根据本发明的一方面,提供了一种通过使用基于具有树结构的编码单元的预测单元对视频解码的方法,所述方法包括以下操作接收关于编码的视频的比特流并解析所述比特流;从所述比特流提取指示作为用于对视频的画面解码的数据单元的编码单元的尺寸和可变深度的编码单元结构信息、以及关于画面的具有树结构的编码单元的编码深度和编码模式的信息;基于编码单元结构信息和关于编码深度和编码模式的信息确定具有树结构的编码单元,基于当前编码单元的深度确定分块类型,并基于编码单元和分块类型对所述画面解码。分块类型可包括具有与当前编码单元相同尺寸的数据单元,并且通过分割当前编码单元的高度和宽度之一来获得部分数据单元。根据本发明的另一方面,提供了一种通过使用基于具有树结构的编码单元的预测单元对视频编码的方法,所述方法包括以下操作将视频的画面分割为一个或多个最大编码单元,所述最大编码单元是具有最大尺寸的编码单元;基于根据深度的编码单元并基于按照根据深度的编码单元的深度确定的分块类型来对画面编码,并针对每个根据深度的编码单元确定根据编码深度的编码单元,从而确定具有树结构的编码单元,其中,通过根据所述一个或多个最大编码单元中的每个最大编码单元中的深度分层分割所述一个或多个最大编码单元中的每个最大编码单元来获得根据深度的编码单元;输出基于分块类型和具有树结构的编码单元编码的数据、关于编码深度和编码模式的信息、以及指示编码单元的尺寸和可变深度的编码单元结构信息。根据本发明的另一方面,提供了一种包括视频解码处理器并使用基于具有树结构的编码单元的预测单元的视频解码设备,所述视频解码设备包括接收器,接收关于编码的视频的比特流并解析所述比特流;提取器,从所述比特流提取指示作为用于对视频的画面解码的数据单元的编码单元的尺寸和可变深度的编码单元结构信息、以及关于画面的具有树结构的编码单元的编码深度和编码模式的信息;解码器,与视频解码处理器结合,基于编码单元结构信息和关于编码深度和编码模式的信息确定具有树结构的编码单元,基于当前编码单元的深度确定分块类型,并基于编码单元和分块类型对所述画面解码。根据本发明的另一方面,提供了一种包括视频编码处理器并使用基于具有树结构的编码单元的预测单元的视频编码设备,所述视频编码设备包括最大编码单元分割器,将视频的画面分割为一个或多个最大编码单元,所述最大编码单元是具有最大尺寸的编码单元;编码单元确定器,与视频编码处理器结合,基于根据深度的编码单元并基于按照根据深度的编码单元的深度确定的分块类型来对画面编码,并针对每个根据深度的编码单元确定根据编码深度的编码单元,从而确定具有树结构的编码单元,其中,通过根据所述一个或多个最大编码单元中的每个最大编码单元中的深度分层分割所述一个或多个最大编码单元中的每个最大编码单元来获得根据深度的编码单元;输出单元,输出基于分块类型和具有树结构的编码单元编码的数据、关于 编码深度和编码模式的信息、以及指示编码单元的尺寸和可变深度的编码单元结构信息。根据本发明的另一方面,提供了一种记录有通过使用计算机执行对视频编码的方法的程序的计算机可读记录介质。根据本发明的另一方面,提供了一种记录有通过使用计算机执行对视频解码的方法的程序的计算机可读记录介质。
具体实施例方式在下文中,将参照附图更全面地描述本发明,在附图中示出本发明的示例性实施例。在本发明的实施例中,术语“图像”不仅可指示静止图像,而且可指示诸如视频的运动图像。在下文中,将参照图I至图15详细地描述通过使用基于具有树结构的编码单元的预测单元对视频编码和解码的设备和方法。图I是根据本发明实施例的通过使用基于具有树结构的编码单元的预测单元对视频编码的设备100的框图。通过使用基于具有树结构的编码单元的预测单元对视频编码的设备100包括最大编码单元分割器110、编码单元确定器120和输出单元130。在下文中,为了便于描述,通过使用基于具有树结构的编码单元的预测单元对视频编码的设备100被称为“视频编码设备 100”。最大编码单元分割器110可基于用于图像的当前画面的最大编码单元来分割当前画面。如果当前画面大于最大编码单元,则当前画面的图像数据可被分割为至少一个最大编码单元。根据本发明实施例的最大编码单元可以是具有32X32、64X64、128X128、256X256等尺寸的数据单元,其中,数据单元的形状是具有宽度和长度为2的若干次方的正方形。根据至少一个最大编码单元,图像数据可被输出到编码单元确定器120。根据本发明实施例的编码单元可由最大尺寸和深度来表示特性。深度表示从最大编码单元空间分割编码单元的次数,并且随着深度加深,可从最大编码单元到最小编码单元分割根据深度的更深的编码单元。最大编码单元的深度是最高的深度,最小编码单元的深度是最低的深度。因为与每个深度相应的编码单元的尺寸随着最大编码单元的深度加深而减小,所以与较高的深度相应的编码单元可包括与较低的深度对应的多个编码单元。如上所述,当前画面的图像数据根据编码单元的最大尺寸被分割为多个最大编码单元,并且每个最大编码单元可包括根据深度分割的更深的编码单元。因为根据本发明实施例的最大编码单元根据深度被分割,所以包括在最大编码单元中的空间域的图像数据可根据深度被分层地分类。编码单元的最大深度和最大尺寸可以被预先确定,所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层分割的总次数。编码单元确定器120对通过根据深度分割最大编码单元的区域获得的至少一个分割区域编码,并根据至少一个分割区域确定深度以输出最终编码的图像数据。换句话说,编码单元确定器120通过根据当前画面的最大编码单元根据深度以更深的编码单元对图像数据编码并选择具有最小编码误差的深度,来确定编码深度。因此,与确定的编码深度相应的编码单元的编码的图像数据被最终输出。此外,与编码深度相应的编码单元可被视为编码的编码单元。
确定的编码深度和根据确定的编码深度的编码的图像数据被输出到输出单元130。基于与等于或小于最大深度的至少一个深度相应的更深的编码单元对最大编码单元中的图像数据编码,并且基于每个更深的编码单元比较编码图像数据的结果。可在比较更深的编码单元的编码误差之后选择具有最小编码误差的深度。可为每个最大编码单元选择至少一个编码深度。随着根据深度对编码单元进行分层分割且随着编码单元的数量的增加,最大编码单元的尺寸被分割。另外,即使在一个最大编码单元中多个编码单元对应于相同深度,也通过单独测量每个编码单元的图像数据的编码误差来确定是否将与相同深度对应的每个编码单元分割至更低的深度。因此,即使在图像数据被包括在一个最大编码单元中时,也根据深度将图像数据分割至多个区域,并且在所述一个最大编码单元中编码误差可根据区域而不同,因此,在图像数据中,编码深度可根据区域而不同。因此,可在一个最大编码单元中确定一个或多个编码深度,并可根据至少一个编码深度的编码单元对最大编码单元的图像数据进行分割。因此,编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据本发明实施例的“具有树结构的编码单元”包括在最大编码单元中所包括的所有更深的编码单元中与确定为编码深度的深度相应的编码单元。可在最大编码单元的相同区域中根据深度来分层确定编码深度的编码单元,并且可在不同区域中独立地确定编码深度的编码单元。类似地,当前区域中的编码深度可与另一区域中的编码深度被独立地确定。根据本发明实施例的最大深度是与从最大编码单元到最小编码单元的分割次数相关的数。根据本发明实施例的最大深度可表示从最大编码单元到最小编码单元的总分割次数。例如,当最大编码单元的深度为O时,最大编码单元被分割一次的编码单元的深度可被设置为1,最大编码单元被分割两次的编码单元的深度可被设置为2。这里,如果最小编码单元是最大编码单元被分割四次的编码单元,则存在深度O、1、2、3和4的5个深度级,因此,最大深度可被设置为4。可根据最大编码单元执行预测编码和变换。还可根据最大编码单元,基于根据等于最大深度的深度或小于最大深度的深度的更深的编码单元,执行预测编码和变换。可根据频率变换、正交变换或整数变换的方法来执行变换。因为每当最大编码单元根据深度被分割时更深的编码单元的数量都增加,所以对随着深度加深而产生的所有的更深的编码单元执行包括预测编码和变换的编码。为了方便描述,现在将基于最大编码单元中的当前深度的编码单元描述预测编码和变换。视频编码设备100可不同地选择用于对图像数据编码的数据单元的尺寸或形状。为了对图像数据编码,执行诸如预测编码、变换和熵编码的操作,并且同时,相同的数据单元可被用于所有的操作,或者不同的数据单元可被用于各个操作。例如,视频编码设备100可不仅选择用于对图像数据编码的编码单元,还可选择与编码单元不同的数据单元以对编码单元中的图像数据执行预测编码。为了以最大编码单元执行预测编码,可基于与编码深度相应的编码单元,S卩,基于不再被分割为与更低的深度相应的编码单元的编码单元,执行预测编码。以下,不再被分割 并且变为用于预测编码的基本单元的编码单元现将被称为“预测单元”。通过分割预测单元获得的分块可包括通过分割预测单元的高度和宽度中的至少一个获得的预测单元或数据单元。例如,当2NX2N (其中,N是正整数)的编码单元不再被分割并且变为2NX2N的预测单元时,分块的尺寸可以是2NX 2N、2NXN或NX 2N。分块类型的示例包括通过对称地分割预测单元的高度或宽度获得的对称分块、通过非对称地分割预测单元的高度或宽度(诸如I :n或η :1)获得的分块、通过几何地分割预测单元获得的分块、以及具有任意形状的分块。可根据是否对具有当前深度或更低深度的当前编码单元执行分割来确定编码单元的分块类型或预测单元的尺寸。当当前编码单元的分块类型是对称分块类型时,当前编码单元的对称分块类型可包括具有与当前编码单元相同尺寸的分块以及通过将当前编码单元的高度或宽度除以二获得的分块。也就是说,具有2Ν X 2Ν尺寸的编码单元的对称分块类型可包括2ΝΧ 2Ν、2ΝΧΝ或ΝΧ2Ν的分块。当当前编码单元不再被分给为更低深度的编码单元时,当前编码单元的对称分块类型可包括具有与更低深度的编码单元相同尺寸的分块。也就是说,当当前编码单元是不能被分割为更低深度的编码单元并且是当前最大编码单元中的最小编码单元时,当前编码单元的对称分块类型不仅可包括2ΝΧ2Ν、2ΝΧΝ或NX 2Ν的分块,而且可包括具有NXN尺寸的分块。相似地,当当前编码单元是当前最大编码单元中的最低深度的编码单元时,当前编码单元的对称分块类型不仅可包括2ΝΧ2Ν、2ΝΧ N或NX 2Ν的分块,而且可包括具有NX N尺寸的分块。例如,当具有当前深度以及2ΝΧ2Ν尺寸的编码单元被分割一次,从而被划分为具有更低深度以及NX N尺寸的编码单元时,可通过使用具有NX N尺寸的分块对具有NX N尺寸的编码单元执行帧内预测和帧间预测。因此,为了避免不必要的处理的重复,在根据本实施例的分层编码单元的结构中,不会将具有NXN尺寸的分块类型设置到具有2ΝΧ2Ν尺寸的编码单元。然而,当具有2ΝΧ2Ν尺寸的当前编码单元是最小编码单元时,当前编码单元不再被分割为具有NXN尺寸的编码单元,从而可通过使用具有NXN尺寸的分块对当前编码单元执行帧间预测或帧内预测。因此,具有2ΝΧ2Ν尺寸的最小编码单元的分块类型可包括2NX2N、2NXN、NX2N 和 NXN 的分块。预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2NX2N、2NXN或NX 2N的分块执行帧内模式和帧间模式的预测编码。也就是说,在以下至少一种情况下,可跳过通过使用NXN的分块执行的帧间预测和帧内预测,所述情况包括当前编码单元不是最小编码单元,当前编码单元被分割为更低深度的编码单元,以及当前编码单元不是当前最大编码单元中的最低深度的编码单元。然而,当当前编码单元是最小编码单元时,因为,不能对更低深度的编码单元执行帧内预测和帧间预测,所以可通过使用2NX2N、2NXN、NX 2N和NXN的分块对最小编码单元执行帧间预测和帧内预测。此外,可仅对2NX 2N的分块执行跳过模式。对编码单元中的一个预测单元独立地执行编码,从而选择引起最小编码误差的预测模式。视频编码设备100还可不仅基于用于对图像数据编码的编码单元,而且基于与该编码单元不同的数据单元,对编码单元中的图像数据执行变换。为了以编码单元执行变换,可基于具有小于或等于所述编码单元的尺寸的变换单元来执行变换。例如,用于变换的变换单元可包括针对帧内模式的变换单元和针对帧间模式的变换单元。与具有树结构的编码单元相似,编码单元中的变换单元可被递归地分割为更小尺·寸的区域。因此,编码单元中的残差数据可根据变换深度按照具有树结构的变换被分割。指示通过分割编码单元的高度和宽度达到变换单元的分割次数的变换深度也可被设置在变换单元中。例如,在2NX2N的当前编码单元中,当变换单元的尺寸也为2NX2N时,变换深度可以为O ;当变换单元的尺寸为NXN时,变换深度可以为I ;当变换单元的尺寸为N/2XN/2时,变换深度可以为2。也就是说,可根据变换深度的分层特性按照分层树结构来设置变换单元。根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要关于与预测编码和变换相关的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分块类型、根据预测单元的预测模式以及用于变换的变换单元的尺寸。稍后将参照图3至图13详细地描述根据本发明实施例的最大编码单元中的根据树结构的编码单元以及确定分块的方法。编码单元确定器120可通过使用基于拉格朗日乘法(Lagrangian multiplier)的率失真最优化,测量根据深度的更深的编码单元的编码误差。输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息,其中,基于由编码单元确定器120确定的至少一个编码深度对最大编码单元的图像数据编码。可通过对图像的残差数据编码来获得编码的图像数据。关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于预测单元中的分块类型、预测模式和变换单元的尺寸的信息。可通过使用根据深度的分割信息定义关于编码深度的信息,所述根据深度的分割信息指示是否对更低深度而非当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度,则当前编码单元中的图像数据被编码和输出,并且因此分割信息可被定义为不将当前编码单元分割至更低深度。可选择地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,并且因此分割信息可被定义为对当前编码单元进行分割以获得更低深度的编码单元。如果当前深度不是编码深度,则对被分割为更低深度的编码单元的编码单元执行编码。因为在当前深度的一个编码单元中存在更低深度的至少一个编码单元,所以对更低深度的每个编码单元重复执行编码,从而可针对具有相同深度的编码单元递归地执行编码。因为针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外,因为根据深度分层地分割图像数据,所以最大编码单元的图像数据的编码深度可根据位置而不同,从而可为图像数据设置关于编码深度和编码模式的信 肩、O因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。输出单元130可将关于相应的编码深度和相应的编码模式的信息插入到比特流的头中,以发送编码的视频数据、序列参数集(SPS)或画面参数集(PPS),并且可输出编码的视频数据、序列参数集(SPS)或画面参数集(PPS)。根据本发明实施例的最小单元是通过将组成最低深度的最小编码单位分割为4份而获得的矩形数据单元。根据本发明实施例的最小单元可以是最大矩形数据单元,所述最大矩形数据单元可被包括在最大编码单元中所包括的所有编码单元、预测单元、分块单元和变换单元中。 例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息以及关于分块的尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息以及关于帧内模式的插值方法的信息。另外,关于根据序列、画面、像条或GOP定义的编码单元的尺寸以及可变深度的编码单元结构信息可被插入到SPS、PPS或比特流的头中。可变深度不仅可指示具有树结构的当前编码单元的允许的最大深度,而且可指示具有最小尺寸的编码单元的最低深度、深度级的数量或者深度变化。深度级的数量可指示根据深度的更深的编码单元的深度级的数量,所述更深的编码单元可存在于具有树结构的当前编码单元中。深度变化可指示根据深度的更深的编码单元的变化的数量,所述更深的编码单元可存在于具有树结构的当前编码单元中。可根据序列、画面、像条或GOP来设置关于可变深度的信息。也就是说,可针对序列、画面、像条或GOP的每个数据单元设置关于可变深度的信息以及关于在具有树结构的当前编码单元中的编码单元的最大尺寸的信息或关于最小尺寸的信息。因此,输出单元130可包括作为编码单元结构信息的编码信息(所述编码信息包括关于可变深度的信息、关于编码单元的最大尺寸的信息和关于编码单元的最小尺寸的信息中的至少两个),可将所述编码信息插入到比特流的头(即,SPS或PPS)中,然后可输出比特流。根据序列、画面、像条或GOP来分别确定可变深度以及编码单元的最大尺寸和最小尺寸。此外,从输出单元130输出的编码信息可包括变换索引。变换索引信息可指示关于用于变换当前编码单元的变换单元的结构的信息。变换索引信息可指示当前变换单元是否被分割为更低级的变换单元。在视频编码设备100中,更深的编码单元可以是通过将上面一级的更高深度的编码单元的高度或宽度除以二获得的编码单元。换句话说,当当前深度的编码单元的尺寸为2NX2N时,更低深度的编码单元的尺寸为NXN。此外,具有2NX 2N尺寸的当前深度的编码单元可包括最多四个更低深度的编码单元。因此,视频编码设备100可基于考虑当前画面的特性确定的最大编码单元的尺寸和最大深度,通过确定针对每个最大编码单元的具有最佳形状和最佳尺寸的编码单元,来形成具有树结构的编码单元。此外,因为可通过使用各种预测模式和变换中的任意一个来 对每个最大编码单元执行编码,所以可考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。因此,如果以传统的宏块来对具有高分辨率或大数据量的图像编码,则每个画面的宏块的数量急剧增加。因此,针对每个宏块产生的压缩信息的条数增加,从而难以发送压缩信息并且数据压缩效率降低。然而,通过使用视频编码设备100,因为在考虑图像的特性的同时调整编码单元并且在考虑图像的尺寸的同时增加编码单元的最大尺寸,所以图像压缩效率可以被提高。图2是根据本发明实施例的通过使用基于按照树结构的编码单元的预测单元对视频解码的设备200的框图。通过使用基于按照树结构的编码单元的预测单元对视频解码的设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。在下文中,为了便于描述,通过使用基于按照树结构的编码单元的预测单元对视频解码的设备200被称为“视频解码设备200”。用于视频解码设备200的各种操作的各种术语(诸如编码单元、深度、预测单元、变换单元以及关于各种编码模式的信息)的定义与参照图I和视频编码设备100所描述的术语的定义相同。接收器210接收并解析已编码的视频的比特流。图像数据和编码信息提取器220从解析的比特流中提取每个编码单元的编码的图像数据,并将提取的图像数据输出到图像数据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从接收的比特流中关于当前画面的头、SPS和PPS中的至少一个提取关于当前画面的编码单元的尺寸和可变深度的编码单元结构信息以及关于编码深度和编码模式的信息。图像数据和编码信息提取器220可从编码信息中提取关于可变深度的信息以及关于序列、画面、像条或GOP的每个数据单元的具有树结构的编码单元中的编码单元的可允许的最大尺寸的信息和关于可允许的最小尺寸的信息中的一个。图像数据解码器230可通过使用关于可变深度的信息、关于编码单元的最大尺寸的信息以及关于编码单元的最小尺寸的信息中的至少两条来确定序列、画面、像条或GOP的每个数据单元的具有树结构的编码单元中的编码单元的可允许的最大尺寸和可允许的最小尺寸。可从编码信息中提取针对每个画面、像条或GOP确定的关于可变深度的信息、关于编码单元的最大尺寸的信息以及关于编码单元的最小尺寸的信息中的至少两条,并且可基于读取的信息来确定当前数据单元的可允许的最大尺寸和可允许的最小尺寸。此外,图像数据和编码信息提取器220从解析的比特流提取关于编码单元的编码深度和编码模式的信息,其中,编码单元具有根据每个最大编码单元的树结构。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换句话说,比特流中的图像数据被分割为最大编码单元,从而图像数据解码器230对每个最大编码单元的图像数据解码。可针对关于与编码深度对应的至少一个编码单元的信息设置关于根据最大编码 单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度对应的相应的编码单元的的分块类型的信息、关于预测模式以及变换单元的尺寸的信息。另外,根据深度的分割信息可被提取作为关于编码深度的信息。此外,图像数据解码器230可从自解析的比特流提取的编码信息读取关于变换索引的信息。图像数据解码器230可基于由图像数据和编码信息提取器220提取的图像数据和变换索引信息来构造当前编码单元的变换单元,可基于变换单元执行当前编码单元的逆变换,从而可对编码的数据解码。作为对编码单元解码的结构,可恢复当前画面。关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码模式和编码深度的信息是这样的信息,即关于被确定为当编码器(诸如视频编码设备100)根据每个最大编码单元针对根据深度的每个更深的编码单元重复执行编码时产生最小编码误差的编码深度和编码模式的信息。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据解码来恢复图像。因为关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元,所以图像数据和编码信息提取器220可根据预定数据单元提取关于编码深度和编码模式的信息。被分配有相同的关于编码深度和编码模式的信息的预定数据单元可被推断为是包括在同一最大编码单元中的数据单元。图像数据解码器230通过基于关于根据最大编码单元的编码深度和编码模式的信息,对每个最大编码单元中的图像数据解码来恢复当前画面。换句话说,图像数据解码器230可基于针对包括在每个最大编码单元中的具有树结构的编码单元中的每个编码单元提取的关于分块类型、预测模式和变换单元的信息,来对编码的图像数据解码。解码处理可包括预测和逆变换,所述预测包括帧内预测和运动补偿。可根据逆正交变换或逆整数变换的方法来执行逆变换。图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的预测模式和分块类型的信息,根据每个编码单元的预测模式和分块执行帧内预测或运动补偿。此外,图像数据解码器230可通过读取根据树结构的变换单元以及关于根据编码深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元来执行逆变换,以根据最大编码单元执行逆变换。图像数据解码器230可通过使用根据深度的分割信息,确定当前最大编码单元的至少一个编码深度。如果所述分割信息指示在当前深度中不再分割图像数据,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于预测单元的分块类型、预测模式、针对与编码深度相应的每个编码单元的变换单元的尺寸的信息,对当前最大编码单元中的与每个编码深度相应的至少一个编码单元的已编码的数据进行解码,并输出当前最大编码单元的图像数据。换句话说,可通过观察为编码单元、预测单元和最小单元中的预定数据单元分配的编码信息,聚集包含编码信息(所述编码信息包括相同的分割信息)的编码单元,并且聚集的数据单元可被考虑为一个数据单元,从而通过图像数据解码器230以相同的编码模式被解码。视频解码设备200可在对每个最大编码单元递归地执行编码时,获得关于产生最小编码误差的至少一个编码单元的信息,并且视频解码设备200可使用所述信息来对当前画面解码。换句话说,可以对在每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元解码。此外,考虑图像数据的分辨率和数据量来确定编码单元的最大尺寸。因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元 的尺寸和编码模式对所述图像数据进行有效地解码和恢复,其中,通过使用从编码器接收的关于最佳编码模式的信息,根据图像数据的特性来自适应地确定编码单元的尺寸和编码模式。现在将参照图3至图13描述根据本发明实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。图3是用于描述根据本发明实施例的编码单元的概念的示图。可以以宽度X高度来表示编码单元的尺寸,并且编码单元的尺寸可以是64X64、32X32、16X16 和 8X8。在视频数据310中,分辨率是1920 X 1080,编码单元的最大尺寸是64,最大深度是2。在视频数据320中,分辨率是1920 X 1080,编码单元的最大尺寸是64,最大深度是3。在视频数据330中,分辨率是352X288,编码单元的最大尺寸是16,最大深度是I。图3中示出的最大深度表示从最大编码单元到最小编码单元的分割的总数。如果分辨率高或者数据量大,则编码单元的最大尺寸可能大,以便不仅提高编码效率,还精确地反映图像的特性。因此,具有比视频数据330高的分辨率的视频数据310和320的编码单元的最大尺寸可以为64。因为视频数据310的最大深度是2,所以视频数据310的编码单元315可包括具有64的长轴(long axis)大小的最大编码单元,以及由于通过分割最大编码单元两次将深度加深至两级而具有32和16的长轴大小的编码单元。同时,因为视频数据330的最大深度是1,所以视频数据330的编码单元335可包括具有16的长轴大小的最大编码单元,以及由于通过分割最大编码单元一次将深度加深至一级而具有8的长轴大小的编码单元。因为视频数据320的最大深度是3,所以视频数据320的编码单元325可包括具有64的长轴大小的最大编码单元,以及由于通过分割最大编码单元三次将深度加深至3级而具有32、16和8的长轴大小的编码单元。随着深度加深,详细信息可被精确地表示。具有64 X 64、64 X 32、32 X 64尺寸的分块类型可被设置到具有64 X 64尺寸的编码单元。因为具有64X64尺寸的编码单元不是关于多条视频数据310、320和330的最小解码单元,所以不会设置具有32X32尺寸的分块类型。具有32 X 32、32 X 16、16 X 32尺寸的分块类型可被设置到具有32 X 32尺寸的编码单元。因为具有32X32尺寸的编码单元不是关于多条视频数据310、320和330的最小解码单元,所以不会设置具有16X 16尺寸的分块类型。具有16 X 16、16 X 8、8 X 16尺寸的分块类型可被设置到具有16 X 16尺寸的编码单元。因为具有16X16尺寸的编码单元是关于视频数据310的最小解码单元,所以可设置具有8X8尺寸的分块类型。然而,具有16X 16尺寸的编码单元不是关于多条视频数据320和330的最小解码单元,所以不会设置具有8X8尺寸的分块类型。在这点上,因为具有8X8尺寸的编码单元是关于多条视频数据310、320和330的最小解码单元,所以不仅可设置具有8X8、8X4、4X8尺寸的分块类型,而且可设置具有4X4尺寸的分块类型。图4是根据本发明实施例的基于编码单元的图像编码器400的框图。图像编码器400执行视频编码设备100的编码单元确定器120的操作,以对图像 数据编码。换句话说,在当前帧405中,帧内预测器410在帧内模式下对编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,在当前帧405中,在帧间模式下对编码单元执行帧间估计和运动补偿。从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化的变换系数。量化的变换系数通过反量化器460和逆变换器470被恢复为在空间域中的数据,并且空间域中的恢复的数据在通过去块单元480和环路滤波单元490进行后处理之后,被输出为参考帧495。量化的变换系数可通过熵编码器450被输出为比特流455。为了在视频编码设备100中应用图像编码器400,图像编码器400的所有部件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元执行操作。具体地讲,帧内预测器410、运动估计器420以及运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元中的每个编码单元的分块和预测模式,变换器430确定在具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。图5是根据本发明实施例的基于编码单元的图像解码器500的框图。解析器510从比特流505对将被解码的已编码的视频数据以及关于进行解码所需的编码的信息进行解析。编码的视频数据通过熵解码器520和反量化器530被输出为反量化的数据,并且反量化的数据通过逆变换器540被恢复为在空间域中的图像数据。帧内预测器550针对空间域中的图像数据,在帧内模式下对编码单元执行帧内预测,运动补偿器560通过使用参考帧585,在帧间模式下对编码单元执行运动补偿。经过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580进行后处理之后,被输出为恢复的帧595。另外,通过去块单元570和环路滤波单元580进行后处理的图像数据可被输出为参考帧585。为了在图像解码设备200的图像数据解码器230中对图像数据解码,图像解码器500可执行在解析器510之后执行的操作。为了在视频解码设备200中应用图像解码器500,图像解码器500的所有部件(即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器560、去块单元570以及环路滤波单元580)基于针对每个最大编码单元的具有树结构的编码单元执行操作。具体地讲,帧内预测器550和运动补偿器560基于每个具有树结构的编码单元的分块和预测模式来执行操作,逆变换器540基于每个编码单元的变换单元的尺寸来执行操作。
图6是示出根据本发明实施例的根据深度的更深的编码单元以及分块的示图。视频编码设备100和视频解码设备200使用分层编码单元,以考虑图像的特性。编码单元的最大高度、最大宽度和最大深度可根据图像的特性被自适应地确定,或者可由用户不同地设置。可根据编码单元的预定最大尺寸来确定根据深度的更深编码单元的尺寸。在根据本发明实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深度是3。这里,最大深度指示从最大编码单元到最小编码单元的根据深度的编码单元的分割的总数。因为深度沿分层结构600的纵轴加深,所以更深的编码单元的高度和宽度均被分割。另外,预测单元和分块沿分层结构600的横轴被示出,其中,所述预测单元和分块是每个更深的编码单元的预测编码的基础。换句话说,编码单元610是分层结构600中的最大编码单元,其中,深度是0,尺寸(即,高度乘以宽度)是64X64。深度沿纵轴加深,并且存在尺寸为32X32且深度为I的编码单元620、尺寸为16X16且深度为2的编码单元630、尺寸为8X8且深度为3的编码单元640。尺寸为8X8且深度为3的编码单元640是最小编码单元。编码单元的预测单元和分块根据每个深度沿横轴排列。换句话说,如果尺寸为64X64且深度为O的编码单元610是预测单元,则预测单元可被分割为包括在编码单元610中的分块,S卩,尺寸为64 X 64的分块610、尺寸为64 X 32的分块612、尺寸为32 X 64的分块614。因为尺寸为64X64的编码单元610不是最小编码单元,所以不设置尺寸为32X32的分块。类似地,尺寸为32X32且深度为I的编码单元620的预测单元可被分割为包括在编码单元620中的分块,即,尺寸为32X32的分块620、尺寸为32X16的分块622、尺寸为16X32的分块624。因为尺寸为32X32的编码单元620不是最小编码单元,所以不设置尺寸为16X16的分块。类似地,尺寸为16X 16且深度为2的编码单元630的预测单元可被分割为包括在编码单元630中的分块,即,包括在编码单元630中的尺寸为16X16的分块、尺寸为16X8的分块632、尺寸为8X16的分块634。因为尺寸为16 X 16的编码单元630不是最小编码单元,所以不设置尺寸为8X8的分块。最终,尺寸8X8且深度为3的编码单元640的预测单元是最小编码单元并且具有最低的深度,因此可被分割为包括在编码单元640中的分块,即,括在编码单元640中的尺寸为8X8的分块、尺寸为8X4的分块642、尺寸为4X8的分块644以及尺寸为4X4的分块 646。为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120针对与包括在最大编码单元610中的每个深度相应的编码单元执行编码。根据深度的更深的编码单元的数量随着深度加深而增加,其中,所述根据深度的更深的编码单元包括相同范围和相同大小的数据。例如,与深度2相应的四个编码单元需要覆盖包括在与深度I对应的一个编码单元中的数据。因此,为了比较根据深度的相同数据的编码结果,与深度I相应的编码单元和与深度2相应的四个编码单元均被编码。为了针对多个深度中的当前深度执行编码,可通过沿分层结构600的横轴对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度选择最小编码误差。可选择地,随着深度沿分层结构600的纵轴加深,可通过针对每个深度执行编码比较根据深度的最小编码误差,来搜索最小编码误差。编码单元610中具有最小编码误差的深度和分块可被选择为编码单元610的编·码深度和分块类型。图7是用于描述根据本发明实施例的编码单元710和变换单元720之间的关系的示图。视频编码设备100或视频解码设备200针对每个最大编码单元,根据尺寸小于或等于最大编码单元的编码单元对图像编码或解码。可基于不大于相应的编码单元的数据单元来选择在编码期间用于变换的变换单元的尺寸。例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64X64,则可通过使用尺寸为32X32的变换单元720来执行变换。此外,可通过对尺寸为小于64X64的32X32、16X16、8X8以及4X4的每个变换单元执行变换来对尺寸为64X64的编码单元710的数据编码,随后可选择具有最小编码误差的变换单元。图8是用于描述根据本发明实施例的与编码深度相应的编码单元的编码信息的示图。视频编码设备100的输出单元130可对关于分块类型的信息800、关于预测模式的信息810和关于与编码深度相应的每个编码单元的变换单元的尺寸的信息820进行编码和发送,作为关于编码模式的信息。信息800指示关于通过分割当前编码单元的预测单元获得的分块的形状的信息,其中,所述分块是用于对当前编码单元进行预测编码的数据单元。例如,尺寸为2NX2N的当前编码单元CU_0可被分割为尺寸为2NX2N的分块802、尺寸为2NXN的分块804、尺寸为NX 2N的分块806中的任意一个。这里,关于分块类型的信息800被设置为指示尺寸为2NX N的分块804以及尺寸为NX2N的分块806中的一个。然而,当尺寸为2NX2N的当前编码单元CU_0是最小编码单元时,关于分块类型的信息800可包括尺寸为NXN的分块808。信息810指示每个分块的预测模式。例如,信息810可指示对由信息800指示的分块执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。视频解码设备200的图像数据和编码信息提取器220可根据每个更深的编码单元提取并使用信息800、810和820以进行解码。图9是根据本发明实施例的根据深度的更深的编码单元的示图。分割信息可被用于指示深度的改变。分割信息指示当前深度的编码单元是否被分割成更低深度的编码单元。
用于对深度为O且尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元910可包括尺寸为2N_0X2N_0的分块类型912的分块、尺寸为2N_0XN_0的分块类型914的分块、尺寸为N_0X2N_0的分块类型916的分块。图9仅示出了通过对称地分割预测单元910获得的分块类型912至916,但是分块类型不限于此,并且预测单元910的分块可包括非对称的分块、具有任意形状的分块和具有几何形状的分块。根据每个分块类型,对尺寸为2N_0X2N_0的一个分块、尺寸为2N_0XN_0的两个分块、尺寸为N_0X2N_0的两个分块重复执行预测编码。可对尺寸为2N_0X2N_0、N_0 X 2N_0、2N_0 X N_0的分块执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0 X 2N_0的分块执行跳过模式下的预测编码。如果在尺寸为2N_0 X 2N_0、N_0 X 2N_0、2N_0 X N_0的分块类型912到分块类型916的一个分块类型中编码误差最小,则预测单元910可以不被分割至更低的深度。然而,如果 在尺寸为Ν_0ΧΝ_0的编码单元930中编码误差最小,则深度从O改变到1,以执行分割(操作920),并对深度为I且尺寸为Ν_0ΧΝ_0的编码单元920重复执行编码,以搜索最小编码误差。用于对深度为I且尺寸为2Ν_1Χ2Ν_1 (=Ν_0ΧΝ_0)的编码单元930进行预测编码的预测单元940可包括尺寸为2N_1 X 2N_1的分块类型942的分块、尺寸为2N_1 XN_1的分块类型944的分块、尺寸为N_1X2N_1的分块类型946的分块。如果与尺寸为2N_1X2N_1、2N_1XN_1、N_1 X 2N_1的分块类型942至946中的编码误差相比,尺寸为N_2XN_2的编码单元960中编码误差最小,则深度从I改变到2以执行分割(操作950),并对深度为2且尺寸为N_2XN_2的编码单元960重复执行编码,以搜索
最小编码误差。当最大深度是d-Ι时,根据每个深度的编码单元可被分割,直到深度变为d-1,并且分割信息可被编码,直到深度为O至d-2之一。换句话说,在操作970中将与深度为d-2相应的编码单元分割之后,当执行编码直到深度为d-Ι时,用于对深度为d-Ι且尺寸为2N_(d-l) X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括尺寸为2N_(d-1) X2N_(d-l)的分块类型992的分块、尺寸为2N_(d_l) XN_(d_l)的分块类型994的分块、尺寸为N_(d-1) X2N_(d-l)的分块类型996的分块以及尺寸为N_(d_l) XN_(d_l)的分块类型998的分块。可在分块类型992至分块类型998之中,对尺寸为2N_(d_l) X2N_(d-1)的一个分块、尺寸为2N_(d-1) XN_(d-1)的两个分块、尺寸为N_(d-1) X2N_(d-l)的两个分块、尺寸为N_(d-1) XN_(d-l)的四个分块重复执行预测编码,以搜索具有最小编码误差的分块类型。即使当分块类型998具有最小编码误差时,因为最大深度为d-Ι,所以深度为d-1的编码单元cu_(d-l)也不再被分割至更低深度,构成当前最大编码单元900的编码单元的编码深度被确定为d-Ι,并且当前最大编码单元900的分块类型可被确定为N_(d-1) XN_(d-1)。此外,因为最大深度为d-1,并且具有最低深度d-Ι的最小编码单元980不再被分割至更低深度,所以不设置用于最小编码单元980的分割信息。因为深度为O且尺寸为2N_0X2N_0的编码单元900和深度为I且尺寸为2N_1 X 2N_1的编码单元930不是最小编码单元,所以尺寸为2N_0X2N_0的编码单元900的预测单元910不会包括尺寸为Ν_0ΧΝ_0的分块类型,尺寸为2N_1X2N_1的编码单元930的预测单元940不会包括尺寸为N_1 XN_1的分块类型。然而,用于对作为最小编码单元的深度为d-Ι的编码单元980进行预测编码的预测单元990可包括尺寸为N_(d-1) XN_(d-l)的分块类型998。数据单元999可以是用于当前最大编码单元的“最小单元”。根据本发明实施例的最小单元可以是通过将最小编码单元980分割为4份而获得的矩形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度,并且可将相应的分块类型和预测模式设置为编码深度的编码模式。这样,在所有深度I至d中比较根据深度的最小编码误差,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分块类型和预测模式可被编码和发送,作为关于编码模式的信息。此外,因为从深度O至编码深度来分割编码单元,所以只有编码深度的分割信息被设置为0,并且除了编码深度之外的深度的分割信息被设置为I。
视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度以及预测单元的信息,以对分块912解码。视频解码设备200可通过使用根据深度的分割信息将分割信息为O的深度确定为编码深度,并且可使用关于编码深度的编码模式的信息来对与编码深度相应的编码单元进行解码。图10至图12是用于描述根据本发明实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。编码单元1010是最大编码单元中的、与由视频编码设备100确定的编码深度相应的、具有树结构的编码单元。预测单元1060是每个编码单元1010的预测单元的分块,变换单元1070是每个编码单元1010的变换单元。当在编码单元1010中最大编码单元的深度为O时,编码单元1012和1054的深度为 1,编码单元 1014、1016、1018、1028、1050 和 1052 的深度为 2,编码单元 1020、1022、1024、1026、1030、1032和1048的深度为3,编码单元1040、1042、1044和1046的深度为4。在预测单元1060中,通过分割编码单元1010中的编码单元获得一些编码单元1014、1016、1022、1032、1048、1050、1052 和 1054。换句话说,编码单元 1014、1022、1050 和1054中的分块类型具有2NXN的尺寸,编码单元1016、1048和1052中的分块类型具有NX2N的尺寸,编码单元1032的分块类型具有NXN的尺寸。仅当编码单元1032是最小编码单元时,才会设置尺寸为NXN的分块类型。编码单元1010的预测单元和分块小于或等于每个编码单元。以小于编码单元1052的数据单元,对变换单元1070中的编码单元1052的图像数据执行变换或逆变换。另外,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052与预测单元1060中的编码单元在尺寸和形状上不同。换句话说,视频编码设备100和视频解码设备200可分别对相同编码单元中的数据单元执行帧内预测、运动估计、运动补偿、变换和逆变换。因此,对每个编码单元递归地执行编码以确定最佳编码单元,从而可获得具有递归树结构的编码单元,其中,每个编码单元在最大编码单元的每个区域中具有分层结构。编码信息可包括关于编码单元的分割信息、关于分块类型的信息、关于预测模式的信息以及关于变换单元的尺寸的信息。表I示出了可由视频编码设备100和视频解码设备200设置的编码息。[表 I]
分割信息O分割信息I
(对尺寸为2NX2N且当前深度为d的编码单元编码)
预测模式分块类型变换单元的尺寸对具有d + 1
帧内对称的分非对称的变换单元变换单元的更低深 帧间块类型分块类型的分割信的分割信度的编码 跳过(仅2N___MO__息I 单元重复
X2N)2NX2N 2ΝΧη 2ΝΧ2Ν NXN (对称编码
2ΝΧΝ 2NXnD分块类型)
KX2N nLX2N N/2XN/2NXN nRX2N (非对称____I分块类型)_视频编码设备100的输出单元130可输出关于具有树结构的编码单元的编码信息,视频解码设备200的图像数据和编码信息提取器220可从接收的比特流提取关于具有树结构的编码单元的编码信息。分割信息指示当前编码单元是否被分割为更低深度的编码单元。如果当前深度d的分割信息为0,则当前编码单元不再被分割至更低深度的深度是编码深度,因此可对编码深度定义关于分块类型、预测模式和变换单元的尺寸的信息。如果根据分割信息将当前编码单元进一步分割,则对更低深度的四个分割的编码单元独立地执行编码。预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可在所有分块类型中定义帧内模式和帧间模式,仅在尺寸为2NX2N的分块类型中定义跳过模式。关于分块类型的信息可指示通过对称地分割预测单元的高度或宽度获得的尺寸为2N X 2N、2N X N、N X 2N和N X N的对称的分块类型以及通过非对称地分割预测单元的高度或宽度获得的尺寸为2NXnU、2NXnD、nLX2N和nRX2N的非对称的分块类型。可通过按1:3和3:1分割预测单元的高度来分别获得尺寸为2NXnU和2NXnD的非对称的分块类型,可通过按1:3和3:1分割预测单元的宽度来分别获得尺寸为nLX 2N和nRX 2N的非对称的分块类型。仅当2NX2N的当前编码单元是最小编码单元时,才会设置NXN的对称的分块类型。变换单元的尺寸可被设置为帧内模式下的两种类型以及帧间模式下的两种类型。换句话说,如果变换单元的分割信息为0,则变换单元的尺寸可以是2NX2N(2NX2N是当前编码单元的尺寸)。如果变换单元的分割信息为1,则可通过分割当前编码单元来获得变换单元。另外,如果尺寸为2NX2N的当前编码单元的分块类型是对称的分块类型,则变换单元的尺寸可以是NXN,如果当前编码单元的分块类型是非对称的分块类型,则变换单元的尺寸可以是N/2XN/2。关于具有树结构的编码单元的编码信息可包括与编码深度相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括包含相同的编码信息的预测单元和最小单元中的至少一个。
因此,通过比较相邻数据单元的编码信息来确定相邻数据单元是否包括在与编码深度相应的相同的编码单元中。另外,通过使用数据单元的编码信息来确定与编码深度相应的相应编码单元,从而可确定在最大编码单元中编码深度的分布。因此,如果基于相邻数据单元的编码信息来预测当前编码单元,则可直接参照和使用与当前编码单元相邻的更深的编码单元中的数据单元的编码信息。可选择地,如果基于相邻数据单元的编码信息来预测当前编码单元,则使用所述数据单元的编码信息来搜索与当前编码单元相邻的数据单元,并且可参照搜索到的相邻的编码单元来预测当前编码单元。图13是用于描述根据表I的编码模式信息的编码单元、预测单元或分块和变换单元之间的关系的示图。最大编码单元1300包括多个编码深度的编码单元1302、1304、1306、1312、1314、1316和1318。这里,因为编码单元1318是编码深度的编码单元,所以分割信息可被设置为O。关于尺寸为2NX2N的编码单元1318的分块类型的信息可被设置为尺寸为2NX2N的分块类型1322、尺寸为2NXN的分块类型1324、尺寸为NX 2N的分块类型1326、尺寸为2NXnU的分块类型1332、尺寸为2NXnD的分块类型1334、尺寸为nLX2N的分块类型1336以及尺寸为nRX2N的分块类型1338中的一个。当尺寸为2NX2N的编码单元1318是最小编码单元时,关于分块类型的信息可被设置为尺寸为NXN的分块类型1328。变换单元的分割信息(TU尺寸标志)是变换索引的类型,与变换索引相应的变换单元的尺寸可根据编码单元的预测单元类型或分块类型而改变。·
例如,当分块类型被设置为对称(S卩,分块类型1322、1324、1326或1328)时,如果变换单元的分割信息为0,则尺寸为2NX 2N的变换单元1342被设置,如果TU尺寸标志为1,则尺寸为NXN的变换单元1344被设置。当分块类型被设置为非对称(即,分块类型1332、1334、1336或1338)时,如果TU尺寸标志为0,则尺寸为2NX2N的变换单元1352被设置,如果TU尺寸标志为I,则尺寸为N/2XN/2的变换单元1354被设置。参照图13, TU尺寸标志是具有值O或I的标志,但是TU尺寸标志不限于I比特,并且在TU尺寸标志从O增加时,变换单元可具有树结构地分层分割。变换单元的分割信息可用作变换索引的示例。在这种情况下,如果变换单元的分割信息与变换单元的最大尺寸和变换单元的最小尺寸一起被使用,则可表示实际使用的变换单元的尺寸。视频编码设备100可对变换单元的最大尺寸信息、变换单元的最小尺寸信息以及变换单元的最大分割信息进行编码。编码的变换单元的最大尺寸信息、编码的变换单元的最小尺寸信息以及编码的变换单元的最大分割信息可被插入到SPS中。视频解码设备200可通过使用变换单元的最大尺寸信息、变换单元的最小尺寸信息以及变换单元的最大分割信息来对视频解码。在一个示例中,Ca)如果当前编码单元的尺寸为64X64,并且变换单元的最大尺寸为32 X 32,则(a-Ι)当变换单元的分割信息是O时,变换单元的尺寸可被设置为32X32 ;(a-2)当变换单元的分割信息是I时,变换单元的尺寸可被设置为16X16 ;(a-3)当变换单元的分割信息是2时,变换单元的尺寸可被设置为8X8。在另一示例中,(b)如果当前编码单元的尺寸为32X32,并且变换单元的最小尺寸为32 X 32,则(b-1)当变换单元的分割信息是O时,变换单元的尺寸可被设置为32 X 32,并且因为变换单元的尺寸不能小于32X32的尺寸,所以变换单元的分割信息不可被进一步设置。在另一示例中,(C)如果当前编码单元的尺寸为64X64,并且变换单元的最大分割信息为1,则变换单元的分割信息可以为O或1,而变换单元的另一分割信息不可被设置。因此,如果定义最大TU尺寸标志为“MaxTransformSizelndex”,最小变换单兀尺寸为“MinTransformSize”,并且当TU尺寸标志位为O时变换单元尺寸为“RootTuSize”,则可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”可通过等式(I)来定义CurrMinTuSize= max(MinTransformSize, RootTuSize/(2'MaxTransformSizeIndex))... (I)与可在当前编码单元中确定的当前最小变换单元尺寸“CurrMinTuSize”相比,当TU尺寸标志为O时的变换单元尺寸“RootTuSize”可表示在系统中可选择的最大变换单元尺寸。在等式(I)中,“RootTuSize/(2'MaxTransformSizeIndex) ” 表不当 TU 尺寸标志为O时的变换单元尺寸“RootTuSize”被分割与最大TU尺寸标志相应的次数时的变换单元尺寸,“MinTransformSize” 表不最小变换尺寸。因此,“MinTransformSize,,与“RootTuSize/(2"MaxTransformSizelndex) ”中较小的值可作为可在当前编码单元中确定的当前最小变换单兀尺寸 “CurrMinTuSize”。根据本发明实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而变化。例如,如果当前预测模式是帧间模式,则可通过使用下面的等式(2)来确定“RootTuSize”。在等式(2)中,“MaxTransformSize”表不最大变换单兀尺寸,“PUSize”表示当前预测单元尺寸。RootTuSize=min(MaxTransformSize, PUSize) …(2)也就是说,如果当前预测模式是帧间模式,则当TU尺寸标志为O时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。如果当前分块单元的预测模式是帧内模式,则可通过使用下面的等式(3)来确定“RootTuSize”。在等式(3)中,“PartitionSize”表示当前分块单元的尺寸。RootTuSize=min(MaxTransformSize, PartitionSize) …(3)也就是说,如果当前预测模式是帧内模式,则当TU尺寸标志为O时的变换单元尺寸“RootTuSize”可以是最大变换单元尺寸和当前分块单元的尺寸中较小的值。然而,根据分块单元中的预测模式的类型变化的当前最大变换单元尺寸“RootTuSize”只是一个示例,本发明不限于此。图14是示出根据本发明实施例的通过使用基于具有树结构的编码单元的预测单元对视频编码的方法的流程图。在操作1210,将当前画面划分为至少一个最大编码单元。可预先确定指示可能的分割次数的总数的最大深度。在操作1220,通过对根据深度分割每个最大编码单元的区域获得的至少一个分割区域进行编码来确定根据至少一个分割区域输出最终编码结果的编码深度,并确定根据树结构的编码单元。每当深度加深时,最大编码单元在空间上被分割,从而被分割为更低深度的编码单元。可通过与相邻编码单元独立地在空间上分割每个编码单元来将每个编码单元分割为另一更低深度的编码单元。根据深度对每个编码单元重复地执行编码。此外,针对每个更深的编码单元确定根据具有最小编码误差的分块类型的变换单元。为了确定在每个最大编码单元中具有最小编码误差的编码深度,可在所有根据深度的更深的编码单元中测量并比较编码误差。当确定变换单元时,可确定用于编码单元的变换的变换单元。根据本实施例的变换单元可被确定为使由用于编码单元的变换的变换单元引起的误差最小化的数据单元。在每个最大编码单元中,基于分块类型(基于根据深度的编码单元被确定)和根据 深度的编码单元的深度对画面编码,并且针对根据深度的每个编码单元独立地确定编码深度的编码单元,从而可确定具有树结构的编码单元。在以下情况中的至少一种情况下,当前编码单元的分块类型还可包括具有与更低深度的编码单元相同尺寸的分块,所述情况包括当前编码单元不再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最大编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。分块类型可包括通过对称地分割当前编码单元的高度或宽度获得的对称的分块、通过非对称地分割当前编码单元的高度或宽度获得的分块、通过几何地分割当前编码单元获得的分块或者具有任意形状的分块。可基于关于当前编码单元的预测单元的分块类型和预测模式来执行预测编码。因此,在以下情况中的至少一种情况下,不仅可通过使用通过对称地分割当前编码单元的高度或宽度获得的对称的分块、通过非对称地分割当前编码单元的高度或宽度获得的分块、通过几何地分割当前编码单元获得的分块和具有任意形状的分块,而且可通过使用具有与更低深度的编码单元相同尺寸的分块来执行预测编码,所述情况包括当前编码单元不再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最小编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。此外,在以下情况中的至少一种情况下,可跳过通过使用具有与更低深度的编码单元相同尺寸的分块执行的帧内预测和帧间预测,所述情况包括当前编码单元可被分割为更低深度的编码单元;当前编码单元不是当前最大编码单元中最低深度的编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。在操作1230,针对每个最大编码单元,输出构成根据编码深度的最终编码结果的编码的图像数据以及关于编码深度和编码模式的编码信息。关于编码模式的信息可包括关于编码深度的信息或分割信息、关于预测单元的分块类型的信息、关于预测模式的信息、关于变换单元的尺寸的信息、变换索引信息等。关于根据诸如序列、画面、像条或GOP的数据单元定义的编码单元的尺寸和可变深度的编码单元结构信息可被插入到比特流的头、SPS或PPS中,然后可被输出。关于编码模式的编码信息以及关于编码单元的尺寸和可变深度的编码单元结构信息可被插入到比特流的头、SPS或PPS中,然后可连同编码的图像数据一起被发送到解码器。图15是示出根据本发明实施例的通过使用基于具有树结构的编码单元的预测单元对视频解码的方法的流程图。在操作1310,接收并解析编码的视频的比特流。在操作1320,从解析的比特流提取分配给最大编码单元的当前画面的编码的图像数据、关于根据最大编码单元的编码深度和编码模式的信息、以及关于编码单元的尺寸和可变深度的编码单元结构信息。可从比特流的头、SPS或PPS提取关于编码深度和编码模式的信息、关于编码单元的尺寸和可变深度的编码单元结构信息、以及分割信息。每个最大编码单元的编码深度是每个最大编码单元中具有最小编码误差的深度。在对每个最大编码单元编码时,基于通过分层分割根据深度的每个最大编码单元获得的至少一个数据单元来对图像数据编码。根据关于编码深度和编码模式的信息,最大编码单元可被分割为具有树结构的编码单元。每个具有树结构的编码单元被确定为与编码深度相应的编码单元,并被最优地编码以输出最小编码误差。因此,通过在根据编码单元确定至少一个编码深度之后对编码单元中的每条编码的图像数据解码,可提高图像的编码和解码效率。可基于编码信息(所述编码信息包括关于具有树结构的当前编码单元的可变深度的信息、关于编码单元的最大尺寸的信息和关于编码单元的最小尺寸的信息中的至少两个)来确定具有树结构的当前编码单元中的编码单元的最大尺寸和最小尺寸。此外,可基于编码信息的变换索引来确定编码单元中的根据树结构的变换单元。可基于当前编码单元的深度来确定分块类型,并基于编码单元和分块类型来执行预测解码,从而可对画面解码。根据本实施例的分块类型可包括具有与当前编码单元相同尺寸的分块、通过将当前编码单元的高度或宽度除以二获得的分块、通过对称地分割当前编码单元的高度或宽度获得的对称的分块、通过非对称地分割当前编码单元的高度或宽度获得的分块、通过几何地分割当前编码单元获得的分块以及具有任意形状的分块中的至少一种。在以下情况中的至少一种情况下,当前编码单元的分块类型还可包括具有与更低深度的编码单元相同尺寸的分块,所述情况包括当前编码单元不再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最小编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。在操作1330,基于关于根据最大编码单元的编码深度和编码模式的信息来对每个最大编码单元的图像数据解码。可基于编码单元结构信息和分割信息来读取编码单元的最大尺寸和最小尺寸,从而可确定具有树结构的编码单元。可从关于编码模式的信息中读取关于编码单元的预测单元的分块类型和预测模式的信息,并可基于关于分块类型和预测模式的信息,针对编码单元执行预测解码,从而可对当前编码单元解码。例如,在以下情况中的至少一种情况下,可跳过通过使用具有与更低深度的编码单元相同尺寸的分块执行的帧内预测或帧间预测/补偿,所述情况包括当前编码单元可被分割为更低深度的编码单元;当前编码单元不是当前最大编码单元中最低深度的编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。在以下情况中的至少一种情况下,不仅可通过使用具有与当前编码单元相同尺寸的分块、通过将当前编码单元的高度或宽度除以二获得的分块、通过非对称地分割当前编码单元的高度或宽度获得的分块,而且可通过使用具有与深度低于当前编码单元的深度的编码单元相同尺寸的分块,来执行帧内预测或帧间预测/补偿,所述情况包括当前编码单元不再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最小编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。解码的图像数据可通过再现设备被再现,可被存储在存储介质中,或者可通过网络被发送。本发明实施例可以被编写为计算机程序,并且可在使用计算机可读记录介质执行程序的通用数字计算机中被实现。计算机可读记录介质的示例包括磁存储介质(例如,ROM、软盘、硬盘等)和光记录介质(例如,CD-ROM或DVD)。虽然已经参照本发明的优选实施例具体显示和描述了本发明,但是本领域普通技术人员将理解,在不脱离权利要求限定的本发明的精神和范围的情况下,可以在形式和细节上进行各种改变。优选实施例应该仅被考虑为描述性的,而非限制性的目的。因此,本发 明的范围不是由本发明的详细描述限定,而是由权利要求限定,并且所述范围内的所有不同将被解释为包括在本发明中。
权利要求
1.一种对视频解码的方法,所述方法包括以下步骤接收关于编码的视频的比特流并解析所述比特流;从所述比特流提取指示作为用于对视频的画面解码的数据单元的编码单元的尺寸和可变深度的编码单元结构信息、以及关于画面的具有树结构的编码单元的编码深度和编码模式的信息;基于编码单元结构信息和关于编码深度和编码模式的信息确定具有树结构的编码单元,基于当前编码单元的深度确定分块类型,并基于编码单元和分块类型对所述画面解码,其中,分块类型包括具有与当前编码单元相同尺寸的数据单元,并且通过分割当前编码单元的高度和宽度之一来获得部分数据单元。
2.如权利要求I所述的方法,其中,在以下情况中的至少一种情况下,当前编码单元的分块类型还包括具有与更低深度的编码单元相同尺寸的分块,所述情况包括当前编码单元不再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最小编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。
3.如权利要求I所述的方法,其中,在以下情况中的至少一种情况下,当前编码单元的分块类型还包括具有与更低深度的编码单元相同尺寸的分块,所述情况包括当前编码单元不再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最小编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元,解码的步骤包括通过使用分块类型执行帧内预测或帧间补偿。
4.如权利要求3所述的方法,其中,在以下情况中的至少一种情况下,解码的步骤还包括跳过通过使用具有与当前编码单元的更低深度的编码单元相同尺寸的分块执行的帧内预测或帧间补偿,所述情况包括当前编码单元被分割为更低深度的编码单元;当前编码单元不是当前最大编码单元中的最小编码单元;当前编码单元不是当前最大编码单元中最低深度的编码单元。
5.如权利要求I所述的方法,其中,提取的步骤包括从关于编码模式的信息中提取关于作为用于执行编码单元的预测解码的数据单元的预测单元的分块类型和预测模式的信息,解码的步骤包括基于提取的关于分块类型和预测模式的信息来执行编码单元的预测解码,分块类型包括通过对称地分割当前编码单元的高度或宽度获得的对称的分块、通过非对称地分割当前编码单元的高度或宽度获得的分块、通过几何地分割当前编码单元的高度或宽度获得的分块以及具有任意形状的分块中的至少一种,预测模式包括帧内模式、帧间模式和跳过模式中的至少一种。
6.如权利要求I所述的方法,其中,通过将最大编码单元分割根据每个深度的空间分割的总数来获得根据深度的编码单元,根据编码深度从根据深度的编码单元获得编码单元,最大编码单元的深度是最高深度,通过将高度和宽度划分为根据更高深度的深度的编码单元的一半来获得每个根据深度的编码单元的尺寸,将画面分层分割为最大编码单元和根据深度的编码单元,根据编码深度独立地分别分割编码单元,关于最大编码单元确定至少一个编码深度,最大编码单元包括根据至少一个编码深度的至少一个编码单元。
7.—种对视频编码的方法,所述方法包括以下步骤将视频的画面分割为一个或多个最大编码单元,所述最大编码单元是具有最大尺寸的编码单元;基于根据深度的编码单元并基于按照根据深度的编码单元的深度确定的分块类型来对画面编码,并针对每个根据深度的编码单元确定根据编码深度的编码单元,从而确定具有树结构的编码单元,其中,通过根据所述一个或多个最大编码单元中的每个最大编码单元中的深度分层分割所述一个或多个最大编码单元中的每个最大编码单元来获得根据深度的编码单元;输出基于分块类型和具有树结构的编码单元编码的数据、关于编码深度和编码模式的信息、以及指示编码单元的尺寸和可变深度的编码单元结构信息,其中,分块类型包括具有与当前编码单元相同尺寸的数据单元,并且通过分割当前编码单元的高度和宽度之一来获得部分数据单元。
8.如权利要求7所述的方法,其中,在以下情况中的至少一种情况下,当前编码单元的分块类型还包括具有与更低深度的编码单元相同尺寸的分块,所述情况包括当前编码单元不再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最小编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元。
9.如权利要求7所述的方法,其中,在以下情况中的至少一种情况下,当前编码单元的分块类型还包括具有与更低深度的编码单元相同尺寸的分块,所述情况包括当前编码单元不再被分割为更低深度的编码单元;当前编码单元是当前最大编码单元中的最小编码单元;当前编码单元是当前最大编码单元中最低深度的编码单元,确定编码单元的步骤包括通过使用分块类型执行帧内预测或帧间补偿。
10.根据权利要求9所述的方法,其中,在以下情况中的至少一种情况下,确定编码单元的步骤还包括跳过通过使用具有与当前编码单元的更低深度的编码单元相同尺寸的分块执行的帧内预测或帧间补偿,所述情况包括当前编码单元被分割为更低深度的编码单元;当前编码单元不是当前最大编码单元中的最小编码单元;当前编码单元不是当前最大编码单元中最低深度的编码单元。
11.如权利要求7所述的方法,其中,编码的步骤包括基于关于预测单元的分块类型和预测模式的信息来执行预测编码,其中,所述预测单元是用于执行当前编码单元的预测编码的数据单元,输出的步骤包括将关于当前编码单元的分块类型和预测模式的信息作为关于编码模式的信息插入到比特流中并输出比特流,分块类型包括通过对称地分割当前编码单元的高度或宽度获得的对称的分块、通过非对称地分割当前编码单元的高度或宽度获得的分块、通过几何地分割当前编码单元的高度或宽度获得的分块以及具有任意形状的分块中的至少一种,预测模式包括帧内模式、帧间模式和跳过模式中的至少一种。
12.一种包括视频解码处理器的视频解码设备,所述视频解码设备包括接收器,接收关于编码的视频的比特流并解析所述比特流;提取器,从所述比特流提取指示作为用于对视频的画面解码的数据单元的编码单元的尺寸和可变深度的编码单元结构信息、以及关于画面的具有树结构的编码单元的编码深度和编码模式的信息;解码器,与视频解码处理器结合,基于编码单元结构信息和关于编码深度和编码模式的信息确定具有树结构的编码单元,基于当前编码单元的深度确定分块类型,并基于编码单元和分块类型对所述画面解码,其中,分块类型包括具有与当前编码单元相同尺寸的数据单元,并且通过分割当前编码单元的高度和宽度之一来获得部分数据单元。
13.—种包括视频编码处理器的视频编码设备,所述视频编码设备包括最大编码单元分割器,将视频的画面分割为一个或多个最大编码单元,所述最大编码单元是具有最大尺寸的编码单元;编码单元确定器,与视频编码处理器结合,基于根据深度的编码单元并基于按照根据深度的编码单元的深度确定的分块类型来对画面编码,并针对每个根据深度的编码单元确定根据编码深度的编码单元,从而确定具有树结构的编码单元,其中,通过根据所述一个或多个最大编码单元中的每个最大编码单元中的深度分层分割所述一个或多个最大编码单元中的每个最大编码单元来获得根据深度的编码单元;输出单元,输出基于分块类型和具有树结构的编码单元编码的数据、关于编码深度和编码模式的信息、以及指示编码单元的尺寸和可变深度的编码单元结构信息,其中,分块类型包括具有与当前编码单元相同尺寸的数据单元,并且通过分割当前编码单元的高度和宽度之一来获得部分数据单元。
14.一种记录有通过使用计算机执行权利要求I的对视频解码的方法的程序的计算机可读记录介质。
15.一种记录有通过使用计算机执行权利要求7的对视频编码的方法的程序的计算机可读记录介质。
全文摘要
一种对视频编码的方法,所述方法包括将视频的画面分割为一个或多个最大编码单元,所述最大编码单元是具有最大尺寸的编码单元;基于根据深度的编码单元并基于按照根据深度的编码单元的深度确定的分块类型来对画面编码,并针对每个根据深度的编码单元确定根据编码深度的编码单元,从而确定具有树结构的编码单元,其中,通过根据所述一个或多个最大编码单元中的每个最大编码单元中的深度分层分割所述一个或多个最大编码单元中的每个最大编码单元来获得根据深度的编码单元;输出基于分块类型和具有树结构的编码单元编码的数据、关于编码深度和编码模式的信息、以及指示编码单元的尺寸和可变深度的编码单元结构信息,其中,分块类型包括具有与当前编码单元相同尺寸的数据单元,并且通过分割当前编码单元的高度和宽度之一来获得部分数据单元。
文档编号H04N7/32GK102934436SQ201180028147
公开日2013年2月13日 申请日期2011年4月13日 优先权日2010年4月13日
发明者闵正惠, 韩宇镇, 金壹求 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1