用于对运动信息进行编码的方法和设备以及用于对运动信息进行解码的方法和设备的制作方法

文档序号:7991582阅读:213来源:国知局
用于对运动信息进行编码的方法和设备以及用于对运动信息进行解码的方法和设备的制作方法
【专利摘要】本发明提供了用于对运动信息进行编码和解码的方法和设备。对运动信息进行编码的方法包括:通过使用与当前预测单元时间或空间相关的预测单元的运动信息来获得运动信息候选;当包括在运动信息候选中的运动信息的数量小于预定数量n时,将可选择的运动信息添加到运动信息候选,从而包括在运动信息候选中的运动信息的数量达到预定数量n;从n个运动信息候选中确定关于当前预测单元的运动信息;将指示确定的运动信息的索引信息编码为当前预测单元的运动信息。
【专利说明】用于对运动信息进行编码的方法和设备以及用于对运动信息进行解码的方法和设备
【技术领域】
[0001]本发明涉及一种用于对视频进行编码和解码的方法和设备,更具体地,涉及一种用于有效地对当前预测单元的运动信息进行编码和解码的方法和设备。
【背景技术】
[0002]由于最近高清晰度视频内容增加,对于具有比根据现有技术的视频编解码器(诸如,MPEG-4H.264/MPEG-4高级视频编码(AVC))更高的编码效率的视频编解码器的需求正在增加。
[0003]运动补偿是用于去除视频信号中的时间冗余的技术。通过运动补偿,作为原始信号和由运动矢量指示的参考信号之间的差的残差信号被发送,从而增加视频编码的压缩效率。一般来说,作为通过运动补偿获得的每个块的编码的结果,每个块的运动矢量和残差值被发送到解码器端。由于各个块的运动矢量占用编码的比特流的相当一部分,因此关于分配给各个块的运动矢量的信息将被减少以增加压缩效率。
[0004]为了减少根据运动矢量的编码的传输开销,在根据现有技术的MPEG-2编解码器中,先前块的运动矢量用作当前块的运动矢量预测,在诸如MPEG-4H.264/MPEG-4AVC的编解码器中,与当前块的左侧、上侧和右上侧相邻的先前编码的块的运动矢量的中值用作运动矢量预测。

【发明内容】

[0005]技术问题
[0006]本发明提供一种用于有效地对预测单元的运动信息进行编码的方法和设备。
[0007]技术方案
[0008]通过使用与当前预测单元时间或空间相关的预测单元的运动信息来产生预定的固定数量的运动信息候选。
[0009]有益效果
[0010]根据本发明的实施例,由于使用了固定数量的运动信息候选,因此与基于周边信息确定运动信息的方法或单独地发送运动信息的方法相比,可执行独立的处理。即使产生了误差,也由于运动信息候选的数量固定,因此在解析阶段的误差健壮性增加。
【专利附图】

【附图说明】
[0011]通过参照附图详细描述本发明的示例性实施例,本发明的以上和其他特征和优点将变得更清楚,其中:
[0012]图1是根据本发明的实施例的视频编码设备的框图;
[0013]图2是根据本发明的实施例的视频解码设备的框图;
[0014]图3是用于描述根据本发明的实施例的编码单元的概念的示图;[0015]图4是根据本发明的实施例的基于具有分层结构的编码单元的视频编码器的框图;
[0016]图5是根据本发明的实施例的基于具有分层结构的编码单元的视频解码器的框图;
[0017]图6是示出根据本发明的实施例的根据深度的较深层编码单元和分区(partition)的不图;
[0018]图7是用于描述根据本发明的实施例的编码单元和变换单元之间的关系的示图;
[0019]图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图;
[0020]图9是根据本发明的实施例的根据深度的较深层编码单元的示图;
[0021]图10至图12是用于描述根据本发明的实施例的编码单元、预测单元和频率变换单元之间的关系的示图;
[0022]图13是用于描述根据表I的编码模式信息的编码单元、预测单元和变换单元之间的关系的不图;
[0023]图14a是示出根据本发明的实施例的运动信息编码设备的结构的框图;
[0024]图14b是示出根据本发明的另一实施例的运动信息编码设备的结构的框图;
[0025]图15是示出根据本发明的实施例的图14a的运动矢量预测候选产生器的详细结构的框图;
[0026]图16示出根据本发明的实施例的在获得当前预测单元的运动矢量预测时使用的周边预测单元;
[0027]图17是根据本发明的实施例的用于解释确定经缩放的空间运动矢量预测候选的操作的参考示图;
[0028]图18是用于解释根据本发明的实施例的通过对周边预测单元的运动矢量进行缩放来产生当前预测单元的运动矢量预测候选的方法的参考示图;
[0029]图19是用于解释根据本发明的实施例的产生时间运动矢量预测的操作的参考示图;
[0030]图20a和图20b示出根据本发明的实施例的指示当前预测单元的运动矢量预测的索引信息;
[0031]图21a和图21b是根据本发明的实施例的用于解释从合并候选去除的周边预测单元的参考示图;
[0032]图22是用于解释根据本发明的实施例的去除包括在合并候选中的运动信息的冗余的操作的参考示图;
[0033]图23至图25是用于解释根据本发明的实施例的将选择性的合并候选添加到合并候选的操作的参考示图;
[0034]图26是根据本发明的实施例的对运动信息进行编码的方法的流程图;
[0035]图27a是示出根据本发明的实施例的运动信息解码设备的结构的框图;
[0036]图27b是示出根据本发明的另一实施例的运动信息解码设备的结构的框图;
[0037]图28是根据本发明的实施例的对运动矢量进行解码的方法的流程图。
[0038]最佳模式[0039]根据本发明的一方面,提供一种对运动信息进行编码的方法,所述方法包括:通过对当前预测单元执行运动预测来获得关于当前预测单元的运动信息;通过使用与当前预测单元时间或空间相关的预测单元的运动信息来获得运动信息候选;当包括在运动信息候选中的运动信息的数量小于预定数量η (η是整数)时,将可选择的运动信息添加到运动信息候选,从而包括在运动信息候选中的运动信息的数量达到预定数量η ;从η个运动信息候选中确定关于当前预测单元的运动信息;将指示所述运动信息的索引信息编码为当前预测单元的运动信息。
[0040]根据本发明的另一方面,提供一种用于对运动信息进行编码的设备,所述设备包括:运动信息候选产生器,用于通过使用与当前预测单元时间或空间相关的预测单元的运动信息来获得运动信息候选,并且当包括在运动信息候选中的运动信息的数量小于预定数量η (η是整数)时,将可选择的运动信息添加到运动信息候选,从而包括在运动信息候选中的运动信息的数量达到预定数量η ;运动信息编码器,用于从η个运动信息候选中确定关于当前预测单元的运动信息,并且将指示所述运动信息的索引信息编码为当前预测单元的运动信息。
[0041]根据本发明的另一方面,提供一种对运动信息进行解码的方法,所述方法包括:通过使用与当前预测单元时间相关的预测单元的运动信息和与当前预测单元空间相关的预测单元的运动信息,来获得运动信息候选;当包括在运动信息候选中的运动信息的数量小于预定数量η (η是整数)时,将可选择的运动信息添加到运动信息候选,从而包括在运动信息候选中的运动信息的数量达到数量η ;从比特流获得指示包括在运动信息候选中的η个运动信息之中的运动信息之一的索引;通过使用由获得的索引指示的运动信息来获得当前预测单元的运动信息。
[0042]根据本发明的另一方面,提供一种用于对运动信息进行解码的设备,所述设备包括:运动信息候选产生器,用于通过使用与当前预测单元时间相关的预测单元的运动信息以及与当前预测单元空间相关的预测单元的运动信息来获得运动信息候选,当包括在运动信息候选中的运动信息的数量小于预定数量η(η是整数)时,将可选择的运动信息添加到运动信息候选,从而包括在运动信息候选中的运动信息的数量达到预定数量η;熵解码器,用于从比特流获得指示包括在运动信息候选中的η个运动信息之中的一个运动信息的索引;运动信息解码器,用于通过使用由获得的索引指示的运动信息来获得当前预测单元的运动信息。
【具体实施方式】
[0043]以下,将参照附图来详细描述本发明的实施例。
[0044]图1是根据本发明的实施例的视频编码设备100的框图。
[0045]视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。
[0046]最大编码单元划分器110可基于作为最大尺寸的编码单元的最大编码单元来划分图像的当前画面。如果当前画面大于最大编码单元,则当前画面的图像数据可被划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32X32、64Χ64、128Χ128、256Χ256等的数据单元,其中,数据单元的形状是具有2的若干次方的宽度和长度并且大于8的正方形。图像数据可以以至少一个最大编码单元为单位被输出到编码单元确定器120。
[0047]根据本发明的实施例的编码单元可由最大尺寸和深度来表征。深度表示从最大编码单元空间划分编码单元的次数,并且随着深度加深,可将较深层编码单元从最大编码单元划分为最小编码单元。最大编码单元的深度是最高深度,最小编码单元的深度是最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减小,因此,与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
[0048]如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据本发明的实施例的最大编码单元根据深度被划分,因此包括在最大编码单元中的空间域的图像数据可根据深度被分层地分类。
[0049]可预先确定编码单元的最大深度和最大尺寸,其中,编码单元的最大深度和最大尺寸限制最大编码单元的高度和宽度被分层地划分的总次数。
[0050]编码单元确定器120对通过根据深度划分最大编码单元的区域而获得的至少一个划分区域进行编码,并根据所述至少一个划分区域确定用于输出最终编码的图像数据的深度。换句话说,编码单元确定器120通过根据当前画面的最大编码单元对根据深度的较深层编码单元中的图像数据进行编码并选择具有最小编码误差的深度,来确定编码深度。根据最大编码器的确定的编码深度和编码图像数据被输出到输出单元130。
[0051]基于与等于或小于最大深度的至少一个深度相应的较深层编码单元对最大编码单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
[0052]随着编码单元根据深度被分层地划分,并且随着编码单元的数量增加,最大编码单元的尺寸被划分。另外,即使在一个最大编码单元中多个编码单元相应于相同深度,也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与相同深度相应的编码单元中的每个编码单元划分至更低深度。因此,即使当图像数据被包括在一个最大编码单元中时,图像数据也根据多个深度被划分为多个区域,在一个最大编码单元中编码误差可根据区域而不同,因此编码深度可根据图像数据中的区域而不同。因此,在一个最大编码单元中可确定一个或多个编码深度,并且可根据至少一个编码深度的编码单元来划分最大编码单元的图像数据。
[0053]因此,编码单元确定器120可确定包括在当前最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括最大编码单元中所包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。在最大编码单元的相同区域中,具有编码深度的编码单元可根据深度被分层地确定,在不同的区域中,具有该编码深度的编码单元可被独立地确定。类似地,当前区域中的编码深度可独立于另一区域中的编码深度被独立确定。
[0054]根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元执行划分的次数相关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元执行划分的总次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度级的总数。例如,当最大编码单元的深度是O时,最大编码单元被划分一次的编码单元的深度可被设置为1,并且最大编码单元被划分两次的编码单元的深度可被设置为2。这里,如果最小编码单元是最大编码单元被划分四次的编码单元,则存在深度为0、1、2、3和4的5个深度级,因此,第一最大深度可被设置为4,第二最大深度可被设置为5。
[0055]可根据最大编码单元执行预测编码和变换。还可根据最大编码单元,基于根据等于最大深度的深度或小于最大深度的多个深度的较深层编码单元来执行预测编码和变换。
[0056]由于每当最大编码单元根据深度被划分时,较深层编码单元的数量增加,因此对随着深度的加深而产生的所有的较深层编码单元执行包括预测编码和变换的编码。为了便于描述,现在将基于在至少一个最大编码单元中的当前深度的编码单元来描述预测编码和变换。
[0057]视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码,执行多个操作(诸如,预测编码、变换和熵编码),此时,可针对所有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
[0058]例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可选择与该编码单元不同的数据单元,以便对编码单元中的图像数据执行预测编码。
[0059]为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元(即,基于不再被划分为与更低深度相应的多个编码单元的编码单元)执行预测编码。以下,不再被划分并且变为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元而获得的分区可包括:通过划分预测单元的高度和宽度中的至少一个而获得的预测单元或数据单元。
[0060]例如,当2NX2N(其中,N是正整数)的编码单元不再被划分并且变为2NX2N的预测单元时,分区的尺寸可以是2NX 2N、2NX N、NX 2N或NX N。分区类型的示例包括通过对预测单元的高度或宽度进行对称划分而获得的对称分区、通过对预测单元的高度或宽度进行不对称划分(诸如,l:n或n:l)而获得的分区、通过对预测单元进行几何划分而获得的分区以及具有任意形状的分区。
[0061 ] 预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如,可对2N X 2N、2N X N、N X 2N或N X N的分区执行帧内模式或帧间模式。另外,可仅对2N X 2N的分区执行跳过模式。对编码单元中的一个预测单元独立地执行编码,从而选择具有最小编码误差的预测模式。
[0062]视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与该编码单元不同的数据单元,对编码单元中的图像数据执行变换。
[0063]为了在编码单元中执行变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,用于变换的数据单元可包括用于帧内模式的数据单元以及用于帧间模式的数据单元。
[0064]用作变换的基础的数据单元现将被称为“变换单元”。与编码单元类似,编码单元中的变换单元可被递归地划分为更小尺寸的区域,从而变换单元可以以区域为单位被独立地确定。因此,编码单元中的残差数据可根据具有根据变换深度的树结构的变换单元被划分。[0065]还可在变换单元中设置指示通过对编码单元的高度和宽度进行划分以达到变换单元而执行划分的次数的变换深度。例如,在2NX2N的当前编码单元中,当变换单元的尺寸是2NX2N时,变换深度可以是0,当变换单元的尺寸是NXN时,变换深度可以是1,当变换单元的尺寸是N/2XN/2时,变换深度可以是2。也就是说,也可根据变换深度设置具有树结构的变换单元。
[0066]根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需要与预测编码和变换相关的信息。因此,编码单元确定器120不仅确定具有最小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式以及用于变换的变换单元的尺寸。
[0067]稍后将参照图3至图12来详细地描述根据本发明的实施例的最大编码单元中的根据树结构的编码单元以及确定分区的方法。
[0068]编码单元确定器120可通过使用基于拉格朗日乘子(Lagrangian multiplier)的率失真优化来测量根据深度的较深层编码单元的编码误差。
[0069]输出单元130在比特流中输出最大编码单元的图像数据以及关于根据编码深度的编码模式的信息,其中,所述图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
[0070]编码的图像数据可以是图像的残差数据的编码结果。
[0071]关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于预测单元中的分区类型的信息、预测模式信息以及变换单元的尺寸信息。
[0072]可通过使用根据深度的划分信息来定义关于编码深度的信息,所述划分信息指示是否针对更低深度而非当前深度的编码单元来执行编码。如果当前编码单元的当前深度是编码深度,则当前编码单元中的图像数据被编码和输出,因此划分信息可被定义为不将当前编码单元划分为更低深度。可选择地,如果当前编码单元的当前深度不是编码深度,则对更低深度的编码单元执行编码,因此划分信息可被定义为划分当前编码单元以获得更低深度的编码单元。
[0073]如果当前深度不是编码深度,则对被划分为更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低深度的每个编码单元重复地执行编码,因而可对具有相同深度的编码单元递归地执行编码。
[0074]由于对一个最大编码单元确定具有树结构的编码单元,并且对编码深度的编码单元确定关于至少一个编码模式的信息,因此可对一个最大编码单元确定关于至少一个编码模式的信息。另外,由于图像数据根据深度被分层地划分,因此最大编码单元的图像数据的编码深度可根据位置而不同,因而可对图像数据设置关于编码深度以及编码模式的信息。
[0075]因此,输出单元130可将关于相应编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
[0076]根据本发明的实施例的最小单元是通过将组成最低深度的最小编码单元划分为4份而获得的矩形数据单元。可选择地,最小单元可以是可被包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。
[0077]例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息以及根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息以及关于分区的尺寸的信息。根据预测单元的编码信息可包括关于以下内容的信息:帧间模式的估计方向、帧间模式的参考图像索引、运动矢量、帧内模式的色度分量以及帧内模式的插值方法。此外,关于根据画面、条带或GOP定义的编码单元的最大尺寸的信息以及关于最大深度的信息可被插入到比特流的头。
[0078]在视频编码设备100中,较深层编码单元可以是通过将作为上一层的更高深度的编码单元的高度或宽度除以二而获得的编码单元。换句话说,在当前深度的编码单元的尺寸是2NX2N时,更低深度的编码单元的尺寸是NXN。另外,尺寸为2NX 2N的当前深度的编码单元可包括最多4个更低深度的编码单元。
[0079]因此,视频编码设备100可通过基于考虑当前画面的特性所确定的最大编码单元的尺寸和最大深度,针对每个最大编码单元确定具有最佳形状和最佳尺寸的编码单元,来形成具有树结构的编码单元。另外,由于通过使用各种预测模式和变换中的任意一个对每个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。
[0080]因此,如果在传统的宏块中对具有高分辨率或大数据量的图像进行编码,则每个画面的宏块的数量过度增加。因此,针对每个宏块产生的压缩信息的数量增加,因此难以发送压缩信息并且数据压缩效率降低。然而,通过使用视频编码设备100,由于在考虑图像的尺寸的同时增加编码单元的最大尺寸,同时在考虑图像的特征的同时调整编码单元,因此图像压缩效率会增加。
[0081]图2是根据本发明的实施例的视频解码设备200的框图。
[0082]视频解码设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。用于视频解码设备200的各种操作的各种术语(诸如,编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与以上参照图1和视频编码设备100描述的那些定义一致。
[0083]接收器210接收编码视频的比特流以对语法元素进行解析。图像数据和编码信息提取器220通过对解析的语法元素执行熵解码来基于具有结构的编码单元提取指示编码图像数据的语法元素,并且将提取的语法元素输出到图像数据解码器230。也就是说,图像数据和编码信息提取器220执行以O和I的比特串的形式接收的语法元素的熵解码,从而恢复语法元素。
[0084]另外,图像数据和编码信息提取器220从解析的比特流针对根据每个最大编码单元的具有树结构的编码单元提取关于编码深度的信息、编码模式、颜色分量信息、预测模式信息等。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。比特流中的图像数据被划分为最大编码单元,从而图像数据解码器230可针对每个最大编码单元对图像数据进行解码。
[0085]可针对关于与编码深度相应的至少一个编码单元的信息来设置关于根据最大编码单元的编码深度和编码模式的信息,并且关于编码模式的信息可包括关于以下内容的信息:与编码深度相应的相应编码单元的分区类型、预测模式以及变换单元的尺寸。另外,根据深度的划分信息可被提取为关于编码深度的信息。
[0086]由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于这样的编码深度和编码模式的信息:所述编码深度和编码模式被确定用于当编码器(诸如,视频编码设备100)根据每个最大编码单元针对根据深度的每个较深层编码单元重复执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
[0087]由于关于编码深度和编码模式的编码信息可被分配给相应编码单元、预测单元以及最小单元中的预定数据单元,因此,图像数据和编码信息提取器220可根据预定数据单元提取关于编码深度和编码模式的信息。当关于相应的最大编码单元的编码深度和编码模式的信息被分配到每个预定数据单元时,被分配相同的关于编码深度和编码模式的信息的预定数据单元可被推断为包括在相同的最大编码单元中的数据单元。
[0088]图像数据解码器230通过基于关于根据最大编码单元的编码深度和编码模式的信息对每个最大编码单元中的图像数据进行解码来恢复当前画面。换句话说,图像数据解码器230可基于提取的关于包括在每个最大编码单元中的具有树结构的编码单元中的每个编码单元的分区类型、预测模式和变换单元的信息来对编码图像数据进行解码。解码处理可包括预测(所述预测包括帧内预测和运动补偿)和反变换。
[0089]图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类
型以及预测模式的信息,根据每个编码单元的分区和预测模式来执行帧内预测或运动补m
\-ΖΧ ο
[0090]另外,图像数据解码器230可基于关于根据编码深度的编码单元的变换单元的尺寸的信息,根据编码单元中的每个变换单元执行反变换,以便根据最大编码单元执行反变换。
[0091]图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深度。因此,图像数据解码器230可通过使用关于预测单元的分区类型、预测模式以及变换单元的尺寸的信息,来针对当前最大编码单元的图像数据对当前深度的编码单元进行解码。
[0092]换句话说,可通过观察针对编码单元、预测单元和最小单元之中的预定数据单元分配的编码信息集,来聚集包含包括相同划分信息的编码信息的数据单元,收集的数据单元可被认为是将由图像数据解码器230以相同的编码模式进行解码的一个数据单元。
[0093]视频解码设备200可获得关于当针对每个最大编码单元递归执行编码时产生最小编码误差的至少一个编码单元的信息,并可使用所述信息来对当前画面进行解码。换句话说,可对每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元的编码图像数据进行解码。
[0094]因此,即使图像数据具有高分辨率和大数据量,也可通过使用从编码器接收的关于最佳编码模式的信息,通过使用根据图像数据的特性自适应地确定的编码单元的尺寸和编码模式来有效地对图像数据进行解码和恢复。
[0095]现将参照图3至图13描述根据本发明的实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。
[0096]图3是用于描述根据本发明的实施例的分层编码单元的概念的示图。
[0097]编码单元的尺寸可按照宽度X高度来表示,并可以是64X64、32X32、16X16和8X8。64X64的编码单元可被划分为64 X 64、64 X 32、32 X 64或32 X 32的分区,32 X 32的编码单元可被划分为32X32、32X16、16X32或16X16的分区,16X16的编码单元可被划分为16X16、16X8、8X16或8X8的分区,8X8的编码单元可被划分为8X8、8X4、4X8或4X4的分区。
[0098]关于视频数据310,设置分辨率是1920 X 1080,编码单元的最大尺寸是64,并且最大深度是2。关于视频数据320,设置分辨率是1920X1080,编码单元的最大尺寸是64,并且最大深度是3。关于视频数据330,设置分辨率是352 X 288,编码单元的最大尺寸是16,并且最大深度是I。图3中示出的最大深度表示从最大编码单元到最小编码单元的划分总数。
[0099]如果分辨率高或者数据量大,则编码单元的最大尺寸可以较大以便不仅提高编码效率还准确地反映图像的特性。因此,分辨率比视频数据330更高的视频数据310和视频数据320的编码单元的最大尺寸可以是64。
[0100]由于视频数据310的最大深度是2,因此由于通过划分最大编码单元两次深度被加深到两层,视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此由于通过划分最大编码单元一次深度被加深到一层,视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元以及长轴尺寸为8的编码单元。
[0101]由于视频数据320的最大深度是3,因此由于通过划分最大编码单元三次深度被加深到3层,视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32、16和8的编码单元。随着深度的加深,可精确地表示详细的信息。
[0102]图4是根据本发明的实施例的基于编码单元的视频编码器400的框图。
[0103]视频编码器400包括在视频编码设备100的编码单元确定器120中执行的操作以对图像数据进行编码。也就是说,帧内预测器410针对当前帧405,在帧内模式下对编码单元执行帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495在帧间模式下对编码单元分别执行帧间估计和运动补偿。
[0104]从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化的变换系数。量化的变换系数通过反量化器460和反变换器470被恢复为空间域中的数据,并且恢复的空间域中的数据在通过去块单元480和环路滤波单兀490被后处理之后被输出为参考巾贞495。量化的变换系数可通过熵编码器450被输出为比特流455。
[0105]为了使视频编码器400被应用到视频编码设备100中,视频编码器400的所有元件(即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、反变换器470、去块单元480和环路滤波单元490)不得不在考虑每个最大编码单元的最大深度的同时,基于具有树结构的多个编码单元中的每个编码单元执行操作。
[0106]具体地讲,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时,确定具有树结构的多个编码单元中的每个编码单元的分区和预测模式,并且变换器430确定具有树结构的多个编码单元的每个编码单元中的变换单元的尺寸。[0107]图5是根据本发明的实施例的基于编码单元的视频解码器500的框图。
[0108]解析器510从比特流505解析将被解码的编码图像数据以及解码所需的关于编码的信息。编码的图像数据通过解码器520和反量化器530被输出为反量化的数据。反变换器540将反量化的数据恢复为空间域中的图像数据。帧内预测器550针对空间域中的图像数据在帧内模式下对编码单元执行帧内预测,运动补偿器560通过使用参考帧585在帧间模式下对编码单元执行运动补偿。
[0109]经过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580被后处理之后被输出为恢复的帧595。另外,经过去块单元570和环路滤波单元580被后处理的图像数据可被输出为参考帧585。
[0110]为了使视频解码器500被应用到视频解码设备200中,图像解码器500的所有元件(即,解析器510、熵解码器520、反量化器530、反变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)基于每个最大编码单元的具有树结构的编码单元执行操作。
[0111]帧内预测器550和运动补偿器560针对每个具有树结构的编码单元确定分区和预测模式,并且反变换器540必须针对每个编码单元确定变换单元的尺寸。
[0112]图6是示出根据本发明的实施例的根据深度的较深层编码单元和分区的示图。
[0113]视频编码设备100和视频解码设备200使用分层的编码单元以考虑图像的特性。编码单元的最大高度、最大宽度和最大深度可根据图像的特性被自适应地确定,或者可由用户不同地设置。根据深度的较深层编码单元的尺寸可根据编码单元的预定最大尺寸被确定。
[0114]在根据本发明的实施例的编码单元的分层结构600中,编码单元的最大高度和最大宽度都是64,并且最大深度是4。由于深度沿着分层结构600的纵轴加深,因此较深层编码单元的高度和宽度都被划分。另外,作为用于每个较深层编码单元的预测编码的基础的预测单元和分区沿分层结构600的横轴被显示。
[0115]换句话说,编码单元610是分层结构600中的最大编码单元,其中,深度是0,尺寸(即,高度乘宽度)是64X64。深度沿纵轴加深,并且存在尺寸为32X32且深度为I的编码单元620、尺寸为16X16且深度为2的编码单元630、尺寸为8X8且深度为3的编码单元640以及尺寸为4X4且深度为4的编码单元650。尺寸为4X4且深度为4的编码单元650是最小编码单元。
[0116]编码单元的预测单元和分区根据每个深度沿横轴排列。换句话说,如果尺寸为64X64且深度为O的编码单元610是预测单元,则该预测单元可被划分为包括在编码器610中的分区(即,尺寸为64X64的分区610、尺寸为64X32的分区612、尺寸为32X64的分区614、或者尺寸为32X32的分区616)。
[0117]类似地,尺寸为32X32且深度为I的编码单元620的预测单元可被划分为包括在编码单元620中的分区(即,尺寸为32X32的分区620、尺寸为32X16的分区622、尺寸为16X32的分区624以及尺寸为16X16的分区626)。
[0118]类似地,尺寸为16 X 16且深度为2的编码单元630的预测单元可被划分为包括在编码单元630中的分区(即,包括在编码单元630中的尺寸为16X16的分区、尺寸为16X8的分区632、尺寸为8X16的分区634以及尺寸为8X8的分区636)。[0119]类似地,尺寸为8X8且深度为3的编码单元640的预测单元可被划分为包括在编码单元640中的分区(即,包括在编码单元640中的尺寸为8X8的分区、尺寸为8X4的分区642、尺寸为4X8的分区644以及尺寸为4X4的分区646)。
[0120]尺寸为4X4且深度为4的编码单元650是最小编码单元以及最低深度的编码单元。编码单元650的预测单元仅被分配给尺寸为4X4的分区。
[0121]为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。
[0122]随着深度加深,包括相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如,需要四个与深度2相应的编码单元以覆盖包括在一个与深度I相应的编码单元中的数据。因此,为了根据深度对相同数据的多个编码结果进行比较,与深度I相应的编码单元以及与深度2相应的四个编码单元都被编码。
[0123]为了针对多个深度中的当前深度执行编码,通过沿分层结构600的横轴,对与当前深度相应的多个编码单元中的每个预测单元执行编码来针对当前深度选择最小编码误差。可选择地,随着深度沿分层结构600的纵轴加深,可通过根据深度比较最小编码误差并针对每个深度执行编码,从而搜索最小编码误差。在最大编码单元610中的具有最小编码误差的深度和分区可被选为最大编码单元610的编码深度和分区类型。
[0124]图7是用于描述根据本发明的实施例的编码单元710和变换单元720之间的关系的示图。
[0125]视频编码设备100或视频解码设备200针对每个最大编码单元根据尺寸小于或等于最大编码单元的编码单元来对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择在编码期间用于变换的变换单元的尺寸。
[0126]例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是64X64,则可通过使用尺寸为32X32的变换单元720来执行变换。
[0127]另外,可通过对小于64X64的尺寸为32X32、16X 16、8X8和4X4的每个变换单元执行变换,来对尺寸为64X64的编码单元710的数据进行编码,并且随后可选择具有最小编码误差的变换单元。
[0128]图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
[0129]视频编码设备100的输出单元130可对关于分区类型的信息800、关于预测模式的信息810以及关于与编码深度相应的每个编码单元的变换单元的尺寸的信息820进行编码和发送,作为关于编码模式的信息。
[0130]信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,尺寸为2NX2N的当前编码单元CU_0可被划分为如下分区中的任何一个:尺寸为2NX2N的分区802、尺寸为2NXN的分区804、尺寸为NX 2N的分区806以及尺寸为NXN的分区808。这里,关于分区类型的信息800被设置为指示尺寸为2NX2N的分区802、尺寸为2NXN的分区804、尺寸为NX 2N的分区806以及尺寸为NXN的分区808中的一个。
[0131]信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的分区执行的预测编码的模式(即,帧内模式812、帧间模式814或跳过模式816)。
[0132]信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间变换单元828。
[0133]视频解码设备200的图像数据和编码信息提取器210可根据每个较深层编码单元来提取并使用用于解码的关于编码单元的信息800、关于预测模式的信息810和关于变换单元的尺寸的信息820。
[0134]图9是根据本发明的实施例的根据深度的较深层编码单元的示图。
[0135]划分信息可用于指示深度的改变。划分信息指示当前深度的编码单元是否被划分为更低深度的编码单元。
[0136]用于对深度为O且尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元910可包括如下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的分区类型914、尺寸为N_0 X 2N_0的分区类型916以及尺寸为Ν_0 ΧΝ_0的分区类型918。图9仅示出通过对预测单元910进行对称划分而获得的分区类型912至918,但是分区类型不限于此,并且预测单元910的分区可包括不对称分区、具有预定形状的分区以及具有几何形状的分区。
[0137]根据每个分区类型对如下分区重复地执行预测编码:尺寸为2N_0X2N_0的一个分区、尺寸为2N_0XN_0的两个分区、尺寸为N_0X2N_0的两个分区以及尺寸为Ν_0ΧΝ_0的四个分区。可对尺寸为2N_0X2N_0、N_0X2N_0、2N_0XN_0以及Ν_0ΧΝ_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0X2N_0的分区执行跳过模式下的预测编码。
[0138]如果在尺寸为2N_0X2N_0、2N_0XN_0和N_0X2N_0的分区类型912至916之一中的编码误差最小,则预测单元910可不被划分为更低深度。
[0139]如果在尺寸为N_0 X N_0的分区类型918中的编码误差最小,则在操作920,深度从O改变为I以划分分区类型918,并且对深度为2且尺寸为Ν_0ΧΝ_0的分区类型的编码单元重复地执行编码以搜索最小编码误差。
[0140]用于对深度为I且尺寸为2Ν_1Χ2Ν_1 (=Ν_0ΧΝ_0)的(分区类型的)编码单元930进行预测编码的预测单元940可包括如下分区类型的分区:尺寸为2N_1X2N_1的分区类型942、尺寸为2N_1XN_1的分区类型944、尺寸为N_1 X2N_1的分区类型946以及尺寸为N_1XN_1的分区类型948。
[0141]如果在尺寸为N_1XN_1的分区类型948中编码误差最小,则在操作950,深度从I改变为2以划分分区类型948,并且对深度为2且尺寸为N_2XN_2的编码单元960重复地执行编码以搜索最小编码误差。
[0142]当最大深度是d时,根据每个深度的划分操作可被执行直到深度变为d-Ι,并且划分信息可被编码直到深度是O至d-2之一。换句话说,当执行编码直到在操作970与深度d-2相应的编码单元被划分之后深度是d-Ι时,用于对深度为d-Ι且尺寸为2N_(d-l) X2N_(d-1)的编码单元980进行预测编码的预测单元990可包括如下分区类型的分区:尺寸为2N_(d-l) X2N_(d-l)的分区类型992、尺寸为2N_(d-l) XN_(d-l)的分区类型994、尺寸为N_(d-1) X2N_(d-l)的分区类型996以及尺寸为N_(d_l) XN_(d_l)的分区类型998。[0143]可对分区类型992至998中的如下分区重复地执行预测编码以搜索具有最小编码误差的分区类型:尺寸为2N_(d-l) X2N_(d-l)的一个分区、尺寸为2N_(d-l) XN_(d_l)的两个分区、尺寸SN_(d-l) X2N_(d-l)的两个分区、尺寸为N_(d_l) XN_(d_l)的四个分区。
[0144]即使在尺寸为N_(d-1) XN_(d-l)的分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-Ι的编码单元CU_(d-l)不再被划分到更低深度,并且构成当前最大编码单元900的编码单元的编码深度被确定为d-Ι并且当前最大编码单元900的分区类型可被确定为N_(d_l) XN_(d-l)。另外,由于最大深度是d,因此最小编码单兀980的划分/[目息不被设置。
[0145]数据单元999可以是当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分为4份而获得的矩形数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的多个深度的多个编码误差来选择具有最小编码误差的深度以确定编码深度,并且将相应分区类型以及预测模式设置为编码深度的编码模式。
[0146]这样,根据深度的最小编码误差在所有的深度I至d中被比较,并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型以及预测模式可被编码并作为关于编码模式的信息被发送。另外,由于编码单元从深度O被划分到编码深度,因此仅该编码深度的划分信息被设置0,除了编码深度之外的深度的划分信息被设置为I。
[0147]视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度以及预测单元的信息以对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息来将划分信息是O的深度确定为编码深度,并且使用关于相应深度的编码模式的信息用于解码。
[0148]图10至图12是用于描述根据本发明的实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。
[0149]编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010的预测单元的分区,变换单元1070是每个编码单元1010的变换单元。
[0150]当在编码单元1010中最大编码单元的深度是O时,编码单元1012和1054的深度是 1,编码单元 1014、1016、1018、1028、1050 和 1052 的深度是 2,编码单元 1020、1022、1024、1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
[0151]在预测单元1060 中,一些编码单元 1014、1016、1022、1032、1048、1050、1052 和1054通过划分编码单元而获得。换句话说,编码单元1014、1022、1050和1054中的分区类型的尺寸为2NXN,编码单元1016、1048和1052中的分区类型的尺寸为NX 2N,编码单元1032的分区类型的尺寸为NXN。编码单元1010的预测单元和分区小于或等于每个编码单
J Li ο
[0152]以小于编码单元1052的数据单元对变换单元1070中的编码单元1052的图像数据执行变换或反变换。另外,变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052和1054在尺寸和形状上与预测单元1060中的编码单元1014、1016、1022、1032、1048、1050、1052和1054不同。换句话说,视频编码设备100和视频解码设备200可对相同编码单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和反变换。[0153]因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码,以确定最佳编码单元,因此可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息以及关于变换单元的尺寸的信息。
[0154]表1显示可由视频编码设备100和视频解码设备200设置的编码信息。
[0155]表1
[0156]
【权利要求】
1.一种对运动信息进行编码的方法,所述方法包括: 通过对当前预测单元执行运动预测来获得关于当前预测单元的运动信息; 通过使用与当前预测单元时间或空间相关的预测单元的运动信息来获得运动信息候选; 当包括在运动信息候选中的运动信息的数量小于预定数量η时,将可选择的运动信息添加到运动信息候选,从而包括在运动信息候选中的运动信息的数量达到预定数量η,其中,η是整数; 从η个运动信息候选中确定关于当前预测单元的运动信息; 将指示所述运动信息的索引信息编码为当前预测单元的运动信息。
2.如权利要求1所述的方法,其中,与当前预测单元空间相关的周边预测单元包括:位于当前预测单元的左下侧的周边预测单元(Α0)、位于所述位于左下侧的周边预测单元(AO)的上侧的周边预测单元(Al)、位于当前预测单元的右上侧的周边预测单元(Β0)、位于所述位于右上侧的周边预测单元(BO)的左侧的周边预测单元(BI)、以及位于当前预测单元的左上侧的周边预测单元(Β2)。
3.如权利要求1所述的方法,其中,所述可选择的运动信息包括具有预设分量值的预定运动矢量。
4.如权利要求1所述的方法,其中,通过修改时间相关的预测单元或空间相关的预测单元的运动信息来产生所述可选择的运动信息。
5.如权利要求1所述的方法,其中,所述可选择的运动信息包括通过对时间相关的预测单元或空间相关的预测单元的运动矢量进行缩放而获得的运动矢量。
6.如权利要求1所述的方法,其中,编码的步骤包括: 将从O到(η-1)的索引分配给η个运动信息候选中的每个运动信息候选; 将分配给用作当前预测单元的运动信息的运动信息的索引编码为当前预测单元的运动信息。
7.如权利要求1所述的方法,其中,作为包括在运动信息候选中的运动信息的数量的η被添加到序列参数集(SPS)、画面参数集(PPS)和条带头中的至少一个。
8.—种对运动信息进行解码的方法,所述方法包括: 通过使用与当前预测单元时间相关的预测单元的运动信息和与当前预测单元空间相关的预测单元的运动信息,来获得运动信息候选; 当包括在运动信息候选中的运动信息的数量小于预定数量η时,将可选择的运动信息添加到运动信息候选,从而包括在运动信息候选中的运动信息的数量达到数量η,其中,η是整数; 从比特流获得指示包括在运动信息候选中的η个运动信息之中的一个运动信息的索引 ; 通过使用由获得的索引指示的运动信息来获得当前预测单元的运动信息。
9.如权利要求8所述的方法,其中,与当前预测单元空间相关的周边预测单元包括:位于当前预测单元的左下侧的周边预测单元(Α0)、位于所述位于左下侧的周边预测单元(AO)的上侧的周边预测单元(Al)、位于当前预测单元的右上侧的周边预测单元(Β0)、位于所述位于右上侧的周边预测单元(BO)的左侧的周边预测单元(BI)、以及位于当前预测单元的左上侧的周边预测单元(B2)。
10.如权利要求8所述的方法,其中,所述可选择的运动信息包括具有预设分量值的预定运动矢量。
11.如权利要求8所述的方法,其中,通过修改时间相关的预测单元或空间相关的预测单元的运动信息来产生所述可选择的运动信息。
12.如权利要求8所述的方法,其中,所述可选择的运动信息包括通过对时间相关的预测单元或空间相关的预测单元的运动矢量进行缩放而获得的运动矢量。
13.如权利要求8所述的方法,其中,获得当前预测单元的运动信息的步骤包括:通过使用分配给包括在运动信息候选中的η个运动信息中的每个运动信息的从O到(η-1)的索引以及当前预测单元的运动信息的索引,从包括在运动信息候选中的η个运动信息获得当前预测单元的运动信息。
14.如权利要求8所述的方法,其中,作为包括在运动信息候选中的运动信息的数量的η被添加到序列参数集(SPS)、画面参数集(PPS)和条带头中的至少一个。
15.一种用于对运动信息进行解码的设备,包括: 运动信息候选产生器,用于通过使用与当前预测单元时间相关的预测单元的运动信息以及与当前预测单元空间相关的预测单元的运动信息来获得运动信息候选,当包括在运动信息候选中的运动信息的数量小于预定数量η (η是整数)时,将可选择的运动信息添加到运动信息候选,从而包括在运动信息候选中的运动信息的数量达到预定数量η ; 熵解码器,用于从比特流获得指示包括在运动信息候选中的η个运动信息之中的一个运动信息的索引; 运动信息解码器,用于通过使用由获得的索引指示的运动信息来获得当前预测单元的运动信息。
【文档编号】H04N19/56GK103733625SQ201280039807
【公开日】2014年4月16日 申请日期:2012年6月14日 优先权日:2011年6月14日
【发明者】李泰美, 陈建乐 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1