基于树结构的编码单元对可伸缩视频进行编码的方法和装置以及基于树结构的编码单元...的制作方法

文档序号:7793170阅读:397来源:国知局
基于树结构的编码单元对可伸缩视频进行编码的方法和装置以及基于树结构的编码单元 ...的制作方法
【专利摘要】提供了基于具有树结构的编码单元的可伸缩视频编码和解码。可伸缩视频编码方法包括:基于具有树结构的编码单元对下层图像进行编码,其中,具有树结构的编码单元包括图像的最大编码单元的分层划分的编码单元之中的被完全划分后的编码单元;确定可伸缩编码模式,其中,可伸缩编码模式用于通过参考下层图像基于具有树结构的编码单元对上层图像执行可伸缩编码;基于确定的可伸缩编码模式,通过参考下层图像的编码信息来对上层图像进行预测和编码;基于确定的可伸缩编码模式,输出下层图像的编码模式和预测值以及确定的上层图像的可伸缩编码模式,其中,在视频的图像的空间划分的最大编码单元中,每个最大编码单元被划分为多个编码单元,每个编码单元与邻近编码单元独立地被确定为划分为更小编码单元。
【专利说明】基于树结构的编码单元对可伸缩视频进行编码的方法和装 置以及基于树结构的编码单元对可伸缩视频进行解码的方 法和装置

【技术领域】
[0001] 本发明涉及视频编码和解码。

【背景技术】
[0002] 随着用于再现和存储高分辨率或高质量视频内容的硬件的开发和提供,对于用于 有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。在 传统的视频编解码器中,基于具有预定尺寸的宏块,根据受限的编码方法来对视频进行编 码。
[0003] 通过使用频率变换将空间域的图像数据变换为频率域的系数。视频编解码器将图 像划分为预定尺寸的块,对每个块执行离散余弦变换(DCT),并对块单元的频率系数进行编 码,以促进频率变换的快速算术运算。与空间域的图像数据的系数相比,频率域的系数容易 被压缩。具体地,空间域的图像像素值被表示为通过视频编解码器的帧间预测或帧内预测 的预测误差,因此如果对预测误差执行频率变换,则大量数据可被变换为〇。视频编解码器 可将连续并重复产生的数据替换为小量数据,从而减少整体数据量。


【发明内容】

[0004] 技术问题
[0005] 本发明提供一种可伸缩视频编码方法和可伸缩视频解码方法,具体地说,一种使 用具有树结构的编码单元的可伸缩视频编码方法和可伸缩视频解码方法。
[0006] 技术方案
[0007] 根据本发明的一方面,提供了一种可伸缩视频编码方法,包括:基于具有树结构的 编码单元对下层图像进行编码,其中,具有树结构的编码单元包括图像的最大编码单元的 分层划分的编码单元之中的被完全划分后的编码单元;确定可伸缩编码模式,其中,可伸缩 编码模式用于通过参考下层图像基于具有树结构的编码单元对上层图像执行可伸缩编码; 基于确定的可伸缩编码模式,通过参考下层图像的编码信息来对上层图像进行预测和编 码;基于确定的可伸缩编码模式,输出下层图像的编码模式和预测值以及确定的上层图像 的可伸缩编码模式。在视频的图像的空间划分的最大编码单元中,每个最大编码单元被划 分为多个编码单元,每个编码单元与邻近编码单元独立地被确定为划分为更小编码单元。
[0008] 有益效果
[0009] 在使用具有树结构的编码单元、所述编码单元中的预测单元和变换单元被编码的 下层图像和上层图像之间,精确地检测彼此相应的下层数据单元和上层数据单元,并且使 用下层数据单元和不同的编码信息确定上层数据单元,从而降低了上层图像的编码信息的 传输比特率,并有效地实现可伸缩视频编码和解码方法。

【专利附图】

【附图说明】
[0010] 图1是根据本发明的实施例的基于具有树结构的编码单元的对视频进行编码的 设备的框图;
[0011] 图2是根据本发明的实施例的基于具有树结构的编码单元对视频进行解码的设 备的框图;
[0012] 图3是用于描述根据本发明的实施例的编码单元的概念的示图;
[0013] 图4是根据本发明的实施例的基于编码单元的图像编码器的框图;
[0014] 图5是根据本发明的实施例的基于编码单元的图像解码器的框图;
[0015] 图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图;
[0016] 图7是用于描述根据本发明的实施例的编码单元与变换单元之间的关系的示图;
[0017] 图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息 的示图;
[0018] 图9是根据本发明的实施例的根据深度的较深层编码单元的示图;
[0019] 图10至图12是用于描述根据本发明的实施例的编码单元、预测单元和变换单元 之间的关系的不图;
[0020] 图13是用于描述根据表0的编码模式信息的编码单元、预测单元或分区、和变换 单元之间的关系的示图;
[0021] 图14是根据本发明的实施例的可伸缩视频编码设备的框图;
[0022] 图15是根据本发明的实施例的可伸缩视频解码设备的框图;
[0023] 图16是根据本发明的实施例的可伸缩视频编码系统的框图;
[0024] 图17是用于解释根据本发明的实施例的层间(inter-layer)预测方法的示图;
[0025] 图18是用于解释根据本发明的实施例的下层和上层之间的映射关系的示图;
[0026] 图19是根据本发明的实施例的可伸缩视频编码方法的流程图;
[0027] 图20是根据本发明的实施例的可伸缩视频解码方法的流程图;
[0028] 图21是根据本发明的另一实施例的可伸缩视频编码方法的流程图;
[0029] 图22是根据本发明的另一实施例的可伸缩视频解码方法的流程图。
[0030] 最佳模式
[0031] 根据本发明的一方面,提供了一种可伸缩视频编码方法,包括:基于具有树结构的 编码单元对下层图像进行编码,其中,具有树结构的编码单元包括图像的最大编码单元的 分层划分的编码单元之中的被完全划分后的编码单元;确定可伸缩编码模式,其中,可伸缩 编码模式用于通过参考下层图像基于具有树结构的编码单元对上层图像执行可伸缩编码; 基于确定的可伸缩编码模式,通过参考下层图像的编码信息来对上层图像进行预测和编 码;基于确定的可伸缩编码模式,输出下层图像的编码模式和预测值以及确定的上层图像 的可伸缩编码模式。在视频的图像的空间划分的最大编码单元中,每个最大编码单元被划 分为多个编码单元,每个编码单元与邻近编码单元独立地被确定为划分为更小编码单元。
[0032] 根据本发明的另一方面,提供了一种可伸缩视频编码方法,包括:基于具有树结构 的编码单元对下层图像进行编码,其中,具有树结构的编码单元包括图像的最大编码单元 的分层划分的编码单元之中的被完全划分后的编码单元;确定可伸缩编码模式,其中,可伸 缩编码模式用于通过参考下层图像基于具有树结构的编码单元对上层图像执行可伸缩编 码;基于确定的可伸缩编码模式,确定将被上层图像的数据单元参考的下层图像的数据单 元;通过参考确定的下层图像的数据单元的编码信息来对上层图像进行预测和编码。
[0033] 根据本发明的另一方面,提供了一种可伸缩视频解码方法,包括:从接收到的比特 流解析下层图像的编码信息和上层图像的可伸缩编码模式;通过使用解析出的下层图像的 编码信息,基于具有树结构的编码单元对下层图像进行解码,其中,具有树结构的编码单元 包括最大编码单元的分层划分的编码单元之中的被完全划分后的编码单元;根据上层图像 的可伸缩编码模式,通过参考下层图像的编码信息,基于具有树结构的编码单元来对上层 图像进行预测和解码。
[0034] 根据本发明的另一方面,提供了一种可伸缩视频解码方法,包括:使用从接收到 的比特流解析出的下层图像的编码信息,通过使用解析出的下层图像的编码信息基于具有 树结构的编码单元对下层图像进行解码,其中,具有树结构的编码单元包括最大编码单元 的分层划分的编码单元之中的被完全划分后的编码单元;根据从比特流解析出的上层图像 的可伸缩编码模式,确定将被上层图像的数据单元参考的下层图像的数据单元,并且通过 参考确定的下层图像的编码信息,基于具有树结构的编码单元来对上层图像进行预测和解 码。
[0035] 根据本发明的另一方面,提供了一种可伸缩视频编码设备,包括:下层编码器,基 于具有树结构的编码单元对下层图像进行编码,其中,具有树结构的编码单元包括图像的 最大编码单元的分层划分的编码单元之中的被完全划分后的编码单元;上层编码器,确定 可伸缩编码模式,并且基于确定的可伸缩编码模式,通过参考下层图像的编码信息来对上 层图像进行预测和编码,其中,可伸缩编码模式用于通过参考下层图像基于具有树结构的 编码单元对上层图像执行可伸缩编码;输出单元,基于确定的可伸缩编码模式,输出下层图 像的编码模式和预测值以及确定的上层图像的可伸缩编码模式。
[0036] 根据本发明的另一方面,提供了一种可伸缩视频编码设备,包括:解析单元,从接 收到的比特流解析下层图像的编码信息和上层图像的可伸缩编码模式;下层解码器,通过 使用解析出的下层图像的编码信息,基于具有树结构的编码单元对下层图像进行解码,其 中,具有树结构的编码单元包括最大编码单元的分层划分的编码单元之中的被完全划分后 的编码单元;上层解码器,根据上层图像的可伸缩编码模式,通过参考下层图像的编码信 息,基于具有树结构的编码单元来对上层图像进行预测和解码。
[0037] 根据本发明的另一方面,提供了一种可伸缩视频解码设备,包括:解析单元,从接 收到的比特流解析下层图像的编码信息和上层图像的可伸缩编码模式;下层解码器,通过 使用解析出的下层图像的编码信息,基于具有树结构的编码单元对下层图像进行解码,其 中,具有树结构的编码单元包括最大编码单元的分层划分的编码单元之中的被完全划分后 的编码单元;上层解码器,根据上层图像的可伸缩编码模式,通过参考下层图像的编码信 息,基于具有树结构的编码单元来对上层图像进行预测和解码。
[0038] 根据本发明的另一方面,提供了一种可伸缩视频解码设备,包括:下层解码器,使 用从接收到的比特流解析出的下层图像的编码信息,通过使用解析出的下层图像的编码信 息基于具有树结构的编码单元对下层图像进行解码,其中,具有树结构的编码单元包括最 大编码单元的分层划分的编码单元之中的被完全划分后的编码单元;上层解码器,根据从 比特流解析出的确定的上层图像的可伸缩编码模式,确定将被上层图像的数据单元参考的 下层图像的数据单元,并且通过参考确定的下层图像的数据单元的编码信息,基于具有树 结构的编码单元对上层图像进行预测和解码。
[0039] 根据本发明的另一方面,提供了一种计算机可读记录介质,其中,所述计算机可读 记录介质记录有用于执行可伸缩视频编码方法的程序。根据本发明的另一方面,提供了一 种计算机可读记录介质,其中,所述计算机可读记录介质记录有用于执行可伸缩视频解码 方法的程序。

【具体实施方式】
[0040] 以下,将参照图1至图13描述根据本发明的实施例的基于具有树结构的编码单元 对视频进行编码和解码的方法。随后,将参照图14至图22描述根据本发明的实施例的基 于具有树结构的编码单元对可伸缩视频进行编码和解码的方法。
[0041] 现在将参照图1至图13描述根据本发明的实施例的基于具有树结构的编码单元 对视频进行编码和解码的方法。
[0042] 图1是根据本发明的实施例的基于根据树结构的编码单元的视频编码设备100的 框图。
[0043] 视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元 130。
[0044] 最大编码单元划分器110可基于图像的当前画面的最大编码单元,来对当前画 面进行划分。如果当前画面大于最大编码单元,则可将当前画面的图像数据划分为至少 一个最大编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32X32、64X64、 128X128、256X256等的数据单元,其中,数据单元的形状是宽度和长度为2的若干次方的 正方形。图像数据可根据至少一个最大编码单元被输出到编码单元确定器120。
[0045] 根据本发明的实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从 最大编码单元被空间划分的次数,并且随着深度加深,根据深度的较深层编码单元可从最 大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元的深 度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺寸减 小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
[0046] 如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单 元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根 据本发明的实施例的最大编码单元进行划分,因此可根据深度对包括在最大编码单元中的 空间域的图像数据进行分层地分类。
[0047] 可预先确定编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限制对最 大编码单元的高度和宽度进行分层划分的总次数。
[0048] 编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的 至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的 图像数据的深度。换句话说,编码单元确定器120通过根据当前画面的最大编码单元以根 据深度的较深层编码单元对图像数据进行编码,选择具有最小编码误差的深度,来确定编 码深度。因此,最终输出与确定的编码深度相应的编码单元的编码图像数据。此外,与编码 深度相应的编码单元可被视为被编码的编码单元。
[0049] 确定的编码深度和根据确定的编码深度的被编码的图像数据被输出到输出单元 130。
[0050] 基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对最大编码 单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结 果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可 针对每个最大编码单元选择至少一个编码深度。
[0051] 随着编码单元根据深度而被分层地划分并且编码单元的数量增加,最大编码单元 的尺寸被划分。另外,即使在一个最大编码单元中编码单元与同一深度相应,也通过分别测 量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单元划 分为更低深度。因此,即使图像数据被包括在一个最大编码单元中,在一个最大编码单元中 图像数据被划分为根据深度的区域,并且编码误差可根据区域而不同,因此在图像数据中 编码深度可根据区域而不同。因此,可在一个最大编码单元中确定一个或更多个编码深度, 并且可根据至少一个编码深度的编码单元来对最大编码单元的图像数据进行划分。
[0052] 因此,编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单 元。根据本发明的实施例的"具有树结构的编码单元"包括在最大编码单元中包括的所有 较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相 同区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深 度的编码单元。类似地,可从另一区域中的编码深度独立地确定当前区域中的编码深度。
[0053] 根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元执行划分 的次数有关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编 码单元的总划分次数。根据本发明实施例的第二最大深度可表示从最大编码单元到最小编 码单元的深度等级的总数。例如,当最大编码单元的深度是0时,对最大编码单元划分一次 的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为 2。这里,如果最小编码单元是对最大编码单元划分四次的编码单元,则存在深度0、1、2、3 和4的5个深度等级,并因此第一最大深度和第二最大深度可分别被设置为4和5。
[0054] 可根据最大编码单元执行预测编码和变换。还根据最大编码单元,基于根据等于 或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
[0055] 由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因 此对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便 于描述,在最大编码单元中,现在将基于当前深度的编码单元来描述预测编码和变换。
[0056] 视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或 形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所 有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
[0057] 例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可 选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
[0058] 为了对最大编码单元执行预测编码,可基于与编码深度相应的编码单元(即,基 于不再被划分成与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再被 划分且成为用于预测编码的基本单元的编码单元现在将被称为"预测单元"。通过划分预测 单元获得的分区可包括预测单元或通过对预测单元的高度和宽度中的至少一个进行划分 而获得的数据单元。分区可以是通过对编码单元的预测单元进行划分而获得的数据单元, 预测单元可以是具有与编码单元的尺寸相同的尺寸的分区。
[0059] 例如,当2NX2N(其中,N是正整数)的编码单元不再被划分,并且成为2NX2N的 预测单元时,分区的尺寸可以是2NX2N、2NXN、NX2N或NXN。分区类型的示例包括通过 对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽 度进行非对称地划分(诸如,1 :n或n:l)而获得的分区、通过对预测单元进行几何地划分 而获得的分区、以及具有任意形状的分区。
[0060] 预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如, 可对2NX2N、2NXN、NX2N或NXN的分区执行帧内模式或帧间模式。另外,可仅对2NX2N 的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选择具有最 小编码误差的预测模式。
[0061] 视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与 编码单元不同的变换单元,来对编码单元中的图像数据执行变换。为了对编码单元执行变 换,可基于具有小于或等于编码单元的尺寸的数据单元,来执行变换。例如,用于变换的数 据单元可包括帧内模式的数据单元和帧间模式的数据单元。
[0062] 现将用作变换的基础的数据单元称为"变换单元"。可在变换单元中设置变换深 度,其中,变换深度指示对编码单元的高度和宽度进行划分以达到变换单元的划分次数。例 如,在2NX2N的当前编码单元中,当变换单元的尺寸也为2NX2N时,变换深度可以是0,当 当前编码单元的高度和宽度中的每一个被划分为两等份,总共被划分为4~1个变换单元, 因此变换单元的尺寸为NXN时,变换深度可以是1,当当前编码单元的高度和宽度中的每 一个被划分为四等份,总共被划分为4~2个变换单元,因此变换单元的尺寸为N/2XN/2时, 变换深度可以是2。例如,可根据分层树结构设置变换单元,在该分层树结构中,更高变换深 度的变换单元根据变换深度的分层特性被划分为四个更低变换深度的变换单元。
[0063] 与编码单元类似,编码单元中的变换单元可被递归地划分为更小尺寸的区域,使 得可以以区域为单位独立地确定变换单元。因此可基于根据变换深度的具有树结构的变 换,对编码单元中的残差数据进行划分。
[0064] 还可在变换单元中设置变换深度,其中,变换深度表示对编码单元的高度和宽度 进行划分以达到变换单元的划分次数。例如,在2NX2N的当前编码单元中,当变换单元的 尺寸为2NX2N时,变换深度可以是0,当变换单元的尺寸为NXN时,变换深度可以是1,当 变换单元的尺寸为N/2XN/2时,变换深度可以是2。换句话说,可根据变换深度设置具有树 结构的变换单元。
[0065] 根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息,还需 要关于与预测编码和变换相关的信息的信息。因此,编码单元确定器120不仅确定具有最 小编码误差的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式和用于 变换的变换单元的尺寸。
[0066] 稍后将参照图3至图13详细描述根据本发明的实施例的最大编码单元中的根据 树结构的编码单元,以及确定预测单元/分区和变换单元的方法。
[0067]编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化,来测量根据深 度的较深层编码单元的编码误差。
[0068] 输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的 编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的 至少一个编码深度被编码。
[0069] 可通过对图像的残差数据进行编码来获得编码图像数据。
[0070] 关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单 元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
[0071] 可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的 划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的 当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可定义划分 信息以不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是编 码深度,则对更低深度的编码单元执行编码,并因此可定义划分信息以对当前编码单元进 行划分来获得更低深度的编码单元。
[0072] 如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行 编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低 深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编 码。
[0073] 由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编 码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一 个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的图 像数据的编码深度可根据位置而不同,因此可针对图像数据设置关于编码深度和编码模式 的信息。
[0074] 因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括 在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
[0075] 根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分为4 份而获得的矩形数据单元。可选择地,最小单元可以是可包括在最大编码单元中所包括的 所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。
[0076] 例如,通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息和 根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分 区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧 间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以 及关于帧内模式的插值方法的信息。
[0077] 此外,根据画面、条带或画面组(G0P)定义的关于编码单元的最大尺寸的信息和 关于最大深度的信息可被插入到比特流的头、序列参数集(SPS)或画面参数集。
[0078] 可经由比特流的头、SPS或画面参数集输出当前视频允许的关于变换单元的最大 尺寸的信息和关于变换单元的最小尺寸的信息。
[0079] 在视频编码设备100中,较深层编码单元可以是通过将更高深度的编码单元(更 高一层)的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的 尺寸是2NX2N时,更低深度的编码单元的尺寸是NXN。另外,尺寸为2NX2N的当前深度的 编码单元可包括最多4个更低深度的编码单元。
[0080] 因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺 寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形 成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每 个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模 式。
[0081] 通常,如果以传统宏块对具有高分辨率或大数据量的图像进行编码,则每个画面 的宏块的数量极大地增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送 压缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备100,由于考虑图像的尺 寸,在增加编码单元的最大尺寸的同时,考虑图像的特征来调整编码单元和编码方法,因此 可提_图像压缩效率。
[0082] 图2根据本发明的实施例的基于具有树结构的编码单元的视频解码设备200的框 图。
[0083] 视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据 解码器230。用于视频解码设备200的各种操作的各种术语(诸如编码单元、深度、预测单 元、变换单元和关于各种编码模式的信息)的定义与参照图6和视频编码设备100描述的 定义相同。
[0084] 接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解 析的比特流,针对每个编码单元提取编码图像数据,并将提取的图像数据输出到图像数据 解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提 取器220可从关于当前画面的头、SPS或画面参数集提取关于当前画面的编码单元的最大 尺寸的信息。
[0085] 另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元, 提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编 码模式的信息被输出到图像数据解码器230。换言之,比特流中的图像数据被划分为最大编 码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
[0086] 可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码 单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相 应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外, 根据深度的划分信息可被提取为关于编码深度的信息。
[0087] 关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码深 度和编码模式的信息是关于这样的编码深度和编码模式的信息:所述编码深度和编码模式 在编码端(诸如,视频编码设备1〇〇)根据每个最大编码单元对根据深度的每个较深层编码 单元重复地执行编码时被确定为产生最小编码误差。因此,视频解码设备200可通过根据 产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
[0088] 由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元 和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单 元,提取关于编码深度和编码模式的信息。可将被分配了相同的关于编码深度和编码模式 的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
[0089] 图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息, 通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码 器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的 每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码 处理可包括预测(包含帧内预测和运动补偿)和逆变换。可根据逆正交变换或逆整数变换 的方法来执行逆变换。
[0090] 图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类 型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
[0091] 另外,为了根据最大编码单元执行逆变换,图像数据解码器230可基于关于根据 编码深度的编码单元的变换单元的尺寸的信息,根据该编码单元中的每个变换单元执行逆 变换。通过逆变换,可重建编码单元的空间域的像素值。
[0092] 图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元 的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度 是编码深度。因此,图像数据解码器230可通过使用关于与编码深度相应的每个编码单元 的预测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的与 每个编码深度相应的至少一个编码单元的编码数据进行解码,并输出当前最大编码单元的 图像数据。
[0093] 换言之,可通过观察分配给编码单元、预测单元和最小单元中的预定数据单元的 编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可 被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。以这样的方 式,可通过根据每个确定的编码单元获得关于编码模式的信息,来执行对当前编码单元的 解码。
[0094] 视频解码设备200可获得关于当针对每个最大编码单元递归地执行编码时产生 最小编码误差的至少一个编码单元的信息,并且可使用所述信息来对当前画面进行解码。 换言之,被确定为每个最大编码单元中的最优编码单元的具有树结构的编码单元可被解 码。
[0095] 因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元的尺寸、编 码模式、预测滤波器和预测滤波方法,对图像数据进行有效地解码和重建,其中,通过使用 从编码器接收到的关于最优编码模式的信息,根据图像数据的特征自适应地确定所述编码 单元的尺寸、编码模式、预测滤波器和预测滤波方法。
[0096] 图3是用于描述根据本发明的实施例的编码单元的概念的示图。
[0097] 编码单元的尺寸可被表示为宽度X高度,并可以是64X64、32X32、16X16和 8X8。64X64的编码单元可被划分为64X64、64X32、32X64或32X32的分区,32X32的 编码单元可被划分为32X32、32X16、16X32或16X16的分区,16X16的编码单元可被划 分为16父16、16\8、8\16或8\8的分区,8\8的编码单元可被划分为8\8、8\4、4父8或 4X4的分区。
[0098] 在视频数据310中,分辨率是1920X1080,编码单元的最大尺寸是64,最大深度是 2。在视频数据320中,分辨率是1920X1080,编码单元的最大尺寸是64,最大深度是3。在 视频数据330中,分辨率是352X288,编码单元的最大尺寸是16,最大深度是1。图3中示 出的最大深度表示从最大编码单元到最小解码单元的划分总次数。
[0099] 如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码 效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310 和320的编码单元的最大尺寸可以是64。
[0100] 由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度 加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长 轴尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此由于通过对 最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长轴尺 寸为16的最大编码单元和长轴尺寸为8的编码单元。
[0101] 由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度 加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长 轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
[0102] 图4是根据本发明的实施例的基于编码单元的图像编码器400的框图。
[0103] 图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数 据进行编码。换言之,帧内预测器410在帧内模式下对当前帧405中的编码单元执行帧内 预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,在帧间模式下 对当前帧405中的编码单元执行帧间预测和运动补偿。
[0104] 从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430 和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换 器470被重建为空间域中的数据,重建的空间域中的数据在通过去块单元480和样点自适 应偏移(SA0)调节器490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编 码器450被输出为比特流455。
[0105] 为了将图像编码器400应用到视频编码设备100中,图像编码器400的所有元件 (即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器 450、反量化器460、逆变换器470、去块单元480和SA0调节器490)在考虑每个最大编码单 元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元执行操作。
[0106] 具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码 单元的最大尺寸和最大深度的同时,确定具有树结构的编码单元中的每个编码单元的分区 和预测模式,变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺 寸。
[0107] 图5是根据本发明的实施例的基于编码单元的图像解码器500的框图。
[0108] 解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的 信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的 数据通过逆变换器540被重建为空间域中的图像数据。
[0109] 针对空间域中的图像数据,帧内预测器550在帧内模式下对编码单元执行帧内预 测,运动补偿器560通过使用参考帧585在帧间模式下对编码单元执行运动补偿。
[0110] 通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元 570和SA0调节器580后处理之后被输出为重建帧595。另外,通过去块单元570和SA0调 节器580后处理的图像数据可被输出为参考帧585。
[0111] 为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解 码器500可执行在解析器510执行操作之后执行的操作。
[0112] 为了将图像解码器500应用到视频解码设备200中,图像解码器500的所有元件 (即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器 560、去块单元570和SA0调节器580)针对每个最大编码单元,基于具有树结构的编码单元 执行操作。
[0113] 具体地,帧内预测器550和运动补偿器560基于具有树结构的每个编码单元的分 区和预测模式来执行操作,逆变换器540基于每个编码单元的变换单元的尺寸来执行操 作。
[0114] 图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
[0115] 视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可 根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不 同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来 确定根据深度的较深层编码单元的尺寸。
[0116] 在编码单元的分层结构600中,编码单元的最大高度和最大宽度均是64,最大深 度是3。这里,最大深度表示编码单元从最大编码单元被划分到最小编码单元的总次数。由 于沿着分层结构600的垂直轴深度加深,因此较深层编码单元的高度和宽度均被划分。另 夕卜,预测单元和分区沿着分层结构600的水平轴被示出,其中,所述预测单元和分区是对每 个较深层编码单元进行预测编码的基础。
[0117] 换言之,在分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸 (即,高度乘宽度)为64X64。随着深度沿着垂直轴加深,存在尺寸为32X32和深度为1 的编码单元620、尺寸为16X16和深度为2的编码单元630、尺寸为8X8和深度为3的编 码单元640。尺寸为8X8和深度为3的编码单元640是最小编码单元。
[0118] 编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸 为64X64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元 610中的分区,即,尺寸为64X64的分区610、尺寸为64X32的分区612、尺寸为32X64的 分区614或尺寸为32X32的分区616。
[0119] 类似地,可将尺寸为32X32和深度为1的编码单元620的预测单元划分成包括在 编码单元620中的分区,S卩,尺寸为32X32的分区620、尺寸为32X16的分区622、尺寸为 16X32的分区624和尺寸为16X16的分区626。
[0120] 类似地,可将尺寸为16X16和深度为2的编码单元630的预测单元划分成包括在 编码单元630中的分区,S卩,包括在编码单元630中的尺寸为16X16的分区、尺寸为16X8 的分区632、尺寸为8X16的分区634和尺寸为8X8的分区636。
[0121] 类似地,可将尺寸为8X8和深度为3的编码单元640的预测单元划分成包括在编 码单元640中的分区,S卩,包括在编码单元640中的尺寸为8X8的分区、尺寸为8X4的分 区642、尺寸为4X8的分区644和尺寸为4X4的分区646。
[0122] 最终,尺寸为8X8且深度为3的编码单元640是最小编码单元以及最低深度的编 码单元。
[0123] 为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备 100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执 行编码。
[0124] 随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单 元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一 个编码单元中的数据。因此,为了根据深度比较对相同数据的编码结果,与深度1相应的编 码单元和四个与深度2相应的编码单元均被编码。
[0125] 为了针对深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通过对 与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度选择最小编码误 差。可选地,随着深度沿着分层结构600的垂直轴加深,可通过针对每个深度执行编码,根 据深度比较最小编码误差,来搜索最小编码误差。在编码单元610中的具有最小编码误差 的深度和分区可被选为编码单元610的编码深度和分区类型。
[0126] 图7是用于描述根据本发明的实施例的在编码单元710和变换单元720之间的关 系的不图。
[0127] 视频编码设备100或视频解码设备200针对每个最大编码单元,根据具有小于或 等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应的编码 单元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
[0128] 例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是 64X64,则可通过使用尺寸为32X32的变换单元720来执行变换。
[0129] 此外,可通过对小于64X64的尺寸为32X32、16X16、8X8和4X4的每个变换单 元执行变换,来对尺寸为64X64的编码单元710的数据进行编码,然后可选择具有最小编 码误差的变换单元。
[0130] 图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息 的示图。
[0131] 视频编码设备100的分层符号编码器130可对与编码深度相应的每个编码单元的 关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行 编码,并将信息800、信息810和信息820作为关于编码模式的信息来发送。
[0132] 信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信 息,其中,所述分区是用于对当前编码单元进行预测编码的数据单元。例如,可将尺寸为 2NX2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2NX2N的分区802、尺 寸为2NXN的分区804、尺寸为NX2N的分区806以及尺寸为NXN的分区808。这里,关于 分区类型的信息800被设置来指示尺寸为2NXN的分区804、尺寸为NX2N的分区806以及 尺寸为NXN的分区808中的一个。
[0133] 信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的 分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
[0134] 信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元 可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧间 变换单元828。
[0135] 视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单 元,提取并使用用于解码的信息800、810和820。
[0136] 图9是根据本发明的实施例的根据深度的较深层编码单元的示图。
[0137] 划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分 成更低深度的编码单元。
[0138] 用于对深度为0和尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元 910可包括以下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的 分区类型914、尺寸为N_0X2N_0的分区类型916和尺寸为N_0XN_0的分区类型918。图 9仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限 于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状 的分区。
[0139] 根据每种分区类型,对尺寸为2N_0X2N_0的一个分区、尺寸为2N_0XN_0的两个 分区、尺寸为N_0X2N_0的两个分区和尺寸为N_0XN_0的四个分区重复地执行预测编码。 可对尺寸为2N_0X2N_0、N_0X2N_0、2N_0XN_0和N_0XN_0的分区执行帧内模式和帧间模 式下的预测编码。可仅对尺寸为2N_0X2N_0的分区执行跳过模式下的预测编码。
[0140] 如果在分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单 元910划分到更低深度。
[0141] 如果在分区类型918中编码误差最小,则深度从0改变到1以在操作920中划分 分区类型918,并对深度为2和尺寸为N_0XN_0的编码单元930重复地执行编码来搜索最 小编码误差。
[0142] 用于对深度为1和尺寸为2N_1X2N_1 ( =N_0XN_0)的编码单元930进行预测编 码的预测单元940可包括以下分区类型的分区:尺寸为2N_1X2N_1的分区类型942、尺寸 为2N_1XN_1的分区类型944、尺寸为N_1X2N_1的分区类型946以及尺寸为N_1XN_1的 分区类型948。
[0143] 如果在分区类型948中编码误差最小,则深度从1改变到2以在操作950中划分 分区类型948,并对深度为2和尺寸为N_2XN_2的编码单元960重复执行编码来搜索最小 编码误差。
[0144] 当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-1,并且划 分信息可被编码直到深度是〇到d-2中的一个。换句话说,当编码被执行直到在与d-2的 深度相应的编码单元在操作970中被划分之后深度是d-1时,用于对深度为d-1和尺寸为 2N_(d-l)X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括以下分区类型的 分区:尺寸为2N_(d-l)X2N_(d-l)的分区类型992、尺寸为2N_(d-l)XN_(d-l)的分区类 型994、尺寸为N_(d-1)X2N_(d-1)的分区类型996和尺寸为【(d-1)XN_(d-1)的分区类 型 998。
[0145] 可对分区类型992至998中的尺寸为2N_(d-l)X2N_(d-l)的一个分区、尺寸 为2N_(d-l)XN_(d-l)的两个分区、尺寸SN_(d-l)X2N_(d-l)的两个分区、尺寸为1 (d-1)XN_(d-1)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
[0146] 即使当分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-1的 编码单元CU_(d-1)也不再被划分到更低深度,构成当前最大编码单元900的编码单元的 编码深度被确定为d-1,并且当前最大编码单元900的分区类型可被确定为N_(d-1)XN_ (d-1)。此外,由于最大深度是d,并且具有最低深度d-1的最小编码单元980不再被划分到 更低深度,因此不设置最小编码单元980的划分信息。
[0147] 数据单元999可以是用于当前最大编码单元的"最小单元"。根据本发明的实施例 的最小单元可以是通过将最小编码单元980划分成4份而获得的矩形数据单元。通过重复 地执行编码,视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具 有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为编码深度的 编码模式。
[0148] 这样,在所有深度1至d中对根据深度的最小编码误差进行比较,并且具有最小编 码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关 于编码模式的信息被编码并发送。另外,由于编码单元从〇的深度被划分到编码深度,因此 仅编码深度的划分信息被设置为0,并且除了编码深度以外的深度的划分信息被设置为1。
[0149] 视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元 900的编码深度和预测单元的信息,来对分区912进行解码。视频解码设备200可通过使用 根据深度的划分信息,将划分信息为〇的深度确定为编码深度,并且使用关于相应深度的 编码模式的信息来进行解码。
[0150] 图10至图12是用于描述根据本发明的实施例的编码单元1010、预测单元1060和 变换单元1070之间的关系的示图。
[0151] 编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应 的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区,变 换单元1070是每个编码单元1010的变换单元。
[0152] 当在编码单元1010中最大编码单元的深度是0时,编码单元1012和编码单元 1054的深度是1,编码单元1014、1016、1018、1028、1050和1052的深度是2,编码单元1020、 1022、1024、1026、1030、1032 和 1048 的深度是 3,编码单元 1040、1042、1044 和 1046 的深度 是4。
[0153] 在预测单元1060中,通过划分编码单元1010中的编码单元来获得一些编码单元 1014、1016、1022、1032、1048、1050、1052 和 1054。换句话说,编码单元 1014、1022、1050 和 1054中的分区类型的尺寸是2NXN,编码单元1016、1048和1052中的分区类型的尺寸是 NX2N,编码单元1032的分区类型的尺寸就NXN。编码单元1010的预测单元和分区小于或 等于每个编码单元。
[0154] 在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图 像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、 1016、1022、1032、1048、1050 和 1052 不同于预测单元 1060 中的编码单元 1014、1016、1022、 1032、1048、1050和1052。换句话说,视频编码设备100和视频解码设备200可对同一编码 单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
[0155] 因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行 编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于 编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸 的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。
[0156] [表 1]
[0157]

【权利要求】
1. 一种可伸缩视频编码方法,包括: 基于具有树结构的编码单元对下层图像进行编码,其中,具有树结构的编码单元包括 图像的最大编码单元的分层划分的编码单元之中的被完全划分后的编码单元; 确定可伸缩编码模式,其中,可伸缩编码模式用于通过参考下层图像基于具有树结构 的编码单元对上层图像执行可伸缩编码; 基于确定的可伸缩编码模式,通过参考下层图像的编码信息来对上层图像进行预测和 编码; 基于确定的可伸缩编码模式,输出下层图像的编码模式和预测值以及确定的上层图像 的可伸缩编码模式, 其中,在视频的图像的空间划分的最大编码单元中,每个最大编码单元被划分为多个 编码单元,每个编码单元与邻近编码单元独立地被确定为划分为更小编码单元。
2. 如权利要求1所述的可伸缩视频编码方法,其中,对上层图像进行预测和编码的步 骤包括: 通过参考下层图像的编码信息之中的以下信息中的至少一个来确定上层图像的编码 信息:关于编码单元的结构的信息、关于编码单元中包括的变换单元的结构的信息、预测模 式、分区类型、运动信息和帧内信息; 基于确定的上层图像的编码信息,对上层图像进行编码。
3. 如权利要求1所述的可伸缩视频编码方法,其中,对上层图像进行预测和编码的步 骤包括: 通过参考下层图像的残差信息、变换系数、预测值、重建值、语法元素、环路滤波相关信 息、非零系数位置信息、重建预测值和重建纹理信息,确定上层图像的编码信息; 基于确定的上层图像的编码信息,对上层图像进行编码。
4. 如权利要求1所述的可伸缩视频编码方法,其中,对上层图像进行预测和编码的步 骤包括: 基于确定的可伸缩编码模式,确定将被上层图像的数据单元参考的下层图像的数据单 元; 通过参考确定的下层图像的数据单元的编码信息,对上层图像进行预测和编码, 其中,数据单元包括以下单元中的至少一个:最大编码单元、编码单元以及编码单元中 包括的预测单元、变换单元和最小单元。
5. 如权利要求4所述的可伸缩视频编码方法,其中,对上层图像进行预测和编码的步 骤包括: 通过参考以下信息中的至少一个来对上层图像的当前数据单元进行编码:下层图像之 中的与上层图像的当前数据单元相应并具有与上层图像的当前数据单元相同的数据单元 类型的数据单元的编码信息、下层图像之中的与上层图像的当前数据单元相应并具有与上 层图像的当前数据单元不同的数据单元类型的数据单元的编码信息、下层图像的数据单元 的条带信息和并行块信息。
6. 如权利要求4所述的可伸缩视频编码方法,其中,对上层图像进行预测和编码的步 骤包括: 确定以下数据单元组中的至少一个:下层图像之中的与上层图像的当前数据单元组相 应并具有与上层图像的当前数据单元组相同的数据单元组类型的数据单元组、以及下层图 像之中的与上层图像的当前数据单元组相应并具有与上层图像的当前数据单元组不同的 数据单元组类型的数据单元组; 通过参考确定的下层图像的数据单元组的编码信息,对上层图像的当前数据单元组进 行编码。
7. -种可伸缩视频解码方法,包括: 从接收到的比特流解析下层图像的编码信息和上层图像的可伸缩编码模式; 通过使用解析出的下层图像的编码信息,基于具有树结构的编码单元对下层图像进行 解码,其中,具有树结构的编码单元包括最大编码单元的分层划分的编码单元之中的被完 全划分后的编码单元; 根据上层图像的可伸缩编码模式,通过参考下层图像的编码信息,基于具有树结构的 编码单元来对上层图像进行预测和解码, 其中,在视频的图像的空间划分的最大编码单元中,每个最大编码单元被划分为多个 编码单元,每个编码单元与邻近编码单元独立地被确定为划分为更小编码单元。
8. 如权利要求7所述的可伸缩视频解码方法,其中,对上层图像进行预测和解码的步 骤包括: 通过参考下层图像的编码信息之中的以下信息中的至少一个来确定上层图像的编码 信息:关于编码单元的结构的信息、关于编码单元中包括的变换单元的结构的信息、预测模 式、分区类型、运动信息和帧内信息; 基于确定的上层图像的编码信息,对上层图像进行解码。
9. 如权利要求7所述的可伸缩视频解码方法,其中,对上层图像进行预测和解码的步 骤包括: 通过参考下层图像的编码信息之中的残差信息、变换系数、预测值、重建值、语法元素、 环路滤波相关信息、非零系数位置信息、重建预测值和重建纹理信息,确定上层图像的编码 信息; 基于确定的上层图像的编码信息,对上层图像进行解码。
10. 如权利要求7所述的可伸缩视频解码方法,其中,对上层图像进行预测和解码的步 骤包括: 根据从比特流解析出的上层图像的可伸缩编码模式,确定将被上层图像的数据单元参 考的下层图像的数据单元,并且通过参考确定的下层图像的数据单元的编码信息,基于具 有树结构的编码单元对上层图像进行预测和解码, 其中,数据单元包括以下单元中的至少一个:最大编码单元、编码单元以及编码单元中 包括的预测单元、变换单元和最小单元。
11. 如权利要求10所述的可伸缩视频解码方法,其中,对上层图像进行预测和解码的 步骤包括: 确定以下信息中的至少一个:下层图像之中的与上层图像的当前数据单元相应并具有 与上层图像的当前数据单元相同的数据单元类型的数据单元的编码信息、下层图像之中的 与上层图像的当前数据单元相应并具有与上层图像的当前数据单元不同的数据单元类型 的数据单元的编码信息、下层图像的数据单元的条带信息和并行块信息; 通过参考确定的下层图像的数据单元的编码信息,确定上层图像的当前数据单元的编 码息; 通过使用确定的所述当前数据单元的编码信息来对所述当前数据单元进行解码。
12. 如权利要求10所述的可伸缩视频解码方法,其中,对上层图像进行预测和解码的 步骤包括: 确定以下数据单元组中的至少一个:下层图像之中的与上层图像的当前数据单元组相 应并具有与上层图像的当前数据单元组相同的数据单元组类型的数据单元组、以及下层图 像之中的与上层图像的当前数据单元组相应并具有与上层图像的当前数据单元组不同的 数据单元组类型的数据单元组; 通过参考确定的下层图像的数据单元组的编码信息,确定上层图像的当前数据单元组 的编码息; 通过使用确定的所述当前数据单元组的编码信息来对所述当前数据单元组进行解码。
13. -种可伸缩视频编码设备,包括: 下层编码器,基于具有树结构的编码单元对下层图像进行编码,其中,具有树结构的 编码单元包括图像的最大编码单元的分层划分的编码单元之中的被完全划分后的编码单 元; 上层编码器,确定可伸缩编码模式,并基于确定的可伸缩编码模式,通过参考下层图像 的编码信息来对上层图像进行预测和编码,其中,可伸缩编码模式用于通过参考下层图像 基于具有树结构的编码单元对上层图像执行可伸缩编码; 输出单元,基于确定的可伸缩编码模式,输出下层图像的编码模式和预测值以及确定 的上层图像的可伸缩编码模式, 其中,在视频的图像的空间划分的最大编码单元中,每个最大编码单元被划分为多个 编码单元,每个编码单元与邻近编码单元独立地被确定为划分为更小编码单元。
14. 一种可伸缩视频编码设备,包括: 解析单元,从接收到的比特流解析下层图像的编码信息和上层图像的可伸缩编码模 式; 下层解码器,通过使用解析出的下层图像的编码信息,基于具有树结构的编码单元对 下层图像进行解码,其中,具有树结构的编码单元包括最大编码单元的分层划分的编码单 元之中的被完全划分后的编码单元; 上层解码器,根据上层图像的可伸缩编码模式,通过参考下层图像的编码信息,基于具 有树结构的编码单元来对上层图像进行预测和解码, 其中,在视频的图像的空间划分的最大编码单元中,每个最大编码单元被划分为多个 编码单元,每个编码单元与邻近编码单元独立地被确定为划分为更小编码单元。
15. -种计算机可读记录介质,其中,所述计算机可读记录介质记录有用于执行如权利 要求1或权利要求7所述的方法的程序。
【文档编号】H04N19/119GK104322067SQ201380026499
【公开日】2015年1月28日 申请日期:2013年3月20日 优先权日:2012年3月20日
【发明者】李泰美, 崔秉斗, 闵正惠, 朴银姬 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1