用于基于树结构编码单元进行多视点视频编码的方法和设备以及用于基于树结构编码单...的制作方法

文档序号:7793540阅读:252来源:国知局
用于基于树结构编码单元进行多视点视频编码的方法和设备以及用于基于树结构编码单 ...的制作方法
【专利摘要】提供基于树结构的编码单元的多视点视频层间编码和解码。一种视频编码方法,包括以下操作:基于通过分层划分图像的最大编码单元而获得的编码单元之中的树结构的编码单元对基本层图像进行编码,其中,基本层图像是基本视点图像之中的基本视点纹理图像和基本视点深度图像中的一个;确定用于基于树结构的编码单元通过参考基本层图像对附加视点图像执行层间编码的层间编码模式;基于层间编码模式参考包括附加视点图像的附加层图像。
【专利说明】用于基于树结构编码单元进行多视点视频编码的方法和设 备以及用于基于树结构编码单元进行多视点视频解码的方 法和设备

【技术领域】
[0001] 本发明涉及对多视点视频进行编码和解码。

【背景技术】
[0002] 随着用于再现和存储高分辨率或高质量视频内容的硬件的开发和提供,对于用于 有效地对高分辨率或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。根 据现有技术的视频编解码器,基于具有预定尺寸的宏块,根据受限的编码方法来对视频进 行编码。
[0003] 空间域的图像数据经由频率变换被变换为频率域的系数。根据视频编解码器,将 图像划分为预定尺寸的块,对每个块执行离散余弦变换(DCT),并以块为单位对频率系数进 行编码,以进行频率变换的快速计算。与空间域的图像数据相比,频率域的系数容易被压 缩。具体地,由于根据经由视频编解码器的帧间预测或帧内预测的预测误差来表示空间域 的图像像素值,因此当对预测误差执行频率变换时,大量数据可被变换为〇。根据视频编解 码器,可通过使用小量数据来代替连续并重复产生的数据,来减少数据量。
[0004] 随着对在多个视点捕捉的视频的需求,与视点的数量成比例地增加的视频数据量 会是一个问题。因此,正为对多视点视频进行有效编码不断做出大量努力。


【发明内容】

[0005] 技术问题
[0006] 本发明提供一种对作为单独的层的基本视点图像和附加视点图像进行预测编码 和预测解码的方法。本发明还提供一种对来自同一视点图像的作为单独的层的纹理图像和 深度图像进行预测编码和预测解码的方法。
[0007] 解决方案
[0008] 根据本发明的一方面,提供一种多视点视频层间编码方法,所述方法包括以下操 作:基于树结构的编码单元对基本层图像进行编码,其中,树结构的编码单元包括通过分层 划分图像的最大编码单元而获得的编码单元之中的被完全划分的编码单元,基本层图像是 基本视点图像之中的基本视点纹理图像和基本视点深度图像中的一个;基于树结构的编码 单元,通过参考预定层间编码模式和基本层图像的编码信息,对作为单独的附加层图像的 以下图像分别执行预测编码:基本视点纹理图像和基本视点深度图像之中的不是基本层图 像的另一个、附加视点图像之中的附加视点纹理图像和附加视点深度图像;基于所述预定 层间编码模式输出基本视点图像的编码模式和预测值以及附加视点图像的层间编码模式, 其中,通过对视频的图像进行空间划分而获得的每个最大编码单元被划分为多个编码单 元,并且,是否将所述多个编码单元中的每个编码单元划分为更小的编码单元以独立于邻 近的编码单元的方式被确定。
[0009] 有益效果
[0010] 多视点视频的基本视点纹理图像和基本视点深度图像中的一个被指定为基本层 图像,基本视点图像中的另一个图像、附加视点纹理图像和附加视点深度图像被指定为附 加层图像,使得对多视点视频执行层间预测。由于在通过使用根据树结构的编码单元、预测 单元和变换单元被编码的基本层图像和附加层图像之间彼此相应的基本层数据单元和附 加层数据单元被正确地检测,并且通过使用各种类型的基本层数据单元的编码信息确定附 加层数据单元,因此,用于附加层图像的编码信息的传输比特量可减少,并且可有效实现对 层间视频进行编码和解码的方法。

【专利附图】

【附图说明】
[0011] 图1是根据本发明的实施例的基于树结构的编码单元的视频编码设备的框图。
[0012] 图2是根据本发明的实施例的基于树结构的编码单元的视频解码设备的框图。
[0013] 图3是用于描述根据本发明的实施例的编码单元的构思的示图。
[0014] 图4是根据本发明的实施例的基于编码单元的图像编码器的框图。
[0015] 图5是根据本发明的实施例的基于编码单元的图像解码器的框图。
[0016] 图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。 [0017] 图7是用于描述根据本发明的实施例的编码单元和变换单元之间的关系的示图。 [0018] 图8示出根据本发明的实施例的根据深度的多条编码信息。
[0019] 图9是根据本发明的实施例的根据深度的较深层编码单元的示图。
[0020] 图10、图11和图12是用于描述根据本发明的实施例的编码单元、预测单元和变换 单元之间的关系的示图。
[0021] 图13是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间 的关系的不图。
[0022] 图14是根据本发明的实施例的多视点视频层间编码设备的框图。
[0023] 图15是根据本发明的实施例的多视点视频层间解码设备的框图。
[0024] 图16是根据本发明的实施例的层间编码系统的框图。
[0025] 图17示出根据本发明的实施例的用于多视点视频的层间编码系统。
[0026] 图18示出根据本发明的实施例的用于多视点视频服务的发送和接收系统。
[0027] 图19示出根据本发明的实施例的多视点视频的层间预测结构。
[0028] 图20示出根据本发明的实施例的层间预测模式的类型。
[0029] 图21示出根据本发明的实施例的基本层和附加层之间的映射关系。
[0030] 图22是根据本发明的实施例的多视点视频层间编码方法的流程图。
[0031] 图23是根据本发明的实施例的多视点视频层间解码方法的流程图。
[0032] 图24是根据本发明的实施例的存储程序的盘的物理结构的示图。
[0033] 图25是用于通过使用盘来记录和读取程序的盘驱动器的示图。
[0034] 图26是用于提供内容分配服务的内容供应系统的整体结构的示图。
[0035] 图27和图28是根据本发明的实施例的应用了视频编码方法和视频解码方法的移 动电话的外部结构和内部结构的各自的示图。
[0036] 图29是根据本发明的实施例的应用通信系统的数字广播系统的示图。
[0037] 图30是示出根据本发明的实施例的使用视频编码设备和视频解码设备的云计算 系统的网络结构的示图。
[0038] 最佳实施方式
[0039] 根据本发明的一方面,提供一种多视点视频层间编码方法,所述方法包括以下操 作:基于树结构的编码单元对基本层图像进行编码,其中,树结构的编码单元包括通过分层 划分图像的最大编码单元而获得的编码单元之中的被完全划分的编码单元,基本层图像是 基本视点图像之中的基本视点纹理图像和基本视点深度图像中的一个图像;基于树结构的 编码单元,通过参考预定层间编码模式和基本层图像的编码信息,对作为单独的附加层图 像的以下图像分别执行预测编码:基本视点纹理图像和基本视点深度图像之中的不是基本 层图像的另一个、附加视点图像之中的附加视点纹理图像和附加视点深度图像;基于所述 预定层间编码模式输出基本视点图像的编码模式和预测值以及附加视点图像的层间编码 模式,其中,通过对视频的图像进行空间划分而获得的每个最大编码单元被划分为多个编 码单元,并且,是否将所述多个编码单元中的每个编码单元划分为更小的编码单元以独立 于邻近的编码单元的方式被确定。
[0040] 对基本层图像进行编码的操作可包括以下操作:对基本视点纹理图像和基本视 点深度图像中的一个进行编码;对附加层图像执行预测编码的操作可包括以下操作:根据 所述预定层间编码模式,通过参考经由对基本视点纹理图像和基本视点深度图像中的一个 进行编码而产生的编码信息,对基本视点纹理图像和基本视点深度图像中的另一个进行编 码。
[0041] 对附加层图像执行预测编码的操作可包括以下操作:对附加视点纹理图像和附加 视点深度图像中的一个进行编码;根据所述预定层间编码模式,通过参考经由对基本视点 纹理图像、基本视点深度图像、附加视点纹理图像和附加视点深度图像中的一个进行编码 而产生的编码信息,对附加视点纹理图像和附加视点深度图像中的另一个进行编码。
[0042] 对基本层图像进行编码的操作可包括以下操作:通过参考基本视点纹理图像的编 码信息对基本视点纹理图像和基本视点深度图像中的至少一个进行编码;通过参考基本视 点深度图像的编码信息对基本视点纹理图像和基本视点深度图像中的至少一个进行编码。 [0043] 对附加层图像执行预测编码的操作可包括以下操作:基于基本视点图像和附加视 点图像之间的视差,确定将被附加视点图像的数据单元参考的基本视点图像的数据单元。[0044] 确定所述数据单元的操作可包括以下操作:通过使用附加视点图像的当前数据单 元和基本视点图像之间的视差,确定与附加视点图像的当前数据单元相映射的基本视点图 像的数据单元的位置。
[0045] 确定所述数据单元的操作可包括以下操作:通过使用先前在基本视点深度图像或 先前在附加视点图像的邻近数据单元中使用的视差或深度信息,确定附加视点图像的当前 数据单元和基本视点图像之间的视差;通过使用确定的视差,确定与所述当前数据单元相 映射的基本视点图像的数据单元的位置。
[0046] 根据本发明的另一方面,提供一种多视点视频层间解码方法,所述方法包括以下 操作:从多个比特流解析基本层图像的编码信息以及基本层图像和附加层图像之间的层间 编码模式,其中,所述多个比特流分别包括作为单独的层的以下图像:基本视点图像的基本 视点纹理图像、基本视点图像的基本视点深度图像、附加视点图像的附加视点纹理图像和 附加视点图像的附加视点深度图像;通过使用解析的基本层图像的编码信息,基于树结构 的编码单元对基本层图像进行解码,其中,树结构的编码单元包括通过分层划分最大编码 单元而获得的编码单元之中的被完全划分的编码单元,基本层图像是基本视点图像的基本 视点纹理图像和基本视点深度图像中的一个;根据附加视点图像的层间编码模式,通过参 考解析的基本层图像的编码信息,基于树结构的编码单元,对作为单独的附加层图像的以 下图像分别执行预测解码:基本视点纹理图像和基本视点深度图像之中的不是基本层图像 的另一个、附加视点图像之中的附加视点纹理图像和附加视点深度图像,其中,通过对视频 的图像进行空间划分而获得的每个最大编码单元被划分为多个编码单元,并且,是否将所 述多个编码单元中的每个编码单元单独地划分为更小的编码单元以独立于邻近的编码单 元的方式被确定。
[0047]对基本层图像进行解码的操作可包括以下操作:对基本视点纹理图像和基本视点 深度图像中的一个进行解码;并且对附加层图像执行预测解码的操作可包括以下操作:根 据所述层间编码模式,通过参考解析的基本层图像的编码信息,对基本视点纹理图像和基 本视点深度图像中的另一个进行解码。
[0048]对附加层图像执行预测解码的操作可包括以下操作:对附加视点纹理图像和附加 视点深度图像中的一个进行解码;根据所述层间编码模式,通过参考基本视点纹理图像、基 本视点深度图像、附加视点纹理图像和附加视点深度图像中的一个的编码信息,对附加视 点纹理图像和附加视点深度图像中的另一个进行解码。
[0049]对附加层图像执行预测解码的操作可以下包括:通过参考基本视点纹理图像的编 码信息对基本视点纹理图像和基本视点深度图像中的至少一个进行解码;通过参考基本视 点深度图像的编码信息对基本视点纹理图像和基本视点深度图像中的至少一个进行解码。
[0050] 对附加层图像执行预测解码的操作可包括以下操作:通过使用附加视点图像的当 前数据单元和基本视点图像之间的视差信息,确定将被附加视点图像的当前数据单元参考 的基本视点图像的数据单元。
[0051] 确定所述数据单元的操作可包括以下操作:通过使用附加视点图像的当前数据单 元和基本视点图像之间的视差信息,确定与所述当前数据单元相映射的基本视点图像的数 据单元的位置。
[0052] 确定所述数据单元的操作可包括以下操作:通过使用先前在基本视点深度图像或 先前在附加视点图像的邻近数据单元中使用的视差信息或深度信息,确定附加视点图像的 当前数据单元和基本视点图像之间的视差信息;通过使用确定的视差信息,确定与所述当 前数据单元相映射的基本视点图像的数据单元的位置。
[0053] 根据本发明的另一方面,提供一种多视点视频层间编码设备,所述设备包括:基本 层编码器,基于树结构的编码单元对基本层图像进行编码,其中,树结构的述编码单元包括 通过分层划分图像的最大编码单元而获得的编码单元之中的被完全划分的编码单元,基本 层图像是基本视点图像之中的基本视点纹理图像和基本视点深度图像中的一个;附加层编 码器,基于树结构的编码单元,通过参考预定层间编码模式和基本层图像的编码信息,对作 为单独的附加层图像的以下图像分别执行预测编码:基本视点纹理图像和基本视点深度图 像之中的未作为基本层图像的另一个、附加视点图像之中的附加视点纹理图像和附加视点 深度图像;输出单元,基于所述预定层间编码模式输出基本视点图像的编码信息以及附加 视点图像的层间编码模式,其中,通过对视频的图像进行空间划分而获得的每个最大编码 单元被划分为多个编码单元,并且,是否将所述多个编码单元中的每个编码单元单独地划 分为更小的编码单元以独立于邻近的编码单元的方式被确定。
[0054] 附加层编码单元可基于基本视点图像和附加视点图像之间的视差确定将被附加 视点图像的数据单元参考的基本视点图像的数据单元。
[0055] 根据本发明的另一方面,提供一种多视点视频层间解码设备,所述设备包括:解析 器,从多个比特流解析基本层图像的编码信息以及基本层图像和附加层图像之间的层间编 码模式,其中,所述多个比特流分别包括作为单独的层的以下图像:基本视点图像的基本视 点纹理图像、基本视点图像的基本视点深度图像、附加视点图像的附加视点纹理图像和附 加视点图像的附加视点深度图像;基本层解码器,通过使用解析的基本层图像的编码信息, 基于树结构的编码单元对基本层图像进行解码,其中,树结构的编码单元包括通过分层划 分最大编码单元而获得的编码单元之中的被完全划分的编码单元,基本层图像是基本视点 图像之中的基本视点纹理图像和基本视点深度图像中的一个图像;附加层解码器,根据附 加视点图像的层间编码模式,通过参考解析的基本层图像的编码信息,基于树结构的编码 单元,对作为单独的附加层图像的以下图像分别执行预测解码:基本视点纹理图像和基本 视点深度图像之中的未作为基本层图像的另一个、附加视点图像之中的附加视点纹理图像 和附加视点深度图像。
[0056] 附加层解码单元可通过使用附加视点图像的当前数据单元和基本视点图像之间 的视差信息来确定将由附加视点图像的当前数据单元参考的基本视点图像的数据单元。
[0057] 根据本发明的另一方面,提供一种记录有用于执行多视点视频层间编码方法的程 序的计算机可读记录介质。根据本发明的另一方面,提供一种记录有用于执行多视点视频 层间解码方法的程序的计算机可读记录介质。

【具体实施方式】
[0058] 在下文中,将参照图1至图13描述根据本发明的实施例的基于树结构的编码单元 的视频编码技术和视频解码技术。此外,将参照图14至图23描述根据本发明的实施例的 基于树结构的编码单元的多视点视频层间编码技术和多视点视频层间解码技术。此外,将 参照图24至图30提供可应用多视点视频编码方法、多视点视频解码方法、视频编码方法和 视频解码方法的各种实施例。在下文中,"图像"可指示静止图像或视频的运动图像(即,视 频本身)。
[0059] 首先,将参照图1至图13描述基于树结构的编码单元的视频编码技术和视频解码 技术。
[0060] 图1是根据本发明的实施例的基于树结构的编码单元的视频编码设备100的框 图。
[0061] 涉及基于树结构的编码单元的视频预测的视频编码设备100包括最大编码单元 划分器110、编码单元确定器120和输出单元130。在下文中,为了便于描述,涉及基于树结 构的编码单元的视频预测的视频编码设备100被称为"视频编码设备100"。
[0062] 最大编码单元划分器110可基于图像的当前画面的最大编码单元来划分当前画 面,其中,最大编码单元是具有最大尺寸的编码单元。如果当前画面大于最大编码单元,则 可将当前画面的图像数据划分为至少一个最大编码单元。根据本发明的实施例的最大编码 单元可以是尺寸为32X32、64X64、128X128、256X256等的数据单元,其中,数据单元的 形状是宽度和长度为2的若干次方的正方形。图像数据可根据至少一个最大编码单元被输 出到编码单元确定器120。
[0063]根据本发明的实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从 最大编码单元在空间上被划分的次数,并且随着深度加深,根据深度的较深层编码单元可 从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度,最小编码单元 的深度为最低深度。由于随着最大编码单元的深度加深,与每个深度相应的编码单元的尺 寸减小,因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
[0064]如上所述,当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单 元,并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根 据本发明的实施例的最大编码单元进行划分,因此可根据深度分层地对包括在最大编码单 元中的空间域的图像数据进行分类。
[0065]可预先确定编码单元的最大深度和最大尺寸,其中,所述最大深度和最大尺寸限 制最大编码单元的高度和宽度被分层划分的总次数。
[0066] 编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的 至少一个划分区域进行编码,并且根据所述至少一个划分区域来确定用于输出最终编码的 图像数据的深度。换言之,编码单元确定器120通过根据当前画面的最大编码单元以根据 深度的较深层编码单元对图像数据进行编码,并选择具有最小编码误差的深度,来确定编 码深度。将确定的编码深度和根据确定的编码深度的编码的图像数据输出到输出单元130。 [0067]基于与等于或低于最大深度的至少一个深度相应的较深层编码单元,对最大编码 单元中的图像数据进行编码,并且基于每个较深层编码单元比较对图像数据进行编码的结 果。在对较深层编码单元的编码误差进行比较之后,可选择具有最小编码误差的深度。可 针对每个最大编码单元选择至少一个编码深度。
[0068] 随着编码单元根据深度而被分层地划分以及随着编码单元的数量增加,最大编码 单元的尺寸被划分。另外,即使在一个最大编码单元中编码单元与同一深度相应,仍通过分 别测量每个编码单元的图像数据的编码误差来确定是否将与同一深度相应的每个编码单 元划分到更低深度。因此,即使图像数据被包括在一个最大编码单元中,编码误差根据所述 一个最大编码单元中的区域而不同,因此编码深度可根据图像数据中的区域而不同。因此, 可在一个最大编码单元中确定一个或更多个编码深度,并且可根据至少一个编码深度的编 码单元来对最大编码单元的图像数据进行划分。
[0069]因此,编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单 元。根据本发明的实施例的"具有树结构的编码单元"包括在最大编码单元中包括的所有 较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相 同区域中的深度来分层地确定编码深度的编码单元,并可在不同区域中独立地确定编码深 度的编码单元。类似地,可从另一区域的编码深度独立地确定当前区域中的编码深度。
[0070]根据本发明的实施例的最大深度是与从最大编码单元到最小编码单元的划分次 数相关的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单 元的总划分次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码 单元的深度等级的总数。例如,当最大编码单元的深度是O时,对最大编码单元划分一次 的编码单元的深度可被设置为1,对最大编码单元划分两次的编码单元的深度可被设置为 2。这里,如果最小编码单元是最大编码单元被划分四次后的编码单元,则存在深度0、1、2、 3和4的5个深度等级,并因此第一最大深度可被设置为4,第二最大深度可被设置为5。
[0071] 可根据最大编码单元执行预测编码和变换。还根据最大编码单元,基于根据等于 或小于最大深度的深度的较深层编码单元来执行预测编码和变换。
[0072] 由于每当根据深度对最大编码单元进行划分时,较深层编码单元的数量增加,因 此将对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了 便于解释,在最大编码单元中,现在将基于当前深度的编码单元来描述预测编码和变换。
[0073] 视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或 形状。为了对图像数据进行编码,执行诸如预测编码、变换和熵编码的操作,此时,可针对所 有操作使用相同的数据单元,或者可针对每个操作使用不同的数据单元。
[0074] 例如,视频编码设备100不仅可选择用于对图像数据进行编码的编码单元,还可 选择不同于编码单元的数据单元,以便对编码单元中的图像数据执行预测编码。
[0075] 为了在最大编码单元中执行预测编码,可基于与编码深度相应的编码单元(即, 基于不再被划分为与更低深度相应的编码单元的编码单元)来执行预测编码。以下,不再 被划分且成为用于预测编码的基本单元的编码单元现在将被称为"预测单元"。通过划分预 测单元获得的分区可包括预测单元以及通过对从预测单元的高度和宽度中选择的至少一 个进行划分而获得的数据单元。分区是编码单元的预测单元被划分的数据单元,并且预测 单元可以是具有与编码单元相同的尺寸的分区。
[0076] 例如,当2NX2N(其中,N是正整数)的编码单元不再被划分时,2NX2N的编码单 元成为尺寸为2NX2N的预测单元,并且分区的尺寸可以是2NX2N、2NXN、NX2N或NXN。 分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通 过对预测单元的高度或宽度进行非对称地划分(诸如,I:n或η: 1)而获得的分区、通过对 预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
[0077] 预测单元的预测模式可以是从帧内模式、帧间模式和跳过模式中选择的至少一 个。例如,可对2ΝX2Ν、2ΝXN、NX2Ν或NXN的分区执行帧内模式或帧间模式。另外,可仅 对2ΝΧ2Ν的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码,从而选 择具有最小编码误差的预测模式。
[0078] 视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与 编码单元不同的数据单元,来对编码单元中的图像数据执行变换。为了在编码单元中执行 变换,可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如,用于变换的数 据单元可包括帧内模式的数据单元和帧间模式的数据单元。
[0079] 以与根据树结构的编码单元类似的方式,编码单元中的变换单元可被递归地划分 为更小尺寸的区域,因此可基于根据变换深度的具有树结构的变换单元,对编码单元中的 残差数据进行划分。
[0080] 还可在变换单元中设置变换深度,其中,变换深度指示通过对编码单元的高度和 宽度进行划分而达到变换单元的划分次数。例如,在2ΝΧ2Ν的当前编码单元中,当变换单 元的尺寸是2ΝΧ2Ν时,变换深度可以是0,当变换单元的尺寸是NXN时,变换深度可以是 I,当变换单元的尺寸是N/2XN/2时,变换深度可以是2。换句话说,还可根据变换深度设置 具有树结构的变换单元。
[0081] 根据与编码深度相应的编码单元的编码信息不仅要求关于编码深度的信息,还要 求与预测编码和变换相关的信息。因此,编码单元确定器120不仅确定具有最小编码误差 的编码深度,还确定预测单元中的分区类型、根据预测单元的预测模式以及用于变换的变 换单元的尺寸。
[0082] 随后将参照图3至图13详细描述根据本发明的实施例的最大编码单元中的根据 树结构的编码单元以及确定预测单元/分区和变换单元的方法。
[0083] 编码单元确定器120可通过使用基于拉格朗日乘数的率失真优化,来测量根据深 度的较深层编码单元的编码误差。
[0084] 输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的 编码模式的信息,其中,所述最大编码单元的图像数据基于由编码单元确定器120确定的 至少一个编码深度被编码。
[0085] 可通过对图像的残差数据进行编码来获得编码图像数据。
[0086] 关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单 元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
[0087]可通过使用根据深度的划分信息来定义关于编码深度的信息,其中,根据深度的 划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的 当前深度是编码深度,则对当前编码单元中的图像数据进行编码并输出,因此可将划分信 息定义为不将当前编码单元划分到更低深度。可选地,如果当前编码单元的当前深度不是 编码深度,则对更低深度的编码单元执行编码,并因此可将划分信息定义为对当前编码单 元进行划分来获得更低深度的编码单元。
[0088]如果当前深度不是编码深度,则对被划分到更低深度的编码单元的编码单元执行 编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中,因此对更低 深度的每个编码单元重复执行编码,并因此可对具有相同深度的编码单元递归地执行编 码。
[0089] 由于针对一个最大编码单元确定具有树结构的编码单元,并且针对编码深度的编 码单元确定关于至少一个编码模式的信息,所以可针对一个最大编码单元确定关于至少一 个编码模式的信息。另外,由于根据深度对图像数据进行分层划分,因此最大编码单元的图 像数据的编码深度可根据位置而不同,因此可针对图像数据设置关于编码深度和编码模式 的信息。
[0090] 因此,输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括 在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
[0091] 根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分为4 份而获得的方形数据单元。可选择地,根据实施例的最小单元可以是可包括在最大编码单 元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大方形数据单元。
[0092] 例如,通过输出单元130输出的编码信息可被分类为根据较深层编码单元的编码 信息和根据预测单元的编码信息。根据较深层编码单元的编码信息可包括关于预测模式的 信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的 信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分 量的信息、以及关于帧内模式的插值方法的信息。
[0093] 根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的 信息可被插入到比特流的头、序列参数集或画面参数集中。
[0094] 还可通过比特流的头、序列参数集或画面参数集来输出关于针对当前视频允许的 变换单元的最大尺寸的信息、以及关于变换单元的最小尺寸的信息。输出单元130可对与 预测相关的参考信息、预测信息和条带类型信息进行编码并输出。
[0095] 在视频编码设备100中,较深层编码单元可以是通过将更高深度的编码单元(更 高一层)的高度或宽度划分成两份而获得的编码单元。换言之,当当前深度的编码单元的 尺寸是2NX2N时,更低深度的编码单元的尺寸是NXN。另外,尺寸为2NX2N的具有当前深 度的编码单元可包括最多4个具有所述更低深度的编码单元。
[0096] 因此,视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺 寸和最大深度,通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形 成具有树结构的编码单元。另外,由于可通过使用各种预测模式和变换中的任意一个对每 个最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特征来确定最优编码模 式。
[0097] 因此,如果以传统宏块对具有高的分辨率或大数据量的图像进行编码,则每个画 面的宏块的数量极度增加。因此,针对每个宏块产生的压缩信息的条数增加,因此难以发送 压缩的信息,并且数据压缩效率降低。然而,通过使用视频编码设备1〇〇,由于在考虑图像的 尺寸的同时增加编码单元的最大尺寸,并同时在考虑图像的特征的同时调整编码单元,因 此可提高图像压缩效率。
[0098] 图2是根据本发明的实施例的基于树结构的编码单元的视频解码设备200的框 图。
[0099] 涉及基于树结构的编码单元的视频预测的视频解码设备200包括接收器210、图 像数据和编码信息提取器220和图像数据解码器230。在下文中,为了便于描述,涉及基于 树结构的编码单元的视频预测的视频解码设备200被称为"视频解码设备200"。
[0100] 用于视频解码设备200的解码操作的各种术语(诸如编码单元、深度、预测单元、 变换单元和关于各种编码模式的信息)的定义与参照图1和视频编码设备100解释的定义 相同。
[0101] 接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解 析的比特流,针对每个编码单元提取编码图像数据,并将提取的图像数据输出到图像数据 解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提 取器220可从关于当前画面的头、序列参数集或画面参数集提取关于当前画面的编码单元 的最大尺寸的信息。
[0102] 另外,图像数据和编码信息提取器220从解析的比特流,根据每个最大编码单元, 提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编 码模式的信息被输出到图像数据解码器230。换言之,比特流中的图像数据被划分为最大编 码单元,使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
[0103] 可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码 单元的编码深度和编码模式的信息,关于编码模式的信息可包括关于与编码深度相应的相 应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外, 根据深度的划分信息可被提取为关于编码深度的信息。
[0104] 由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深 度和编码模式的信息是这样的关于编码深度和编码模式的信息:该信息被确定为在编码器 (诸如,视频编码设备100)根据每个最大编码单元对根据深度的每个较深层编码单元重复 地执行编码时产生最小编码误差。因此,视频解码设备200可通过根据产生最小编码误差 的编码深度和编码模式对图像数据进行解码来恢复图像。
[0105] 由于关于编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元 和最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单 元,提取关于编码深度和编码模式的信息。如果关于相应最大编码单元的编码深度和编码 模式的信息根据预定数据单元被记录,则可将被分配相同的关于编码深度和编码模式的信 息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
[0106] 图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息, 通过对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码 器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的 每个编码单元的分区类型、预测模式和变换单元的信息,对编码的图像数据进行解码。解码 处理可包括预测(包含帧内预测和运动补偿)和逆变换。
[0107] 图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类 型和预测模式的信息,根据每个编码单元的分区和预测模式,执行帧内预测或运动补偿。
[0108] 此外,针对每个最大编码单元的逆变换,图像数据解码器230可针对每个编码单 元读取关于根据树结构的变换单元的信息,以基于每个编码单元的变换单元来执行逆变 换。经过逆变换,可恢复编码单元的空间域的像素值。
[0109] 图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元 的编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度是编码深 度。因此,图像数据解码器230可通过使用关于用于与编码深度相应的每个编码单元的预 测单元的分区类型、预测模式和变换单元的尺寸的信息,对当前最大编码单元中的编码数 据进行解码。
[0110] 换言之,可通过观察被分配给编码单元、预测单元和最小单元中的预定数据单元 的编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元 可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。因此,可 通过获得关于每个编码单元的编码模式的信息来对当前编码单元进行解码。
[0111] 因此,视频解码设备200可获得关于当对每个最大编码单元递归地执行编码时产 生最小编码误差的至少一个编码单元的信息,并使用所述信息来对当前画面进行解码。换 言之,可对在每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元进行解 码。
[0112] 因此,即使图像数据具有高分辨率和大数据量,也可通过使用编码单元的尺寸和 编码模式,有效地对图像数据进行解码和恢复,其中,通过使用从编码器接收到的关于最优 编码模式的信息,根据图像的特征自适应地确定所述编码单元的尺寸和编码模式。
[0113] 图3是用于描述根据本发明的实施例的编码单元的构思的示图。
[0114] 编码单元的尺寸可被表示为宽度X高度,并且可以是64X64、32X32、16X16和 8X8。64X64的编码单元可被划分为64X64、64X32、32X64或32X32的分区,32X32的 编码单元可被划分为32X32、32X16、16X32或16X16的分区,16X16的编码单元可被划 分为16父16、16\8、8\16或8\8的分区,8\8的编码单元可被划分为8\8、8\4、4父8或 4X4的分区。
[0115] 在视频数据310中,分辨率为1920X1080,编码单元的最大尺寸为64,最大深度为 2。在视频数据320中,分辨率为1920X1080,编码单元的最大尺寸为64,最大深度为3。在 视频数据330中,分辨率为352X288,编码单元的最大尺寸为16,最大深度为1。图3中示 出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
[0116] 如果分辨率高或数据量大,则编码单元的最大尺寸可能较大,从而不仅提高编码 效率,而且准确地反映图像的特征。因此,具有比视频数据330更高分辨率的视频数据310 和320的编码单元的最大尺寸可以是64。
[0117] 由于视频数据310的最大深度是2,因此由于通过对最大编码单元划分两次,深度 加深至两层,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长 轴尺寸为32和16的编码单元。另一方面,由于视频数据330的最大深度是1,因此由于通 过对最大编码单元划分一次,深度加深至一层,因此视频数据330的编码单元335可包括长 轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
[0118] 由于视频数据320的最大深度是3,因此由于通过对最大编码单元划分三次,深度 加深至3层,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长 轴尺寸为32、16和8的编码单元。随着深度加深,详细信息可被精确地表示。
[0119] 图4是根据本发明的实施例的基于编码单元的图像编码器400的框图。
[0120] 图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数 据进行编码。换言之,帧内预测器410对当前帧405中的帧内模式下的编码单元执行帧内 预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495,对当前帧405 中的帧间模式下的编码单元分别执行帧间估计和运动补偿。
[0121] 从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430 和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆变换 器470被恢复为空间域中的数据,恢复的空间域中的数据在通过去块单元480和偏移调整 单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出 为比特流455。
[0122] 为了在视频编码设备100中应用图像编码器400,图像编码器400的所有元件 (即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器 450、反量化器460、逆变换器470、去块单元480和偏移调整单元490)在考虑每个最大编码 单元的最大深度的同时,基于具有树结构的编码单元中的每个编码单元执行操作。
[0123] 具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码 单元的最大尺寸和最大深度的同时确定具有树结构的编码单元中的每个编码单元的分区 和预测模式,变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺 寸。
[0124] 图5是根据本发明的实施例的基于编码单元的图像解码器500的框图。
[0125] 解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的 信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据,反量化的 数据通过逆变换器540被恢复为空间域中的图像数据。
[0126] 针对空间域中的图像数据,帧内预测器550对帧内模式下的编码单元执行帧内预 测,运动补偿器560通过使用参考帧585对帧间模式下的编码单元执行运动补偿。
[0127] 通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元 570和偏移调整单元580后处理之后被输出为恢复帧595。另外,通过去块单元570和偏移 调整单元580后处理的图像数据可被输出为参考帧585。
[0128] 为了在视频解码设备200的图像数据解码器230中对图像数据进行解码,图像解 码器500可执行在解析器510之后执行的操作。
[0129] 为了在视频解码设备200中应用图像解码器500,图像解码器500的所有元件 (即,解析器510、熵解码器520、反量化器530、逆变换器540、帧内预测器550、运动补偿器 560、去块单元570和偏移调整单元580)针对每个最大编码单元基于具有树结构的编码单 元执行操作。
[0130] 具体地,帧内预测器550和运动补偿器560必须针对具有树结构的每个编码单元 确定分区和预测模式,逆变换器540必须针对每个编码单元确定变换单元的尺寸。
[0131] 图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
[0132] 视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特征。可 根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度,或可由用户不 同地设置编码单元的最大高度、最大宽度和最大深度。可根据预定的编码单元的最大尺寸 来确定根据深度的较深层编码单元的尺寸。
[0133] 根据本发明的实施例,在编码单元的分层结构600中,编码单元的最大高度和最 大宽度均是64,最大深度是3。在此情况下,最大深度是指编码单元从最大编码单元到最小 编码单元被划分的总次数。由于深度沿着分层结构600的垂直轴加深,因此较深层编码单 元的高度和宽度均被划分。另外,预测单元和分区沿着分层结构600的水平轴被示出,其 中,所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
[0134] 换言之,在分层结构600中,编码单元610是最大编码单元,其中,深度为0,尺寸 (即,高度乘宽度)为64X64。随着深度沿着垂直轴加深,存在尺寸为32X32和深度为1 的编码单元620、尺寸为16X16和深度为2的编码单元630、尺寸为8X8和深度为3的编 码单元640。尺寸为8X8和深度为3的编码单元640是最小编码单元。
[0135] 编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之,如果尺寸 为64X64和深度为0的编码单元610是预测单元,则可将预测单元划分成包括在编码单元 610中的分区,即,尺寸为64X64的分区610、尺寸为64X32的分区612、尺寸为32X64的 分区614或尺寸为32X32的分区616。
[0136] 类似地,可将尺寸为32X32和深度为1的编码单元620的预测单元划分成包括在 编码单元620中的分区,S卩,尺寸为32X32的分区620、尺寸为32X16的分区622、尺寸为 16X32的分区624和尺寸为16X16的分区626。
[0137] 类似地,可将尺寸为16X16和深度为2的编码单元630的预测单元划分成包括 在编码单元630中的分区,S卩,包括在编码度单元630中的尺寸为16X16的分区、尺寸为 16X8的分区632、尺寸为8X16的分区634和尺寸为8X8的分区636。
[0138] 类似地,可将尺寸为8X8和深度为3的编码单元640的预测单元划分成包括在编 码单元640中的分区,S卩,包括在编码单元640中的尺寸为8X8的分区、尺寸为8X4的分 区642、尺寸为4X8的分区644和尺寸为4X4的分区646。
[0139] 最后,尺寸为8X8和深度为3的编码单兀640是具有最低深度的最小编码单兀。
[0140] 为了确定构成最大编码单元610的编码单元的至少一个编码深度,视频编码设备 100的编码单元确定器120对包括在最大编码单元610中的与每个深度相应的编码单元执 行编码。
[0141]随着深度加深,包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单 元的数量增加。例如,需要四个与深度2相应的编码单元来覆盖包括在与深度1相应的一 个编码单元中的数据。因此,为了根据深度比较对相同数据进行编码的结果,与深度1相应 的编码单元和四个与深度2相应的编码单元均被编码。
[0142] 为了针对多个深度之中的当前深度执行编码,可沿着分层结构600的水平轴,通 过对与当前深度相应的编码单元中的每个预测单元执行编码,来针对当前深度,选择作为 代表性编码误差的最小编码误差。可选地,随着深度沿着分层结构600的垂直轴加深,可通 过针对每个深度执行编码来比较根据深度的代表性编码误差,以搜索最小编码误差。在编 码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区 类型。
[0143] 图7是用于描述根据本发明的实施例的编码单元710和变换单元720之间的关系 的示图。
[0144] 视频编码设备100或视频解码设备200针对每个最大编码单元,根据具有小于或 等于最大编码单元的尺寸的编码单元,对图像进行编码或解码。可基于不大于相应编码单 元的数据单元,来选择用于在编码期间进行变换的变换单元的尺寸。
[0145] 例如,在视频编码设备100或视频解码设备200中,如果编码单元710的尺寸是 64X64,则可通过使用尺寸为32X32的变换单元720来执行变换。
[0146] 此外,可通过对小于64X64的尺寸为32X32、16X16、8X8和4X4的每个变换单 元执行变换,来对尺寸为64X64的编码单元710的数据进行编码,然后可选择具有最小编 码误差的变换单元。
[0147] 图8示出根据本发明的实施例的根据深度的多条编码信息。
[0148] 视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分 区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码, 并将信息800、信息810和信息820作为关于编码模式的信息来发送。
[0149] 信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的 分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
[0150] 信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换单元 可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内 变换单元828。
[0151] 视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单 元,提取并使用用于解码的信息800、810和820。
[0152] 图9是根据本发明的实施例的根据深度的较深层编码单元的示图。
[0153] 划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分 成更低深度的编码单元。
[0154] 用于对深度为0和尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元 910可包括以下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的 分区类型914、尺寸为N_0X2N_0的分区类型916和尺寸为Ν_0ΧΝ_0的分区类型918。图 9仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不限 于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形状 的分区。
[0155] 根据每种分区类型,对尺寸为2N_0X2N_0的一个分区、尺寸为2N_0XN_0的两个 分区、尺寸为N_0X2N_0的两个分区和尺寸为Ν_0ΧΝ_0的四个分区重复地执行预测编码。 可对尺寸为2N_0X2N_0、N_0X2N_0、2N_0XN_0和N_0XN_0的分区执行帧内模式和帧间模 式下的预测编码。仅对尺寸为2N_0X2N_0的分区执行跳过模式下的预测编码。
[0156] 如果在尺寸为2N_0X2N_0、2N_0XN_0和N_0X2N_0的分区类型912至916中的 一个分区类型中编码误差最小,则可不将预测单元910划分到更低深度。
[0157] 如果在尺寸为Ν_0ΧΝ_0的分区类型918中编码误差最小,则深度从0改变到1以 在操作920中划分分区类型918,并对深度为2和尺寸为N_0XN_0的编码单元930重复地 执行编码来搜索最小编码误差。
[0158] 用于对深度为1和尺寸为2N_1X2N_1 ( =N_0XN_0)的编码单元930进行预测编 码的预测单元940可包括以下分区类型的分区:尺寸为2N_1X2N_1的分区类型942、尺寸 为2N_1XN_1的分区类型944、尺寸为N_1X2N_1的分区类型946以及尺寸为N_1XN_1的 分区类型948。
[0159] 如果在尺寸为N_1XN_1的分区类型948中编码误差最小,则深度从1改变到2以 在操作950中划分分区类型948,并对深度为2和尺寸为N_2XN_2的编码单元960重复执 行编码来搜索最小编码误差。
[0160] 当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-Ι,并且 划分信息可被设置直到深度是〇到d-2之一。换句话说,当编码被执行直到在与d-2的深 度相应的编码单元在操作970中被划分之后深度是d-Ι时,用于对深度为d-Ι和尺寸为 2N_(d-l)X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括以下分区类型 的分区:尺寸为2N_(d-l)X2N(d-l)的分区类型992、尺寸为2N_(d-l)XN(d-l)的分区类 型994、尺寸为【((1-1)\2以(1-1)的分区类型996和尺寸为1((1-1)\叭(1-1)的分区类型 998。
[0161] 可对分区类型992至998中的尺寸为2N_(d-l)X2N_(d-l)的一个分区、尺寸 为2N_(d-l)XN_(d-l)的两个分区、尺寸SN_(d-l)X2N_(d-l)的两个分区、尺寸为1 (d-1)XN_(d-l)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
[0162] 即使当尺寸为N_(d-1)XN_(d-Ι)的分区类型998具有最小编码误差时,由于最大 深度是d,因此深度为d-Ι的编码单元CU_(d-Ι)也不再被划分到更低深度,用于构成当前最 大编码单元900的编码单元的编码深度被确定为d-Ι,并且当前最大编码单元900的分区类 型可被确定为N_(d-1)XN(d-l)。此外,由于最大深度是d,并且具有最低深度d-1的最小 编码单元980不再被划分到更低深度,因此不设置最小编码单元980的划分信息。
[0163] 数据单元999可以是用于当前最大编码单元的"最小单元"。根据本发明的实施例 的最小单元可以是通过将具有最低编码深度的最小编码单元980划分成4份而获得的方形 数据单元。通过重复地执行编码,视频编码设备100可通过比较根据编码单元900的深度 的编码误差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模 式设置为编码深度的编码模式。
[0164] 这样,在所有深度0、1、…d_l、d中对根据深度的最小编码误差进行比较,并且具 有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式 可作为关于编码模式的信息被编码并发送。另外,由于编码单元从〇的深度被划分到编码 深度,因此仅将编码深度的划分信息设置为0,并且将除了编码深度以外的深度的划分信息 设置为1。
[0165] 视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元 900的编码深度和预测单元的信息,来对分区912进行解码。视频解码设备200可通过使用 根据深度的划分信息,将划分信息为〇的深度确定为编码深度,并且使用关于相应深度的 编码模式的信息来进行解码。
[0166] 图10、图11和图12是用于描述根据本发明的实施例的在编码单元1010、预测单 元1060和变换单元1070之间的关系的示图。
[0167] 编码单元1010是最大编码单元中的由视频编码设备100确定的根据深度的较深 层编码单元。预测单元1060是每个编码单元1010中的预测单元的分区,变换单元1070是 每个编码单元1010的变换单元。
[0168] 当在编码单元1010中最大编码单元的深度是0时,编码单元1012和1054的深度 是 1,编码单元 1014、1016、1018、1028、1050 和 1052 的深度是 2,编码单元 1020、1022、1024、 1026、1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
[0169] 在预测单元1060中,通过划分编码单元1010中的编码单元来获得一些分区1014、 1016、1022、1032、1048、1050、1052 和 1054。换句话说,编码单元 1014、1022、1050 和 1054 中的分区类型的尺寸是2NXN,编码单元1016、1048和1052中的分区类型的尺寸是NX2N, 编码单元1032的分区类型的尺寸为NXN。编码单元1010的预测单元和分区小于或等于每 个编码单元。
[0170] 在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图 像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、 1016、1022、1032、1048、1050和 1052 不同于预测单元 1060 中的编码单元1014、1016、1022、 1032、1048、1050和1052。换句话说,视频编码设备100和视频解码设备200可对同一编码 单元中的数据单元独立地执行帧内预测、运动估计、运动补偿、变换和逆变换。
[0171] 因此,对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行 编码来确定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于 编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸 的信息。表1示出可由视频编码设备100和视频解码设备200设置的编码信息。
[0172] [表 1]

【权利要求】
1. 一种多视点视频层间编码方法,包括: 基于树结构的编码单元对基本层图像进行编码,其中,树结构的编码单元包括通过分 层划分图像的最大编码单元而获得的编码单元之中的被完全划分的编码单元,基本层图像 是基本视点图像之中的基本视点纹理图像和基本视点深度图像中的一个; 基于树结构的编码单元,通过参考预定层间编码模式和基本层图像的编码信息,对作 为单独的附加层图像的以下图像分别执行预测编码:基本视点纹理图像和基本视点深度图 像之中的不是基本层图像的另一个、附加视点图像之中的附加视点纹理图像和附加视点深 度图像; 基于所述预定层间编码模式输出基本视点图像的编码模式和预测值以及附加视点图 像的层间编码模式, 其中,通过对视频的图像进行空间划分而获得的每个最大编码单元被划分为多个编码 单元,并且,是否将所述多个编码单元中的每个编码单元划分为更小的编码单元以独立于 邻近的编码单元的方式被确定。
2. 如权利要求1所述的多视点视频层间编码方法,其中,对基本层图像进行编码的步 骤包括:对基本视点纹理图像和基本视点深度图像中的一个进行编码, 其中,对附加层图像执行预测编码的步骤包括:根据所述预定层间编码模式,通过参 考经由对基本视点纹理图像和基本视点深度图像中的一个进行编码而产生的编码信息,对 基本视点纹理图像和基本视点深度图像中的另一个进行编码。
3. 如权利要求2所述的多视点视频层间编码方法,其中,对附加层图像执行预测编码 的步骤包括: 对附加视点纹理图像和附加视点深度图像中的一个进行编码; 根据所述预定层间编码模式,通过参考经由对基本视点纹理图像、基本视点深度图像、 附加视点纹理图像和附加视点深度图像中的一个进行编码而产生的编码信息,对附加视点 纹理图像和附加视点深度图像中的另一个进行编码。
4. 如权利要求1所述的多视点视频层间编码方法,其中,对附加层图像执行预测编码 的步骤包括:基于基本视点图像和附加视点图像之间的视差,确定将被附加视点图像的数 据单元参考的基本视点图像的数据单元。
5. 如权利要求4所述的多视点视频层间编码方法,其中,确定所述数据单元的步骤包 括:通过使用附加视点图像的当前数据单元和基本视点图像之间的视差,确定与附加视点 图像的当前数据单元相映射的基本视点图像的数据单元的位置, 其中,数据单元包括以下单元中的至少一个:最大编码单元、编码单元、预测单元、变换 单元和最小单元,其中,预测单元、变换单元和最小单元被包括在编码单元中。
6. 如权利要求5所述的多视点视频层间编码方法,其中,确定所述数据单元的步骤包 括: 通过使用先前在基本视点深度图像或先前在附加视点图像的邻近数据单元中使用的 视差或深度信息,确定附加视点图像的当前数据单元和基本视点图像之间的视差; 通过使用确定的视差,确定与所述当前数据单元相映射的基本视点图像的数据单元的 位置。
7. -种多视点视频层间解码方法,包括: 从多个比特流解析基本层图像的编码信息以及基本层图像和附加层图像之间的层间 编码模式,其中,所述多个比特流分别包括作为单独的层的以下图像:基本视点图像的基本 视点纹理图像、基本视点图像的基本视点深度图像、附加视点图像的附加视点纹理图像和 附加视点图像的附加视点深度图像; 通过使用解析的基本层图像的编码信息,基于树结构的编码单元对基本层图像进行解 码,其中,树结构的编码单元包括通过分层划分最大编码单元而获得的编码单元之中的被 完全划分的编码单元,基本层图像是基本视点图像之中的基本视点纹理图像和基本视点深 度图像中的一个; 根据附加视点图像的层间编码模式,通过参考解析的基本层图像的编码信息,基于树 结构的编码单元,对作为单独的附加层图像的以下图像分别执行预测解码:基本视点纹理 图像和基本视点深度图像之中的不是基本层图像的另一个、附加视点图像之中的附加视点 纹理图像和附加视点深度图像, 其中,通过对视频的图像进行空间划分而获得的每个最大编码单元被划分为多个编码 单元,并且,是否将所述多个编码单元中的每个编码单元单独地划分为更小的编码单元以 独立于邻近的编码单元的方式被确定。
8. 如权利要求7所述的多视点视频层间解码方法,其中,对基本层图像进行解码的步 骤包括:对基本视点纹理图像和基本视点深度图像中的一个进行解码, 其中,对附加层图像执行预测解码的步骤包括:根据所述层间编码模式,通过参考解 析的基本层图像的编码信息,对基本视点纹理图像和基本视点深度图像中的另一个进行解 码。
9. 如权利要求8所述的多视点视频层间解码方法,其中,对附加层图像执行预测解码 的步骤包括: 对附加视点纹理图像和附加视点深度图像中的一个进行解码; 根据所述层间编码模式,通过参考基本视点纹理图像、基本视点深度图像、附加视点纹 理图像和附加视点深度图像中的一个的编码信息,对附加视点纹理图像和附加视点深度图 像中的另一个进行解码。
10. 如权利要求7所述的多视点视频层间解码方法,其中,对附加层图像执行预测解码 的步骤包括:通过使用附加视点图像的当前数据单元和基本视点图像之间的视差信息,确 定将被附加视点图像的当前数据单元参考的基本视点图像的数据单元, 其中,数据单元包括以下单元中的至少一个:最大编码单元、编码单元、预测单元、变换 单元和最小单元,其中,预测单元、变换单元和最小单元被包括在编码单元中。
11. 如权利要求10所述的多视点视频层间解码方法,其中,确定所述数据单元的步骤 包括:通过使用附加视点图像的当前数据单元和基本视点图像之间的视差信息,确定与所 述当前数据单元相映射的基本视点图像的数据单元的位置。
12. 如权利要求10所述的多视点视频层间解码方法,其中,确定所述数据单元的步骤 包括: 通过使用先前在基本视点深度图像或先前在附加视点图像的邻近数据单元中使用的 视差信息或深度信息,确定附加视点图像的当前数据单元和基本视点图像之间的视差信 息; 通过使用确定的视差信息,确定与所述当前数据单元相映射的基本视点图像的数据单 元的位置。
13. -种多视点视频层间编码设备,包括: 基本层编码器,基于树结构的编码单元对基本层图像进行编码,其中,树结构的编码单 元包括通过分层划分图像的最大编码单元而获得的编码单元之中的被完全划分的编码单 元,基本层图像是基本视点图像之中的基本视点纹理图像和基本视点深度图像中的一个; 附加层编码器,基于树结构的编码单元,通过参考预定层间编码模式和基本层图像的 编码信息,对作为单独的附加层图像的以下图像分别执行预测编码:基本视点纹理图像和 基本视点深度图像之中的不是基本层图像的另一个、附加视点图像之中的附加视点纹理图 像和附加视点深度图像; 输出单元,基于所述预定层间编码模式输出基本视点图像的编码信息以及附加视点图 像的层间编码模式, 其中,通过对视频的图像进行空间划分而获得的每个最大编码单元被划分为多个编码 单元,并且,是否将所述多个编码单元中的每个编码单元单独地划分为更小的编码单元以 独立于邻近的编码单元的方式被确定。
14. 一种多视点视频层间解码设备,包括: 解析器,从多个比特流解析基本层图像的编码信息以及基本层图像和附加层图像之间 的层间编码模式,其中,所述多个比特流分别包括作为单独的层的以下图像:基本视点图像 的基本视点纹理图像、基本视点图像的基本视点深度图像、附加视点图像的附加视点纹理 图像和附加视点图像的附加视点深度图像; 基本层解码器,通过使用解析的基本层图像的编码信息,基于树结构的编码单元对基 本层图像进行解码,其中,树结构的编码单元包括通过分层划分最大编码单元而获得的编 码单元之中的被完全划分的编码单元,基本层图像是基本视点图像之中的基本视点纹理图 像和基本视点深度图像中的一个; 附加层解码器,根据附加视点图像的层间编码模式,通过参考解析的基本层图像的编 码信息,基于树结构的编码单元,对作为单独的附加层图像的以下图像分别执行预测解码: 基本视点纹理图像和基本视点深度图像之中的不是基本层图像的另一个、附加视点图像之 中的附加视点纹理图像和附加视点深度图像, 其中,通过对视频的图像进行空间划分而获得的每个最大编码单元被划分为多个编码 单元,并且,是否将所述多个编码单元中的每个编码单元单独地划分为更小的编码单元以 独立于邻近的编码单元的方式被确定。
15. -种记录有用于执行如权利要求1和6中的任意一项所述的多视点视频层间编码 方法的程序的计算机可读记录介质。
【文档编号】H04N19/30GK104365104SQ201380031804
【公开日】2015年2月18日 申请日期:2013年4月16日 优先权日:2012年4月16日
【发明者】崔秉斗, 李泰美, 朴正辉 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1