用于对多层视频进行解码的方法和设备以及用于对多层视频进行编码的方法和设备的制造方法_4

文档序号:9553566阅读:来源:国知局
低深度。
[0147] 如果在尺寸为Ν_0ΧΝ_0的分区类型918中编码误差最小,则在操作920中,深度 可从〇改变为1以对分区类型918进行划分,并可对深度为2且尺寸为Ν_0ΧΝ_0的编码单 兀930重复执行编码以搜索最小编码误差。
[0148] 用于对深度为1且尺寸为2N_1X2N_1( =Ν_0ΧΝ_0)的编码单元930进行预测编 码的预测单元940可包括尺寸为2N_1X2N_1的分区类型942、尺寸为2N_1XN_1的分区类 型944、尺寸为N_1X2N_1的分区类型946和尺寸为N_1XN_1的分区类型948的分区。
[0149] 如果在尺寸为N_1XN_1的分区类型948中编码误差最小,则在操作950中,深度 可从1改变为2以对分区类型948进行划分,并可对深度为2且尺寸为N_2XN_2的编码单 兀960重复执行编码以搜索最小编码误差。
[0150] 在最大深度为d时,根据每个深度的划分操作可被执行直到深度变为d-Ι,并且 划分信息可被编码直到深度为〇至d-2中的一个。换而言之,当在操作970中执行编码 直到与深度d-2相应的编码单元被划分之后深度为d-Ι时,用于对深度为d-Ι且尺寸为 2N_(d-l)X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括尺寸为2N_ (d-l)X2N_(d-l)的分区类型992、尺寸为2N_(d-l)XN_(d-l)的分区类型994、尺寸为N_ (d-1)X2N_(d-l)的分区类型996以及尺寸为N_(d-1)XN_(d-l)的分区类型998的分区。
[0151] 可对分区类型992至分区类型998之中的尺寸为2N_ (d-1)X2N_ (d-Ι)的一个分 区、尺寸为2N_(d-l)XN_(d-l)的两个分区、尺寸SN_(d-l)X2N_(d-l)的两个分区、尺寸 为N_(d-1)XN_(d-Ι)的四个分区重复执行预测编码,以搜索具有最小编码误差的分区类 型。
[0152] 即使在尺寸为N_(d_l)XN_(d_l)的分区类型998具有最小编码误差时,由于最大 深度为d,所以深度为d-Ι的编码单元CU_(d-Ι)不再被划分为更低深度,针对构成当前最大 编码单元900的编码单元的编码深度可被确定为d-Ι,并且当前最大编码单元900的分区类 型可被确定为N_(d_l)XN_(d_l)。另外,由于最大深度为d并且最低深度为d-Ι的最小编 码单元980不再被划分为更低深度,所以不设置针对最小编码单元980的划分信息。
[0153] 数据单元999可以是针对当前最大编码单元的"最小单元"。根据本发明的实施例 的最小单元可以是通过将最小编码单元980划分为4份而获取的矩形数据单元。通过重复 地执行编码,视频编码设备100可通过将根据编码单元900的深度的编码误差进行比较来 选择具有最小编码误差的深度以确定编码深度,并且可将相应的分区类型和预测模式设置 为所述编码深度的编码模式。
[0154] 这样,在深度0至d的所有深度中对根据深度的最小编码误差进行比较,并且具有 最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型以及预测模式 可作为与编码模式有关的信息被编码和发送。另外,由于从深度〇至编码深度对编码单元 进行划分,所以仅编码深度的划分信息被设置为〇,并且除了编码深度以外的深度的划分信 息被设置为1。
[0155] 视频解码设备200的图像数据和编码信息提取器220可提取并使用与编码单元 900的编码深度和预测单元有关的信息,以对编码单元912进行解码。视频解码设备200可 通过使用根据深度的划分信息将划分信息为0的深度确定为编码深度,并且可使用与相应 深度的编码模式有关的信息,以用于解码。
[0156] 图10至图12是用于描述根据本发明的实施例的编码单元1010、预测单元1060和 变换单元1070之间的关系的示图。
[0157] 编码单元1010是最大编码单元中的与由视频编码设备100确定的编码深度相应 的具有树结构的编码单元。预测单元1060是每个编码单元1010的预测单元的分区,变换 单元1070是每个编码单元1010的变换单元。
[0158] 当在编码单元1010中最大编码单元的深度为0时,编码单元1012和编码单元 1054的深度为1,编码单元1014、编码单元1016、编码单元1018、编码单元1028、编码单元 1050和编码单元1052的深度为2,编码单元1020、编码单元1022、编码单元1024、编码单 元1026、编码单元1030、编码单元1032和编码单元1048的深度为3,编码单元1040、编码 单元1042、编码单元1044和编码单元1046的深度为4。
[0159] 关于预测单元1060,通过对编码单元进行划分获取一些编码单元1014、编码单元 1016、编码单元1022、编码单元1032、编码单元1048、编码单元1050、编码单元1052和编码 单元1054。换而言之,编码单元1014、编码单元1022、编码单元1050和编码单元1054中的 分区类型的尺寸为2NXN,编码单元1016、编码单元1048和编码单元1052中的分区类型的 尺寸为NX2N,编码单元1032的分区类型的尺寸为NXN。编码单元1010的预测单元和分 区小于或等于每个编码单元。
[0160] 以小于编码单元1052的数据单元对变换单元1070中的编码单元1052的图像数 据执行变换或逆变换。另外,编码单元1014、编码单元1016、编码单元1022、编码单元1032、 编码单元1048、编码单元1050、编码单元1052和编码单元1054与预测单元1060中的那些 编码单元在尺寸或形状上不同。换而言之,视频编码设备100和视频解码设备200可对在相 同的编码单元中的数据单元独立地执行帧内预测、运动预测、运动补偿、变换以及逆变换。
[0161] 因此,对最大编码单元的每个区域中具有分层结构的编码单元中的每个编码单元 递归地执行编码以确定最佳编码单元,因此可获取具有递归树结构的编码单元。编码信息 可包括与编码单元有关的划分信息、与分区类型有关的信息、与预测模式有关的信息以及 与变换单元的尺寸有关的信息。表1示出可由视频编码设备100和视频解码设备200设置 的编码?目息。
[0162][表1]
[0163]
[0165] 视频编码设备100的输出单兀130可输出与具有树结构的编码单兀有关的编码信 息,视频解码设备200的图像数据和编码信息提取器220可从接收的比特流提取与具有树 结构的编码单元有关的编码信息。
[0166] 划分信息指示当前编码单元是否被划分为更低深度的编码单元。如果当前深度d 的划分信息为〇,则当前编码单元不再被划分为更低深度的深度是编码深度,因此,可针对 编码深度定义与变换单元的分区类型、预测模式、尺寸有关的信息。如果还根据划分信息对 当前编码单元进行划分,则对更低深度的被划分的四个编码单元独立地执行编码。
[0167] 预测模式可以是帧内模式、帧间模式和跳过模式中的一种模式。可在所有分区类 型中定义帧内模式和帧间模式,可仅在尺寸为2NX2N的分区类型中定义跳过模式。
[0168] 与分区类型有关的信息可指示通过对称地划分预测单元的高度或宽度而获取的 尺寸为2~\212~\1~\2~和~\~的对称分区类型以及通过非对称地划分预测单元的高 度或宽度而获取的尺寸为2NXnU、2NXnD、nLX2N和nRX2N的非对称分区类型。可通过以 1:3和3:1对预测单元的高度进行划分来分别获取尺寸为2NXnU和2NXnD的非对称分区 类型,可通过以1:3和3:1对预测单元的宽度进行划分来分别获取尺寸为nLX2N和nRX2N 的非对称分区类型。
[0169] 变换单元的尺寸可被设置为帧内模式下的两种类型以及帧间模式下的两种类型。 换而言之,如果变换单元的划分信息为0,则变换单元的尺寸可以是2NX2N(2NX2N是当前 编码单元的尺寸)。如果变换单元的划分信息为1,则可通过对当前编码单元进行划分来获 取变换单元。另外,如果尺寸为2NX2N的当前编码单元的分区类型是对称分区类型,则变 换单元的尺寸可以是NXN,如果当前编码单元的分区类型是非对称分区类型,则变换单元 的尺寸可以是N/2XN/2。
[0170] 与具有树结构的编码单元有关的编码信息包括与编码深度相应的编码单元、预测 单元以及最小单元中的至少一个。与编码深度相应的编码单元可包括包含相同编码信息的 最小单元和预测单元中的至少一个。
[0171] 因此,通过对邻近数据单元的编码信息进行比较来确定邻近数据单元是否被包括 在与编码深度相应的相同编码单元中。另外,可通过使用数据单元的编码信息来确定与编 码深度相应的相应编码单元,因此可确定最大编码单元中的编码深度的分布。
[0172] 因此,如果基于邻近数据单元的编码信息来预测当前编码单元,则可直接参考并 使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
[0173] 可选择地,如果基于邻近数据单元的编码信息来预测当前编码单元,则使用数据 单元的编码信息来搜索与当前编码单元邻近的数据单元,并且可参考搜索到的邻近编码单 元,以用于对当前编码单元进行预测。
[0174] 图13是用于描述根据表1的编码模式信息的编码单元、预测单元或变换单元之间 的关系的不图。
[0175] 最大编码单元1300包括多个编码深度的编码单元1302、编码单元1304、编码单元 1306、编码单元1312、编码单元1314、编码单元1316和编码单元1318。在这种情况下,由于 编码单元1318是编码深度的编码单元,所以划分信息可被设置为0。与尺寸为2NX2N的 编码单元1318的分区类型有关的信息可被设置为尺寸为2NX2N的分区类型1322、尺寸为 2NXN的分区类型1324、尺寸为NX2N的分区类型1326、尺寸为NXN的分区类型1328、尺 寸为2NXnU的分区类型1332、尺寸为2NXnD的分区类型1334、尺寸为nLX2N的分区类型 1336以及尺寸为nRX2N的分区类型1338中的一个分区类型。
[0176]在分区类型被设置为对称(S卩,分区类型1322、分区类型1324、分区类型1326或 分区类型1328)时,如果变换单元的划分信息(TU尺寸标志)为0,则设置尺寸为2NX2N的 变换单元1342,如果TU尺寸标志为1,则设置尺寸为NXN的变换单元1344。
[0177]在分区类型被设置为非对称(即,分区类型1332、分区类型1334、分区类型1336或分区类型1338)时,如果TU尺寸标志为0,则设置尺寸为2NX 2N的变换单元1352,如果 TU尺寸标志为1,则设置尺寸为N/2XN/2的变换单元1354。
[0178] 以上参照图1至图13描述的包括具有树结构的编码单元的最大编码单元可被称 为各种名称,诸如编码块树、块树、根块树、编码树或树干。
[0179] 在下文中,参照图14至图22,以下将描述用于对多层视频进行编码的方法和设备 以及用于对多层视频进行解码的方法和设备。在下文中,术语"画面"可指示视频静止画面 或运动画面(即,视频)。此外,编码序列是编码器对画面进行处理的序列,而解码序列是解 码器对画面进行处理的序列,其中,编码序列和解码序列彼此相同。
[0180] 图14是根据本发明的实施例的多层视频编码设备的框图。
[0181] 参照图14,多层视频编码设备包括视频编码器1410和DPB操作信息产生器1420。
[0182]视频编码器1410接收多层视频并对多层视频进行编码。视频编码器1410与对输 入的视频进行编码的视频编码层相应。
[0183] 如在上文中参照图1至图13进行的描述,根据示例性实施例的视频编码器1410 将多层视频中所包括的每个画面划分为具有最大尺寸的最大编码单元,将划分的最大编码 单元划分为编码单元,并基于编码单元对每个画面进行编码。编码单元具有通过分层地划 分根据深度的最大编码单元而形成的树结构。视频编码器1410通过使用预测单元关于编 码单元进行预测,并通过使用变换单元对包括预测值与原始信号之间的差异的残差数据进 行变换。
[0184] 多层视频可以是多视点视频或可伸缩视频。如果多层视频是多视点视频,则视频 编码器141〇可将n(n为自然数)个视点的每个画面序列编码编码为单个层。如果多层视 频是可伸缩视频,则视频编码器1410可对基本层的画面序列和增强层的画面序列分别进 行编码。
[0185] 多层视频与单层视频相比包括较大的数据量。因此,视频编码器1410可通过使用 多层视频中所包括的各个层的画面之间的相关性来执行预测编码。换而言之,视频编码器 1410可基于另一层的一个或更多个画面来对每层的画面进行预测编码。通过参照当前层的 画面和另一层的画面进行预测可指示层间预测。
[0186] 例如,视频编码器1410可通过参考基本视点的画面来执行用于预测附加视点的 画面的视点间预测。此外,视频编码器1410可通过参考预定的附加视点的画面来执行用于 预测其它额外视点的画面的视点间预测。通过视点间预测,可产生当前画面与参考画面之 间的不同,以及作为当前画面与参考画面之间的差异的残差。如上所述,可基于具有树结构 的编码单元、预测单元或变换单元来执行层间预测。
[0187] 视频编码器1410可通过在同一层的画面中执行帧间预测和帧内预测或者使用另 一层的画面执行层间预测来确定多层中所包括的画面之间的参考关系。此外,视频编码器 1410可通过对帧间预测、帧内预测和层间预测期间产生的预测值与原始信号之间的差异 进行变换和量化来执行编码。通过这种在VCL(视频编码层)下的编码操作,视频编码器 1410输出与编码单元有关的残差信息、预测模式信息和与编码单元的预测编码有关的附加 信息。附加信息可包括:DPB(解码图像缓冲器)信息、RPS(
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1