视频解码方法和视频解码设备的制造方法_5

文档序号:9601150阅读:来源:国知局
分区804、尺寸为NX2N的分区806和尺寸为NXN的分区808。这里,关于分区类 型的信息800被设置为指示以下分区之一:尺寸为2NXN的分区804、尺寸为NX2N的分区 806和尺寸为NXN的分区808。
[0303] 信息810指示每个分区的预测模式。例如,信息810可指示对由信息800指示的 分区执行的预测编码的模式,即,帧内模式812、帧间模式814或跳过模式816。
[0304] 此外,信息820指示当对当前编码单元执行变换时所基于的变换单元。例如,变换 单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二 帧间变换单元828。
[0305] 根据示例性实施例的视频解码设备200的图像数据和编码信息提取器220可根据 每个较深层编码单元,提取并使用用于解码的信息800、810和820。
[0306] 图16是示出根据本发明的示例性实施例的根据深度的较深层编码单元的示图。
[0307] 划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分 成更低深度的编码单元。
[0308] 用于对深度为0和尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元 910可包括以下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的 分区类型914、尺寸为N_0X2N_0的分区类型916和尺寸为Ν_0ΧΝ_0的分区类型918。图 16仅示出了通过对称地划分预测单元910而获得的分区类型912至918,但是分区类型不 限于此,并且预测单元910的分区可包括非对称分区、具有预定形状的分区和具有几何形 状的分区。
[0309] 根据每种分区类型,对尺寸为2N_0X2N_0的一个分区、尺寸为2N_0XN_0的两个 分区、尺寸为N_0X2N_0的两个分区和尺寸为Ν_0ΧΝ_0的四个分区重复地执行预测编码。 可对尺寸为2N_0X2N_0、N_0X2N_0、2N_0XN_0和N_0XN_0的分区执行帧内模式和帧间模 式下的预测编码。仅对尺寸为2N_0X2N_0的分区执行跳过模式下的预测编码。
[0310] 如果在分区类型912至916中的一个分区类型中编码误差最小,则可不将预测单 元910划分到更低深度。
[0311] 如果在分区类型918中编码误差最小,则深度从0改变到1以在操作920中划分 分区类型918,并对深度为2和尺寸为Ν_0ΧΝ_0的编码单元930重复地执行编码来搜索最 小编码误差。
[0312] 用于对深度为1和尺寸为2N_1X2N_1( =Ν_0ΧΝ_0)的编码单元930进行预测编 码的预测单元940可包括以下分区类型的分区:尺寸为2N_1X2N_1的分区类型942、尺寸 为2N_1XN_1的分区类型944、尺寸为N_1X2N_1的分区类型946以及尺寸为N_1XN_1的 分区类型948。
[0313] 如果在分区类型948中编码误差最小,则深度从1改变到2以在操作950中划分 分区类型948,并对深度为2和尺寸为N_2XN_2的编码单元960重复执行编码来搜索最小 编码误差。
[0314] 当最大深度是d时,根据每个深度的划分操作可被执行直到深度变成d-Ι时,并且 划分信息可被编码直到深度是〇到d-2之一时。换句话说,当编码被执行直到在与d-2的 深度相应的编码单元在操作970中被划分之后深度是d-Ι时,用于对深度为d-Ι和尺寸为 2N_(d-l)X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括以下分区类型的 分区:尺寸为2N_(d-l)X2N_(d-l)的分区类型992、尺寸为2N_(d-l)XN_(d-l)的分区类 型994、尺寸为N_(d-l)X2N_(d-l)的分区类型996和尺寸SN_(d-l)XN_(d-l)的分区类 型 998。
[0315] 可对分区类型992至998中的尺寸为2N_(d-l)X2N_(d-l)的一个分区、尺寸 为21((1-1)\1((1-1)的两个分区、尺寸为1((1-1)\21((1-1)的两个分区、尺寸为1 (d-1)XN_(d-l)的四个分区重复地执行预测编码,以搜索具有最小编码误差的分区类型。
[0316] 即使当分区类型998具有最小编码误差时,由于最大深度是d,因此深度为d-Ι的 编码单元CU_(d-Ι)也不再被划分到更低深度,用于构成当前LCU900的编码单元的编码深 度被确定为d-Ι,并且当前IXU900的分区类型可被确定SN_(d-l)XN_(d-l)。此外,由于 最大深度是d,并且具有最低深度d-Ι的最小编码单元980不再被划分到更低深度,因此不 设置最小编码单元980的划分信息。
[0317] 数据单元999可以是用于当前LCU的"最小单元"。根据示例性实施例的最小单元 可以是通过将最小编码单元980划分成4份而获得的正方形数据单元。通过重复地执行编 码,根据示例性实施例的视频编码设备100可通过比较根据编码单元900的深度的编码误 差来选择具有最小编码误差的深度以确定编码深度,并将相应分区类型和预测模式设置为 编码深度的编码模式。
[0318] 这样,在所有深度1至d中对根据深度的最小编码误差进行比较,并且具有最小编 码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关 于编码模式的信息被编码并发送。另外,由于编码单元从〇的深度被划分到编码深度,因此 仅将编码深度的划分信息设置为〇,并且将除了编码深度以外的深度的划分信息设置为1。
[0319] 根据示例性实施例的视频解码设备200的图像数据和编码信息提取器220可提取 并使用关于编码单元900的编码深度和预测单元的信息,来对分区912进行解码。根据示 例性实施例的视频解码设备200可通过使用根据深度的划分信息,将划分信息为0的深度 确定为编码深度,并且使用关于相应深度的编码模式的信息来进行解码。
[0320] 图17至图19是用于解释根据本发明的示例性实施例的在编码单元1010、预测单 元1060和变换单元1070之间的关系的示图。
[0321] 编码单元1010是LCU中的与由根据示例性实施例的视频编码设备100确定的编 码深度相应的具有树结构的编码单元。预测单元1060是每个编码单元1010中的预测单元 的分区,变换单元1070是每个编码单元1010的变换单元。
[0322] 当在编码单元1010中IXU的深度是0时,编码单元1012和1054的深度是1,编 码单元 1014、1016、1018、1028、1050 和 1052 的深度是 2,编码单元 1020、1022、1024、1026、 1030、1032和1048的深度是3,编码单元1040、1042、1044和1046的深度是4。
[0323] 在预测单元1060中,通过划分编码单元1010中的编码单元来获得一些编码单元 1014、1016、1022、1032、1048、1050、1052 和 1054。换句话说,编码单元 1014、1022、1050 和 1054中的分区类型的尺寸是2NXN,编码单元1016U048和1052中的分区类型的尺寸是 NX2N,编码单元1032的分区类型的尺寸为NXN。编码单元1010的预测单元和分区小于或 等于每个编码单元。
[0324] 在小于编码单元1052的数据单元中的变换单元1070中,对编码单元1052的图 像数据执行变换或逆变换。另外,在尺寸和形状方面,变换单元1070中的编码单元1014、 1016、1022、1032、1048、1050、1052 和 1054 不同于预测单元 1060 中的编码单元 1014、1016、 1022、1032、1048、1050、1052和1054。换句话说,根据示例性实施例的视频编码设备100和 根据示例性实施例的视频解码设备200可对同一编码单元中的数据单元独立地执行帧内 预测、运动估计、运动补偿、变换和逆变换。
[0325] 因此,对LCU的每个区域中的具有分层结构的每个编码单元递归地执行编码来确 定最优编码单元,从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元 的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表 1示出可由根据示例性实施例的视频编码设备100和根据示例性实施例的视频解码设备 200设置的编码信息。
[0326][表1]
[0327]
[0328] 根据示例性实施例的视频编码设备100的输出单元130可输出关于具有树结构的 编码单元的编码信息,根据示例性实施例的视频解码设备200的图像数据和编码信息提取 器220可从接收到的比特流提取关于具有树结构的编码单元的编码信息。
[0329] 划分信息指示是否将当前编码单元划分成更低深度的编码单元。如果当前深度d 的划分信息是〇,则当前编码单元不再被划分成更低深度的深度是编码深度,从而可针对所 述编码深度来定义关于分区类型、预测模式和变换单元的尺寸的信息。如果当前编码单元 根据划分信息被进一步划分,则对更低深度的四个划分编码单元独立地执行编码。
[0330] 预测模式可以是帧内模式、帧间模式和跳过模式中的一种。可在所有分区类型中 定义帧内模式和帧间模式,仅在尺寸为2NX2N的分区类型中定义跳过模式。
[0331] 关于分区类型的信息可指示通过对称地划分预测单元的高度或宽度而获得的尺 寸为2NX2N、2NXN、NX2N和NXN的对称分区类型,以及通过非对称地划分预测单元的高 度或宽度而获得的尺寸为2NXnU、2NXnD、nLX2N和nRX2N的非对称分区类型。可通过按 1:3和3:1来划分预测单元的高度来分别获得尺寸为2NXnU和2NXnD的非对称分区类型, 可通过按1:3和3:1来划分预测单元的宽度来分别获得尺寸为nLX2N和nRX2N的非对称 分区类型。
[0332] 可将变换单元的尺寸设置成帧内模式下的两种类型和帧间模式下的两种类型。换 句话说,如果变换单元的划分信息是0,则变换单元的尺寸可以是2NX2N,即当前编码单元 的尺寸。如果变换单元的划分信息是1,则可通过对当前编码单元进行划分来获得变换单 元。另外,如果尺寸为2NX2N的当前编码单元的分区类型是对称分区类型,则变换单元的 尺寸可以是NXN,如果当前编码单元的分区类型是非对称分区类型,则变换单元的尺寸可 以是N/2XN/2。
[0333] 根据示例性实施例的关于具有树结构的编码单元的编码信息可包括与编码深度 相应的编码单元、预测单元和最小单元中的至少一个。与编码深度相应的编码单元可包括 包含相同编码信息的预测单元和最小单元中的至少一个。
[0334] 因此,通过比较邻近数据单元的编码信息来确定邻近数据单元是否被包括在与编 码深度相应的同一编码单元中。另外,通过使用数据单元的编码信息来确定与编码深度相 应的相应编码单元,并因此可确定LCU中的编码深度的分布。
[0335] 因此,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则可直接 参考并使用与当前编码单元邻近的较深层编码单元中的数据单元的编码信息。
[0336] 可选地,如果基于邻近数据单元的编码信息来对当前编码单元进行预测,则使用 数据单元的编码信息来搜索与当前编码单元邻近的数据单元,并可参考搜索到的邻近编码 单元以对当前编码单元进行预测。
[0337] 图20是用于描述根据表1的编码模式信息的编码单元、预测单元和变换单元之间 的关系的示图。
[0338]LCU1300包括多个编码深度的编码单元1302、1304、1306、1312、1314、1316和 1318。这里,由于编码单元1318是一个编码深度的编码单元,因此划分信息可被设置成0。 可将关于尺寸为2NX2N的编码单元1318的分区类型的信息设置成以下分区类型中的一 种:尺寸为2NX2N的分区类型1322、尺寸为2NXN的分区类型1324、尺寸为NX2N的分区 类型1326、尺寸为NXN的分区类型1328、尺寸为2NXnU的分区类型1332、尺寸为2NXnD 的分区类型1334、尺寸为nLX2N的分区类型1336以及尺寸为nRX2N的分区类型1338。
[0339] 变换单元的划分信息(TU尺寸标记)是一种类型的变换索引。与变换索引相应的 变换单元的尺寸可根据编码单元的预测单元类型或分区类型而改变。
[0340] 例如,当分区类型被设置成对称(S卩,分区类型1322、1324、1326或1328)时,如果 变换单元的TU尺寸标记是0,则设置尺寸为2NX2N的变换单元1342,如果TU尺寸标记是 1,则设置尺寸为NXN的变换单元1344。
[0341] 当分区类型被设置成非对称(S卩,分区类型1332、1334、1336或1338)时,如果TU 尺寸标记是0,则设置尺寸为2NX2N的变换单元1352,如果TU尺寸标记是1,则设置尺寸为 N/2XN/2的变换单元1354。
[0342] 参照图20,TU尺寸标记是具有值0或1的标记,但是TU尺寸标记不限于1比特, 并且变换单元可在TU尺寸标记从0开始增加时被分层划分为具有树结构。变换单元的划 分信息(TU尺寸标记)可以是变换索引的示例。
[0343] 在这种情况下,根据示例性实施例,可通过使用变换单元的TU尺寸标记以及变换 单元的最大尺寸和最小尺寸来表示实际上已使用的变换单元的尺寸。根据示例性实施例的 视频编码设备100能够对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标 记进行编码。对最大变换单元尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记进行编 码的结果可被插入SPS。根据示例性实施例的视频解码设备200可通过使用最大变换单元 尺寸信息、最小变换单元尺寸信息和最大TU尺寸标记来对视频进行解码。
[0344] 例如,(a)如果当前编码单元的尺寸是64X64并且最大变换单元尺寸是32X32, 则(a-Ι)当TU尺寸标记为0时,变换单元的尺寸可以是32X32,(a-2)当TU尺寸标记为1 时,变换单元的尺寸可以是16X16,(a-3)当TU尺寸标记为2时,变换单元的尺寸可以是 8X8。
[0345] 作为另一示例,(b)如果当前编码单元的尺寸是32X32并且最小变换单元尺寸是 32X32,则(b-Ι)当TU尺寸标记为0时,变换单元的尺寸可以是32X32。这里,由于变换单 元的尺寸不能够小于32X32,因此TU尺寸标记不能够被设置为除了 0以外的值。
[0346] 作为另一示例,(c)如果当前编码单元的尺寸是64X64并且最大TU尺寸标记为 1,则TU尺寸标记可以是0或1。这里,TU尺寸标记不能够被设置为除了 0或1以外的值。
[0347] 因此,如果定义最大TU尺寸标记为"MaxTransformSizelndex",最小变换单元尺 寸为"MinTransformSize",当TU尺寸标记为0时的变换单元尺寸为"RootTuSize",则可通 过等式(1)来定义可在当前编码单元中确定的当前最小变换单元尺寸"CurrMinTuSize":
[0348]CurrMinTuSize=max(MinTransformSize,RootTuSize/ (2'MaxTransformSizeIndex))
[0349] ... (1)
[0350] 与可在当前编码单元中确定的当前最小变换单元尺寸"CurrMinTuSize"相 比,当TU尺寸标记为0的变换单元尺寸"RootTuSize"可指示可在系统中选择的最大 变换单元尺寸。在等式(1)中,"RootTuSize/(2~MaxTransformSizeIndex)" 指不当TU 尺寸标记为〇时,变换单元尺寸"RootTuSize"被划分了与最大TU尺寸标记相应的次 数时的变换单元尺寸,"MinTransformSize"指示最小变换尺寸。因此,"RootTuSize/ (2~MaxTransformSizeIndex) "和"MinTransformSize"中较小的值可以是可在当前编码单 元中确定的当前最小变换单元尺寸"CurrMinTuSize"。
[0351] 根据示例性实施例,最大变换单元尺寸RootTuSize可根据预测模式的类型而改 变。
[0352] 例如,如果当前预测模式是帧间模式,则可通过使用以下的等式(2)来确定 "RootTuSize"。在等式(2)中,"MaxTransformSize"指不最大变换单元尺寸,"PUSize"指 示当前预测单元尺寸。
[0353]RootTuSize=min(MaxTransformSize,PUSize)......(2)
[0354] 也就是说,如果当前预测模式是帧间模式,则当TU尺寸标记为0时的变换单元尺 寸"RootTuSize"可以是最大变换单元尺寸和当前预测单元尺寸中较小的值。
[0355] 如果当前分区单元的预测模式是帧内模式,则可通过使用以下的等式(3)来确定 "RootTuSize"。在等式(3)中,"PartitionSize"指示当前分区单元的尺寸:
[0356]RootTuSize=min(MaxTransformSize,PartitionSize)......(3)
[0357] 也就是说,如果当前预测模式是帧内模式,则当TU尺寸标记为0时的变换单元尺 寸"RootTuSize"可以是最大变换单元尺寸和当前分区单元的尺寸之中较小的值。
[0358] 然而,根据分区单元中的预测模式的类型而改变的当前最大变换单元尺寸 "RootTuSize"仅是示例,并且本发明不限于此。
[0359] 根据参照图8至图20描述的基于具有树结构的编码单元的视频编码方法,可针对 具有树结构的每个编码单元对空间域的图像数据进行编码。根据基于具有树结构的编码单 元的视频解码方法,可针对每个LCU执行解码来恢复空间域的图像数据。因此,可恢复画面 和作为画面序列的视频。恢复的视频可由再现设备来再现,可存储在存储介质中,或可通过 网络来发送。
[0360] 根据本发明的实施例可被编写为计算机程序,并可以以使用计算机可读记录介质 执行程序的通用数据计算机来实现。计算机可读记录介质的示例包括磁存储介质(例如, R0M、软盘、硬盘等)和光学记录介质(例如,CD-ROM或DVD)。
[0361] 为了便于解释,涉及参照图la至图20描述的熵编码方法的视频编码方法将被统 称为"根据本发明的视频编码方法"。另外,涉及参照图la至图20描述的熵解码方法的视 频解码方法将被统称为"根据本发明的视频解码方法"。
[0362] 另外,参照图la至图20描述的包括熵编码设备10的视频编码设备100以及包括 图像编码器400的视频编码设备将被称为"根据本发明的视频编码设备"。另外,以上参照 图la至图20描述的包括熵解码设备20和图像解码器500的视频解码设备200将被称为 "根据本发明的视频解码设备"。
[0363] 现在将详细描述根据示例性实施例的存储程序的计算机可读记录介质(例如,盘 26000)〇
[0364]图21是根据示例性实施例的存储程序的盘26000的物理结构的示图。作为存储 介质的盘26000可以是硬盘驱动器、致密盘只读存储器(CD-ROM)盘、蓝光盘或数字多功能 盘(DVD)。盘26000包括多个同心磁道Tr,每个同心磁道Tr沿盘26000的圆周方向被划分 成特定数量的扇区Se。在盘26000的特定区域中,可分配并存储执行以上所描述的量化参 数确定方法、视频编码方法和视频解码方法的程序。
[0365] 现在将参照图22来描述使用存储用于执行如上所述的视频编码方法和视频解码 方法的程序的存储介质来实现的计算机系统。
[0366] 图22是通过使用盘26000来记录并读取程序的盘驱动器26800的示图。计算机 系统27000可经由盘驱动器26800将执行根据本发明的视频编码方法和视频解码方法中的 至少一个的程序存储在盘26000中。为了在计算机系统27000中运行存储在盘26000中的 程序,可通过使用盘驱动器26800从盘26000读取程序并将程序发送到计算机系统26700。
[0367] 执行根据本发明的视频编码方法和视频解码方法中的至少一个的程序不仅可被 存储在图21或图22中示出的盘26000中,还可被存储在存储卡、ROM卡带或固态驱动器 (SSD)中。
[0368] 以下将描述应用以上所描述的视频编码方法和视频解码方法的系统。
[0369]图23是用于提供内容分布服务的内容供应系统11000的整体结构的示图。将通 信系统的服务区域划分成预定尺寸的小区,并将无线基站11700、11800、11900和12000分 别安装在这些小区中。
[0370] 内容供应系统11000包括多个独立装置。例如,诸
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1