使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备的制作方法

文档序号：7792101阅读：208来源：国知局

使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备的制作方法
【专利摘要】提供使用用于并行处理的统一语法的一种视频编码方法和设备以及一种视频解码方法和设备。所述视频解码方法包括：从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志，其中，第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码信息；基于第一数据单元并行处理标志来确定第一数据单元中是否包括可并行处理数据；当确定第一数据单元中包括可并行处理数据时，从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志，其中，第二数据单元的级别低于第一数据单元的级别。
【专利说明】使用用于并行处理的统一语法的视频编码方法和设备以及视频解码方法和设备

【技术领域】
[0001 ] 本发明涉及用于平行处理的视频编码和解码。

【背景技术】
[0002]由于最近已开发出数字显示技术并且高清晰度数字TV时代已到来，因此提出了用于处理大视频数据的新编解码器。此外，由于硬件性能最近得到了提高，因此执行视频图像处理的中央处理单元(CPU)或图形处理单元(GPU)被配置为包括多个核，并能够执行并行图像数据处理。

【发明内容】

[0003]技术问题
[0004]本发明提供使用并行处理信息的一种视频编码方法和设备以及一种视频解码方法和设备，其中，所述并行处理信息根据用于对视频数据进行并行处理的视频数据单元被统一 O
[0005]解决方案
[0006]将用于系统地执行并行处理的标志信息添加到具有更高级别和更低级别的数据单元。
[0007]有益效果
[0008]根据本发明的实施例，可通过按照从更高数据层到更低数据层的顺序使用统一和系统的并行处理信息，预先确定当在解码器中数据按照从更高数据单元到更低数据单元的顺序被解析时可被并行处理的数据(在下文中，被称为可并行处理数据)是否存在于每个数据单元中。因此，根据本发明的实施例，通过检测可并行处理数据、划分数据并将数据分配给解码器的多个核，可进行并行图像处理。

【专利附图】

【附图说明】
[0009]图1是示出根据本发明的实施例的视频编码设备的框图。
[0010]图2是示出根据本发明的实施例的视频解码设备的框图。
[0011]图3是用于解释根据本发明的实施例的编码单元的概念的示图。
[0012]图4是示出根据本发明的实施例的基于编码单元的图像编码器的框图。
[0013]图5是示出根据本发明的实施例的基于编码单元的图像解码器的框图。
[0014]图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
[0015]图7是用于解释根据本发明的实施例的编码单元与变换单元之间的关系的示图。
[0016]图8是用于解释根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
[0017]图9是示出根据本发明的实施例的根据深度的较深层编码单元的示图。
[0018]图10至图12是用于解释根据本发明的实施例的编码单元、预测单元和频率变换单元之间的关系的示图。
[0019]图13是用于解释根据表I的编码模式信息的编码单元、预测单元和变换单元之间的关系的不图。
[0020]图14是用于解释根据本发明的实施例的对视频数据单元的并行处理的构思的参考不图。
[0021]图15是示出根据本发明的实施例的熵编码设备的框图。
[0022]图16是用于解释根据本发明的实施例的条带单元的参考示图。
[0023]图17是用于解释根据本发明的另一实施例的条带单元的参考示图。
[0024]图18是用于解释根据本发明的实施例的并行块(tile)单元的参考示图。
[0025]图19是用于解释根据本发明的实施例的波前并行处理(WPP)的参考示图。
[0026]图20是示出根据本发明的实施例的由并行处理信息输出单元1520执行的用于设置标志的处理的流程图，其中，所述标志指示可被并行处理的数据(在下文中，被称为可并行处理数据)是否存在于每个数据单元中。
[0027]图21是示出根据本发明的实施例的序列参数集(SPS)的示图。
[0028]图22是示出根据本发明的实施例的画面参数集(PPS)的示图。
[0029]图23是示出根据本发明的实施例的并行处理信息parallel_processing_param O的示图。
[0030]图24是示出根据本发明的实施例的视频编码方法的流程图。
[0031]图25是示出根据本发明的实施例的熵解码设备的框图。
[0032]图26是示出根据本发明的实施例的视频解码方法的流程图。
[0033]图27是示出根据本发明的实施例的用于并行处理的视频解码方法的详细流程图。
[0034]最佳实施方式
[0035]根据本发明的实施例的用于解决前述技术问题的一种视频解码方法包括:从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志，其中，第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码信息；基于第一数据单元并行处理标志来确定第一数据单元中是否包括可并行处理数据；当确定第一数据单元中包括可并行处理数据时，从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志，其中，第二数据单元的级别低于第一数据单元的级别。
[0036]根据本发明的实施例的一种视频解码设备包括:并行处理信息获得器，从第一数据单元头获得指示构成在比特流中包括的视频的第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志，当基于第一数据单元并行处理标志确定第一数据单元中包括可并行处理数据时，从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志，其中，第一数据单元头包括第一数据单元的编码信息，第二数据单元的级别低于第一数据单元的级别；并行处理确定器，基于获得的第一数据单元并行处理标志和获得的第二数据单元并行处理标志来确定视频中包括的可并行处理数据单元。
[0037]根据本发明的实施例的一种视频编码方法包括:获得构成视频的第一数据单元和第二数据单元的编码数据，其中，第二数据单元的级别低于第一数据单元的级别；对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码，并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头；当第一数据单元中包括可并行处理数据时，对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码，并将编码后的第二数据单元并行处理标志输出到第二数据单元头。
[0038]根据本发明的实施例的一种视频编码设备包括:并行处理确定器，获得构成视频的第一数据单元和第二数据单元的编码数据，并确定第一数据单元和第二数据单元中是否包括可并行处理数据，其中，第二数据单元的级别低于第一数据单元的级别；并行处理信息输出单元，对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码，并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头，当第一数据单元中包括可并行处理数据时，对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码，并将编码后的第二数据单元并行处理标志输出到第二数据单元头。

【具体实施方式】
[0039]现在将参照附图更充分地解释本发明，其中，本发明的示例性实施例在附图中示出。
[0040]将参照图1至图13解释根据本发明的实施例的基于在空间上分层的数据单元的视频编码和视频解码。将参照图14至图27解释根据本发明的实施例的使用用于并行处理的统一语法的视频编码和视频解码。
[0041]图1是示出根据本发明的实施例的视频编码设备100的框图。
[0042]视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。
[0043]最大编码单元划分器110可基于图像的当前画面的最大编码单元划分当前画面。如果当前画面大于最大编码单元，则可将当前画面的图像数据划分为至少一个最大编码单元。根据实施例的最大编码单元可以是尺寸为32X 32、64X64、128X 128,256X 256等的数据单元，其中，数据单元的形状是宽度和长度为2的若干次方的正方形。图像数据可根据至少一个最大编码单元被输出到编码单元确定器120。
[0044]根据实施例的编码单元可由最大尺寸和深度表征。深度表示编码单元从最大编码单元空间被划分的次数，并且随着深度加深，根据深度的较深层编码单元可从最大编码单元被划分到最小编码单元。最大编码单元的深度为最高深度，最小编码单元的深度为最低深度。由于随着最大编码单元的深度加深，与每个深度相应的编码单元的尺寸减小，因此与更高深度相应的编码单元可包括多个与更低深度相应的编码单元。
[0045]如上所述，当前画面的图像数据根据编码单元的最大尺寸被划分为最大编码单元，并且每个最大编码单元可包括根据深度被划分的较深层编码单元。由于根据深度对根据实施例的最大编码单元进行划分，因此可根据深度分层地对包括在最大编码单元中的空间域的图像数据进行分类。
[0046]可预先设置编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限制最大编码单元的高度和宽度被分层划分的总次数。
[0047]编码单元确定器120对通过根据深度对最大编码单元的区域进行划分而获得的至少一个划分区域进行编码，并且根据所述至少一个划分区域来确定用于输出最终编码的图像数据的深度。换言之，编码单元确定器120通过根据当前画面的最大编码单元以根据深度的较深层编码单元对图像数据进行编码，并选择具有最小编码误差的深度，来确定编码深度。确定的编码深度和根据最大编码单元的图像数据被输出到输出单元130。
[0048]基于与等于或小于最大深度的至少一个深度相应的较深层编码单元，对最大编码单元中的图像数据进行编码，并且基于每个较深层编码单元比较对图像数据进行编码的结果。在对与较深层编码单元的编码误差进行比较之后，可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。
[0049]随着编码单元根据深度而被分层地划分，最大编码单元的尺寸被划分并且编码单元的数量增加。另外，即使在一个最大编码单元中编码单元与同一深度相应，仍通过估计每个编码单元的数据的编码误差来确定是否将与同一深度相应的每个编码单元划分为更低深度。因此，即使数据被包括在一个最大编码单元中，在一个最大编码单元中编码误差根据区域而不同，因此在数据中编码深度可根据区域而不同。因此，可在一个最大编码单元中设置一个或更多个编码深度，并且可根据至少一个编码深度的编码单元来对最大编码单元的数据进行划分。
[0050]因此，根据实施例的编码单元确定器120可确定包括在当前最大编码单元中的具有树结构的编码单元。根据实施例的“具有树结构的编码单元”包括在当前最大编码单元中包括的所有较深层编码单元中的与确定为编码深度的深度相应的编码单元。可根据最大编码单元的相同区域中的深度来分层地确定编码深度的编码单元，并可在不同区域中独立地确定编码深度的编码单元。类似地，可从另一区域的编码深度独立地确定当前区域中的编码深度。
[0051]根据实施例的最大深度是与从最大编码单元到最小编码单元所执行划分的次数有关的索引。根据实施例的第一最大深度可表示从最大编码单元到最小编码单元所执行的划分的总次数。根据实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度等级的总数。例如，当最大编码单元的深度是O时，对最大编码单元划分一次的编码单元的深度可被设置为1，对最大编码单元划分两次的编码单元的深度可被设置为2。这里，如果最小编码单元是对最大编码单元划分四次的编码单元，则存在深度0、1、2、3和4的5个深度等级，并因此第一最大深度可被设置为4，第二最大深度可被设置为5。
[0052]可根据最大编码单元执行预测编码和频率变换。还根据最大编码单元，基于根据等于或小于最大深度的深度的较深层编码单元来执行预测编码和频率变换。
[0053]由于每当根据深度对最大编码单元进行划分时，较深层编码单元的数量增加，因此将对随着深度加深而产生的所有较深层编码单元执行包括预测编码和频率变换的编码。为了便于解释，在至少一个最大编码单元中，现在将基于当前深度的编码单元来解释预测编码和频率变换。
[0054]根据实施例的视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码，执行诸如预测编码、频率变换和熵编码的操作，此时，可针对所有操作使用相同的数据单元，或者可针对每个操作使用不同的数据单
J Li ο
[0055]例如，视频编码设备100不仅可选择用于对图像数据进行编码的编码单元，还可选择不同于编码单元的数据单元，以便对编码单元中的图像数据执行预测编码。
[0056]为了在最大编码单元中执行预测编码，可基于与编码深度相应的编码单元(即，基于不再被划分为与更低深度相应的编码单元的编码单元)来执行预测编码。以下，不再被划分且成为用于预测编码的基本单元的编码单元现在将被称为“预测单元”。通过划分预测单元获得的分区可包括预测单元以及通过对预测单元的高度和宽度中的至少一个进行划分而获得的数据单元。
[0057]例如，当尺寸为2NX2N(其中，N是正整数)的编码单元不再被划分，并且成为尺寸为2NX2N的预测单元时，分区的尺寸可以是2NX2N、2NXN、NX2N或NXN。根据实施例的分区类型的示例包括通过对预测单元的高度或宽度进行对称地划分而获得的对称分区、通过对预测单元的高度或宽度进行非对称地划分(诸如，1:11或11:1)而获得的分区、通过对预测单元进行几何地划分而获得的分区、以及具有任意形状的分区。
[0058]预测单元的预测模式可以是从帧内模式、帧间模式和跳过模式中选择的至少一个。例如，可对尺寸为2NX2N、2NXN、NX2N或NXN的分区执行帧内模式或帧间模式。另夕卜，可仅对尺寸为2NX2N的分区执行跳过模式。可对编码单元中的一个预测单元独立地执行编码，从而选择具有最小编码误差的预测模式。
[0059]视频编码设备100不仅可基于用于对图像数据进行编码的编码单元还可基于与编码单元不同的数据单元，来对编码单元中的图像数据执行频率变换。
[0060]为了在编码单元中执行频率变换，可基于具有小于或等于编码单元的尺寸的数据单元来执行频率变换。例如，用于变换的数据单元可包括帧内模式的数据单元和帧间模式的数据单元。
[0061]现在将用作频率变换的基础的数据单元称为“变换单元”。类似于编码单元，编码单元中的变换单元可被递归地划分为更小尺寸的区域，因此可基于根据变换深度的具有树结构的变换单元，对编码单元中的残差数据进行划分。
[0062]还可在变换单元中设置变换深度，其中，变换深度表示通过对编码单元的高度和宽度进行划分以达到变换单元所执行的划分的次数。例如，在尺寸为2NX2N的当前编码单元中，当变换单元的尺寸是2NX2N时，变换深度可以是0，当变换单元的尺寸是NXN时，变换深度可以是1，当变换单元的尺寸是N/2XN/2时，变换深度可以是2。也就是说，还可根据变换深度设置具有树结构的变换单元。
[0063]根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息，还需要关于与预测编码和频率变换相关的信息的信息。因此，编码单元确定器120不仅确定具有最小编码误差的编码深度，还确定预测单元中的分区类型、根据预测单元的预测模式和用于频率变换的变换单元的尺寸。
[0064]以下将参照图3至图12详细解释根据实施例的最大编码单元中的具有树结构的编码单元以及确定分区的方法。
[0065]编码单元确定器120可通过使用基于拉格朗日乘数的率失真(RD)优化，来测量根据深度的较深层编码单元的编码误差。
[0066]输出单元130在比特流中输出最大编码单元的图像数据和关于根据编码深度的编码模式的信息，其中，所述最大编码单元的图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。
[0067]可通过对图像的残差数据进行编码来获得编码图像数据。
[0068]关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于在预测单元中的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。
[0069]可通过使用根据深度的划分信息来定义关于编码深度的信息，其中，根据深度的划分信息指示是否对更低深度而不是当前深度的编码单元执行编码。如果当前编码单元的当前深度是编码深度，则对当前编码单元中的图像数据进行编码并输出，因此可定义划分信息以不将当前编码单元划分到更低深度。可选地，如果当前编码单元的当前深度不是编码深度，则必需对更低深度的编码单元执行编码，并因此可定义划分信息以对当前编码单元进行划分来获得更低深度的编码单元。
[0070]如果当前深度不是编码深度，则对被划分到更低深度的编码单元的编码单元执行编码。由于更低深度的至少一个编码单元存在于当前深度的一个编码单元中，因此对更低深度的每个编码单元重复执行编码，并因此可对具有相同深度的编码单元递归地执行编码。
[0071]由于针对一个最大编码单元确定具有树结构的编码单元，并且针对编码深度的编码单元确定关于至少一个编码模式的信息，所以可针对一个最大编码单元确定关于至少一个编码模式的信息。另外，由于根据深度对图像数据进行分层划分，因此最大编码单元的数据的编码深度可根据位置而不同，因此可针对数据设置关于编码深度和编码模式的信息。
[0072]因此，输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。
[0073]根据实施例的最小单元是通过将构成最低深度的最小编码单元划分为4份而获得的矩形数据单元。可选择地，最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。
[0074]例如，通过输出单元130输出的编码信息可被分类为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息、以及关于帧内模式的插值方法的信息。此外，根据画面、条带或GOP定义的关于编码单元的最大尺寸的信息和关于最大深度的信息可被插入到比特流的头。
[0075]根据视频编码设备100的最简单实施例，较深层编码单元是通过将更高深度的编码单元(更高一层)的高度或宽度划分成两份而获得的编码单元。换言之，当当前深度的编码单元的尺寸是2NX 2N时，更低深度的编码单元的尺寸是NXN。另外，尺寸为2NX 2N的具有当前深度的编码单元可包括最多4个所述更低深度的尺寸为NXN的编码单元。
[0076]因此，根据实施例的视频编码设备100可基于考虑当前画面的特征而确定的最大编码单元的尺寸和最大深度，通过针对每个最大编码单元确定具有最优形状和最优尺寸的编码单元来形成具有树结构的编码单元。另外，由于可通过使用各种预测模式和频率变换中的任意一个对每个最大编码单元执行编码，因此可考虑各种图像尺寸的编码单元的图像特征来确定最优编码模式。
[0077]因此，如果以传统宏块对具有非常高的分辨率或大数据量的图像进行编码，则每个画面的宏块的数量极度增加。因此，针对每个宏块产生的压缩信息的条数增加，因此难以发送压缩的信息，并且数据压缩效率降低。然而，通过使用根据实施例的视频编码设备100，由于考虑图像的特征来调整编码单元，并且考虑图像的尺寸来增加编码单元的最大尺寸，因此可提高图像压缩效率。
[0078]图2是示出根据本发明的实施例的视频解码设备200的框图。
[0079]根据实施例的视频解码设备200包括接收器210、图像数据和编码信息提取器220和图像数据解码器230。用于根据实施例的视频解码设备200的各种操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图1和视频编码设备100解释的定义相同。
[0080]接收器210接收和解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流，针对每个编码单元提取编码图像数据，并将提取的图像数据输出到图像数据解码器230，其中，编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头提取关于当前画面的编码单元的最大尺寸的信息。
[0081]另外，图像数据和编码信息提取器220从解析的比特流，根据每个最大编码单元，提取关于具有树结构的编码单元的编码深度和编码模式的信息。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之，比特流中的图像数据被划分为最大编码单元，使得图像数据解码器230针对每个最大编码单元对图像数据进行解码。
[0082]可针对关于与编码深度相应的至少一个编码单元的信息设置关于根据最大编码单元的编码深度和编码模式的信息，关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。另外，根据深度的划分信息可被提取为关于编码深度的信息。
[0083]关于由图像数据和编码信息提取器220提取的根据每个最大编码单元的编码深度和编码模式的信息是关于在以下情况下被确定为产生最小编码误差的编码深度和编码模式的信息，即，在编码器(诸如，视频编码设备100)根据最大编码单元对根据深度的每个较深层编码单元重复地执行编码的时候。因此，视频解码设备200可通过根据产生最小编码误差的编码方法对数据进行解码来恢复图像。
[0084]由于关于根据实施例的编码深度和编码模式的编码信息可被分配给相应的编码单元、预测单元和最小单元中的预定数据单元，因此图像数据和编码信息提取器220可根据预定数据单元，提取关于编码深度和编码模式的信息。当关于相应最大编码单元的编码深度和编码模式的信息根据预定数据单元被编写时，可将具有相同的关于编码深度和编码模式的信息的预定数据单元推断为是包括在同一最大编码单元中的数据单元。
[0085]图像数据解码器230基于关于根据最大编码单元的编码深度和编码模式的信息，通过对每个最大编码单元中的图像数据进行解码，来恢复当前画面。换言之，图像数据解码器230可基于提取出的关于包括在每个最大编码单元中的具有树结构的编码单元之中的每个编码单元的分区类型、预测模式和变换单元的信息，对编码的图像数据进行解码。解码处理可包括预测(包含帧内预测和运动补偿)和逆频率变换。
[0086]图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息，根据每个编码单元的分区和预测模式，执行帧内预测或运动补偿。
[0087]此外，图像数据解码器230可基于关于根据深度的编码单元的变换单元的尺寸的信息，根据编码单元中的每个变换单元执行逆频率变换，以根据最大编码单元执行逆频率变换。
[0088]图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的编码深度。如果划分信息指示图像数据在当前深度中不再被划分，则当前深度是编码深度。因此，图像数据解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元的尺寸的信息，对当前最大编码单元中的与编码深度相应的编码单元的图像数据进行解码。
[0089]换言之，可通过观察针对编码单元、预测单元和最小单元中的预定数据单元设置的编码信息集来收集包含包括相同划分信息的编码信息的数据单元，并且收集的数据单元可被认为是将由图像数据解码器230以相同编码模式进行解码的一个数据单元。
[0090]根据实施例的视频解码设备200可获得关于当对每个最大编码单元迭代地执行编码时产生最小编码误差的编码单元的信息，并使用所述信息来对当前画面进行解码。换言之，可对在每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元进行解码。
[0091]因此，即使图像数据具有高分辨率和过大数据量，也可通过使用编码单元的尺寸和编码模式，有效地对图像数据进行解码和恢复，其中，通过使用从编码器接收到的关于最优编码模式的信息，根据图像的特征自适应地确定所述编码单元的尺寸和编码模式。
[0092]现在将参照图3至图13解释根据本发明的实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。
[0093]图3是用于解释根据本发明的实施例的分层编码单元的构思的视图。
[0094]编码单元的尺寸可被表示为宽度X高度，并可以是64X64、32X32、16X16和8X8。尺寸为64X64的编码单元可被划分为尺寸为64X64、64X32、32X64或32X32的分区，尺寸为32X32的编码单元可被划分为尺寸为32X 32、32X 16、16X 32或16X 16的分区，尺寸为16X16的编码单元可被划分为尺寸为16X16、16X8、8X16或8X8的分区，尺寸为8X8的编码单元可被划分为尺寸为8X8、8X4、4X8或4X4的分区。
[0095]在视频数据310中，分辨率是1920 X 1080，编码单元的最大尺寸是64，最大深度是
2。在视频数据320中，分辨率是1920 X 1080，编码单元的最大尺寸是64，最大深度是3。在视频数据330中，分辨率是352X288，编码单元的最大尺寸是16，最大深度是I。图3中示出的最大深度表示从最大编码单元到最小编码单元的划分总次数。
[0096]如果分辨率高或数据量大，则编码单元的最大尺寸可能较大，从而不仅提高编码效率，而且准确地反映图像的特征。因此，具有比视频数据330更高分辨率的视频数据310和320的编码单元的最大尺寸可被选为64。
[0097]由于视频数据310的最大深度是2，因此由于通过对最大编码单元划分两次，深度加深至两层，因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元和长轴尺寸为32和16的编码单元。同时，由于视频数据330的最大深度是1，因此由于通过对最大编码单元划分一次，深度增加至一层，因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元和长轴尺寸为8的编码单元。
[0098]由于视频数据320的最大深度是3，因此由于通过对最大编码单元划分三次，深度增加至3层，因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元和长轴尺寸为32、16和8的编码单元。随着深度加深，详细信息可被精确地表示。
[0099]图4是示出根据本发明的实施例的基于编码单元的图像编码器400的框图。
[0100]根据实施例的图像编码器400执行视频编码设备100的编码单元确定器120的操作来对图像数据进行编码。换言之，帧内预测器410在帧内模式下对当前帧405中的编码单元执行帧内预测，运动估计器420和运动补偿器425通过使用当前帧405和参考帧495，在帧间模式下对编码单元执行帧间估计和运动补偿。
[0101]从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过频率变换器430和量化器440被输出为量化后的变换系数。量化后的变换系数通过反量化器460和逆频率变换器470被恢复为空间域中的数据，恢复的空间域中的数据在通过去块单元480和环路滤波单元490后处理之后被输出为参考帧495。量化后的变换系数可通过熵编码器450被输出为比特流455。
[0102]为了将图像编码器400应用到根据实施例的视频编码设备100中，图像编码器400的所有元件(即，帧内预测器410、运动估计器420、运动补偿器425、频率变换器430、量化器440、熵编码器450、反量化器460、逆频率变换器470、去块单元480和环路滤波单元490)必需考虑每个最大编码单元的最大深度，基于具有树结构的编码单元中的每个编码单元执行操作。
[0103]具体地，帧内预测器410、运动估计器420和运动补偿器425考虑当前最大编码单元的最大尺寸和最大深度来确定具有树结构的编码单元中的每个编码单元的分区和预测模式，频率变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。
[0104]图5是根据本发明的实施例的基于编码单元的图像解码器500的框图。
[0105]解析器510从比特流505解析将被解码的编码图像数据和解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据，反量化的数据通过逆频率变换器540被恢复为空间域中的图像数据。
[0106]针对空间域中的图像数据，帧内预测器550在帧内模式下对编码单元执行帧内预测，运动补偿器560通过使用参考帧585在帧间模式下对编码单元执行运动补偿。
[0107]通过帧内预测器550和运动补偿器560的空间域中的数据可在通过去块单元570和环路滤波单元580后处理之后被输出为恢复帧595。另外，通过去块单元570和环路滤波单元580后处理的数据可被输出为参考帧585。
[0108]为了在视频解码设备200的图像数据解码器230中对图像数据进行解码，根据实施例的图像解码器500可执行在解析器510的操作被执行之后执行的操作。
[0109]为了将图像解码器500应用到根据实施例的视频解码设备200中，图像解码器500的所有元件(即，解析器510、熵解码器520、反量化器530、逆频率变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)需针对每个最大编码单元基于具有树结构的编码单元执行操作。
[0110]具体地，帧内预测器550和运动补偿器560针对具有树结构的每个编码单元确定分区和预测模式，逆频率变换器540针对每个编码单元确定变换单元的尺寸。
[0111]图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。
[0112]根据实施例的视频编码设备100和根据实施例的视频解码设备200使用分层编码单元以考虑图像的特征。可根据图像的特征自适应地确定编码单元的最大高度、最大宽度和最大深度，或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。
[0113]在根据实施例的编码单元的分层结构600中，编码单元的最大高度和最大宽度均是64，最大深度是4。由于沿着根据实施例的分层结构600的垂直轴深度增加，因此较深层编码单元的高度和宽度均被划分。另外，预测单元和分区沿着分层结构600的水平轴被示出，其中，所述预测单元和分区是对每个较深层编码单元进行预测编码的基础。
[0114]换言之，在分层结构600中，编码单元610是最大编码单元，其中，深度为0，尺寸(即，高度乘宽度)为64X64。随着深度沿着垂直轴增大，存在尺寸为32X32和深度为I的编码单元620、尺寸为16X16和深度为2的编码单元630、尺寸为8X8和深度为3的编码单元640、尺寸为4X4和深度为4的编码单元650。尺寸为4X4和深度为4的编码单元650是最小编码单元。
[0115]编码单元的预测单元和分区根据每个深度沿着水平轴被排列。换言之，如果尺寸为64X64和深度为O的编码单元610是预测单元，则可将预测单元划分成包括在编码单元610中的分区，即，尺寸为64X64的分区610、尺寸为64X32的分区612、尺寸为32X64的分区614或尺寸为32X32的分区616。
[0116]类似地，可将尺寸为32 X 32和深度为I的编码单元620的预测单元划分成包括在编码单元620中的分区，即，尺寸为32X32的分区620、尺寸为32X16的分区622、尺寸为16X32的分区624和尺寸为16X16的分区626。
[0117]类似地，可将尺寸为16X16和深度为2的编码单元630的预测单元划分成包括在编码单元630中的分区，即，包括在编码度单元630中的尺寸为16X16的分区、尺寸为16X8的分区632、尺寸为8X16的分区634和尺寸为8X8的分区636。
[0118]类似地，可将尺寸为8X8和深度为3的编码单元640的预测单元划分成包括在编码单元640中的分区，即，包括在编码单元640中的尺寸为8X8的分区、尺寸为8X4的分区642、尺寸为4X8的分区644和尺寸为4X4的分区646。
[0119]尺寸为4X4和深度为4的编码单元650是最小编码单元和最低深度的编码单元。编码单元650的预测单元仅被分配给尺寸为4X4的分区。
[0120]为了确定最大编码单元610的编码深度，根据实施例的视频编码设备100的编码单元确定器120需对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。[0121 ] 随着深度增大，包括具有相同范围和相同尺寸的数据的根据深度的较深层编码单元的数量增加。例如，需要四个与深度2相应的编码单元来覆盖包括在与深度I相应的一个编码单元中的数据。因此，为了根据深度比较对相同数据进行编码的结果，与深度I相应的编码单元和四个与深度2相应的编码单元均需被编码。
[0122]为了针对深度之中的当前深度执行编码，可沿着分层结构600的水平轴，通过对与当前深度相应的编码单元中的每个预测单元执行编码，来针对当前深度选择作为最小编码误差的代表性误差。可选地，随着深度沿着分层结构600的垂直轴增大，可通过比较根据深度的代表性误差并针对每个深度执行编码，来搜索最小编码误差。在编码单元610中的具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。
[0123]图7是用于解释根据本发明的实施例的在编码单元710和变换单元720之间的关系的不图。
[0124]根据实施例的视频编码设备100或根据实施例的视频解码设备200针对每个最大编码单元，根据具有小于或等于最大编码单元的尺寸的编码单元，对图像进行编码或解码。可基于不大于每个编码单元的数据单元，来选择用于在编码期间进行频率变换的变换单元的尺寸。
[0125]例如，在根据实施例的视频编码设备100或根据实施例的视频解码设备200中，如果编码单元710的尺寸是64 X 64，则可通过使用尺寸为32 X 32的变换单元720来执行频率变换。
[0126]此外，可通过对小于64X64的尺寸为32X32、16X 16、8X8和4X4的每个变换单元执行频率变换，来对尺寸为64X64的编码单元710的数据进行编码，然后可选择具有最小编码误差的变换单元。
[0127]图8是用于解释根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。
[0128]根据实施例的视频编码设备100的输出单兀130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810以及关于变换单元尺寸的信息820进行编码，并将信息800、信息810和信息820作为关于编码模式的信息来发送。
[0129]信息800指示关于通过划分当前编码单元的预测单元而获得的分区的形状的信息，其中，所述分区是用于对当前编码单元进行预测编码的数据单元。例如，可将尺寸为2NX2N的当前编码单元CU_0划分成以下分区中的任意一个:尺寸为2NX2N的分区802、尺寸为2NXN的分区804、尺寸为NX2N的分区806以及尺寸为NXN的分区808。这里，关于当前编码单元的分区类型的信息800被设置来指示尺寸为2NXN的分区804、尺寸为NX 2N的分区806以及尺寸为NXN的分区808中的一个。
[0130]信息810指示每个分区的预测模式。例如，信息810可指示对由信息800指示的分区执行的预测编码的模式，即，帧内模式812、帧间模式814或跳过模式816。
[0131]此外，信息820指示当对当前编码单元执行频率变换时所基于的变换单元。例如，变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826和第二帧内变换单元828中的任意一个。
[0132]根据实施例的视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元，提取并使用用于解码的信息800、810和820。
[0133]图9是示出根据本发明的实施例的根据深度的较深层编码单元的示图。
[0134]划分信息可用来指示深度的改变。划分信息指示当前深度的编码单元是否被划分成更低深度的编码单元。
[0135]用于对深度为O和尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的分区类型914、尺寸为N_0X2N_0的分区类型916和尺寸为Ν_0ΧΝ_0的分区类型918。图9仅示出了通过对称地划分预测单元910而获得的分区类型912至918，但是分区类型不限于此，并且预测单元910的分区可包括非对称分区、具有任意形状的分区和具有几何形状的分区。
[0136]根据每种分区类型，需对尺寸为2N_0X2N_0的一个分区、尺寸为2N_0XN_0的两个分区、尺寸为N_0X2N_0的两个分区和尺寸为Ν_0ΧΝ_0的四个分区重复地执行预测编码。可对尺寸为2N_0X2N_0、N_0X2N_0、2N_0XN_0和N_0XN_0的分区执行帧内模式和帧间模式下的预测编码。可仅对尺寸为2N_0X2N_0的分区执行跳过模式下的预测编码。
[0137]如果在尺寸为2N_0X2N_0、2N_0XN_0和N_0X2N_0的分区类型912至916中的一个分区类型中编码误差最小，则可不将预测单元910划分到更低深度。
[0138]如果在尺寸为Ν_0ΧΝ_0的分区类型918中编码误差最小，则深度从O改变到I以在操作920中划分分区类型918，并对深度为2和尺寸为Ν_0ΧΝ_0的编码单元930重复地执行编码来搜索最小编码误差。
[0139]用于对深度为I和尺寸为2N_1X2N_1 ( = Ν_0ΧΝ_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1X2N_1的分区类型942、尺寸为2N_1XN_1的分区类型944、尺寸为N_1X2N_1的分区类型946以及尺寸为N_1XN_1的分区类型948。
[0140]如果在尺寸为N_1XN_1的分区类型948中编码误差最小，则深度从I改变到2以在操作950中划分分区类型948，并对深度为2和尺寸为N_2XN_2的编码单元960重复执行编码来搜索最小编码误差。
[0141]当最大深度是d时，根据每个深度的划分操作可被执行直到深度变成d-Ι，并且划分信息可被编码直到深度是O到d-2中的一个。换句话说，当编码被执行直到在与d-2的深度相应的编码单元在操作970中被划分之后深度是d-Ι时，用于对深度为d-Ι和尺寸为2N_(d-l) X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-l)X2N(d-l)的分区类型992、尺寸为2N_(d-l)XN(d-l)的分区类型994、尺寸为N_(d-1) X2N(d-l)的分区类型996和尺寸为N_(d_l) XN(d_l)的分区类型998。
[0142]可对分区类型992至998中的尺寸为2N_(d_l) X2N_(d_l)的一个分区、尺寸为2N_(d-l) XN_(d-l)的两个分区、尺寸为N_(d-1) X2N_(d-l)的两个分区、尺寸为1(d-1) XN_(d-l)的四个分区重复地执行预测编码，以搜索具有最小编码误差的分区类型。
[0143]即使当尺寸为N_(d-l)XN_(d_l)的分区类型998具有最小编码误差时，由于最大深度是d，因此深度为d-Ι的编码单元CU_(d-l)也不再被划分到更低深度，构成当前最大编码单元900的编码单元的编码深度被确定为d-Ι，并且当前最大编码单元900的分区类型可被确定为N_(d-1) X N (d-Ι)。此外，由于最大深度是d，因此不设置深度为d-Ι的最小编码单元980的划分信息。
[0144]数据单元999可被称为用于当前最大编码单元的“最小单元”。根据实施例的最小单元可以是通过将具有最低编码深度的最小编码单元划分成4份而获得的矩形数据单元。通过重复地执行编码，根据实施例的视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度，并将相应分区类型和预测模式设置为编码深度的编码模式。
[0145]这样，在所有深度I至d中对根据深度的最小编码误差进行比较，并且具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码并发送。另外，由于编码单元需从O的深度被划分到编码深度，因此仅编码深度的划分信息被设置为O，并且除了编码深度以外的深度的划分信息被设置为
1
[0146]根据实施例的视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息，来对编码单元912进行解码。根据实施例的视频解码设备200可通过使用根据深度的划分信息，将划分信息为O的深度确定为编码深度，并且使用关于相应深度的编码模式的信息来进行解码。
[0147]图10至图12是用于解释根据本发明的实施例的编码单元1010、预测单元1060和频率变换单兀1070之间的关系的不图。
[0148]编码单元1010是最大编码单元中的与由根据实施例的视频编码设备100确定的编码深度相应的编码单元。预测单元1060是每个编码单元1010中的预测单元的分区，变换单元1070是每个编码单元1010的变换单元。
[0149]当在编码单元1010中最大编码单元的深度是O时，编码单元1012和编码单元1054的深度是1，编码单元1014、1016、1018、1028、1050和1052的深度是2，编码单元1020、1022、1024、1026、1030、1032 和 1048 的深度是 3，编码单元 1040、1042、1044 和 1046 的深度是4。
[0150]在预测单元1060中，通过划分编码单元来获得一些分区1014、1016、1022、1032、1048、1050、1052和1054。换句话说，分区1014、1022、1050和1054中的分区类型的尺寸是2NXN，分区1016、1048和1052中的分区类型的尺寸是NX 2N，分区1032的分区类型的尺寸就NXN。编码单元1010的预测单元和分区小于或等于每个编码单元。
[0151]在小于变换单元1052的数据单元中的变换单元1070中，对变换单元1052的图像数据执行频率变换或逆频率变换。另外，在尺寸和形状方面，变换单元1070中的变换单元1014、1016、1022、1032、1048、1050 和 1052 不同于预测单元 1060 中的变换单元 1014、1016、1022、1032、1048、1050和1052。换句话说，根据实施例的视频编码设备100和根据实施例的视频解码设备200可对同一编码单元中的数据单元独立地执行帧内预测/运动估计/运动补偿和频率变换/逆频率变换。
[0152]因此，对最大编码单元的每个区域中的具有分层结构的每个编码单元递归地执行编码来确定最优编码单元，从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表I示出可由根据实施例的视频编码设备100和根据实施例的视频解码设备200设置的编码信息。
[0153][表 I]
[0154]

【权利要求】
1.一种视频解码方法，包括: 从第一数据单元头获得指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志，其中，第一数据单元头包括构成在比特流中包括的视频的第一数据单元的编码息; 基于第一数据单元并行处理标志来确定第一数据单元中是否包括可并行处理数据；当确定第一数据单元中包括可并行处理数据时，从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志，其中，第二数据单元的级别低于第一数据单元的级别。
2.如权利要求1所述的视频解码方法，其中，第一数据单元是序列，第二数据单元是画面，第一数据单元头是序列参数集(SPS)，第二数据单元头是画面参数集(PPS)。
3.如权利要求1所述的视频解码方法，还包括: 基于第二数据单元并行处理标志来确定第二数据单元中是否包括可并行处理数据；当确定第二数据单元中包括可并行处理数据时，从包括第三数据单元的编码信息的第三数据单元头获得指示第三数据单元中是否包括可并行处理数据的第三数据单元并行处理标志，其中，第三数据单元的级别低于第二数据单元的级别。
4.如权利要求3所述的视频解码方法，其中，第二数据单元是画面，第三数据单元是条带。
5.如权利要求1所述的视频解码方法，其中，第一数据单元头和第二数据单元头中的每一个包括附加并行处理信息，其中，当第一数据单元头和第二数据单元头中包括相同的并行处理信息时，第二数据单元头中包括的并行处理信息具有比第一数据单元头中包括的并行处理信息更高的优先级，并且第二数据单元头的并行处理信息替换第一数据单元头的并行处理信息。
6.如权利要求1所述的视频解码方法，其中，可并行处理数据是与从并行块、波前并行处理(WPP)和条带中选择的至少一个有关的数据。
7.一种视频解码设备，包括: 并行处理信息获得器，从第一数据单元头获得指示构成在比特流中包括的视频的第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志，当基于第一数据单元并行处理标志确定第一数据单元中包括可并行处理数据时，从包括第二数据单元的编码信息的第二数据单元头获得指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志，其中，第一数据单元头包括第一数据单元的编码信息，第二数据单元的级别低于第一数据单元的级别；并行处理确定器，基于获得的第一数据单元并行处理标志和获得的第二数据单元并行处理标志来确定视频中包括的可并行处理数据单元。
8.如权利要求7所述的视频解码设备，其中，第一数据单元是序列，第二数据单元是画面，第一数据单元头是序列参数集(SPS)，第二数据单元头是画面参数集(PPS)。
9.如权利要求7所述的视频解码设备，其中，并行处理信息获得器基于第二数据单元并行处理标志来确定第二数据单元中是否包括可并行处理数据，当确定第二数据单元中包括可并行处理数据时，从包括第三数据单元的编码信息的第三数据单元头获得指示第三数据单元中是否包括可并行处理数据的第三数据单元并行处理标志，其中，第三数据单元的级别低于第二数据单元的级别。
10.如权利要求9所述的视频解码设备，其中，第二数据单元是画面，第三数据单元是条带。
11.如权利要求7所述的视频解码设备，其中，第一数据单元头和第二数据单元头中的每一个包括附加并行处理信息，当第一数据单元头和第二数据单元头中包括相同的并行处理信息时，第二数据单元头中包括的并行处理信息具有比第一数据单元头中包括的并行处理信息更高的优先级，其中，并行处理信息获得器用第二数据单元头的并行处理信息替换第一数据单元头的并行处理信息。
12.如权利要求7所述的视频解码设备，其中，可并行处理数据是与从并行块、波前并行处理(WPP)和条带中选择的至少一个有关的数据。
13.—种视频编码方法，包括: 获得构成视频的第一数据单元和第二数据单元的编码数据，其中，第二数据单元的级别低于第一数据单元的级别；对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码，并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单兀头；当第一数据单元中包括可并行处理数据时，对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码，并将编码后的第二数据单元并行处理标志输出到第二数据单元头。
14.如权利要求13所述的视频编码方法，其中，第一数据单元头和第二数据单元头中的每一个包括附加并行处理信息，当第一数据单元头和第二数据单元头中包括相同的并行处理信息时，第二数据单元头中包括的并行处理信息具有比第一数据单元头中包括的并行处理信息更高的优先级，其中，第二数据单元头的并行处理信息替换第一数据单元头的并行处理信息。
15.一种视频编码设备，包括: 并行处理确定器，获得构成视频的第一数据单元和第二数据单元的编码数据，并确定第一数据单元和第二数据单元中是否包括可并行处理数据，其中，第二数据单元的级别低于第一数据单元的级别；并行处理信息输出单元，对指示第一数据单元中是否包括可并行处理数据的第一数据单元并行处理标志进行编码，并将编码后的第一数据单元并行处理标志输出到包括第一数据单元的编码信息的第一数据单元头，当第一数据单元中包括可并行处理数据时，对指示第二数据单元中是否包括可并行处理数据的第二数据单元并行处理标志进行编码，并将编码后的第二数据单元并行处理标志输出到第二数据单元头。
【文档编号】H04N19/33GK104205848SQ201380015767
【公开日】2014年12月10日申请日期:2013年1月21日优先权日:2012年1月20日
【发明者】郑丞洙, 朴永五, 金赞烈, 朴正辉, 金宰贤申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郑丞洙;朴永五;金赞烈;朴正辉;金宰贤
技术所有人：三星电子株式会社
我是此专利的发明人

上一篇：视频译码中的经译码块旗标推断的制作方法
上一篇：在无线通信系统中接收控制信息的方法和设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。