图像帧内预测方法和设备的制作方法

文档序号：7886306阅读：119来源：国知局

专利名称：：图像帧内预测方法和设备的制作方法
技术领域：
：本发明的一个或多个方面涉及对图像进行编码和解码，更具体地说，涉及一种用于基于色度信号和先前恢复的亮度信号之间的相关性来从先前恢复的亮度信号预测色度信号的帧内预测方法和设备。
背景技术：
：在图像编码方法(诸如MPEG-1、MPEG-2、MPEG-4H.264/MPEG-4高级视频编码(AVC)等)中，将图像划分为均具有预定尺寸的块来对图像进行编码。随后，通过使用帧间预测或帧内预测来对每个块进行预测编码。从原始块中减去通过执行帧间预测或帧内预测而产生的预测块来产生残差块，残差块经过离散余弦变换、量化和熵编码来产生比特流。在现有技术的图像编码方法或解码方法中，使用亮度分量和色度分量来表示单个像素，独立地对亮度分量和色度分量进行编码或解码。
发明内容技术问题本发明的一个或多个方面提供了一种用于基于色度信号和亮度信号之间的相关性来从亮度信号预测色度信号的方法和设备。本发明的一个或多个方面还提供了用于在维持数据的精确性的同时防止发生比特溢出的预测方法和设备。技术方案根据本发明的一方面，获得表不恢复的色度信号和恢复的亮度信号之间的相关性的参数，并且使用所述参数来从恢复的亮度信号预测色度信号。可通过执行预定操作来获得所述参数。所述预定操作可包括改变所述参数的比特深度的自适应缩放处理以减小查找表的尺寸并防止发生溢出。有益效果根据本发明的实施例，可基于亮度信号和色度信号之间的相关性来提高预测的效率。此外，可在不必执行除法操作的情况下获得定义亮度信号和色度信号之间的线性相关性的参数，从而减少了预测的计算量并提高了计算速度。此外，可在维持数据的精确性的同时防止在获得参数期间发生比特溢出。图1是根据示例性实施例的视频编码设备的框图。图2是根据示例性实施例的视频解码设备的框图。图3是用于描述根据示例性实施例的编码单元的概念的示图。图4是根据示例性实施例的基于编码单元的图像编码器的框图。图5是根据示例性实施例的基于编码单元的图像解码器的框图。图6是示出根据示例性实施例的根据深度的较深层编码单元以及分区的示图。图7是用于描述根据示例性实施例的编码单元和变换单元之间的关系的示图。图8是用于描述根据示例性实施例的与编码深度相应的编码单元的编码信息的示图。图9是根据示例性实施例的根据深度的较深层编码单元的示图。图10、图11和图12是用于描述根据示例性实施例的编码单元、预测单元和变换单元之间的关系的示图。图13是用于描述根据表I的编码模式信息的编码单元、预测单元或分区以及变换单元之间的关系的示图。图14是根据本发明的实施例的帧内预测设备的框图。图15a至图15c是示出彩色格式的参考示图。图16a和图16b是均示出根据彩色格式的亮度块和色度块的参考示图。图17是示出根据本发明的实施例的对亮度信号进行下采样的处理的参考示图。图18a和图18b是示出根据本发明的实施例的获得表示亮度信号和色度信号之间的相关性的参数的处理和预测色度信号的处理的参考示图。图19示出根据本发明的实施例的获得近似值A2’的处理。图20是示出根据本发明的实施例的查找表的参考示图。图21是示出根据本发明的实施例的帧内预测方法的流程图。最佳实施方式根据本发明的一方面，提供了一种对图像进行帧内预测的方法，所述方法包括:基于将被帧内预测的色度块的恢复的邻近像素和与所述色度块相应的亮度像素的恢复的邻近像素，获得表示所述色度块和亮度块之间的相关性的参数；通过使用所述参数来从所述亮度块预测所述色度块。获得所述参数的步骤包括:对所述色度块的恢复的邻近像素和所述亮度块的恢复的邻近像素执行预定操作。预定操作包括改变所述参数的比特深度以减小查找表的尺寸并防止溢出的发生的自适应缩放处理。根据本发明的另一方面，提供了一种对图像进行帧内预测的设备，所述设备包括:参数获得单元，基于将被帧内预测的色度块的恢复的邻近像素和与所述色度块相应的亮度像素的恢复的邻近像素，获得表示所述色度块和亮度块之间的相关性的参数；预测执行单元，通过使用所述参数来从所述亮度块预测所述色度块。参数获得单元通过对所述色度块的恢复的邻近像素和所述亮度块的恢复的邻近像素执行预定操作来获得所述参数。参数获得单元还执行改变所述参数的比特深度以减小查找表的尺寸并防止溢出的发生的自适应缩放处理。具体实施例方式现在将参照附图更充分地描述本发明，在附图中示出本发明的示例性实施例。图1是根据本发明的实施例的视频编码设备100的框图。视频编码设备100包括最大编码单元划分器110、编码单元确定器120和输出单元130。最大编码单元划分器110可基于图像的当前画面的最大编码单元对当前画面进行划分。如果当前画面大于最大编码单元，则当前画面的图像数据可被划分为至少一个最大编码单元。根据本发明的实施例的最大编码单元可以是尺寸为32X32、64X64、128X128、256X256等的数据单元，其中，数据单元的形状是宽度和高度为2的幂次方并大于8的正方形。图像数据可根据所述至少一个最大编码单元被输出到编码单元确定器120。根据本发明的实施例的编码单元可由最大尺寸以及深度来表征。深度表示编码单元从最大编码单元被空间划分的次数，并且随着深度加深，根据深度的较深层编码单元可从最大编码单元被划分为最小编码单元。最大编码单元的深度是最上层深度，最小编码单元的深度是最下层深度。由于与每个深度相应的编码单元的尺寸随着最大编码单元的深度加深而减小，因此，与上层深度相应的编码单元可包括多个与下层深度相应的编码单元。如上所述，当前画面的图像数据根据编码单元的最大尺寸而被划分为最大编码单元，所述最大编码单元中的每一个可包括根据深度被划分的较深层编码单元。由于根据本发明的实施例的最大编码单元根据深度被划分，因此包括在最大编码单元中的空间域的图像数据可根据深度被分层划分。可预先确定编码单元的最大深度和最大尺寸,所述最大深度和最大尺寸限定最大编码单元的高度和宽度被分层划分的总次数。编码单元确定器120根据深度对通过划分最大编码单元的区域而获得的至少一个划分的区域进行编码，并根据所述至少一个划分的区域确定用于输出最终编码的图像数据的深度。换句话说，编码单元确定器120通过根据当前画面的最大编码单元按照根据深度的较深层编码单元对图像数据进行编码，并选择具有最小编码误差的深度，来确定编码深度。因此，与确定的编码深度相应的编码单元的编码图像数据被最终输出。此外，与编码深度相应的编码单元可被视为被编码的编码单元。确定的编码深度和根据确定的编码深度的编码图像数据被输出到输出单元130。基于与等于或低于最大深度的至少一个深度相应的较深层编码单元对最大编码单元中的图像数据进行编码，并基于较深层编码单元中的每一个来比较对图像数据进行编码的结果。在比较较深层编码单元的编码误差之后，可选择具有最小编码误差的深度。可针对每个最大编码单元选择至少一个编码深度。随着编码单元根据深度而被分层划分，并且随着编码单元的数量增加，最大编码单元的尺寸被划分。此外，即使在一个最大编码单元中编码单元相应于相同深度，也通过分别测量每个编码单元的图像数据的编码误差来确定是否将与相同深度相应的编码单元中的每一个划分到下层深度。因此，即使当图像数据被包括在一个最大编码单元中时，在所述一个最大编码单元中，图像数据根据深度被划分为区域，编码误差也可根据区域而不同，因此，编码深度可根据图像数据中的区域而不同。因此，在一个最大编码单元中可确定一个或多个编码深度，并可根据至少一个编码深度的编码单元来划分最大编码单元的图像数据。因此，编码单元确定器120可确定包括在最大编码单元中的具有树结构的编码单元。根据本发明的实施例的“具有树结构的编码单元”包括有在最大编码单元中包括的所有较深层编码单元中与被确定为编码深度的深度相应的编码单元。在最大编码单元的相同区域中，编码深度的编码单元可根据深度被分层确定，在不同的区域中，编码深度的编码单元可被独立地确定。类似地，当前区域中的编码深度可独立于另一区域中的编码深度被确定。根据本发明的实施例的最大深度是关于从最大编码单元到最小编码单元的划分次数的索引。根据本发明的实施例的第一最大深度可表示从最大编码单元到最小编码单元的总划分次数。根据本发明的实施例的第二最大深度可表示从最大编码单元到最小编码单元的深度级的总数。例如，当最大编码单元的深度为O时，最大编码单元被划分一次的编码单元的深度可被设置为1，最大编码单元被划分两次的编码单元的深度可被设置为2。这里，如果最小编码单元是最大编码单元被划分四次的编码单元，则存在深度O、1、2、3和4这5个深度级，因此，第一最大深度可被设置为4，第二最大深度可被设置为5。可根据最大编码单元执行预测编码和变换。还可根据最大编码单元，基于根据等于最大深度的深度或小于最大深度的深度的较深层编码单元来执行预测编码和变换。由于每当最大编码单元根据深度被划分时较深层编码单元的数量增加，因此可针对随着深度加深而产生的所有较深层编码单元执行包括预测编码和变换的编码。为了便于描述，现在将基于最大编码单元中的当前深度的编码单元来描述预测编码和变换。视频编码设备100可不同地选择用于对图像数据进行编码的数据单元的尺寸或形状。为了对图像数据进行编码，执行诸如预测编码、变换和熵编码的操作，此时，可针对所有操作使用相同的数据单元，或者可针对每个操作使用不同的数据单元。例如，视频编码设备100不仅可选择用于对图像数据进行编码的编码单元，还可选择与编码单元不同的数据单元，以便对编码单元中的图像数据执行预测编码。为了在最大编码单元中执行预测编码，可基于与编码深度相应的编码单元(S卩，基于不再被划分为与下层深度相应的编码单元的编码单元)执行预测编码。以下，现将不再被划分并且变成用于预测编码的基本单元的编码单元称为“预测单元”。通过对预测单元进行划分所获得的分区(partition)可包括预测单元或通过对预测单元的高度和宽度中的至少一个进行划分所获得的数据单元。例如，当2NX2N(其中，N是正整数)的编码单元不再被划分，并且变成2NX2N的预测单元时，分区的尺寸可以是2NX2N、2NXN、NX2N或NXN。分区类型的示例包括通过对预测单元的高度或宽度进行对称划分所获得的对称分区、通过对预测单元的高度或宽度进行不对称划分(诸如l:n或η:1)所获得的分区、通过对预测单元进行几何划分所获得的分区以及具有任意形状的分区。预测单元的预测模式可以是帧内模式、帧间模式和跳过模式中的至少一个。例如，可针对2ΝX2Ν、2ΝXN、NX2Ν或NXN的分区执行帧内模式或帧间模式。此外，可仅针对2ΝΧ2Ν的分区执行跳过模式。针对编码单元中的一个预测单元独立地执行编码，从而选择具有最小编码误差的预测模式。视频编码设备100还可不仅基于用于对图像数据进行编码的编码单元，还基于不同于编码单元的数据单元，对编码单元中的图像数据执行变换。为了在编码单元中执行变换，可基于具有小于或等于编码单元的尺寸的数据单元来执行变换。例如，用于变换的数据单元可包括用于帧内模式的数据单元和用于帧间模式的数据单元。下面将用作变换的基础的数据单元称为变换单元。与编码单元类似，编码单元中的变换单元可被递归地划分为更小尺寸的区域，从而编码单元中的残差数据可基于根据变换深度的具有树结构的变换单元被划分。还可在变换单元中设置变换深度，所述变换深度指示通过对编码单元的高度和宽度进行划分来实现变换单元的划分次数。例如，在2NX2N的当前编码单元中，当变换单元的尺寸也为2NX2N时，变换深度可以是O，当当前编码单元的高度和宽度中的每个被划分为二等分，总共被划分为4个变换单元，变换单元的尺寸是NXN时，变换深度可以是1，当当前编码单元的高度和宽度中的每个被划分为四等分，总共被划分为42个变换单元，变换单元的尺寸是N/2XN/2时，变换深度可以是2。例如，可根据分层树结构设置变换单元，其中，根据变换深度的分层特性，上层变换深度的变换单元被划分为下层变换深度的四个变换单元ο与编码单元相似，编码单元中的变换单元可被递归地划分为更小尺寸的区域，从而可以以区域为单位独立地确定变换单元。因此，可基于变换深度，根据具有树结构的变换来划分编码单元中的残差数据。根据与编码深度相应的编码单元的编码信息不仅需要关于编码深度的信息，还需要关于与预测编码和变换有关的信息的信息。因此，编码单元确定器120不仅确定具有最小编码误差的编码深度，还确定预测单元中的分区类型、根据预测单元的预测模式和用于变换的变换单元的尺寸。稍后将参照图3至图12详细描述根据本发明的实施例的最大编码单元中的根据树结构的编码单元以及确定分区的方法。编码单元确定器120可通过使用基于拉格朗日乘子的率失真优化来测量根据深度的较深层编码单元的编码误差。输出单元130在比特流中输出最大编码单元的图像数据以及关于根据编码深度的编码模式的信息，其中，所述图像数据基于由编码单元确定器120确定的至少一个编码深度被编码。可通过对图像的残差数据进行编码来获得编码图像数据。关于根据编码深度的编码模式的信息可包括关于编码深度的信息、关于预测单元中的分区类型的信息、预测模式以及变换单元的尺寸。可通过使用根据深度的划分信息来定义关于编码深度的信息，所述根据深度的划分信息指示是否针对下层深度而不是当前深度的编码单元来执行编码。如果当前编码单元的当前深度是编码深度，则当前编码单元中的图像数据被编码并被输出，因此划分信息可被定义为不将当前编码单元划分到下层深度。可选地，如果当前编码单元的当前深度不是编码深度，则针对下层深度的编码单元来执行编码，因此，划分信息可被定义为划分当前编码单元以获得下层深度的编码单元。如果当前深度不是编码深度，则针对被划分为下层深度的编码单元的编码单元来执行编码。由于在当前深度的一个编码单元中存在下层深度的至少一个编码单元，因此针对下层深度的每个编码单元重复执行编码，因此，可针对具有相同深度的编码单元递归地执行编码。由于针对一个最大编码单元确定具有树结构的编码单元，并且针对编码深度的编码单元确定关于至少一个编码模式的信息，因此，可针对一个最大编码单元确定关于至少一个编码模式的信息。此外，由于图像数据根据深度被分层划分，因此，最大编码单元的图像数据的编码深度可根据位置而不同，因此，可针对图像数据设置关于编码深度和编码模式的信息。因此，输出单元130可将关于相应的编码深度和编码模式的编码信息分配给包括在最大编码单元中的编码单元、预测单元和最小单元中的至少一个。根据本发明的实施例的最小单元是通过将构成最低深度的最小编码单元划分4次所获得的矩形数据单元。可选地，最小单元可以是可包括在最大编码单元中所包括的所有编码单元、预测单元、分区单元和变换单元中的最大矩形数据单元。例如，通过输出单元130输出的编码信息可被分为根据编码单元的编码信息和根据预测单元的编码信息。根据编码单元的编码信息可包括关于预测模式的信息和关于分区尺寸的信息。根据预测单元的编码信息可包括关于帧间模式的估计方向的信息、关于帧间模式的参考图像索引的信息、关于运动矢量的信息、关于帧内模式的色度分量的信息和关于帧内模式的插值方法的信息。此外，关于根据画面、条带或GOP定义的编码单元的最大尺寸的信息以及关于最大深度的信息可被插入比特流的头中。在视频编码设备100中，较深层编码单元可以是通过将作为上一层的上层深度的编码单元的高度或宽度划分两次所获得的编码单元。换句话说，当当前深度的编码单元的尺寸为2NX2N时，下层深度的编码单元的尺寸是NXN。此外，尺寸为2NX2N的当前深度的编码单元可最多包括下层深度的4个编码单元。因此，视频编码设备100可通过基于考虑当前画面的特性所确定的最大编码单元的尺寸和最大深度，针对每个最大编码单元确定具有最佳形状和最佳尺寸的编码单元，来形成具有树结构的编码单元。此外，由于可通过使用各种预测模式和变换中的任何一个来针对每个最大编码单元执行编码，因此可考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。因此，当以传统的宏块对具有高分辨率或大数据量的图像进行编码时，每个像素所需的宏块数量过度增加。因此，针对每个宏块产生的压缩信息量也增加，因此发送压缩信息的负载将增加，并且数据压缩效率将降低。然而，视频编码设备100可考虑图像尺寸而增加编码单元的最大尺寸，并且可考虑图像特性而调整编码单元，从而图像压缩效率可提高。图2是根据本发明的实施例的视频解码设备200的框图。根据本发明的实施例的视频解码设备200包括接收器210、图像数据和编码信息提取器220以及图像数据解码器230。用于视频解码设备200的各种操作的各种术语(诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息)的定义与参照图1和视频编码设备100描述的那些术语相同。接收器210接收并解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流提取每个编码单元的编码图像数据，并将提取的图像数据输出到图像数据解码器230，其中，编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头或SPS提取关于当前画面的编码单元的最大尺寸的信息。此外，图像数据和编码信息提取器220从解析的比特流，提取关于编码单元的编码深度和编码模式的信息，其中，编码单元具有根据每个最大编码单元的树结构。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换句话说，比特流中的图像数据被划分为最大编码单元，从而图像数据解码器230对每个最大编码单元的图像数据进行解码。可针对关于与编码深度相应的至少一个编码单元的信息，来设置关于根据最大编码单元的编码深度和编码模式的信息，并且关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息和变换单元的尺寸。此外，根据深度的划分信息可被提取作为关于编码深度的信息。由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于如下编码深度和编码模式的信息，其中，所述编码深度和编码模式被确定为用于当编码器(诸如视频编码设备100)根据每个最大编码单元对每个根据深度的较深层编码单元重复执行编码时产生最小编码误差。因此，视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。由于关于编码深度和编码模式的编码信息可被分配给相应编码单元、预测单元和最小单元中的预定数据单元，因此图像数据和编码信息提取器220可根据预定数据单元提取关于编码深度和编码模式的信息。被分配关于编码深度和编码模式的相同信息的预定数据单元可被推断为包括在相同最大编码单元中的数据单元。图像数据解码器230通过基于关于根据最大编码单元的编码深度和编码模式的信息对每个最大编码单元中的图像数据进行解码，来恢复当前画面。换句话说，图像数据解码器230可基于提取的关于包括在每个最大编码单元中的具有树结构的编码单元中的每个编码单元的分区类型、预测模式和变换单元的信息，来对编码图像数据进行解码。解码处理可包括预测(包括帧内预测和运动补偿)和反变换。图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的分区类型和预测模式的信息，根据每个编码单元的分区和预测模式执行帧内预测或运动补偿。此外，图像数据解码器230可基于关于根据编码深度的编码单元的变换单元的尺寸的信息，根据编码单元中的每个变换单元执行反变换，从而根据最大编码单元执行反变换。图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度下不再被划分，则当前深度是编码深度。因此，图像数据解码器230可通过使用与编码深度相应的每个编码单元的关于预测单元的分区类型、预测模式和变换单元尺寸的信息，对当前最大编码单元中与每个编码深度相应的至少一个编码单元的编码数据进行解码。换句话说，可通过观察为编码单元、预测单元和最小单元中的预定数据单元分配的编码信息集来收集包括编码信息(包括相同划分信息)的数据单元，收集的数据单元可被视为将由图像数据解码器230以相同的编码模式进行解码的一个数据单元。视频解码设备200可获得关于当针对每个最大编码单元递归执行编码时产生最小编码误差的至少一个编码单元的信息，并可使用所述信息来对当前画面进行解码。换句话说，可对每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元进行解码。因此，即使图像数据对应于具有高分辨率和过大数据量的图像，视频解码设备200也可通过使用从编码器接收的关于最佳编码模式的信息，根据编码单元的尺寸和编码模式来有效地对所述图像数据进行解码和恢复，其中，根据图像的特性来自适应地确定所述编码单元的尺寸和所述编码模式。现在将参照图3至图13描述根据本发明的实施例的确定具有树结构的编码单元、预测单元和变换单元的方法。图3是用于描述根据本发明的实施例的分层编码单元的概念的示图。编码单元的尺寸可被表示为宽度X高度，可以是64\64、32父32、16\16和8父8。64X64的编码单元可被划分为64X64、64X32、32X64或32X32的分区，32X32的编码单元可被划分为32X32、32X16、16X32或16X16的分区，16X16的编码单元可被划分为16X16、16X8、8X16或8X8的分区，8X8的编码单元可被划分为8X8、8X4、4X8或4X4的分区。在视频数据310中，分辨率为1920X1080，编码单元的最大尺寸为64，最大深度为2。在视频数据320中，分辨率为1920X1080，编码单元的最大尺寸为64，最大深度为3。在视频数据330中，分辨率为352X288，编码单元的最大尺寸为16，最大深度为I。图3的最大深度指示从最大编码单元到最小解码单元的总划分次数。如果分辨率高或数据量大，则编码单元的最大尺寸可较大，从而不仅提高了编码效率还精确地反映出图像的特性。因此，分辨率高于视频数据330的视频数据310和视频数据320的编码单元的最大尺寸可以是64。由于视频数据310的最大深度是2，因此，由于通过将最大编码单元划分两次，深度被加深两层，因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32和16的编码单元。同时，由于视频数据330的最大深度是1，因此，由于通过将最大编码单元划分一次，深度被加深一层，因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元以及长轴尺寸为8的编码单元。由于视频数据320的最大深度为3，因此，由于通过将最大编码单元划分三次，深度被加深3层，因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元以及长轴尺寸为32、16和8的编码单元。随着深度加深，可精确地表达详细信息。图4是根据本发明的实施例的基于编码单元的图像编码器400的框图。图像编码器400执行视频编码设备100的编码单元确定器120的操作以对图像数据进行编码。换句话说，帧内预测器410对当前帧405中的帧内模式下的编码单元执行帧内预测，运动估计器420和运动补偿器425通过使用当前帧405和参考帧495，对当前帧405中的帧间模式下的编码单元执行帧间估计和运动补偿。从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出作为量化的变换系数。量化的变换系数通过反量化器460和反变换器470被恢复为空间域中的数据，恢复的空间域中的数据在通过去块单元480和环路滤波单元490进行后处理之后被输出为参考帧495。量化的变换系数可通过熵编码器450被输出为比特流455。为了将图像编码器400应用在视频编码设备100中，图像编码器400的所有元件(即，帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器450、反量化器460、反变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度的同时，基于具有树结构的编码单元中的每个编码单元来执行操作。具体地，帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度的同时确定具有树结构的编码单元中的每个编码单元的分区和预测模式，变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元的尺寸。图5是根据本发明的实施例的基于编码单元的图像解码器500的框图。解析器510从比特流505解析将被解码的编码图像数据以及解码所需的关于编码的信息。编码图像数据通过熵解码器520和反量化器530被输出为反量化的数据，反量化的数据通过反变换器540被恢复为空间域中的图像数据。帧内预测器550针对空间域中的图像数据，对帧内模式下的编码单元执行帧内预测，运动补偿器560通过使用参考帧585对帧间模式下的编码单元执行运动补偿。通过帧内预测器550和运动补偿器560的空间域中的图像数据可在通过去块单元570和环路滤波单元580进行后处理之后被输出为恢复的帧595。此外，通过去块单元570和环路滤波单元580进行后处理的图像数据可被输出为参考帧585。为了在视频解码设备200的图像数据解码器230中对图像数据进行解码，图像解码器500可执行在解析器510之后执行的操作。为了将图像解码器500应用在视频解码设备200中，图像解码器500的所有元件(即，解析器510、熵解码器520、反量化器530、反变换器540、帧内预测器550、运动补偿器560、去块单元570和环路滤波单元580)针对每个最大编码单元基于具有树结构的编码单元执行操作。具体地，帧内预测器550和运动补偿器560基于具有树结构的编码单元中的每个编码单元的分区和预测模式执行操作，反变换器540基于每个编码单元的变换单元的尺寸执行操作。图6是示出根据本发明的实施例的根据深度的较深层编码单元以及分区的示图。视频编码设备100和视频解码设备200使用分层编码单元以考虑图像的特性。可根据图像的特性适应地确定编码单元的最大高度、最大宽度和最大深度，或可由用户不同地设置编码单元的最大高度、最大宽度和最大深度。可根据编码单元的预定最大尺寸来确定根据深度的较深层编码单元的尺寸。在根据本发明的实施例的编码单元的分层结构600中，编码单元的最大高度和最大宽度均为64，最大深度为4。由于深度沿分层结构600的纵轴加深，因此较深层编码单元的高度和宽度均被划分。此外，沿分层结构600的横轴示出作为用于每个较深层编码单元的预测编码的基础的预测单元和分区。换句话说，编码单元610是分层结构600中的最大编码单元，其中，深度为0，尺寸(即，高度乘宽度)为64X64。深度沿纵轴加深，存在尺寸为32X32且深度为I的编码单元620、尺寸为16X16且深度为2的编码单元630、尺寸为8X8且深度为3的编码单元640以及尺寸为4X4且深度为4的编码单元650。尺寸为4X4且深度为4的编码单元650是最小编码单元。编码单元的预测单元和分区根据每个深度沿横轴排列。换句话说，如果尺寸为64X64且深度为O的编码单元610是预测单元，则预测单元可被划分为包括在编码单元610中的分区，即，尺寸为64X64的分区610、尺寸为64X32的分区612、尺寸为32X64的分区614或尺寸为32X32的分区616。类似地，尺寸为32X32且深度为I的编码单元620的预测单元可被划分为包括在编码单元620中的分区，即，尺寸为32X32的分区620、尺寸为32X16的分区622、尺寸为16X32的分区624和尺寸为16X16的分区626。类似地，尺寸为16X16且深度为2的编码单元630的预测单元可被划分为包括在编码单元630中的分区，即，包括在编码单元630中的尺寸为16X16的分区630、尺寸为16X8的分区632、尺寸为8X16的分区634和尺寸为8X8的分区636。类似地，尺寸为8X8且深度为3的编码单元640的预测单元可被划分为包括在编码单元640中的分区，S卩，包括在编码单元640中的尺寸为8X8的分区640、尺寸为8X4的分区642、尺寸为4X8的分区644和尺寸为4X4的分区646。尺寸为4X4且深度为4的编码单元650是最小编码单元和最下层深度的编码单元。编码单元650的预测单元仅被分配给尺寸为4X4的分区。为了确定组成最大编码单元610的编码单元的至少一个编码深度，视频编码设备100的编码单元确定器120针对包括在最大编码单元610中的与每个深度相应的编码单元执行编码。随着深度加深，以相同范围和相同尺寸包括数据的根据深度的较深层编码单元的数量增加。例如，需要四个与深度2相应的编码单元，以覆盖包括在一个与深度I相应的编码单元中的数据。因此，为了比较相同数据根据深度的编码结果，与深度I相应的编码单元和四个与深度2相应的编码单元各自被编码。为了针对多个深度中的当前深度执行编码，可通过沿分层结构600的横轴，针对与当前深度相应的编码单元中的每个预测单元执行编码，来针对当前深度选择最小编码误差。可选地，可通过随着深度沿分层结构600的纵轴加深针对每个深度执行编码来比较根据深度的最小编码误差，从而搜索最小编码误差。在编码单元610中具有最小编码误差的深度和分区可被选为编码单元610的编码深度和分区类型。图7是用于描述根据本发明的实施例的编码单元710和变换单元720之间的关系的示图。视频编码设备100或200针对每个最大编码单元，根据具有小于或等于最大编码单元的尺寸的编码单元来对图像进行编码或解码。可基于不大于相应编码单元的数据单元来选择在编码期间用于变换的变换单元的尺寸。例如，在视频编码设备100或200中，如果编码单元710的尺寸是64X64，则可通过使用尺寸为32X32的变换单元720来执行变换。此外，可通过对小于64X64的尺寸为32X32、16X16、8X8和4X4的变换单元中的每一个执行变换，来对尺寸为64X64的编码单元710的数据进行编码，随后可选择具有最小编码误差的变换单元。图8是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息的示图。视频编码设备100的输出单元130可对与编码深度相应的每个编码单元的关于分区类型的信息800、关于预测模式的信息810和关于变换单元的尺寸的信息820进行编码和发送，以作为关于编码模式的信息。信息800指示关于通过对当前编码单元的预测单元进行划分而获得的分区的形状的信息，其中，所述分区是用于对当前编码单元进行预测编码的数据单元。例如，尺寸为2NX2N的当前编码单元CU_0可被划分为尺寸为2NX2N的分区802、尺寸为2NXN的分区804、尺寸为NX2N的分区806和尺寸为NXN的分区808中的任意一个。这里，关于分区类型的信息800被设置为指示尺寸为2NXN的分区804、尺寸为NX2N的分区806和尺寸为NXN的尺寸的分区808之一。信息810指示每个分区的预测模式。例如，信息810可指示对由信息800指示的分区执行的预测编码的模式，即，帧内模式812、帧间模式814或跳过模式816。信息820指示当对当前编码单元执行变换时所基于的变换单元。例如，变换单元可以是第一帧内变换单元822、第二帧内变换单元824、第一帧间变换单元826或第二帧内变换单元828。视频解码设备200的图像数据和编码信息提取器220可根据每个较深层编码单元提取和使用用于解码的信息800、810和820。图9是根据本发明的实施例的根据深度的较深层编码单元的示图。划分信息可被用于指示深度的改变。划分信息指示当前深度的编码单元是否被划分为下层深度的编码单元。用于对深度为O且尺寸为2N_0X2N_0的编码单元900进行预测编码的预测单元910可包括以下分区类型的分区:尺寸为2N_0X2N_0的分区类型912、尺寸为2N_0XN_0的分区类型914、尺寸为N_0X2N_0的分区类型916、尺寸为Ν_0ΧΝ_0的分区类型918。图16仅示出通过对预测单元910进行对称划分而获得的分区类型912至918，但分区类型不限于此，预测单元910的分区可包括不对称分区、具有预定形状的分区和具有几何形状的分区。根据每个分区类型，对一个尺寸为2N_0X2N_0的分区、两个尺寸为2N_0XN_0的分区、两个尺寸为N_0X2N_0的分区和四个尺寸为Ν_0ΧΝ_0的分区重复执行预测编码。可对尺寸为2N_0X2N_0、N_0X2N_0、2N_0XN_0和N_0XN_0的分区执行帧内模式和帧间模式下的预测编码。仅对尺寸为2N_0X2N_0的分区执行跳过模式下的预测编码。对在分区类型912至918中的包括预测编码的编码的误差进行比较，在所述分区类型中确定最小编码误差。如果在分区类型912至916之一中编码误差最小，则预测单元910可不被划分到下层深度。如果在分区类型918中编码误差最小，则深度从O改变到I以在操作920对分区类型918进行划分，并对深度为2且尺寸为Ν_0ΧΝ_0的编码单元930重复执行编码，以搜索最小编码误差。用于对深度为I且尺寸为2N_1X2N_1(=Ν_0ΧΝ_0)的编码单元930进行预测编码的预测单元940可包括以下分区类型的分区:尺寸为2N_1X2N_1的分区类型942、尺寸为2N_1XN_1的分区类型944、尺寸为N_1X2N_1的分区类型946、尺寸为N_1XN_1的分区类型948。如果在分区类型948中编码误差最小，则深度从I改变到2以在操作950对分区类型948进行划分，并对深度为2且尺寸为N_2XN_2的编码单元960重复执行编码，以搜索最小编码误差。当最大深度为d时，可执行根据每个深度的划分操作，直到深度变为d-Ι，并且划分信息可被编码，直到深度为O到d-2中的一个。换句话说，当编码被执行直到在操作970与深度d-2相应的编码单元被划分之后深度为d-Ι时，用于对深度为d-Ι且尺寸为2N_(d-1)X2N_(d-l)的编码单元980进行预测编码的预测单元990可包括以下分区类型的分区:尺寸为2N_(d-l)X2N_(d-l)的分区类型992、尺寸为2N_(d_l)XN_(d_l)的分区类型994、尺寸为N_(d-1)X2N_(d-l)的分区类型996、尺寸为N_(d_l)XN_(d_l)的分区类型998。可在分区类型992至998中对一个尺寸为2N_(d_l)X2N_(d_l)的分区、两个尺寸为2N_(d-l)XN_(d-l)的分区、两个尺寸为N_(d-1)X2N_(d-l)的分区、四个尺寸为N_(d-1)XN_(d-l)的分区重复执行预测编码，以搜索具有最小编码误差的分区类型。即使当分区类型998具有最小编码误差时，由于最大深度为d，因此深度为d-Ι的编码单元cu_(d-l)也不再被划分到下层深度，用于组成当前最大编码单元900的编码单元的编码深度被确定为d-Ι，当前最大编码单元900的分区类型可被确定为N_(d-1)XN_(d-1)。此外，由于最大深度为d并且具有最下层深度d-Ι的最小编码单元980不再被划分到下层深度，因此不设置最小编码单元980的划分信息。数据单元999可以为当前最大编码单元的“最小单元”。根据本发明的实施例的最小单元可以是通过将最小编码单元980划分4次而获得的正方形数据单元。通过重复执行编码，视频编码设备100可通过比较根据编码单元900的深度的编码误差来选择具有最小编码误差的深度以确定编码深度，并将相应的分区类型和预测模式设置为编码深度的编码模式。这样，在I至d的所有深度中比较根据深度的最小编码误差，具有最小编码误差的深度可被确定为编码深度。编码深度、预测单元的分区类型和预测模式可作为关于编码模式的信息被编码和发送。此外，由于编码单元从深度O被划分到编码深度，因此仅编码深度的划分信息被设置为0，除了编码深度之外的深度的划分信息被设置为I。视频解码设备200的图像数据和编码信息提取器220可提取并使用关于编码单元900的编码深度和预测单元的信息以对分区912进行解码。视频解码设备200可通过使用根据深度的划分信息将划分信息为O的深度确定为编码深度，并使用关于相应深度的编码模式的信息以进行解码。图10、图11和图12是用于描述根据本发明的实施例的编码单元1010、预测单元1060和变换单元1070之间的关系的示图。编码单元1010是最大编码单元中与由视频编码设备100确定的编码深度相应的具有树结构的编码单元。预测单元1060是编码单元1010中的每一个的预测单元的分区，变换单元1070是编码单元1010中的每一个的变换单元。当编码单元1010中的最大编码单元的深度是O时，编码单元1012和1054的深度是1，编码单元1014、1016、1018、1028、1050和1052的深度是2，编码单元1020、1022、1024、1026、1030、1032和1048的深度是3，编码单元1040、1042、1044和1046的深度是4。在预测单元1060中，通过对编码单元1010中的编码单元进行划分来获得某些编码单元1014、1016、1022、1032、1048、1050、1052和1054。换句话说，编码单元1014、1022、1050和1054中的分区类型具有2NXN的尺寸，编码单元1016、1048和1052中的分区类型具有NX2N的尺寸，编码单元1032的分区类型具有NXN的尺寸。编码单元1010的预测单元和分区小于或等于每个编码单元。对小于编码单元1052的数据单元中的变换单元1070中的编码单元1052的图像数据执行变换或反变换。此外，变换单元1070中的编码单元1014、1016、1022、1032、1048、1050和1052在尺寸和形状方面与预测单元1060中的编码单元1014、1016、1022、1032、1048,1050和1052不同。换句话说，视频编码设备100和视频解码设备200可对相同编码单元中的数据单元分别执行帧内预测、运动估计、运动补偿、变换和反变换。因此，对最大编码单元的每个区域中具有分层结构的编码单元中的每一个递归地执行编码，以确定最佳编码单元，从而可获得具有递归树结构的编码单元。编码信息可包括关于编码单元的划分信息、关于分区类型的信息、关于预测模式的信息和关于变换单元的尺寸的信息。表I示出可由视频编码设备100和视频解码设备200设置的编码信息。表I权利要求1.一种对图像进行帧内预测的方法，所述方法包括:基于将被帧内预测的色度块的恢复的邻近像素和与所述色度块相应的亮度像素的恢复的邻近像素，获得表示所述色度块和亮度块之间的相关性的参数；通过使用所述参数来从所述亮度块预测所述色度块；其中，获得所述参数的步骤包括:对所述色度块的恢复的邻近像素和所述亮度块的恢复的邻近像素执行预定操作，其中，预定操作包括改变所述参数的比特深度以减小查找表的尺寸并防止溢出的发生的自适应缩放处理。2.如权利要求1所述的方法，其中，所述参数包括定义所述亮度块的恢复的像素和与所述亮度块的恢复的像素相应的色度块的像素之间的线性相关性的权重和偏移。3.如权利要求2所述的方法，其中，如果在亮度块上的位置(X，y)存在的恢复的像素是Rec_L’(X，y)，在色度块上的位置(X，y)存在的恢复的像素是Pred_C(x，y)，权重是a，偏移是b,则通过Pred_C(x,y)=aXRec_L’(x,y)+b来定义相关性。4.如权利要求3所述的方法，其中，如果亮度块的I个恢复的邻近像素是Rec_L’(i)，色度块的I个恢复的邻近像素是Rec_C(i)，则通过下面的等式确定权重a:5.如权利要求4所述的方法，其中，通过下面的等式确定偏移b:6.如权利要求4所述的方法，还包括:通过使用预定数量的高位比特分别逼近值Al和Α2来计算估计值Al’和Α2’；基于估计值Al’和Α2’，通过将权重a放大预定\比特来计算整数a’。7.如权利要求6的方法，其中，如果nA1表示从值Al提取的高位比特的数量，nA2表示从值A2提取的高位比特的数量，rA1=max(bdepth(Al)_nA1,O)，rA2=max(bdepth(A2)-nA2,0)，bdepth(Al)表示值Al的比特深度,bdepth(A2)表示值A2的比特深度,ntable表示预定常数，则通过*2确定估计值Al’，通过__U'12》ryl2|.确定估计值A2’，通过8.如权利要求7所述方法，其中，从预定查找表获得计算9.如权利要求4所述的方法，其中，基于通过分别将在下面的等式中定义的CL、C、LL和L缩小预定比特而获得的值，计算权重a:10.如权利要求9所述的方法，其中，如果色度块的尺寸是nSXnS，色度像素的比特深度是BitDepth。，则通过将CL、C、LL和L缩小通过下面的等式定义的k3比特来减少CL、C、LL和L的比特深度:k3=Max(O,BitDepthc+log2(nS)-14)，其中，nS表示正整数。11.如权利要求10所述的方法，如果k2是通过k2=1g2((2*ns)>>k3)定义12.如权利要求11所述的方法，还包括:通过基于值Al和Α2的绝对值分别将值Al和Α2缩小预定比特来计算估计值Al’和Α2’，其中，通过下面的算法确定权重a和偏移b:13.如权利要求3所述的方法，其中，预测色度块的步骤:根据下面的等式，通过使用由将权重a放大预定na比特而获得的整数a’和由对偏移b进行四舍五入而获得的整数b’，对在色度块上的位置(x，y)的预测值Pred_C(X，y)进行预测:Pred_c(x,y)=(a'.Rec_L/(x,y)>>na)+b1。14.如权利要求13所述的方法，还包括:将预测值Pred_C(X，y)缩减到在色度块的像素的值的范围内。15.如权利要求1所述的方法，如果色度块和亮度块的尺寸不同，则对恢复的亮度块及其邻近像素进行采样，以使色度信号的尺寸和亮度信号的尺寸彼此相等。全文摘要本发明公开了一种图像帧内预测方法和设备。根据本发明的实施例的帧内预测方法包括如下步骤基于将被帧内预测的色度块的恢复的邻近像素和亮度像素的恢复的邻近像素，获得表示所述色度块和亮度块之间的相关性的参数；通过使用所述参数从亮度块预测色度块。此外，根据本发明的实施例，获得所述参数的步骤可包括通过对所述色度块的恢复的邻近像素和所述亮度块的恢复的邻近像素执行预定操作来获得所述参数，所述预定操作可包括改变所述参数的比特深度以防止比特溢出的发生的缩放处理。文档编号H04N7/34GK103238334SQ201180058274公开日2013年8月7日申请日期2011年9月30日优先权日2010年10月1日发明者陈建乐,范迪姆·谢廖金申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈建乐;范迪姆·谢廖金
技术所有人：三星电子株式会社
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。