对视频进行解码的方法和设备的制造方法_4

文档序号：9755179阅读：来源：国知局

尺寸是2N X 2N时，更低深度的编码单元的尺寸是NX N。此外，具有2N X 2N尺寸的当前深度的编码单元可包括最多四个更低深度的编码单元。
[0171] 因此，视频编码设备100可通过基于考虑当前画面的特性确定的最大深度和最大编码单元的尺寸针对每个最大编码单元确定具有最佳形状和最佳尺寸的编码单元，来形成具有树结构的编码单元。此外，由于可通过使用各种预测模式和变换中的任何一种对每个最大编码单元执行编码，因此可考虑各种图像尺寸的编码单元的特性来确定最佳编码模式。
[0172] 因此，如果具有高分辨率或大数据量的图像W传统宏块被编码，则对于每个画面宏块的数量过度增加。因此，针对每个宏块产生的压缩信息的条数增加，从而难W发送压缩信息，并且数据压缩效率降低。然而，通过使用视频编码设备100,图像压缩效率可W提高，运是因为在考虑图像的特性时调整编码单元，同时在考虑图像的尺寸时增大编码单元的最大尺寸。
[0173] 图7的视频编码设备100可执行参照图1描述的视频编码设备10的操作。
[0174] 编码单元确定器120可执行视频编码设备10的图像编码器12的操作。编码单元确定器120可针对每个最大编码单元根据具有树结构的编码单元确定用于帖内预测的预测单元，在每个预测单元中执行帖内预测，确定用于变换的变换单元，并在每个变换单元中执行变换。
[0175] 输出单元130可执行视频编码设备10的符号编码单元14和比特流输出单元16的操作。产生用于各种数据单元(诸如画面、条带、最大编码单元、编码单元、预测单元和变换单元)的符号，根据基于相应数据单元的尺寸确定的阔值将每个符号分类为前缀区域和后缀区域。输出单元130可通过使用针对符号的前缀区域和后缀区域中的每一个确定的二值化方法来产生前缀比特串和后缀比特串。选择一般二值化、一元二值化、截断一元二值化、指数哥伦布二值化和固定长度二值化中的任何一个来对前缀区域和后缀区域进行二值化，从而产生前缀比特串和后缀比特串。
[0176] 输出单元130可通过执行针对前缀比特串和后缀比特串中的每一个确定的算术编码来执行符号编码。输出单元130可通过对前缀比特串执行用于根据比特的位置执行上下文建模的算术编码并通过在旁路模式下对后缀比特串执行省略上下文建模的算术编码，来执行符号编码。
[0177] 例如，当变换单元的变换系数的最终系数位置信息被编码时，可根据变换单元的尺寸（宽度或高度)确定用于分类前缀比特串和后缀比特串的阔值。可选地，可根据包括当前变换单元、最大编码单元、编码单元、预测单元等的条带的尺寸来确定阔值。
[0178] 可选地，可通过帖内预测模式的最大索引确定帖内预测模式下的符号比特串的多少比特在算术编码中作为前缀比特串通过上下文建模被编码W及符号比特串的多少比特在算术编码中作为后缀比特串在旁路模式下被编码。例如，可对于具有8X8、16X 16和32X 32尺寸的预测单元使用总共34个帖内预测模式，可对于具有4X4尺寸的预测单元使用总共 17个帖内预测模式，可对于具有64X64尺寸的预测单元使用总共3个帖内预测模式。在此情况下，由于能够使用相同数量的帖内预测模式的预测单元被视为具有相似的统计特性，因此帖内预测模式下的比特串中的第一比特可通过上下文建模被编码W针对具有8X8、16X 16和32X32尺寸的预测单元进行算术编码。此外，帖内预测模式下的比特串中的所有比特可在旁路模式下被编码W针对剩余的预测单元（即，具有4 X 4和64 X 64尺寸的预测单元)进行算术编码。
[0179] 输出单元130可W W比特流的形式输出通过符号编码产生的比特串。
[0180] 图8是根据本发明的实施例的基于具有树结构的编码单元的视频解码设备200的框图。
[0181] 基于具有树结构的编码单元执行视频预测的视频解码设备200包括接收器210、图像数据和编码信息提取器220W及图像数据解码器230。
[0182] 用于视频解码设备200的各种操作的诸如编码单元、深度、预测单元、变换单元和关于各种编码模式的信息的各种术语的定义与参照图7描述的术语和视频编码设备100的术语的定义相同。
[0183] 接收器210接收并解析编码视频的比特流。图像数据和编码信息提取器220从解析的比特流提取用于每个编码单元的编码的图像数据，并将提取的图像数据输出到图像数据解码器230，其中，编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息提取器220可从关于当前画面的头或SI^或PI^提取关于当前画面的编码单元的最大尺寸的信息。
[0184] 此外，图像数据和编码信息提取器220从解析的比特流提取关于编码深度和编码模式的信息，其中，所述编码深度和编码模式用于具有根据每个最大编码单元的树结构的编码单元。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之，比特串中的图像数据被划分为最大编码单元，从而图像数据解码器230针对每个最大编码单元对图像数据进行解码。
[0185] 可针对关于与编码深度相应的至少一个编码单元的信息来设置关于根据最大编码单元的编码深度和编码模式的信息，并且关于编码模式的信息可包括关于与编码深度相应的相应编码单元的分区类型的信息、关于预测模式的信息W及关于变换单元的尺寸的信息。此外，可提取根据深度的划分信息，作为关于编码深度的信息。
[0186] 由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深度和编码模式的信息是关于如下编码深度和编码模式的信息，所述编码深度和编码模式被确定为当编码器(诸如视频编码设备100)根据每个最大编码单元针对根据深度的每个较深层编码单元重复地执行编码时产生最小编码误差。因此，视频解码设备200可通过根据产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
[0187] 由于关于编码深度和编码模式的编码信息可被分配到相应编码单元、预测单元和最小单元中的预定数据单元，因此图像数据和编码信息提取器220可根据预定数据单元提取关于编码深度和编码模式的信息。分配有关于编码深度和编码模式的相同信息的预定数据单元可被推断为包括在相同最大编码单元中的数据单元。
[0188] 图像数据解码器230通过基于关于根据最大编码单元的编码深度和编码模式的信息对每个最大编码单元中的图像数据进行解码，来恢复当前画面。换言之，图像数据解码器 230可基于提取的关于包括在每个最大编码单元中的具有树结构的编码单元中的每个编码单元的分区类型、预测模式和变换单元的信息，来对编码的图像数据进行解码。解码处理可包括包含帖内预测和运动补偿的预测W及逆变换。
[0189] 图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的预测模式和分区类型的信息，根据每个编码单元的预测模式和分区来执行帖内预测或运动补偿。
[0190] 此外，图像数据解码器230可基于关于根据具有树结构的编码单元的变换单元的信息，根据编码单元中的每个变换单元来执行逆变换，从而根据最大编码单元执行逆变换。可通过逆变换恢复编码单元中的空域的像素值。
[0191] 图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分，则当前深度是编码深度。因此，图像数据解码器230可通过使用关于与编码深度相应的每个编码单元的预测单元的分区类型、预测模式和变换单元尺寸的信息，对当前最大编码单元中的与每个编码深度相应的至少一个编码单元的编码数据进行解码，并输出当前最大编码单元的图像数据。
[0192] 换言之，可通过观察为编码单元、预测单元和最小单元中的预定数据单元分配的编码信息集来收集包含包括相同划分信息的编码信息的数据单元，并且收集的数据单元可被视为将在相同编码模式下被图像数据解码器230解码的一个数据单元。可通过获得关于 W运种方式确定的每个编码单元的编码模式的信息，来执行当前编码单元的解码。
[0193] 此外，图8的视频解码设备200可执行W上参照图2描述的视频解码设备20的操作。
[0194] 接收器210W及图像数据和编码信息提取器220可执行视频解码设备20的解析器 22和符号解码器24的操作。图像数据解码器230可执行视频解码设备20的符号解码器24的操作。
[01M]接收器210接收图像的比特流，图像数据和编码信息提取器220从接收的比特流解析图像块的符号。
[0196] 图像数据和编码信息提取器220可基于根据当前块的尺寸确定的阔值将当前符号分类为前缀比特串和后缀比特串。例如，当变换单元的变换系数的最终系数位置信息被解码时，可根据变换单元的尺寸（宽度或高度)确定用于分类前缀比特串和后缀比特串的阔值。可选地，可根据包括当前变换单元、最大编码单元、编码单元、预测单元等的条带的尺寸确定阔值。可选地，可通过帖内预测模式的最大索引确定在帖内预测模式下的符号比特串的多少比特在算术编码中作为前缀比特串通过上下文建模被编码W及符号比特串的多少比特在算术编码中作为后缀比特串在旁路模式下被编码。
[0197] 通过使用针对当前符号的前缀比特串和后缀比特串中的每一个确定的算术解码方法来执行算术解码。可对前缀比特串执行用于根据比特位置确定上下文建模的算术解码，并可通过使用旁路模式对后缀比特串执行省略上下文建模的算术解码。
[0198] 在算术解码之后，根据针对前缀比特串和后缀比特串中的每一个确定的二值化方法来执行逆二值化。可通过根据针对前缀比特串和后缀比特串中的每一个确定的二值化方法执行逆二值化，来恢复符号的前缀区域和后缀区域。
[0199] 图像数据解码器230可通过使用经由算术解码和逆二值化恢复的当前符号对当前块执行逆变换和预测，来恢复图像块。
[0200] 因此，当针对每个最大编码单元递归地执行编码时，视频解码设备200可获得关于产生最小编码误差的至少一个编码单元的信息，并可使用该信息来对当前画面进行解码。换言之，在每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元可被解码。
[0201] 因此，即使图像数据具有高分辨率和大量数据，也可通过使用关于从编码器接收的最佳编码模式的信息，通过使用根据图像数据的特性自适应地确定的编码单元的尺寸和编码模式来对图像数据有效地进行解码并恢复图像数据。
[0202] 图9是根据本发明的实施例的编码单元的概念图。
[0203] 编码单元的尺寸可被表示为宽度X高度，并且可W是64 X 64、32 X 32、16 X 16和8 X 8。64 X 64的编码单元可被划分为64 X 64、64 X 32、32 X 64或32 X 32的分区，32 X 32的编码单元可被划分为32 X 32、32 X 16、16 X 32或16 X 16的分区，16 X 16的编码单元可被划分为16 X 16、16 X 8、8 X 16或8 X 8的分区，8 X 8的编码单元可被划分为8 X 8、8 X 4、4 X 8或4 X 4的分区。
[0204] 在视频数据310中，分辨率是1920 X 1080，编码单元的最大尺寸是64，最大深度是 2。在视频数据320中，分辨率是1920 X 1080，编码单元的最大尺寸是64，最大深度是3。在视频数据330中，分辨率是352 X 288，编码单元的最大尺寸是16，最大深度是1。图9中示出的最大深度表示从最大编码单元到最小解码单元的划分总数。
[0205] 如果分辨率高或数据量大，则编码单元的最大尺寸可W大，从而不但提高编码效率，而且精确地反映图像的特性。因此，具有比视频数据330更高分辨率的视频数据310和 320的编码单元的最大尺寸可W是64。
[0206] 由于视频数据310的最大深度是2,因此视频数据310的编码单元315可包括长轴尺寸为64的最大编码单元W及因通过将最大编码单元划分两次而深度加深到两层的长轴尺寸为32和16的编码单元。同时，由于视频数据330的最大深度是1，因此视频数据330的编码单元335可包括长轴尺寸为16的最大编码单元W及因通过将最大编码单元划分一次而深度加深到一层的长轴尺寸为8的编码单元。
[0207] 由于视频数据320的最大深度是3,因此视频数据320的编码单元325可包括长轴尺寸为64的最大编码单元W及因通过将最大编码单元划分=次而深度加深到3层的长轴尺寸为32、16和8的编码单元。随着深度加深，可精确表示详细信息。
[0208] 图10是根据本发明的实施例的基于编码单元的图像编码器400的框图。
[0209] 图像编码器400执行视频编码设备100的编码单元确定器120的操作W对图像数据进行编码。换言之，帖内预测器410对当前帖405中的处于帖内模式下的编码单元执行帖内预测，运动估计器420和运动补偿器425通过使用当前帖405和参考帖495对当前帖405中的处于帖间模式下的编码单元执行帖间估计和运动补偿。
[0210] 从帖内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430和量化器440被输出为量化的变换系数。量化的变换系数通过反量化器460和逆变换器470被恢复为空域中的数据，恢复的空域中的数据在通过去块单元480和环路滤波单元490进行后处理之后被输出为参考帖495。量化的变换系数可通过赌编码器450被输出为比特流455。
[0211] 为了将图像编码器400应用在视频编码设备100中，图像编码器400的所有元件 (即，帖内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、赌编码器 450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码单元的最大深度时基于具有树结构的编码单元中的每个编码单元来执行操作。
[0212] 具体地，帖内预测器410、运动估计器420和运动补偿器425在考虑当前最大编码单元的最大尺寸和最大深度时确定具有树结构的编码单元中的每个编码单元的分区和预测模式，并且变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元尺寸。
[0213] 具体地讲，赌编码器450可通过根据预定阔值将

完整全部详细技术资料下载

当前第4页1 2 3 4 5 6