对视频进行解码的方法和设备的制造方法_4

文档序号:9601160阅读:来源:国知局
] 因此,视频编码设备100可通过基于考虑当前画面的特性确定的最大深度和最大 编码单元的尺寸针对每个最大编码单元确定具有最佳形状和最佳尺寸的编码单元,来形成 具有树结构的编码单元。此外,由于可通过使用各种预测模式和变换中的任何一种对每个 最大编码单元执行编码,因此可考虑各种图像尺寸的编码单元的特性来确定最佳编码模 式。
[0172]因此,如果具有高分辨率或大数据量的图像以传统宏块被编码,则对于每个画面 宏块的数量过度增加。因此,针对每个宏块产生的压缩信息的条数增加,从而难以发送压缩 信息,并且数据压缩效率降低。然而,通过使用视频编码设备100,图像压缩效率可以提高, 这是因为在考虑图像的特性时调整编码单元,同时在考虑图像的尺寸时增大编码单元的最 大尺寸。
[0173] 图7的视频编码设备100可执行参照图1描述的视频编码设备10的操作。
[0174] 编码单元确定器120可执行视频编码设备10的图像编码器12的操作。编码单元 确定器120可针对每个最大编码单元根据具有树结构的编码单元确定用于帧内预测的预 测单元,在每个预测单元中执行帧内预测,确定用于变换的变换单元,并在每个变换单元中 执行变换。
[0175] 输出单元130可执行视频编码设备10的符号编码单元14和比特流输出单元16的 操作。产生用于各种数据单元(诸如画面、条带、最大编码单元、编码单元、预测单元和变换 单元)的符号,根据基于相应数据单元的尺寸确定的阈值将每个符号分类为前缀区域和后 缀区域。输出单元130可通过使用针对符号的前缀区域和后缀区域中的每一个确定的二值 化方法来产生前缀比特串和后缀比特串。选择一般二值化、一元二值化、截断一元二值化、 指数哥伦布二值化和固定长度二值化中的任何一个来对前缀区域和后缀区域进行二值化, 从而产生前缀比特串和后缀比特串。
[0176] 输出单元130可通过执行针对前缀比特串和后缀比特串中的每一个确定的算术 编码来执行符号编码。输出单元130可通过对前缀比特串执行用于根据比特的位置执行上 下文建模的算术编码并通过在旁路模式下对后缀比特串执行省略上下文建模的算术编码, 来执行符号编码。
[0177]例如,当变换单元的变换系数的最终系数位置信息被编码时,可根据变换单元的 尺寸(宽度或高度)确定用于分类前缀比特串和后缀比特串的阈值。可选地,可根据包括 当前变换单元、最大编码单元、编码单元、预测单元等的条带的尺寸来确定阈值。
[0178] 可选地,可通过帧内预测模式的最大索引确定帧内预测模式下的符号比特串的 多少比特在算术编码中作为前缀比特串通过上下文建模被编码以及符号比特串的多少比 特在算术编码中作为后缀比特串在旁路模式下被编码。例如,可对于具有8X8、16X16和 32X32尺寸的预测单元使用总共34个帧内预测模式,可对于具有4X4尺寸的预测单元使 用总共17个帧内预测模式,可对于具有64X64尺寸的预测单元使用总共3个帧内预测模 式。在此情况下,由于能够使用相同数量的帧内预测模式的预测单元被视为具有相似的统 计特性,因此帧内预测模式下的比特串中的第一比特可通过上下文建模被编码以针对具有 8X8、16X16和32X32尺寸的预测单元进行算术编码。此外,帧内预测模式下的比特串中 的所有比特可在旁路模式下被编码以针对剩余的预测单元(即,具有4X4和64X64尺寸 的预测单元)进行算术编码。
[0179] 输出单元130可以以比特流的形式输出通过符号编码产生的比特串。
[0180] 图8是根据本发明的实施例的基于具有树结构的编码单元的视频解码设备200的 框图。
[0181] 基于具有树结构的编码单元执行视频预测的视频解码设备200包括接收器210、 图像数据和编码信息提取器220以及图像数据解码器230。
[0182] 用于视频解码设备200的各种操作的诸如编码单元、深度、预测单元、变换单元和 关于各种编码模式的信息的各种术语的定义与参照图7描述的术语和视频编码设备100的 术语的定义相同。
[0183] 接收器210接收并解析编码视频的比特流。图像数据和编码信息提取器220从解 析的比特流提取用于每个编码单元的编码的图像数据,并将提取的图像数据输出到图像数 据解码器230,其中,编码单元具有根据每个最大编码单元的树结构。图像数据和编码信息 提取器220可从关于当前画面的头或SPS或PPS提取关于当前画面的编码单元的最大尺寸 的信息。
[0184] 此外,图像数据和编码信息提取器220从解析的比特流提取关于编码深度和编码 模式的信息,其中,所述编码深度和编码模式用于具有根据每个最大编码单元的树结构的 编码单元。提取的关于编码深度和编码模式的信息被输出到图像数据解码器230。换言之, 比特串中的图像数据被划分为最大编码单元,从而图像数据解码器230针对每个最大编码 单元对图像数据进行解码。
[0185] 可针对关于与编码深度相应的至少一个编码单元的信息来设置关于根据最大编 码单元的编码深度和编码模式的信息,并且关于编码模式的信息可包括关于与编码深度相 应的相应编码单元的分区类型的信息、关于预测模式的信息以及关于变换单元的尺寸的信 息。此外,可提取根据深度的划分信息,作为关于编码深度的信息。
[0186] 由图像数据和编码信息提取器220提取的关于根据每个最大编码单元的编码深 度和编码模式的信息是关于如下编码深度和编码模式的信息,所述编码深度和编码模式被 确定为当编码器(诸如视频编码设备100)根据每个最大编码单元针对根据深度的每个较 深层编码单元重复地执行编码时产生最小编码误差。因此,视频解码设备200可通过根据 产生最小编码误差的编码深度和编码模式对图像数据进行解码来恢复图像。
[0187] 由于关于编码深度和编码模式的编码信息可被分配到相应编码单元、预测单元和 最小单元中的预定数据单元,因此图像数据和编码信息提取器220可根据预定数据单元提 取关于编码深度和编码模式的信息。分配有关于编码深度和编码模式的相同信息的预定数 据单元可被推断为包括在相同最大编码单元中的数据单元。
[0188] 图像数据解码器230通过基于关于根据最大编码单元的编码深度和编码模式的 信息对每个最大编码单元中的图像数据进行解码,来恢复当前画面。换言之,图像数据解码 器230可基于提取的关于包括在每个最大编码单元中的具有树结构的编码单元中的每个 编码单元的分区类型、预测模式和变换单元的信息,来对编码的图像数据进行解码。解码处 理可包括包含帧内预测和运动补偿的预测以及逆变换。
[0189] 图像数据解码器230可基于关于根据编码深度的编码单元的预测单元的预测模 式和分区类型的信息,根据每个编码单元的预测模式和分区来执行帧内预测或运动补偿。
[0190] 此外,图像数据解码器230可基于关于根据具有树结构的编码单元的变换单元的 信息,根据编码单元中的每个变换单元来执行逆变换,从而根据最大编码单元执行逆变换。 可通过逆变换恢复编码单元中的空域的像素值。
[0191] 图像数据解码器230可通过使用根据深度的划分信息来确定当前最大编码单元 的至少一个编码深度。如果划分信息指示图像数据在当前深度中不再被划分,则当前深度 是编码深度。因此,图像数据解码器230可通过使用关于与编码深度相应的每个编码单元 的预测单元的分区类型、预测模式和变换单元尺寸的信息,对当前最大编码单元中的与每 个编码深度相应的至少一个编码单元的编码数据进行解码,并输出当前最大编码单元的图 像数据。
[0192] 换言之,可通过观察为编码单元、预测单元和最小单元中的预定数据单元分配的 编码信息集来收集包含包括相同划分信息的编码信息的数据单元,并且收集的数据单元可 被视为将在相同编码模式下被图像数据解码器230解码的一个数据单元。可通过获得关于 以这种方式确定的每个编码单元的编码模式的信息,来执行当前编码单元的解码。
[0193] 此外,图8的视频解码设备200可执行以上参照图2描述的视频解码设备20的操 作。
[0194] 接收器210以及图像数据和编码信息提取器220可执行视频解码设备20的解析 器22和符号解码器24的操作。图像数据解码器230可执行视频解码设备20的符号解码 器24的操作。
[0195] 接收器210接收图像的比特流,图像数据和编码信息提取器220从接收的比特流 解析图像块的符号。
[0196] 图像数据和编码信息提取器220可基于根据当前块的尺寸确定的阈值将当前符 号分类为前缀比特串和后缀比特串。例如,当变换单元的变换系数的最终系数位置信息被 解码时,可根据变换单元的尺寸(宽度或高度)确定用于分类前缀比特串和后缀比特串的 阈值。可选地,可根据包括当前变换单元、最大编码单元、编码单元、预测单元等的条带的尺 寸确定阈值。可选地,可通过帧内预测模式的最大索引确定在帧内预测模式下的符号比特 串的多少比特在算术编码中作为前缀比特串通过上下文建模被编码以及符号比特串的多 少比特在算术编码中作为后缀比特串在旁路模式下被编码。
[0197] 通过使用针对当前符号的前缀比特串和后缀比特串中的每一个确定的算术解码 方法来执行算术解码。可对前缀比特串执行用于根据比特位置确定上下文建模的算术解 码,并可通过使用旁路模式对后缀比特串执行省略上下文建模的算术解码。
[0198] 在算术解码之后,根据针对前缀比特串和后缀比特串中的每一个确定的二值化方 法来执行逆二值化。可通过根据针对前缀比特串和后缀比特串中的每一个确定的二值化方 法执行逆二值化,来恢复符号的前缀区域和后缀区域。
[0199] 图像数据解码器230可通过使用经由算术解码和逆二值化恢复的当前符号对当 前块执行逆变换和预测,来恢复图像块。
[0200] 因此,当针对每个最大编码单元递归地执行编码时,视频解码设备200可获得关 于产生最小编码误差的至少一个编码单元的信息,并可使用该信息来对当前画面进行解 码。换言之,在每个最大编码单元中被确定为最佳编码单元的具有树结构的编码单元可被 解码。
[0201] 因此,即使图像数据具有高分辨率和大量数据,也可通过使用关于从编码器接收 的最佳编码模式的信息,通过使用根据图像数据的特性自适应地确定的编码单元的尺寸和 编码模式来对图像数据有效地进行解码并恢复图像数据。
[0202] 图9是根据本发明的实施例的编码单元的概念图。
[0203] 编码单元的尺寸可被表示为宽度X高度,并且可以是64X64、32X32、16X16和 8X8。64X64的编码单元可被划分为64X64、64X32、32X64或32X32的分区,32X32的 编码单元可被划分为32X32、32X16、16X32或16X16的分区,16X16的编码单元可被划 分为16\16、16\8、8\16或8\8的分区,8\8的编码单元可被划分为8\8、8\4、4父8或 4X4的分区。
[0204] 在视频数据310中,分辨率是1920X1080,编码单元的最大尺寸是64,最大深度是 2。在视频数据320中,分辨率是1920X1080,编码单元的最大尺寸是64,最大深度是3。在 视频数据330中,分辨率是352X288,编码单元的最大尺寸是16,最大深度是1。图9中示 出的最大深度表示从最大编码单元到最小解码单元的划分总数。
[0205] 如果分辨率高或数据量大,则编码单元的最大尺寸可以大,从而不但提高编码效 率,而且精确地反映图像的特性。因此,具有比视频数据330更高分辨率的视频数据310和 320的编码单元的最大尺寸可以是64。
[0206] 由于视频数据310的最大深度是2,因此视频数据310的编码单元315可包括长轴 尺寸为64的最大编码单元以及因通过将最大编码单元划分两次而深度加深到两层的长轴 尺寸为32和16的编码单元。同时,由于视频数据330的最大深度是1,因此视频数据330 的编码单元335可包括长轴尺寸为16的最大编码单元以及因通过将最大编码单元划分一 次而深度加深到一层的长轴尺寸为8的编码单元。
[0207] 由于视频数据320的最大深度是3,因此视频数据320的编码单元325可包括长轴 尺寸为64的最大编码单元以及因通过将最大编码单元划分三次而深度加深到3层的长轴 尺寸为32、16和8的编码单元。随着深度加深,可精确表示详细信息。
[0208] 图10是根据本发明的实施例的基于编码单元的图像编码器400的框图。
[0209] 图像编码器400执行视频编码设备100的编码单元确定器120的操作以对图像数 据进行编码。换言之,帧内预测器410对当前帧405中的处于帧内模式下的编码单元执行 帧内预测,运动估计器420和运动补偿器425通过使用当前帧405和参考帧495对当前帧 405中的处于帧间模式下的编码单元执行帧间估计和运动补偿。
[0210] 从帧内预测器410、运动估计器420和运动补偿器425输出的数据通过变换器430 和量化器440被输出为量化的变换系数。量化的变换系数通过反量化器460和逆变换器 470被恢复为空域中的数据,恢复的空域中的数据在通过去块单元480和环路滤波单元490 进行后处理之后被输出为参考帧495。量化的变换系数可通过熵编码器450被输出为比特 流 455。
[0211] 为了将图像编码器400应用在视频编码设备100中,图像编码器400的所有元件 (即,帧内预测器410、运动估计器420、运动补偿器425、变换器430、量化器440、熵编码器 450、反量化器460、逆变换器470、去块单元480和环路滤波单元490)在考虑每个最大编码 单元的最大深度时基于具有树结构的编码单元中的每个编码单元来执行操作。
[0212] 具体地,帧内预测器410、运动估计器420和运动补偿器425在考虑当前最大编 码单元的最大尺寸和最大深度时确定具有树结构的编码单元中的每个编码单元的分区和 预测模式,并且变换器430确定具有树结构的编码单元中的每个编码单元中的变换单元尺 寸。
[0213] 具体地讲,熵编码器450可通过根据预定阈值将符号分类为前缀区域和后缀区域 并针对前缀区域和后缀区域使用不同的二值化和算术编码方法,来对前缀区域和后缀区域 执行符号编码。
[0214] 可基于符号的数据单元(即,条带、最大编码单元、编码单元、预测单元、变换单元 等)的尺寸来确定用于将符号分类为前缀区域和后缀区域的阈值。
[0215] 图11是根据本发明的
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1