用于预测编码的使用可变分区的视频编码的方法和设备以及用于预测编码的使用可变分...的制作方法

文档序号:9711953阅读:346来源:国知局
用于预测编码的使用可变分区的视频编码的方法和设备以及用于预测编码的使用可变分 ...的制作方法
【专利说明】用于预测编码的使用可变分区的视频编码的方法和设备从及 用于预测编码的使用可变分区的视频解码的方法和设备
[0001] 本申请是申请日为2011年1月14日、申请号为201180014086.8、题为"用于预测编 码的使用可变分区的视频编码的方法和设备W及用于预测编码的使用可变分区的视频解 码的方法和设备"的专利申请的分案申请。
技术领域
[0002] 本发明设及对视频进行编码和解码。
【背景技术】
[0003] 随着用于再现和存储高清晰度或高质量视频内容的硬件的发展和供应,对有效地 对高清晰度或高质量视频内容进行编码或解码的视频编解码器的需求正在增加。在现有视 频编解码器中,基于具有预定尺寸的宏块根据有限的编码方法来对视频进行编码。
[0004] 视频压缩使用空间相关性和时间相关性。一般来说,W特定尺寸数据的单元(例 如,16 X 16宏块)执行帖间预测。当具有特定尺寸的宏块被划分为两个、四个或更多个运动 区域并且随后对每个运动区域执行帖间预测时,会发生与原始图像相关的恢复的图像的失 真,并且会产生用于发送帖间预测的结果的开销。当用于帖间预测的运动区域被精细划分 时,与原始图像相关的恢复的图像的失真减少,但开销增加。因此,在帖间预测中,存在与原 始图像相关的恢复的图像的失真和用于发送帖间预测结果的开销之间的权衡关系。

【发明内容】

[0005] 技术问题
[0006] 本发明提供使用用于预测编码的具有可变形状和可变尺寸的分区的视频编码和 视频解码。
[0007] 解决方案
[000引根据本发明的一方面,提供了一种使用可变分区的视频编码方法,实施视频编码 方法包括:通过使用基于第一分区模式和分区等级确定的分区,W作为用于对画面进行编 码的数据单元的编码单元为单位执行预测编码,W便从确定的分区中选择将输出编码结果 的分区,其中,第一编码模式表示作为用于对编码单元执行预测编码的数据单元的分区的 形状和方向性,并且分区等级表示编码单元被划分为用于详细的运动预测的分区的程度; W及对表示选择的分区的第一分区模式和分区等级的分区信息进行编码和输出。
[0009] 有益效果
[0010] 不仅可确定具有与现有宏块相同的尺寸的分区、具有现有宏块的一半尺寸的分区 和具有现有宏块的四分之一尺寸的分区,还可确定能够预测纹理的方向性和位置的改变W 及详细的运动的分区。由于可基于编码单元的尺寸对允许分区的详细运动被预测的分区的 形状和方向进行调整,因此可充分考虑图像特性来执行预测编码和预测解码。
【附图说明】
[0011] 图1是根据本发明的实施例的使用可变分区的视频编码设备的框图;
[0012] 图2是根据本发明的实施例的使用可变分区的视频解码设备的框图;
[0013] 图3是示出根据本发明的实施例的具有分层结构的编码单元的示图;
[0014] 图4示出根据本发明的实施例的由第一分区模式和分区等级定义的具有树形结构 的分区;
[0015] 图5示出根据本发明的实施例的第一分区模式、分区等级和第二分区模式之间的 关系;
[0016] 图6是根据本发明的实施例的使用可变分区的视频编码方法的流程图;
[0017] 图7是根据本发明的实施例的使用可变分区的视频解码方法的流程图;
[0018] 图8是根据本发明的实施例的使用基于具有树形结构的编码单元进行预测编码的 可变分区的视频编码设备的框图;
[0019] 图9是根据本发明的实施例的使用基于具有树形结构的编码单元进行预测编码的 可变分区的视频解码设备的框图;
[0020] 图10是用于描述根据本发明的实施例的编码单元的概念的示图;
[0021] 图11是根据本发明的实施例的基于编码单元的图像编码器的框图;
[0022] 图12是根据本发明的实施例的基于编码单元的图像解码器的框图;
[0023] 图13是示出根据本发明的实施例的根据深度的较深层编码单元和分区的示图;
[0024] 图14是用于描述根据本发明的实施例的编码单元和变换单元之间的关系的示图;
[0025] 图15是用于描述根据本发明的实施例的与编码深度相应的编码单元的编码信息 的示图;
[0026] 图16是根据本发明的实施例的根据深度的较深层编码单元的示图;
[0027] 图17、图18和图19是用于描述根据本发明的实施例的编码单元、预测单元和变换 单元之间的关系的示图;
[0028] 图20是用于描述根据表2的编码模式信息的编码单元、预测单元或分区和变换单 元之间的关系的示图;
[0029] 图21是根据本发明的实施例的使用基于具有树形结构的编码单元的可变分区的 视频编码方法的流程图;
[0030] 图22是根据本发明的实施例的使用基于具有树形结构的编码单元的可变分区的 视频解码方法的流程图。
【具体实施方式】
[0031] 最佳模式
[0032] -种根据本发明的实施例的使用可变分区的视频编码方法包括:通过使用基于第 一分区模式和分区等级确定的多个分区,W作为用于对画面进行编码的数据单元的编码单 元为单位执行预测编码,W便从确定的多个分区中选择将输出编码结果的分区,其中,所述 第一分区模式表示作为用于对所述编码单元执行预测编码的数据单元的分区的形状和方 向性,所述分区等级表示所述编码单元被划分为用于详细的运动预测的多个分区的程度; 对表示选择的分区的第一分区模式和分区等级的分区信息进行编码和输出。
[0033] -种根据本发明的实施例的使用可变分区的视频解码方法包括:从接收到的比特 流提取包括第一分区模式和分区等级的分区信息,其中,所述提取W作为用于对画面进行 编码的数据单元的编码单元为单位被执行,第一分区模式表示作为用于对编码单元执行预 测解码的数据单元的分区的形状和方向性,分区等级表示编码单元被划分为用于详细的运 动预测的多个分区的程度;通过使用基于提取的分区信息的第一分区模式和分区等级确定 的多个分区执行预测解码来恢复所述画面。
[0034] -种根据本发明的实施例的使用可变分区的视频编码设备包括:编码器,通过使 用基于第一分区模式和分区等级确定的多个分区,W作为用于对画面进行编码的数据单元 的编码单元为单位执行预测编码,W便从确定的多个分区中选择将输出编码结果的分区, 并对所述画面进行编码W便确定编码单元的编码模式,其中,第一分区模式表示作为用于 对编码单元执行预测编码的数据单元的分区的形状和方向性,分区等级表示编码单元被划 分为用于详细的运动预测的多个分区的程度;输出单元,对表示选择的分区的第一分区模 式和分区等级的分区信息、关于选择的分区的预测模式的信息W及包括关于编码模式的信 息的编码信息进行编码和输出,并对选择的分区的运动矢量和残差数据进行编码和输出。
[0035] -种根据本发明的实施例的使用可变分区的视频解码设备包括:提取器,从接收 到的比特流提取包括第一分区模式和分区等级的分区信息、关于分区的预测模式的信息、 包括关于编码模式的信息的编码信息W及分区的运动矢量和残差数据,其中,所述第一分 区模式表示作为用于对作为用于对画面进行编码的数据单元的编码单元执行预测编码的 数据单元的分区的形状和方向性,分区等级表示编码单元被划分为用于详细的运动预测的 多个分区的程度,其中,所述提取针对每个编码单元被执行;解码器,根据基于提取的分区 信息的第一分区模式和分区等级确定的多个分区的预测模式,对所述确定的多个分区执行 预测解码,并根据编码模式恢复所述画面。
[0036] 本发明包括一种记录有用于执行所述视频编码方法的程序的计算机可读记录介 质。
[0037] 本发明包括一种记录有用于执行所述视频解码方法的程序的计算机可读记录介 质。
[003引本发明的模式
[0039] W下,"图像"可表示视频的静止图像或运动图像(即,视频本身KW下,"数据单 元"可表示构成视频的多份数据中落入预定范围之内的多份数据的集。
[0040] 现将参照图1至图7描述根据本发明的实施例的使用用于预测编码的可变分区的 视频的编码和解码。稍后将参照图8至图22描述根据本发明的实施例的使用基于具有树形 结构的编码单元进行预测编码的可变分区的视频的编码和解码。
[0041] 图1是根据本发明的实施例的使用用于预测编码的可变分区的视频编码设备10的 框图。
[0042] 参照图1,使用可变分区的视频编码设备10包括编码器11和输出单元12。为便于解 释,W下使用可变分区的视频编码设备10将被简称为视频编码设备10。
[0043] 视频编码设备10接收视频的画面序列,通过对所述画面序列的每个画面执行帖间 预测、帖内预测、变换、量化和赌编码来对所述画面序列进行编码,并输出编码的视频数据 (即,编码的结果)W及包括关于编码模式的信息的编码信息。
[0044] 视频编码设备10可将当前画面划分为多个数据单元(每个数据单元均具有预定尺 寸),并可对每个数据单元执行编码,W有效地对当前画面进行编码。W下,用于对画面进行 编码的数据单元被称为"编码单元"。编码器11可确定编码单元和将对每个编码单元执行的 编码方法。针对每个编码单元确定的编码方法被称为编码模式。
[0045] 数据冗余会发生在视频的时间连续的多个图像中,或发生在视频的图像的空间相 邻区域中。在视频压缩编码期间,参考空间/时间相邻数据区域执行编码的预测编码技术被 执行,W去除空间/时间相邻的数据区域中的数据冗余而减少编码数据的尺寸。
[0046] 在预测编码技术中,基于具有预定尺寸和预定形状的数据单元捜索具有冗余数据 的相邻数据区域,因此可对捜索的冗余数据单元之间的差距(即,运动)W及原始数据和捜 索的冗余数据单元的冗余数据之间的差值(即,残差数据)进行编码。
[0047] 编码器11可确定作为将与相邻数据的运动进行比较的数据单元的分区,W对每个 编码单元执行预测编码。分区的尺寸可小于或等于编码单元的尺寸。编码器11可根据使用 确定的分区的预测编码输出通过从每个分区去除冗余数据而获得的残差数据。
[0048] 编码器11通过使用基于第一分区模式和分区等级确定的分区执行预测编码,来选 择用于输出编码结果的分区。
[0049] 编码器11可通过使用具有多种形状、方向性和尺寸的分区对每个编码单元执行预 测编码,并从多个分区中选择一分区,残差数据最终将通过该分区被输出。分区的方向性表 示所述分区从编码单元被划分的方向。编码器11可通过根据多种分区确定并比较编码效率 来选择产生最高编码效率的用于预测编码的分区。
[0050] 可考虑原始数据和恢复的数据之间的误差、在解码之后产生的开销等来确定编码 效率。可使用基于拉格朗日乘子化agrangian multipliers)的率失真最优化来测量根据预 测编码的编码效率。
[0051] 可基于第一分区模式和分区等级定义根据本发明的实施例的分区。根据本发明的 实施例的第一分区模式指示分区的形状和方向性。
[0052] 例如,可根据第一分区模式的类型定义分区类型(矩形分区、正方形分区、非矩形 分区等)。例如,可定义根据第一编码模式的划分编码单元的方向性,其中,编码单元被划分 的示例包括:i)编码单元被垂直地,水平地,垂直并水平地均分为多个分区,或对角地划分 为多个分区;ii)编码单元沿着偏向编码单元的左端、右端、上端或下端的划分线被划分为 多个分区;或iii)通过从宽度到对面宽度,从高度到对面高度,从宽度到相邻高度,和从高 度到相邻宽度对编码单元进行划分而获得多个分区。
[0053] 根据本发明的实施例的分区等级表示为了精细运动预测将编码单元划分为多个 分区的程度。可根据分区等级的值确定分区的宽度(高度)相对于编码单元的宽度(高度)的 划分比率。
[0054] 例如,随着根据实施例的划分等级增加,可确定通过对编码单元的宽度和高度进 行精细划分而获得的多个分区。例如,可基于编码单元的宽度或高度变为n等份的划分确定 Wl:(n-l)、2:(n-2)、…、(n-2):2和(n-l):l对编码单元的宽度或高度进行划分而获得的多 个分区。
[0055] 然而,根据实施例的分区的最小尺寸是有限的,也就是说,编码单元无法被无限划 分。因此,可基于根据分层树形结构确定的当前编码单元的尺寸确定分区的分区等级的上 限、下限、或上限和下限两者。可由系统设置或用户设置来限制分区等级的值。
[0056] 分区的宽度和高度可增加或减少,其中,所述分区的形状和方向基于根据实施例 的第一分区模式被确定。可根据第二分区模式定义分区的宽度和高度,其中,所述分区的形 状和方向基于第一分区模式被确定。换句话说,第二分区模式可从根据第一分区模式的允 许的多个分区中确定详细的分区类型。
[0057] 第一分区模式的多个分区的形状和方向根据第一分区模式被确定,并且分区的宽 度、高度、或宽度或高度两者增加或减少为根据分区等级确定的分区的最小宽度或最小高 度的一倍或多倍。因此,第二分区模式可被定义,W便指示第一分区模式的多个分区中的每 个。
[0058] 例如,当分区的最小宽度和最小高度根据分区等级被确定为编码单元的宽度和高 度的1/n,第二分区模式指示所述编码单元的宽度或高度Wl:(n-l)、2:(n-2)、…、(n-2):2 和(n-l):l被划分的多个分区中的每个。
[0059] 因此,编码器11还可根据第一分区模式确定第二分区模式,并且第二分区模式的 类型或数量可根据第一分区模式和分区等级被确定。
[0060] 输出单元12可对表示由编码器11选择的分区的第一分区模式和分区等级的模式 信息进行编码和输出。分区信息还可根据第一分区模式包括第二分区模式。分区信息可包 括用于确定分区等级的下限或上限的分区等级限制信息。
[0061] 输出单元12可输出分区的运动矢量和残差数据,其中,已通过使用由编码器11确 定的分区进行预测编码产生所述分区。输出单元12还可对关于预测模式的信息W及包括关 于编码模式的信息的编码信息进行编码和输出,其中,所述预测模式表示使用由编码器11 确定的分区的预测编码方法。根据本发明的实施例的编码信息可被插入到序列参数集 (SPS)。根据实施例的编码信息可W W数据单元(诸如,序列、画面、帖、像条、最大编码单元 等)的每个单位被编码并被插入输出比特流。
[0062] 图2是根据本发明的实施例的使用用于预测编码的可变分区的视频解码设备20的 框图。
[0063] 参照图2,使用用于预测编码的可变分区的视频解码设备20包括提取器21和解码 器22。为便于解释,使用用于预测编码的可变分区的视频解码设备20W下将被简称为视频 解码设备20。
[0064] 视频解码设备20可接收比特流(其中,视频的画面序列已被编码为比特流),并通 过相对于每个编码的画面数据的赌解码、反量化、逆变换、帖间预测/补偿和帖内预测,从而 恢复画面。
[0065] 提取器21可对接收到的比特流进行解析W提取编码的画面数据和运动矢量。提取 器21可对接收到的比特流进行解析W提取编码的残差数据。
[0066] 提取器21可对接收到的比特流进行W提取编码信息。提取器21可从编码信息读取 关于编码模式的信息、分区信息和关于预测模式的信息。可从分区信息读取编码单元的分 区的第一分区模式和分区等级。
[0067] 由提取器21提取的分区信息可包括关于分区的形状和方向的信息,所述分区是具 有由第一分区模式和分区等级形成的分层树形结构的分区中提供最高编码效率的分区。
[0068] 解码器22可基于由提取器21提取并读取的分区信息确定用于针对画面进行预测 编码的分区。解码器22可通过使用由提取器21提取的预测模式和运动矢量对编码的残差数 据进行预测解码。
[0069] 解码器22可基于分区信息确定每个编码单元的分区。解码器22可基于包括在分区 信息中的第一分区模式确定分区的形状和编码单元被划分为多个分区的方向性。解码器22 可基于包括在分区信息中的分区等级确定编码单元被精细地划分为
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1