用于视频编码的方法、装置和存储介质与流程

文档序号:35575322发布日期:2023-09-24 14:32阅读:36来源:国知局
用于视频编码的方法、装置和存储介质与流程

本申请总体涉及视频编解码和压缩,并且具体地但不限于在视频编解码中用于使用三角形预测单元(即,几何分割预测单元的特殊情况)的运动补偿预测的方法和装置。


背景技术:

1、各种电子设备(诸如数字电视、膝上型计算机或台式计算机、平板计算机、数码相机、数字记录设备、数字媒体播放器、视频游戏机、智能电话、视频电话会议设备、视频流设备等)都支持数字视频。电子设备通过实施视频压缩/解压缩来发送、接收、编码、解码和/或存储数字视频数据。数字视频设备实施视频编解码技术,诸如由通用视频编码(vvc)、联合探索测试模型(jem)、mpeg-2、mpeg-4、itu-t h.263、itu-t h.264/mpeg-4、part 10、高级视频编码(avc)、itu-t h.265/高效视频编码(hevc)定义的标准及此类标准的扩展中所描述的那些技术。

2、视频编解码通常使用利用了视频图像或序列中存在的冗余的预测方法(例如,帧间预测、帧内预测)。视频编解码技术的重要目标在于将视频数据压缩为使用更低比特率的形式,同时避免或最小化视频质量的降级。随着不断发展的视频服务变得可用,需要具有更好编解码效率的编解码技术。

3、视频压缩通常包括执行空间(帧内)预测和/或时间(帧间)预测来减少或移除视频数据中固有的冗余。对于基于块的视频编码,将视频帧划分为一个或更多个条带,每个条带具有多个视频块,视频块也可被称为编码树单元(ctu)。每个ctu可包含一个编码单元(cu)或者递归地被划分为更小的cu直到达到预定义的最小cu尺寸为止。每个cu(也称为叶cu)包含一个或多个变换单元(tu)并且每个cu还包含一个或多个预测单元(pu)。可以以帧内、帧间或ibc模式对每个cu进行编码。视频帧的帧内编码(i)条带中的视频块使用关于同一视频帧内的相邻块中的参考样点的空间预测来进行编码。视频帧的帧间编码(p或b)条带中的视频块可使用关于同一视频帧内的相邻块中的参考样点的空间预测或关于其它先前参考视频帧和/或未来参考视频帧中的参考样点的时间预测。

4、基于先前已被编码的参考块(例如,邻近块)的空间预测或时间预测得出用于待编码的当前视频块的预测块。找到参考块的过程可通过块匹配算法来完成。表示待编码的当前块与预测块之间的像素差的残差数据被称为残差块或预测误差。根据残差块和指向参考帧中的形成预测块的参考块的运动矢量来对帧间编码块进行编码。确定运动矢量的过程通常被称为运动估计。根据帧内预测模式和残差块对帧内编码块进行编码。为了进一步压缩,将残差块从像素域变换到变换域(例如,频域),从而得出残差变换系数,残差变换系数然后可被量化。最初以二维阵列布置的量化的变换系数可被扫描以产生变换系数的一维矢量,然后被熵编码为视频比特流以实现甚至更大的压缩。

5、然后,将已编码的视频比特流保存于计算机可读存储介质(例如,闪存存储器)中,以由具有数字视频能力的另一电子设备访问或者有线或无线地直接发送到电子设备。然后,电子设备执行视频解压缩(其为与上文描述的视频压缩相反的过程),例如,通过对已编码的视频比特流进行解析来从比特流获得语义元素,并且至少部分地基于从比特流获得的语义元素从已编码的视频比特流将数字视频数据重建为其原始格式,并且电子设备在电子设备的显示器上呈现重建的数字视频数据。

6、随着数字视频质量从高清变为4k×2k或甚至8k×4k,待编码/解码的视频数据量呈指数增长。在如何在保持解码视频数据的图像质量的同时能够更有效率地对视频数据进行编码/解码方面,是一个长久挑战。

7、在联合视频专家组(jvet)会议中,jvet定义了通用视频编码(vvc)的第一草案和vvc测试模型1(vtm1)编码方法。决定包括使用二划分和三划分编码块结构的具有嵌套多类型树的四叉树作为vvc的初始新编码特征。从那时起,在jvet会议期间已经研发了用于实现编解码方法的参考软件vtm和草拟vvc解码过程。


技术实现思路

1、一般来说,本公开描述了在视频编解码中与使用作为几何分割预测单元的特殊情况的三角形预测单元的运动补偿预测相关的技术的示例。

2、根据本公开的第一方面,提供了一种用于视频编解码的方法,包括:将视频图片分割为多个编码单元(cu),其中所述多个cu中的至少一个cu进一步被分割为两个预测单元(pu),所述两个pu包括至少一个几何形状pu;构建包括多个候选的第一合并列表,其中每个候选包括一个或更多个运动矢量;并且获得用于所述几何形状pu的单向预测合并列表,其中所述单向预测合并列表包括多个单向预测合并候选,并且每个单向预测合并候选包括第一合并列表中的相应候选的一个运动矢量。

3、根据本公开的第二方面,提供了一种用于视频编解码的装置,包括:处理器;以及存储器,被配置为存储可由处理器执行的指令;其中处理器在执行所述指令时被配置为:将视频图片分割为多个编码单元(cu),其中所述多个cu中的至少一个cu进一步被分割为两个预测单元(pu),所述两个pu包括至少一个几何形状pu;构建包括多个候选的第一合并列表,其中每个候选包括一个或更多个运动矢量;并且获得用于所述几何形状pu的单向预测合并列表,其中所述单向预测合并列表包括多个单向预测合并候选,并且每个单向预测合并候选包括第一合并列表中的相应候选的一个运动矢量。

4、根据本公开的第三方面,提供了一种非暂态计算机可读存储介质,包括存储在其中的指令,其中在由处理器执行所述指令时,所述指令使所述处理器进行以下操作:将视频图片分割为多个编码单元(cu),其中所述多个cu中的至少一个cu进一步被分割为两个预测单元(pu),所述两个pu包括至少一个几何形状pu;构建包括多个候选的第一合并列表,其中每个候选包括一个或更多个运动矢量;并且获得用于所述几何形状pu的单向预测合并列表,其中所述单向预测合并列表包括多个单向预测合并候选,并且每个单向预测合并候选包括第一合并列表中的相应候选的一个运动矢量。



技术特征:

1.一种用于视频编码的方法,包括:

2.如权利要求1所述的方法,其中所述第一合并列表基于用于常规合并预测的合并列表构建过程被构建。

3.根据权利要求1所述的方法,其中每个单向预测合并候选与整数值的合并索引相关联;并且列表0运动矢量和列表1运动矢量基于针对单向预测合并候选的预设规则被选择。

4.根据权利要求3所述的方法,其中具有合并索引值的每个单向预测合并候选包括第一合并列表中的具有相同合并索引的相应候选的列表0运动矢量或列表1运动矢量。

5.根据权利要求3所述的方法,其中在确定第一合并列表中的所述相应候选的列表0运动矢量可用的情况下,具有偶数合并索引值的每个单向预测合并候选包括所述相应候选的列表0运动矢量;或在确定第一合并列表中的所述相应候选的列表0运动矢量不可用的情况下,具有偶数合并索引值的每个单向预测合并候选包括所述相应候选的列表1运动矢量。

6.根据权利要求3所述的方法,其中在确定第一合并列表中的所述相应候选的列表1运动矢量可用的情况下,具有奇数合并索引值的每个单向预测合并候选包括所述相应候选的列表1运动矢量;或在确定第一合并列表中的所述相应候选的列表1运动矢量不可用的情况下,具有奇数合并索引值的每个单向预测合并候选包括所述相应候选的列表0运动矢量。

7.根据权利要求3所述的方法,其中具有在第一范围内的合并索引值的每个单向预测合并候选包括第一合并列表中的所述相应候选的列表0运动矢量;并且具有在第二范围内的合并索引值的每个单向预测合并候选包括第一合并列表中的所述相应候选的列表1运动矢量。

8.一种用于视频编码的装置,包括:

9.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质存储由具有一个或更多个处理器的计算装置执行的多个指令,其中,所述多个指令在由所述一个或更多个处理器执行时,使所述计算装置根据权利要求1至7中任意一项所述的用于视频编码的方法生成视频比特流并将生成的视频比特流存储在所述非暂时性计算机可读存储介质中。

10.一种计算机程序产品,所述计算机程序产品中的指令被至少一个处理器运行以执行如权利要求1到7中任意一项所述的用于视频编码的方法。


技术总结
提供了用于视频编码的方法、装置和存储介质。所述方法包括:将视频图片分割为多个编码单元(CU),其中所述多个CU中的至少一个CU进一步被分割为两个预测单元(PU),所述两个PU包括至少一个几何形状PU;构建包括多个候选的第一合并列表,其中每个候选包括一个或更多个运动矢量;并且获得用于所述几何形状PU的单向预测合并列表,其中所述单向预测合并列表包括多个单向预测合并候选,并且每个单向预测合并候选包括第一合并列表中的相应候选的一个运动矢量。

技术研发人员:王祥林,陈漪纹,修晓宇,马宗全
受保护的技术使用者:北京达佳互联信息技术有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1