本专利文档涉及文件格式的数字音频视频媒体信息的生成、存储和消费。
背景技术:
1、数字视频占据了互联网和其他数字通信网络上使用的最大带宽。随着能够接收和显示视频的连接用户设备数量的增加,数字视频使用的带宽需求可能会继续增长。
技术实现思路
1、第一方面涉及一种由视频编解码装置实现的用于处理视频数据的方法,该方法包括:确定块是否为二元的或非二元的;当块被确定为二元的时,启用与帧间预测相关联的编解码工具;当块被确定为非二元的时,禁用编解码工具;和通过对块应用帧间预测来执行可视媒体数据和比特流之间的转换。
2、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,编解码工具是双向帧间预测、加权双向帧间预测、仿射预测、解码器侧运动矢量细化(dmvr)、解码器侧运动矢量推导(dmvd)、多通道解码器侧运动矢量细化、三角分割模式(tpm)、几何分割模式(gpm)、双向光流(bdof)、利用光流的预测细化(prof)、子块变换(sbt)、多变换选择(mts)、低频不可分离变换(lfnst)、自适应运动矢量精度(amvr)、组合帧间帧内预测(ciip)、多假设预测、基于子块的时域运动矢量预测(tmvp)、帧速率上转换(fruc)、具有编解码单元(cu)级别权重的双向预测、重叠块运动补偿(obmc)、局部照明补偿(lic)、基于模板匹配的运动矢量推导、基于模板匹配的自适应merge候选重排序、基于子块的帧间预测或其组合。
3、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,基于块是否是非二元的,在比特流中指示针对块的一个或多个编解码工具的使用。
4、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,基于块的维度在比特流中指示针对块的一个或多个编解码工具的使用。
5、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,块包括多个样点,并且其中基于是否针对样点数量小于或等于块中的多个样点的二元块启用一个或多个编解码工具,在比特流中指示针对块的一个或多个编解码工具的使用。
6、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,当块的一侧的维度不能表示为二的幂时,块是非二元的。
7、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,基于块是否是非二元的,对块执行基于子块的帧间预测。
8、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,基于块是否是非二元的,将块划分成子块。
9、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,基于块是否是色度块将块划分成子块。
10、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,当块是非二元的时,块被划分成m2xn2子块,并且其中当块是二元的时,块被划分成m1xn1子块,其中m1、m2、n1和n2是整数值,并且其中m1不等于m2或者n1不等于n2。
11、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,当块的维度不是4n的形式时,块被划分成2×2子块,其中n是整数。
12、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,当块的维度不是4n的形式时,块被划分成4×2子块,其中n是整数。
13、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,当块的维度不是4n的形式时,块被划分成2×4子块,其中n是整数。
14、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,块具有宽度(w)和高度(h),并且其中当时,块被划分成一个或多个维度为m1×n1的子块,其中m1和n1是整数。
15、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,块具有宽度(w)和高度(h),并且其中当w%m1不等于零和时,块被划分成一个或多个维度为m2×n1的子块,其中m2、m1和n1是整数,并且%是模运算符。
16、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,块具有宽度(w)和高度(h),并且其中当h%n1不等于0和时,块被划分成一个或多个维度为m1×n2的子块,其中n2、n1和m1是整数,并且%是模运算符。
17、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,块具有宽度(w)和高度(h),并且其中当h%n1不等于零并且w%m1不等于零时,块被划分成一个或多个维度为m2×n2的子块,其中n2、n1、m2和m1是整数并且%是模运算符。
18、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,基于块是否是非二元的,对块执行解码器侧运动细化。
19、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,当对块执行局部光照补偿(lic)时,模板的数量是二的幂。
20、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,当左邻近列可用时,来自左邻近列的n个样点用于lic,其中当顶部邻近行可用时,来自顶部邻近行的n个样点用于lic,并且其中n是整数。
21、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,用于lic的样点位于左邻近列中的(x-1,y+f2(0)),(x-1,y+f2(1)),…,(x-1,y+f2(n-1))处以及位于上邻近行中的(x+f1(0),y-1),(x+f1(1),y-1),…,(x+f1(n-1),y-1)处,其中x和y是坐标,f1(k)=((k*w)>>dimshift),f2(k)=((k*h)>>dimshift),k是整数值,w是cu的宽度,h是cu的高度,>>表示右移位,并且dimshift是在lic参数推导过程中使用的整数变量。
22、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,将子块变换应用于块,并且其中基于块是否是非二元的来调整子块变换的尺寸。
23、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,对块应用仿射帧间预测,并且其中基于块的宽度(w)是否是非二元值或者块的高度(h)是否是非二元值来选择四参数仿射模型或六参数仿射模型。
24、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,块与控制点运动矢量(cpmv)相关联,并且其中基于块是否是非二元的来选择块中的cpmv的位置。
25、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,当块是非二元的时,规则要求块中的两个cpmv之间的距离是二元值。
26、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,块具有宽度(w),其中当w是非二元数时,第一cpmv(mv0)的位置是(x0,y0)并且第二cpmv(mv1)的位置是(x0+ww,y0),并且其中(x0,y0)是块的左顶位置,并且其中<<是左移位操作。
27、可选地,在前述方面中的任一项中,该方面的另一实现方式规定,块具有高度(h),其中当h为非二元数时,第一cpmv(mv0)的位置为(x0,y0),第二cpmv(mv1)的位置为(x0,y0+hh),并且其中(x0,y0)为块的左顶位置,并且其中<<为左移位操作。
28、第二方面涉及一种非暂时性计算机可读介质,其包含供视频编解码设备使用的计算机程序产品,计算机程序产品包含存储在非暂时性计算机可读介质上的计算机可执行指令,使得计算机可执行指令在由处理器执行时使视频编解码设备执行前述方面中任一方面的方法。
29、第三方面涉及一种用于处理视频数据的装置,包括:处理器;以及其上具有指令的非暂时性存储器,其中指令在由处理器执行时使得处理器执行前述方面中任一方面的方法。
30、为清晰起见,任何一个前述实施例可与任何一个或多个其他前述实施例组合,以在本公开的范围内形成新的实施例。
31、从以下结合附图和权利要求的详细说明中,可更清楚地理解这些和其他特征。