基于块尺寸的变换限制的制作方法

文档序号:34707012发布日期:2023-07-07 12:18阅读:33来源:国知局
基于块尺寸的变换限制的制作方法

本原理涉及视频压缩领域。


背景技术:

1、在hevc视频压缩标准中,图像被分割为所谓的编码树单元(ctu),其尺寸通常是64×64,128×128或256×256像素。

2、每个ctu由压缩域中的编码树表示。这是ctu的四叉树分割,其中每个叶子称为编码单元(cu),如图1所示。

3、然后给每个cu某些帧内或帧间预测参数,也称为预测信息(predictioninformation或prediction info)。为此,将其在空间上划分为一个或多个预测单元(pu),每个pu被分配某些预测信息。在cu级别上分配帧内或帧间编码模式,如图2的示例中所示。

4、编码单元到预测单元的划分是根据划分类型完成的,在比特流中用信号通知。对于帧内编码单元,如图3所示,仅使用2n×2n和n×n的划分类型。这意味着在帧内编码单元中仅使用方形预测单元。

5、相反,帧间编码单元可以使用图3所示的所有划分类型。

6、根据hevc标准,编码单元按照“变换树”以递归方式也被分割为所谓的变换单元。因此,变换树是编码单元的四叉树分割,并且变换单元是变换树的叶子。变换单元封装对应于所考虑的方形空间区域的每个图片分量的方形变换块。变换块是单个分量中的方形样本块,其中应用相同的变换。

7、新兴的视频压缩工具包括压缩域中的编码树单元表示,作为在压缩域中以更灵活的方式表示图像数据的提议方式。编码树的这种灵活表示的优点在于,与hevc标准的cu/pu/tu布置相比,它提供了增加的压缩效率。

8、四叉树加二叉树(qtbt)编码工具提供了这种增加的灵活性。它包含在编码树中,其中编码单元可以以四叉树和二叉树方式分割。图4中图示了编码树单元的这种编码树表示。

9、可以通过速率失真优化过程在编码器侧决定编码单元的分割,该速率失真优化过程包括确定具有最小的速率失真成本的ctu的qtbt表示。

10、在qtbt技术中,cu具有方形或矩形形状。编码单元的尺寸总是2的幂,并且典型地从4到128。

11、除了用于编码单元的各种矩形形状之外,与hevc相比,这种新的ctu表示具有以下不同的特征:

12、·ctu的qtbt分解由两个阶段组成:首先以四叉树方式分割ctu,然后可以以二进制方式进一步分割每个四叉树叶子。这在图4的右侧图示了,其中实线表示四叉树分解阶段,而虚线表示在空间上嵌入四叉树叶子中的二进制分解。

13、·在帧内条带中,亮度和色度块划分结构是分开的,并且是独立决定的。

14、·不再采用将cu划分为预测单元或变换单元。换句话说,每个编码单元系统地由单个预测单元(先前的2n×2n预测单元划分类型)和单个变换单元(不分割为变换树)组成。

15、然而,与qtbt技术相比,需要进一步提高的压缩效率。


技术实现思路

1、现有技术的这些和其它缺点和劣势由所描述的实施例中的至少一个来解决,这些实施例针对用于对视频数据块进行编码或解码的方法和装置。在至少一个实施例中,将视频数据块分割为子块,其中至少一个子块具有不是二的幂的高度或宽度的尺寸。

2、根据本文描述的至少一个一般实施例,提供了一种用于对视频数据块进行编码的方法。该方法包括将所述块分割为至少两个矩形子块;使用使得不需要不是二的幂的变换的处理来对具有在宽度或高度上不是二的幂的尺寸的子块进行编码。

3、根据本文描述的另一个一般实施例,提供了一种用于对视频数据块进行编码的装置,包括:存储器,以及处理器,其被配置为:将所述块分割为至少两个矩形子块,并且使用使得不需要不是二的幂的变换的处理来对具有在宽度或高度上不是二的幂的尺寸的子块进行编码。

4、根据本文描述的另一个一般方面,提供了上述两个实施例中的任一个,其中,所述处理包括,或者所述处理器还被配置用于:使用至少两个对应的预测器子块获得对于所述至少两个子块的残差;将所述至少两个子块的一个子块分割为至少两个较小的子块;对于所述至少两个子块的所述一个子块,计算单个dc系数;使用尺寸为二的幂的变换对每个所述较小子块进行变换,以在从每个所述较小子块中减去所述单个dc系数的重建版本之后生成变换系数,其中所述单个dc系数被包括在所述较小的子块中的一个的变换系数中。

5、根据本文描述的另一个实施例,提供了一种用于对视频数据块进行解码的方法,包括:使用使得不需要不是二的幂的逆变换的处理来对具有在宽度或高度上不是二的幂的尺寸的子块进行解码,其中所述子块从所述块分割为至少两个矩形子块。

6、根据本文描述的另一个实施例,提供了一种用于对视频数据块进行解码的装置,包括:存储器,以及处理器,其被配置为:使用使得不需要不是二的幂的逆变换的处理来对具有在宽度或高度上不是二的幂的尺寸的子块进行解码,其中所述子块从所述块分割为至少两个矩形子块。

7、根据本文描述的另一个一般方面,提供了前述两个实施例中的任一个,其中,所述处理包括,或者所述处理器还被配置用于:通过对与包括所述子块的第一较小子块相关联的变换系数进行熵解码,获得具有在宽度或高度上不是二的幂的尺寸的子块的dc系数;使用应用于所述dc系数的逆变换来重建所述子块的低通分量;通过对所述第一较小子块的ac系数应用逆变换并考虑dc系数等于零,应用所述第一较小子块的部分逆变换;对与所述子块的第二较小子块相关联的ac系数进行熵解码;通过对所述第二较小子块的ac系数应用逆变换并考虑dc系数等于零,对所述第二较小子块进行部分逆变换。

8、根据本文描述的另一个方面,提供了一种非暂时性计算机可读存储介质,其包含根据前述方法实施例中的任一个的方法或者由前述装置实施例中的任一个的装置生成的数据内容,用于使用处理器进行回放。

9、根据本文描述的另一个方面,提供了一种信号,其包括根据用于对视频数据块进行编码的前述方法实施例中的任一个的方法或者由用于对视频数据块进行编码的前述装置实施例中的任一个的装置生成的视频数据,用于使用处理器进行回放。

10、根据本文描述的另一个方面,提供了一种计算机程序产品,包括指令,当程序由计算机运行时,该指令使计算机进行前述方法实施例中的任一个的方法。

11、从以下结合附图阅读的示例性实施例的详细描述中,本原理的这些和其他方面、特征和优势将变得显而易见。



技术特征:

1.一种用于对视频数据块进行解码的方法,包括:

2.根据权利要求1所述的方法,其中,具有不是二的幂的维度的子块是二的幂的倍数。

3.根据权利要求1所述的方法,还包括:对指示至少一个子块的至少一个语法元素进行解码,所述至少一个子块具有由零替代的残差。

4.根据权利要求1所述的方法,其中,所述处理还包括:对具有不是二的幂的维度的所述子块使用skip模式。

5.权利要求1所述的方法,其中,所述处理包括:

6.一种用于对视频数据块进行解码的装置,包括:

7.根据权利要求6所述的装置,其中,具有不是二的幂的维度的子块是二的幂的倍数。

8.根据权利要求6所述的装置,还包括:对指示至少一个子块的至少一个语法元素进行解码,所述至少一个子块具有由零替代的残差。

9.根据权利要求6所述的装置,其中,所述处理还包括:对具有不是二的幂的维度的所述子块使用skip模式。

10.根据权利要求6所述的装置,其中,所述处理包括:

11.一种用于对视频数据块进行编码的方法,包括:

12.根据权利要求11所述的方法,其中,具有不是二的幂的维度的子块是二的幂的倍数。

13.根据权利要求11所述的方法,还包括:对指示至少一个子块的至少一个语法元素进行解码,所述至少一个子块具有由零替代的残差。

14.根据权利要求11所述的方法,其中,所述处理还包括:对具有不是二的幂的维度的所述子块使用skip模式。

15.根据权利要求11所述的方法,其中,所述处理包括:

16.一种用于对视频数据块进行编码的装置,包括:

17.根据权利要求16所述的装置,其中,具有不是二的幂的维度的子块是二的幂的倍数。

18.根据权利要求16所述的装置,还包括:对指示至少一个子块的至少一个语法元素进行编码,所述至少一个子块具有由零替代的残差。

19.根据权利要求16所述的装置,其中,所述处理还包括:对具有不是二的幂的维度的所述子块使用skip模式。

20.根据权利要求16所述的装置,其中,所述处理包括:

21.一种非易失性计算机可读存储介质,包括当由处理器执行时执行权利要求1的方法的指令。

22.一种制造装置的工艺,包括:


技术总结
通过若干实施例中的一个对在水平或垂直方向上具有三的倍数的尺寸的编码单元进行编码。在一个实施例中,对于某些块尺寸,通过SKIP模式对编码单元系统地进行编码和解码。在另一实施例中,可以以SKIP模式或用DC系数对编码单元进行编码。在另一实施例中,执行公共编码单元父的非对称分割,并且在至少两个子块之间分解变换系数以对编码单元进行编码。在另一实施例中,可以通过在一个方向上对块应用变换,并且在另一个方向上的子块上使用两个一维变换来应用可分离的二维变换以进行编码。提供了用于编码和解码的方法、装置和信号实施例。

技术研发人员:F·莱兰内克,F·加尔平,T·波里尔
受保护的技术使用者:交互数字VC控股公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1