本申请涉及视频编解码。特别是,本申请涉及通过跨分量(cross-component)模型推导对像素块进行编解码的方法。
背景技术:
1、除非本文另有说明,本节所述的方法不是针对下文所列的权利要求的现有技术,并且不因包含在本节中而被承认为现有技术。
2、高效视频编解码(hevc)是由视频编解码联合协作小组(jct-vc)制定的国际视频编解码标准。hevc是基于基于混合块的运动补偿dct类转换编解码架构。压缩的基本单元,称为编解码单元(cu),是一个2nx2n的正方形块,每个cu可以递回地分割成四个更小的cu,直到达到预定的最小尺寸。每个cu包含一个或多个预测单元(pu)。
3、多功能视频编解码(vvc)是由itu-t sg16 wp3和iso/iec jtc1/sc29/wg11的联合视频专家小组(jvet)制定的最新国际视频编解码标准。输入的视频信号是从重建的信号中预测出来的,而重建的信号是由编码的图片区域得出的。预测的残差信号由块变换处理。变换系数被量化,并与比特流中的其他辅助信息(side information)一起进行熵编码。重建信号是由预测信号和重建残差信号在对去量化的变换系数进行反变换后产生的。重建信号通过环内滤波进一步处理,以消除编码伪影。解码后的图片被存储在帧缓冲器中,用于预测输入视频信号中未来的图片。
4、在vvc中,编码的图片被划分为非重叠的方形块区域,由相关的编解码树单元(ctu)表示。编解码树的叶节点对应于编解码单元(cu)。编码的图片可以用切片的集合来表示,每个切片包括整数个的ctu。切片中的各个ctu是按光栅扫描连续处理的。双向预测(bi-predictive,简写为b)切片可以使用帧内预测或帧间预测进行解码,最多使用两个运动向量和参考索引来预测每个块的采样值。预测(predictive,简写为p)切片使用帧内预测或帧间预测进行解码,最多使用一个运动向量和参考索引来预测每个块的采样值。帧内(intra,简写为i)切片仅使用帧内预测进行解码。
5、ctu可以使用具有嵌套多类型树(mtt)结构的四叉树(qt)被分割成一个或多个不重叠的编解码单元(cu),以适应各种局部运动和纹理特征。cu可以使用五种分割类型(四叉树分割、垂直二叉树分割、水平二叉树分割、垂直中心侧三叉树分割、水平中心侧三叉树分割)之一进一步分割成更小的cu。
6、每个cu包含一个或多个预测单元(pu)。预测单元与相关的cu语法一起,作为传讯(signal)预测子信息的基本单元工作。采用指定的预测过程来预测pu内相关像素采样的值。每个cu可以包含一个或多个转换单元(tu),用于表示预测残差块。变换单元(tu)由一个亮度采样的变换块(tb)和两个相应的色度采样的变换块组成,每个tb对应一个颜色分量的采样残差块。整数转换被应用于转换块。量化系数的水平值(level value)与其他辅助信息一起在比特流中进行熵编码。术语编解码树块(ctb)、编解码块(cb)、预测块(pb)、和变换块(tb)被分别定义为指定与ctu、cu、pu、和tu相关的单色分量的二维采样阵列。因此,ctu由一个亮度ctb、两个色度ctb、和相关的语法元素组成。类似的关系适用于cu、pu和tu。
7、对于每个帧间预测的cu,由运动向量、参考图片索引、参考图片列表使用索引、以及附加信息组成的运动参数被用于帧间预测的采样生成。该运动参数可以以显式或隐式方式传讯。当cu以跳过模式编码时,该cu与一个pu相关,并且没有有效残差系数(significantresidual coefficient),没有编码的运动向量增量或参考图片索引。规定了一种合并模式,其中,当前cu的运动参数从邻近的cu中获得,包括空间和时间上的候选以及vvc中引入的附加时间表。该合并模式可以应用于任何帧间预测的cu。该合并模式的替代方案是运动参数的显式传输,其中运动向量、每个参考图片清单的相应参考图片索引、参考图片清单使用标志、以及其他需要的信息在每个cu中显式地传讯。
技术实现思路
1、以下概述仅是说明性的,并不旨在以任何方式进行限制。即,提供以下概述以介绍本文描述的新颖的和非显而易见的技术的概念、亮点、好处和优势。在下面的详细描述中进一步描述了选择的而不是所有的实施方式。因此,以下概述不旨在识别要求保护的主题的基本特征,也不旨在用于确定要求保护的主题的范围。
2、一些实施例提供一种用于在对视频的当前图片的当前块进行编码或解码时导出跨分量模型或卷积模型的方法。视频编解码器可撷取导出当前块的分量预测模型所需的第一组像素位置的一组重建分量采样。视频编解码器针对第二组像素位置产生一组填充分量采样,这是基于检索到的一组重建分量采样导出分量预测模型所需要的。编码器可以透过复制撷取到的最近的重建分量采样、或预定义值、或由当前采样的比特深度定义的中间值来产生每个填充分量采样。视频编解码器透过使用撷取到的重建分量采样集和产生的填充分量采样集来导出分量预测模型。视频编解码器透过使用分量预测模型对当前块进行编码或解码以产生当前块的预测子。
3、在一些实施例中,第二组像素位置被指定为具有基于边界的不可用或禁止的重建采样。第二组像素位置可以对应于当前块内的分量采样。第二组像素位置可以对应于当前块的左上相邻区域中的分量采样。第二组像素位置可以位于包围当前块的数据管线单元之外。此边界可以是储存一行或多行重建的编解码树单元(ctu)的缓冲器的范围分界。
4、在一些实施例中,分量预测模型由对应的目标分量采样和预测分量采样导出,其中每个预测分量采样基于并置分量采样和一组周围分量采样(例如,围绕并置采样″c″的″n″、″s″、″w″、″e″、″nw″、″ne″、″se″、″sw″采样)产生。在一些实施例中,超出边界的像素位置的周围分量采样被填充分量采样取代。分量预测模型可以是跨分量模型,使得目标分量采样是色度采样,并置分量采样和周围分量采样是亮度采样。
5、在一些实施例中,目标分量采样和并置分量采样是与当前块相邻的参考区域的采样。周围分量采样中的一些可能是刚好超出参考区域的扩展区域中的采样。
1.一种视频编解码方法,包括:
2.根据权利要求1所述的视频编解码方法,其特征在于,产生填充分量采样包括复制以下之一:(i)最接近的撷取到的重建分量采样,(ii)预定义值,或(iii)由当前采样的比特深度定义的中间值。
3.根据权利要求1所述的视频编解码方法,其特征在于,该第二组像素位置被指定为具有基于边界的不可用的重建采样。
4.根据权利要求3所述的视频编解码方法,其特征在于,该第二组像素位置对应于该当前块内的分量采样。
5.根据权利要求3所述的视频解码方法,其中该第二组像素位置对应于该当前块的左上邻近区域内的分量采样。
6.根据权利要求3所述的视频编解码方法,其特征在于,该第二组像素位置位于包围该当前块的数据管线单元之外。
7.根据权利要求3所述的视频编解码方法,其特征在于,该边界是储存一行或多行重建编解码树单元的缓冲器的范围分界。
8.根据权利要求1所述的视频编解码方法,其特征在于,该分量预测模型是透过对应的目标分量采样和预测分量采样导出的,每个预测分量采样基于并置分量采样和一组周围分量采样生成。
9.根据权利要求8所述的视频编解码方法,其特征在于,超出该边界的像素位置处的周围分量采样被替换为填充的分量采样。
10.根据权利要求8所述的视频编解码方法,其特征在于,该目标分量采样是色度采样,其中该并置分量采样和该周围分量采样是亮度采样。
11.根据权利要求8所述的视频编解码方法,其特征在于,该目标分量采样和该并置分量采样是与该当前块相邻的参考区域的采样。
12.根据权利要求1所述的视频编解码方法,其特征在于,该当前块的该预测子包括将该分量预测模型应用于该当前块的亮度采样而产生的预测色度采样。
13.一种电子装置,包括:
14.一种视频解码方法,包括:
15.一种视频编码方法,包括: