IBC合并候选上的模板匹配的制作方法

文档序号:35339947发布日期:2023-09-07 07:38阅读:53来源:国知局
IBC合并候选上的模板匹配的制作方法

本技术描述总体上涉及视频编解码的实施例。


背景技术:

1、本文所提供的背景描述旨在整体呈现本技术的背景。在背景技术部分以及本说明书的各个方面中所描述的目前已署名的发明人的工作所进行的程度,并不表明其在本技术提交时作为现有技术,且从未明示或暗示其被承认为本技术的现有技术。

2、未压缩的数字视频可包括一系列图片,每个图片具有例如1920×1080亮度样本及相关色度样本的空间维度。所述系列图片具有固定的或可变的图片速率(也非正式地称为帧率),例如每秒60个图片或60hz。未压缩的视频具有非常大的比特率要求。例如,每个样本8比特的1080p60 4:2:0的视频(1920x1080亮度样本分辨率,60hz帧率)要求接近1.5gbit/s带宽。一小时这样的视频就需要超过600gb的存储空间。

3、视频编码和解码的一个目的,是通过压缩减少输入视频信号的冗余信息。视频压缩可以帮助降低对上述带宽和/或存储空间的要求,在某些情况下可降低两个或更多数量级。无损压缩和有损压缩,以及两者的组合均可采用。无损压缩是指从压缩的原始信号中重建原始信号精确副本的技术。当使用有损压缩时,重建信号可能与原始信号不完全相同,但是原始信号和重建信号之间的失真足够小,使得重建信号可用于预期应用。有损压缩广泛应用于视频。容许的失真量取决于应用。例如,相比于电视应用的用户,某些消费流媒体应用的用户可以容忍更高的失真。可实现的压缩比反映出:较高的允许/容许失真可产生较高的压缩比。

4、视频编码器和解码器可利用几大类技术,例如包括:运动补偿、变换、量化和熵编码。

5、视频编解码器技术可包括已知的帧内编码技术。在帧内编码中,在不参考先前重建的参考图片的样本或其它数据的情况下表示样本值。在一些视频编解码器中,图片在空间上被细分为样本块。当所有的样本块都以帧内模式编码时,该图片可以为帧内图片。帧内图片及其衍生(例如独立解码器刷新图片)可用于复位解码器状态,并且因此可用作编码视频比特流和视频会话中的第一图片,或用作静止图像。帧内块的样本可用于变换,且可在熵编码之前量化变换系数。帧内预测可以是使预变换域中的样本值最小化的技术。在某些情形下,变换后的dc值越小,且ac系数越小,则在给定的量化步长尺寸下需要越少的比特来表示熵编码之后的块。

6、如同从诸如mpeg-2代编码技术中所获知的,传统帧内编码不使用帧内预测。然而,一些较新的视频压缩技术包括:试图从例如周围样本数据和/或元数据中得到数据块的技术,其中周围样本数据和/或元数据是在空间相邻的编码和/或解码期间、且在解码顺序之前获得的。这种技术后来被称为"帧内预测"技术。需要注意的是,至少在某些情形下,帧内预测仅使用正在重建的当前图片的参考数据,而不使用参考图片的参考数据。

7、可以存在许多不同形式的帧内预测。当在给定的视频编码技术中可以使用超过一种这样的技术时,所使用的技术可以按帧内预测模式进行编码。在某些情形下,模式可具有子模式和/或参数,且这些模式可单独编码或包含在模式码字中。将哪个码字用于给定模式,子模式和/或参数组合会通过帧内预测影响编码效率增益,因此用于将码字转换成比特流的熵编码技术也会出现这种情况。

8、h.264引入了一种帧内预测模式,其在h.265中进行了改进,且在如联合开发模型(jem)、通用视频编码(vvc)和基准集合(bms)的更新的编码技术中进一步被改进。通过使用属于已经可用的样本的相邻样本值可以形成预测块。在一些示例中,将相邻样本的样本值按照一些示例中某一方向复制到预测块中。对所使用方向的引用可以被编码在比特流中,或者本身可以被预测。

9、参照图1a,右下方描绘了来自h.265的33个可能的预测方向(对应35个帧内模式的33个角度模式)中已知的8个预测方向的子集。箭头会聚的点(101)表示正在被预测的样本。箭头表示样本正在被预测的方向。例如,箭头(102)表示根据右上方与水平方向成45度角的一个或多个样本,预测样本(101)。类似地,箭头(103)表示根据左下方与水平方向成22.5度角的一个或多个样本,预测样本(101)。

10、仍然参考图1a,在左上方示出了一个包括4×4个样本的正方形块(104)(由粗虚线表示)。正方形块(104)包括16个样本,每个样本用“s”、以及其在y维度上的位置(例如行索引)和在x维度上的位置(例如列索引)来标记。例如,样本s2是y维度上的第二个样本(从顶部开始)和x维度上的第一个(从左侧开始)样本。类似地,样本s44在y维度和x维度上都是块(104)中的第四个样本。由于该块为4×4大小的样本,因此s44位于右下角。还示出了遵循类似编号方案的参考样本。参考样本用"r"、以及其相对于块(104)的y位置(例如行索引)和x位置(例如列索引)来标记。在h.264与h.265中,预测样本与正在重建的块相邻,因此不需要使用负值。

11、通过从信号通知的预测方向所占用的相邻样本来复制参考样本值,可以进行帧内图片预测。例如,假设编码视频比特流包括信令,对于该块,该信令指示与箭头(102)一致的预测方向,即,根据右上方与水平方向成45度角的一个或多个预测样本来预测样本。在这种情况下,根据同一参考样本r05,预测样本s41、s32、s23和s14。根据参考样本r08,预测样本s44。

12、在某些情况下,例如通过内插,可以合并多个参考样本的值,以便计算参考样本,尤其是当方向不能被45度整除时。

13、随着视频编码技术的发展,可能的方向的数量已经增加了。在h.264(2003年)中,可以表示九种不同的方向。在h.265(2013年)和jem/vvc/bms中增加到了33个,而在此申请时,可以支持多达65个方向。已经进行了实验来识别最可能的方向,并且熵编码中的某些技术被用于使用少量比特来表示那些可能的方向,对于较不可能的方向则接受某些代价。此外,有时可以根据在相邻的、已经解码的块中所使用的相邻方向来预测方向本身。

14、图1b示出了根据jem描绘65个帧内预测方向的示意图(110),以说明预测方向的数量随着时间的推移而增加。

15、表示方向的编码视频比特流中的帧内预测方向比特的映射可以因视频编码技术的不同而不同,并且,例如可以从对帧内预测模式到码字的预测方向的简单直接映射,到包括最可能的模式和类似技术的复杂的自适应方案。然而,在所有情况下,视频内容中可能存在某些方向,其在统计学上比其它方向更不可能出现。由于视频压缩的目的是减少冗余,所以在运行良好的视频编码技术中,与更可能的方向相比,那些不太可能的方向将使用更多数量的比特来表示。

16、运动补偿可以是一种有损压缩技术,且可涉及如下技术:来自先前重建的图片或重建图片一部分(参考图片)的样本数据块在空间上按运动矢量(下文称为mv)指示的方向移位后,用于新重建的图片或图片部分的预测。在某些情况下,参考图片可与当前正在重建的图片相同。mv可具有两个维度x和y,或者三个维度,其中第三个维度表示使用中的参考图片(后者间接地可为时间维度)。

17、在一些视频压缩技术中,应用于某个样本数据区域的mv可根据其它mv来预测,例如根据与正在重建的区域空间相邻的另一个样本数据区域相关的、且按解码顺序在该mv前面的那些mv。这样做可以大大减少编码mv所需的数据量,从而消除冗余信息并增加压缩量。mv预测可以有效地进行,例如,当对从相机导出的输入视频信号(称为自然视频)进行编码时,存在一种统计上的可能性,即面积大于单个mv适用区域的区域,会朝着类似的方向移动,因此,在某些情况下,可以用邻近区域的mv导出的相似运动矢量进行预测。这导致针对给定区域发现的mv与根据周围mv预测的mv相似或相同,并且在熵编码之后,又可以用比直接编码mv时使用的比特数更少的比特数来表示。在某些情况下,mv预测可以是对从原始信号(即样本流)导出的信号(即mv)进行无损压缩的示例。在其它情况下,mv预测本身可能是有损的,例如由于根据几个周围mv计算预测值时产生的取整误差。

18、h.265/hevc(itu-t h.265建议书,“高效视频编解码(high efficiency videocoding)”,2016年12月)中描述了各种mv预测机制。在h.265指定的多种mv预测机制中,本技术描述的是下文称作“空间合并”的技术。

19、请参考图2,当前块(201)包括在运动搜索过程期间已由编码器发现的样本,根据已产生空间偏移的相同尺寸的先前块,可预测所述样本。另外,可从一个或多个参考图片相关联的元数据中导出所述mv,而非对mv直接编码。例如,使用关联于a0、a1和b0、b1、b2(分别对应202到206)五个周围样本中的任一样本的mv,(按解码次序)从最近的参考图片的元数据中导出所述mv。在h.265中,mv预测可使用相邻块也使用的相同参考图片的预测值。


技术实现思路

1、本公开的各方面提供了视频编码/解码的方法和装置。在一些示例中,视频解码的装置包括处理电路。处理电路响应于以帧内块复制(ibc)模式预测当前块,确定初始块矢量,所述初始块矢量用于预测当前编码树单元ctu中的所述当前块。处理电路基于所述初始块矢量执行模板匹配,以确定修正块矢量,所述修正块矢量指向图片中的作为所述当前块的参考块,以及基于所述参考块,重建所述当前块。在一些示例中,处理电路基于包括在已编码视频码流中的合并索引来确定初始块矢量。合并索引指示ibc合并候选列表中的块矢量候选,所述ibc合并候选列表包括ibc合并模式的多个ibc候选。

2、在一个示例中,处理电路从所述已编码视频码流解析指示所述ibc合并模式的第一标志,以及从所述已编码视频码流解析第二标志,所述第二标志指示是否将所述模板匹配应用于由所述合并索引指示的所述ibc合并模式中的所述多个ibc候选的所述块矢量候选。

3、在另一个例子中,处理电路从所述已编码视频码流解析指示所述ibc合并模式的标志,所述模板匹配被应用于以所述ibc合并模式预测的所述ctu中的每个块的块矢量候选。

4、在一些示例中,处理电路构建所述ibc合并候选列表,所述ibc合并候选列表至少包括指向ibc参考区域之外的第一位置的第一块矢量候选。

5、在一个示例中,处理电路响应于指示所述第一块矢量候选的所述合并索引,确定所述ibc参考区域中到所述第一位置的最近位置,以及确定指向所述最近位置的所述初始块矢量。

6、在一个示例中,为了构建ibc合并候选列表,处理电路响应于确定所述第一块矢量候选的模板匹配搜索区域与所述ibc参考区域至少部分地重叠,将所述第一块矢量候选插入所述ibc合并候选列表中。

7、在一些示例中,所述ibc参考区域包括所述当前ctu的已重建部分和左ctu的区域,所述已重建部分和所述左ctu的区域被缓存在存储空间中,所述存储空间具有存储ctu的大小。

8、在一些示例中,处理电路在所述模板匹配中排除所述模板匹配搜索区域的在所述ibc参考区域之外的部分。

9、本公开的各方面还提供了一种存储指令的非暂时性计算机可读介质,当指令由计算机执行以进行视频解码时,使计算机执行用于视频解码的方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1