变换系数符号预测和编解码的系统和方法与流程

文档序号:36778918发布日期:2024-01-23 11:50阅读:15来源:国知局
变换系数符号预测和编解码的系统和方法与流程

所公开的实施例总体上涉及视频编解码,包括但不限于变换系数的系数符号编解码系统和方法。


背景技术:

1、数字视频由各种电子设备支持,诸如数字电视、膝上型计算机或台式电脑、平板电脑、数码相机、数字录音设备、数字媒体播放器、视频游戏机、智能电话、视频电话会议设备、视频流式传输设备等。电子设备通过通信网络传输和接收或以其它方式传送数字视频数据,和/或将数字视频数据存储在存储设备上。由于通信网络的带宽容量有限,存储设备的存储器资源有限,在传送或存储视频数据之前,可根据一个或多个视频编码标准使用视频编码压缩视频数据。

2、目前已经开发出多种视频编解码器标准。例如,视频编码标准包括aomedia video1(av1)、通用视频编码(vvc)、联合探索测试模型(jem)、高效视频编码(hevc/h.265)、高级视频编码(avc/h.264)和运动图像专家组(mpeg)编码。视频编码通常利用预测方法(例如,帧间预测、帧内预测等),利用视频数据中固有的冗余。视频编码的目的是将视频数据压缩成使用较低比特率的形式,同时避免或最大限度地减少视频质量的下降。

3、hevc,也称为h.265,是作为mpeg-h项目的一部分而设计的视频压缩标准。itu-t和iso/iec分别于2013年(版本1)、2014年(版本2)、2015年(版本3)和2016年(版本4)发布了hevc/h.265标准。通用视频编码(vvc),也称为h.266,是一种旨在作为hevc的后续标准的视频压缩标准。itu-t和iso/iec分别于2020(版本1)和2022(版本2)发布了vvc/h.266标准。av1是作为hevc的替代方案而设计的开放视频编码格式。2019年1月8日,该规范的1.0.0验证版本和勘误表1发布。


技术实现思路

1、如上所述,视频编解码器技术包括帧内编码。在帧内编码中,样本值的表示不参考先前已重建参考图片的样本或其它数据。在一些情况下,图片在空间上被细分为样本块。当所有的样本块都以帧内模式进行编码时,该图片就是帧内图片。帧内图片及其衍生图片(如独立解码器刷新图片)可用于重置解码器状态,因此可用作已编码视频码流和视频会话中的第一图片或静止图像。帧内块的样本可进行变换,变换系数可在熵编码之前量化。帧内预测可以减少/最小化预变换域中的样本值。在一些情况下,变换后的dc值越小,ac系数越小,在给定量化步长下,熵编码后表示块所需的比特数就越少。对于变换系数的熵编码,可以使用旁路模式将系数符号与量值/层级(系数值的绝对值)分开编码。这意味着每个系数符号的编码成本为一个比特,成本很高。

2、根据一些实施例,提供了一种视频编码的方法。该方法包括:(i)获取包括多个块的视频数据,该多个块包括第一块;(ii)确定与第一块相关联的多个变换系数;(iii)使用第一种技术预测多个变换系数的第一集合的相应系数符号;(iv)使用第二种技术预测多个变换系数的第二集合的相应系数符号,该第二种技术不同于该第一种技术;以及(v)基于多个变换系数以及预测的第一集合和第二集合的相应系数符号,重建第一块。

3、根据一些实施例,提供了另一种视频编码的方法。该方法包括:(i)获取包括多个块的视频数据,该多个块包括由多个元素构成的第一块,以及(ii)对于多个元素中的每个元素,编码一个指示符,该指示符指定该元素的变换系数的符号值是否与相应的第二元素的变换系数的符号值相同。

4、根据一些实施例,提供了一种计算系统,诸如流式传输系统、服务器系统、个人计算机系统或其它电子设备。该计算系统包括控制电路和存储一个或多个指令集的存储器。该一个或多个指令集包括用于执行本文中描述的方法中的任何方法的指令。在一些实施例中,该计算系统包括编码器部件和/或解码器部件。

5、根据一些实施例,提供了一种非易失性计算机可读存储介质。该非易失性计算机可读存储介质存储由计算系统执行的一个或多个指令集。该一个或多个指令集包括用于执行本文中描述的方法中的任何方法的指令。

6、相应地,公开了用于编码视频的设备和系统与方法。此类方法、设备和系统可以补充或替代用于视频编码的常规方法、设备和系统。

7、说明书中所描述的特征和优点不一定是全部包括的,特别是,对于本领域普通技术人员而言,根据本公开提供的附图、说明书和权利要求书,一些另外的特征和优点将是显而易见的。此外,应当注意的是,说明书中所使用的语言主要是出于可读性和指导性的目的而选择的,而不一定被选择为描绘或限定本文中描述的主题。



技术特征:

1.一种在具有存储器和一个或多个处理器的计算系统处执行的视频解码方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述第一种技术包括基于一个或多个相邻分量,预测色彩系数的系数符号。

3.根据权利要求1所述的方法,其特征在于,所述第二种技术包括基于不同色彩系数的符号值,预测色彩系数的系数符号。

4.根据权利要求1所述的方法,其特征在于,进一步包括:放弃预测所述多个变换系数的第三集合的相应系数符号。

5.根据权利要求1所述的方法,其特征在于,进一步包括:基于一个或多个基于频率的准则,选择所述第一集合用于所述第一种技术。

6.根据权利要求1所述的方法,其特征在于,进一步包括:基于所述第一块的扫描顺序,选择所述第一集合用于所述第一种技术。

7.根据权利要求1所述的方法,其特征在于,进一步包括:基于所述第一块的预定义区域,选择所述第一集合用于所述第一种技术。

8.根据权利要求1所述的方法,其特征在于,进一步包括:根据所述第二集合的每个变换系数为非零的判断,选择所述第二集合用于所述第二种技术。

9.根据权利要求1所述的方法,其特征在于,所述第二集合包括第一色彩的一组色彩元素;

10.一种计算系统,其特征在于,包括:

11.根据权利要求10所述的计算系统,其特征在于,所述第一种技术包括基于一个或多个相邻分量,预测色彩系数的系数符号。

12.根据权利要求10所述的计算系统,其特征在于,所述第二种技术包括基于不同色彩系数的符号值,预测色彩系数的系数符号。

13.根据权利要求10所述的计算系统,其特征在于,所述一个或多个指令集进一步包括指令,用于基于一个或多个基于频率的准则,选择所述第一集合用于所述第一种技术。

14.根据权利要求10所述的计算系统,其特征在于,所述一个或多个指令集进一步包括指令,用于基于所述第一块的扫描顺序,选择所述第一集合用于所述第一种技术。

15.根据权利要求10所述的计算系统,其特征在于,所述一个或多个指令集进一步包括指令,用于基于所述第一块的预定义区域,选择所述第一集合用于所述第一种技术。

16.根据权利要求10所述的计算系统,其特征在于,所述一个或多个指令集进一步包括指令,用于根据所述第二集合的每个变换系数为非零的判断,选择所述第二集合用于所述第二种技术。

17.一种非易失性计算机可读存储介质,其特征在于,其存储被配置为由具有控制电路和存储器的计算设备执行的一个或多个指令集,所述一个或多个指令集包括用于以下操作的指令:

18.根据权利要求17所述的非易失性计算机可读存储介质,其特征在于,所述第一种技术包括基于一个或多个相邻分量,预测色彩系数的系数符号。

19.根据权利要求17所述的非易失性计算机可读存储介质,其特征在于,所述第二种技术包括基于不同色彩系数的符号值,预测色彩系数的系数符号。

20.根据权利要求17所述的非易失性计算机可读存储介质,其特征在于,所述一个或多个指令集进一步包括指令,用于基于一个或多个基于频率的准则,选择所述第一集合用于所述第一种技术。


技术总结
本申请描述的各种实施例包括用于视频编解码的方法和系统。在一个方面,方法包括:获取包括多个块的视频数据,该多个块包括第一块;以及确定与第一块相关联的多个变换系数。方法进一步包括:使用第一种技术预测多个变换系数的第一集合的相应系数符号;以及使用第二种技术预测多个变换系数的第二集合的相应系数符号,该第二种技术不同于该第一种技术。方法还包括基于多个变换系数以及预测的第一集合和第二集合的相应系数符号,重建第一块。

技术研发人员:赵欣,山姆如迪·亚士万狄·卡胡,马杜·柏林加色·克里什南,刘杉
受保护的技术使用者:腾讯美国有限责任公司
技术研发日:
技术公布日:2024/1/22
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1