在视频编码中利用率失真优化进行图像再成形的制作方法

文档序号：36167936发布日期：2023-11-23 21:14阅读：66来源：国知局

本发明大体上涉及图像及视频编码。更特定来说，本发明的实施例涉及视频编码的图像再成形。

背景技术：

1、在2013年，国际标准化组织(iso)中的mpeg团体与国际电信联盟(itu)联合发布hevc(也称为h.265)视频编码标准(参考文献[4])的草案初稿。最近，相同团体已收集证据支持下一代编码标准(其提供相较于既有视频编码技术的改进编码性能)的发展。

2、如本文所利用，术语‘位深度’表示用于表示图像的色彩分量中的一者的像素的数目。传统上，以每像素每色彩分量8个位(例如每像素24个位)编码图像；然而，现代架构现可支持更高位深度，例如10个位、12个位或12个以上位。

3、在传统图像管线中，利用将线性场景光转换为非线性视频信号(例如伽玛编码rgb或ycbcr)的非线性光电函数(oetf)来量化捕获图像。接着，在接收器上，在显示于显示器上之前，由将视频信号值转化为输出屏幕色彩值的电光转移函数(eotf)处理信号。此类非线性函数包含tu-r rec.bt.709及bt.2020中所记录的传统“伽玛”曲线、smpte st 2084中所描述的“pq(感知量化)”曲线及rec.itu-r bt.2100中所描述的“hybridlog-伽玛”或“hlg”曲线。

4、如本文所利用，术语“正向再成形”表示数字图像从其原始位深度及原始码字分布或表示(例如伽玛或pq或hlg及其类似者)到相同或不同位深度及不同码字分布或表示的图像的样本到样本或码字到码字映射的过程。再成形允许固定比特率下的改进可压缩性或改进图像质量。例如(但不限于)，再成形可应用于10位或12位pq编码hdr视频以提高10位视频编码架构的编码效率。在接收器中，在解压缩再成形信号之后，接收器可应用“反再成形函数”来使信号恢复到其原始码字分布。此处发明者应了解，随着下一代视频编码标准开始发展，期望图像的一体化再成形及编码的改进技术。本发明的方法可应用于包含(但不限于)标准动态范围(sdr)及/或高动态范围(hdr)内的内容的各种视频内容。

5、本章节中所描述的方法是可寻求的方法，但未必为先前已设想或寻求的方法。因此，除非另有指示，否则不应认为本章节中所描述的方法中的任何者仅因其包含于本章节中而被限定为现有技术。类似地，除非另有指示，否则相对于一或多个方法所识别的问题不应被认为已基于本章节而在任何现有技术中辨识。

技术实现思路

1、本申请的一方面涉及一种利用一或多个处理器来重建编码视频数据的方法。所述方法包括：接收包括呈输入码字表示的一或多个编码再成形图像的编码位流；在所述编码位流中接收用于所述一或多个编码再成形图像的再成形元数据，其中所述再成形元数据包括用以生成基于亮度的色度残差换算器以换算经解码色度残差的参数和正向再成形函数，其中所述正向再成形函数将图像的像素从第一码字表示映射到所述输入码字表示，其中所述再成形元数据进一步包括：第一参数，其指示用于再成形中的最小分组指数；第二参数，其确定用于所述再成形中的活跃最大分组指数，其中所述活跃最大分组指数小于或等于预定最大分组指数，且确定所述活跃最大分组指数包括计算所述预定最大分组指数与所述第二参数之间的差值；绝对差量码字值，其用于所述输入码字表示中的每一活跃分组；及所述绝对差量码字值的正负号，其用于所述输入码字表示中的每一活跃分组；基于所述再成形元数据产生正向再成形函数；基于所述再成形元数据或所述正向再成形函数产生反再成形函数，其中所述反再成形函数将再成形图像的像素从所述输入码字表示映射到所述第一码字表示；以及基于所述正向再成形函数、所述反再成形函数和所述色度残差换算器解码所述编码位流。

2、本申请的另一方面涉及一种利用处理器来使视频序列适应性再成形的方法。所述方法包括：利用处理器来存取呈第一码字表示的输入图像；产生再成形参数以表示将所述输入图像的像素映射到第二码字表示的正向再成形函数；以及基于所述输入图像和所述正向再成形函数生成编码位流，其中所述再成形参数包括：第一参数，其确定用于再成形的活跃最大码字分组指数，其中所述活跃最大码字分组指数小于或等于预定最大码字分组指数；第二参数，其指示用于所述再成形中的最小码字分组指数；绝对差量码字值，其用于所述第二码字表示中的每一活跃码字分组；所述绝对差量码字值的正负号，其用于所述第二码字表示中的每一活跃分组；及一或多个基于亮度的色度残差换算参数。

3、本申请的又一方面涉及一种用于传输由视频编码设备生成并用于重建视频的位流的方法。所述方法包括：传输所述位流，其中生成所述位流包括：利用处理器来存取呈第一码字表示的输入图像；生成再成形参数以表示将所述输入图像的像素映射到第二码字表示的正向再成形函数；以及基于所述输入图像和所述正向再成形函数生成编码位流，其中所述再成形参数包括：第一参数，其确定用于再成形的活跃最大码字分组指数，其中所述活跃最大码字分组指数小于或等于预定最大码字分组指数；第二参数，其指示用于所述再成形中的最小码字分组指数；绝对差量码字值，其用于所述第二码字表示中的每一活跃码字分组；所述绝对差量码字值的正负号，其用于所述第二码字表示中的每一活跃分组；及一或多个基于亮度的色度残差换算参数。

技术特征：

1.一种利用一或多个处理器来重建编码视频数据的方法，所述方法包括：

2.根据权利要求1所述的方法，其中将所述正向再成形函数重建为具有由所述再成形元数据导出的线性分段的分段线性函数。

3.一种利用处理器来使视频序列适应性再成形的方法，所述方法包括：

4.根据权利要求3所述的方法，其中所述正向再成形函数包括具有由所述再成形参数导出的线性分段的分段线性函数。

5.一种用于传输由视频编码设备生成并用于重建视频的位流的方法，

技术总结
本公开涉及在视频编码中利用率失真优化进行图像再成形。鉴于呈第一码字表示的图像的序列，呈现用于利用率失真优化来进行图像再成形的方法、过程及系统，其中再成形允许以第二码字表示编码图像，所述第二码字表示允许比利用所述第一码字表示更高效率的压缩。还呈现用于传信再成形参数的语法方法。

技术研发人员：尹鹏,浦方君,吕陶然,陈涛,W·J·胡萨克,S·T·麦卡锡
受保护的技术使用者：杜比实验室特许公司
技术研发日：
技术公布日：2024/1/16

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：尹鹏浦方君吕陶然陈涛 W
技术所有人：杜比实验室特许公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。