一种适用于VVC标准的帧内预测的模式选择的快速算法

文档序号:31071269发布日期:2022-08-09 21:06阅读:159来源:国知局
一种适用于VVC标准的帧内预测的模式选择的快速算法
一种适用于vvc标准的帧内预测的模式选择的快速算法
技术领域
1.本发明属于视频压缩编解码技术领域,具体涉及视频帧内模式选择的快速算法。


背景技术:

2.随着超高清和视频市场需求的快速发展,对高分辨率和高帧率视频的需求越来越大。联合视频探索团队(jvet)提出了多功能视频编码标准(vvc)来满足这一需求,相比于前身hevc,它提供了50%更高的编码性能。
3.vvc利用两阶段帧内模式决策策略来获得最优模式。两阶段快速帧内预测类似于hevc。如图1所示,vvc的帧内预测有65种角度模式、dc和平面模式。粗模式决策(rmd)是通过计算哈达玛(hadmard)成本,从所有帧内模式中选择模式的第一阶段。候选列表(mpm)代表rmd之后的最优模式候选列表,其中vvc中的mpm数量增加到6个用于帧内预测。最后,使用rdo挑选出最佳的帧内模式,其中最佳模式是从候选模式列表中具有最小rdo损失的。
4.所有的67种帧内模式都需要计算satd损失,而mpm中rdo也都非常耗时,引入了极大的运算量,不适合硬件实现,因此需要使用快速算法加速模式选择的过程。


技术实现要素:

5.本发明的目的在于提出一种可以适应于vvc标准的帧内预测的模式选择的快速算法。
6.本发明提出的适用于vvc标准的帧内预测的模式选择的快速算法,是基于梯度直方图技术的,具体步骤如下:
7.(1)首先计算编码块cu的梯度直方图(hog)值,具体包括每个像素点的梯度幅值、梯度角度,并且将梯度角度等间隔的划分为32个区间;共有65个角度模式,所有角度模式按照其角度值对应32个区间中的一个区间,参见图1;这里,编码块cu是vvc标准中的编码块;
8.(2)拥有最大梯度幅值的区间占所有32个区间的比值,若大于提前设定的阈值,表明当前cu的纹理梯度所对应的角度很大概率在这个最大区间内,因此最终的角度模式大概率在这个最大区间内,由此进入步骤(3),进入下一步模式判决;反之,表明当前cu是一个较为平滑的块,也就是纹理细节没有那么丰富,由此进入步骤(4),进入下一步模式判决;
9.这里,阈值作为调控最大梯度幅值所占的比例,也就是判断当前编码块cu是否平滑,最大梯度幅值所占比例越大,则表明当前编码块cu的纹理不平滑而且朝向最大幅值所对应的梯度方向;通常,该阈值根据编码性能(bdbr)和减少时间(ts)两个指标的折衷来确定;
10.(3)对最大区间的角度模式进行satd(绝对变换差之和)运算,拥有最小satd的角度模式为最佳模式,结束模式选择的过程;
11.(4)利用空间相关性来进一步模式选择,如果左面的编码块cu和上面的编码块cu模式相同,则最终的模式为左上面编码块cu的模式;反之,对最大区间内的角度模式、编码块dc和planar(平面模式)进行rdo(率失真优化)运算,拥有最小rdo值的模式为最佳模式,
结束模式选择的过程。
12.本发明从梯度直方图与帧内模式的映射和空间相关性两个方面来减少vvc标准的编码复杂度从而加快帧内预测速度;首先,通过引入梯度直方图hog建立帧内65个角度模式和hog的32个区间的映射关系,对于hog区间的选择从而对模式进行选择,利用纹理信息与角度模式的关系减少satd和rdo等耗时操作的可能性;另外,利用空间信息的相关性减低编码的冗余度,参考左面和上面cu的模式作为当前cu的模式的选择参考。通过这两个方面大大加速帧内预测的模式选择过程,相比于原vvc编码标准,提出的方法可以减少36.6%以上的编码时间。
附图说明
13.图1为vvc帧内预测的67中模式,包括65种角度模式,以及dc和planar。
14.图2为本发明提出的快速算法流程图。
15.图3为阈值选择中bdbr与ts的实验结果图。
具体实施方式
16.下面结合附图,对本发明进行进一步的说明。
17.本发明提出的适用于vvc标准的帧内预测的模式选择的快速算法,依据编码块内角度模式与梯度直方图内的区间之间的关系,并且利用空间相关性,大大加速了帧内模式选择的速度。
18.首先,计算编码块cu中每一个像素点i(x,y)的hog值,包括梯度的幅值、梯度的角度。其中梯度的幅值g(x,y)由横向梯度g
x
(x,y)和纵向梯度gy(x,y)两部分构成:
19.g
x
(x,y)=i(x+1,y)-i(x-1,y),
ꢀꢀꢀ
(1)
20.gy(x,y)=i(x,y+1)-i(x,y-1),
ꢀꢀꢀ
(2)
21.g(x,y)=g
x
(x,y)2+gy(x,y)2,
ꢀꢀꢀꢀꢀꢀ
(3)
22.梯度的角度表示为公式(4):
[0023][0024]
弧度平均分成32个区间,每个区间的角度都是65个角度模式按照其角度分到对应的区间内,具体的对应表如下:
[0025]
(1)区间等间隔的分为8个区间,每个区间的长度为模式2-17共16个模式平均分到这8个区间内,也就是每个区间对应2个模式;
[0026]
(2)模式18、19、20分到区间内。区间等间隔的分为7个区间,每个区间的长度为模式21-34共14个模式平均分到这7个区间内,也就是每个区间对应2个模式;
[0027]
(3)模式35分到区间内,模式48、49、50分到区间区间平均分成6个区间,每个区间的长度为模式36-47共12个模式平均分到这6个区间内,也就是每个区间对应2个模式;
[0028]
(4)区间等间隔的分为8个区间,每个区间的长度为模式51-66共16个模式平均分到这8个区间内,也就是每个区间对应2个模式。
[0029]
表1弧度和角度模式对应关系表
[0030][0031]
计算每个区间内所有梯度幅值和,选择和值最大的区间b,计算所有区间的梯度幅值之和sum,则最大区间占所有区间的比值为q:
[0032][0033]
这里我们预先设置一个阈值w(w的确定后面有具体的实验),则接下来的步骤分为以下两种可能:
[0034]
(1)如果q》=w,表明当前纹理不平滑,很大概率是偏向于角度模式。这时候直接对区间b中的角度模式进行绝对变换差之和(satd)运算,最小的satd对应的角度模式判定为最终的模式,结束模型选择;
[0035]
(2)如果q《w,表明当前纹理很光滑。这时候我们采用空间相关性信息去去除冗余,也就是利用左面和上面的编码块cu模式进行参考,如果左面和上面的模式相等,则当前编码块cu的模式判定为和上面一样的模式,结束模式选择。反之,如果上面和做缪按的编码块cu模式不同,我们对区间b内的角度模式再加上编码块dc和planar都进行率失真优化(rdo)的运算,最终的模式为最小rdo的模式,结束模式选择。
[0036]
本发明中确定阈值w的具体过程如下:
[0037]
首先,使用官方参考软件vtm编码图片集或视频序列,得到量化参数(qp)=22,27,32和37四种情况下原始算法的平均编码时间和编码性能。如图3,使用官方参考软件vtm编码图片集或视频序列,得到qp=22,27,32和37四种情况下使用本发明所提出算法的编码时间和编码性能,与原始算法比较,得到编码性能(bdbr)和减少时间(ts),对于多个阈值w的测试可得到一系列bdbr和ts点连线。其中bdbr越小越好,表示编码质量越高;ts越大越好,表示编码速度越快。为了获得折衷的编码质量与编码速度,采用0.3作为最终的阈值w。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1