一种基于随机树的帧内编码速度优化方法及存储介质

文档序号:37472821发布日期:2024-03-28 18:55阅读:18来源:国知局
一种基于随机树的帧内编码速度优化方法及存储介质

本发明涉及视频编码,尤其是一种基于随机树的帧内编码速度优化方法及存储介质。


背景技术:

1、随着高清和超高清视频的普及和快速发展,视频数据量急剧增加,给视频的存储的传输带来的新的机遇和挑战。第三代音视频编码标准(avs3)是我国最新制定的视频编码标准,其性能比上一代标准avs2和hevc高出约30%。在编码单元(cu)划分方面,avs3采用了更灵活的编码单元划分结构,在四叉树划分(qt)的编码框架的基础上增加了二叉树划分(bt)和扩展四叉树划分(eqt)。共有6种划分模式,如图1所示,分别是:不划分、垂直二叉树、水平二叉树、垂直扩展四叉树、水平扩展四叉树、四叉树。更灵活的划分方式给avs3带来性能增益的同时也使得avs3的计算复杂度远远高于avs2和hevc。

2、为了降低avs3编码单元划分这一过程的复杂性,学者们提出了一些研究工作。例如,相关技术提出了一种基于梯度和方差的avs3帧内编码快速cu划分决策方法;也提出了一种基于频域离散余弦变换(dct)系数的avs3编码单元快速划分算法;还提出了利用历史分区信息来提前跳过不必要的eqt划分模式,利用梯度信息来跳过另一个方向上纹理结构突出的划分方式,从而达到在同质区域提前终止划分的效果。

3、以上均为基于统计的方案,其实现复杂度较低,也能够取得一定的效果。但也存在一些不足:首先,基于统计的方案往往需要人工来进行大量的规律归纳,经过大量的手工调试实验才能确定最终合适的判断阈值;另外,基于统计的方案会存在仅限于特定尺寸的编码单元或特定的编码模式的情况,限制了在不同编码场景的适用性。


技术实现思路

1、有鉴于此,本发明实施例提供一种高效的基于随机树的帧内编码速度优化方法及存储介质,以实现编码速度和性能损失的平衡。

2、本发明实施例的一方面提供了一种基于随机树的帧内编码速度优化方法,包括:

3、通过第一随机森林模型对非首次编码的第一编码单元进行第一特征提取,并通过第二随机森林模型对首次编码的第二编码单元进行第二特征提取,得到各个编码单元的特征信息;

4、根据所述特征信息,构建训练数据集,对所述第二随机森林模型和所述第一随机森林模型进行训练;

5、根据训练好的第二随机森林模型对首次编码的编码单元进行划分模式判断,并根据训练好的第一随机森林模型对非首次编码的编码单元进行划分模式判断,进而根据编码单元的划分模式实现对编码单元的编码速度优化。

6、可选地,所述特征信息包括历史划分信息、帧内预测角度、编码单元的宽度以及编码单元的长度、方差、量化参数、水平方向上的绝对误差和、垂直方向上的绝对误差和。

7、可选地,所述编码单元的方差用于表征编码单元的纹理复杂度,以确定是否提前终止划分;

8、其中,所述方差的计算公式为:

9、

10、其中,w和h分别指当前编码单元的宽和高;p(x,y)指位于当前帧图像(x,y)位置的像素值;μ为当前编码单元像素的平均值;var表示当前编码单元像素的方差值。

11、可选地,所述量化参数用于表征编码比特率和失真信息,并用于表征图像细节压缩信息。

12、可选地,所述水平方向上的绝对误差和的表达式为:

13、

14、所述垂直方向上的绝对误差和的表达式为:

15、

16、其中,sadh为所述水平方向上的绝对误差和;w和h分别指当前编码单元的宽和高;表示表示纵坐标为y0的一行的像素的绝对误差和;sadv为所述垂直方向上的绝对误差;表示表示横坐标为x0的一列的像素的绝对误差和。

17、可选地,所述根据训练好的第二随机森林模型对首次编码的编码单元进行划分模式判断,包括:

18、当所述编码单元为首次编码,判断编码单元的宽和高都处于预设区间,则记录和计算当前编码单元的特征值;

19、将所述特征值输入所述第二随机森林模型,计算所述编码单元在不同划分模式标签下的得票结果,确定每个划分模式对应的概率;

20、跳过概率低于概率阈值的划分模式,确定当前编码单元的划分模式。

21、可选地,所述根据训练好的第一随机森林模型对非首次编码的编码单元进行划分模式判断,包括:

22、当所述编码单元为非首次编码,记录和计算当前编码单元的特征值;

23、将所述特征值输入所述第一随机森林模型,直接确定当前编码单元的最优划分模式。

24、本发明实施例的另一方面还提供了一种基于随机树的帧内编码速度优化装置,包括:

25、第一模块,用于通过第一随机森林模型对非首次编码的第一编码单元进行第一特征提取,并通过第二随机森林模型对首次编码的第二编码单元进行第二特征提取,得到各个编码单元的特征信息;

26、第二模块,用于根据所述特征信息,构建训练数据集,对所述第二随机森林模型和所述第一随机森林模型进行训练;

27、第三模块,用于根据训练好的第二随机森林模型对首次编码的编码单元进行划分模式判断,并根据训练好的第一随机森林模型对非首次编码的编码单元进行划分模式判断,进而根据编码单元的划分模式实现对编码单元的编码速度优化。

28、本发明实施例的另一方面还提供了一种电子设备,包括处理器以及存储器;

29、所述存储器用于存储程序;

30、所述处理器执行所述程序实现如前面所述的方法。

31、本发明实施例的另一方面还提供了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。

32、本发明实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。

33、本发明的实施例首先通过第一随机森林模型对非首次编码的第一编码单元进行第一特征提取,并通过第二随机森林模型对首次编码的第二编码单元进行第二特征提取,得到各个编码单元的特征信息;接着根据所述特征信息,构建训练数据集,对所述第二随机森林模型和所述第一随机森林模型进行训练;最后根据训练好的第二随机森林模型对首次编码的编码单元进行划分模式判断,并根据训练好的第一随机森林模型对非首次编码的编码单元进行划分模式判断,进而根据编码单元的划分模式实现对编码单元的编码速度优化。本发明能够选出最优的编码划分模式,提高了帧内编码效率,节省了编码时间,实现了编码速度和性能损失的平衡。



技术特征:

1.一种基于随机树的帧内编码速度优化方法,其特征在于,包括:

2.根据权利要求1所述的一种基于随机树的帧内编码速度优化方法,其特征在于,所述特征信息包括历史划分信息、帧内预测角度、编码单元的宽度以及编码单元的长度、方差、量化参数、水平方向上的绝对误差和、垂直方向上的绝对误差和。

3.根据权利要求2所述的一种基于随机树的帧内编码速度优化方法,其特征在于,所述编码单元的方差用于表征编码单元的纹理复杂度,以确定是否提前终止划分;

4.根据权利要求2所述的一种基于随机树的帧内编码速度优化方法,其特征在于,所述量化参数用于表征编码比特率和失真信息,并用于表征图像细节压缩信息。

5.根据权利要求2所述的一种基于随机树的帧内编码速度优化方法,其特征在于,

6.根据权利要求1所述的一种基于随机树的帧内编码速度优化方法,其特征在于,所述根据训练好的第二随机森林模型对首次编码的编码单元进行划分模式判断,包括:

7.根据权利要求6所述的一种基于随机树的帧内编码速度优化方法,其特征在于,所述根据训练好的第一随机森林模型对非首次编码的编码单元进行划分模式判断,包括:

8.一种基于随机树的帧内编码速度优化装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括处理器以及存储器;

10.一种计算机可读存储介质,其特征在于,所述存储介质存储有程序,所述程序被处理器执行实现如权利要求1至7中任一项所述的方法。


技术总结
本发明公开了一种基于随机树的帧内编码速度优化方法及存储介质,方法包括:首先通过第一随机森林模型对非首次编码的第一编码单元进行第一特征提取,并通过第二随机森林模型对首次编码的第二编码单元进行第二特征提取,得到各个编码单元的特征信息;接着构建训练数据集,对第二随机森林模型和第一随机森林模型进行训练;最后对首次编码的编码单元和非首次编码的编码单元进行划分模式判断,进而根据编码单元的划分模式实现对编码单元的编码速度优化。本发明能够选出最优的编码划分模式,提高了帧内编码效率,节省了编码时间,实现了编码速度和性能损失的平衡,可广泛应用于视频编码技术领域。

技术研发人员:崔心怡,梁凡
受保护的技术使用者:中山大学
技术研发日:
技术公布日:2024/3/27
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1