一种基于超先验可变码率图像压缩的个体R-λ模型码率控制方法

文档序号：31361118发布日期：2022-08-31 14:36阅读：37来源：国知局

一种基于超先验可变码率图像压缩的个体r-λ
模型码率控制方法
技术领域
1.本发明属于计算机视觉领域，具体涉及深度学习，图像压缩，码率控制等技术。

背景技术：

2.图像压缩是图像处理领域的基础课题之一。近年来，在自媒体时代，不仅图片和视频传输的数量在急剧的增加，而且单幅图像包含的数据量也不断增加，对图像压缩技术的性能提出了越来越高的要求。传统图像压缩方法依赖复杂的人工设计和单独优化各个模块，因此进一步追求编码性能改进存在越来越多的挑战。得益于深度学习的蓬勃发展，基于变分自编码器图像压缩框架，且包含超先验网络的模型，即基于超先验可变码率图像压缩由于能够端到端的联合优化各个模块，取得了较好的性能。
3.尽管基于超先验可变码率压缩图像能用同一模型以不同码率压缩图像，但是在相同权衡参数作为输入下，不同图像输出的码率并不相同。在实际应用中，为了适应传输带宽或者存储要求，需要改变输入(权衡参数)来调整图像的输出码率，以使输出码率接近目标码率，而这一过程需要码率控制来实现。在传统的编码框架下，码率控制算法通常建立r-q模型或者r-λ模型，其中r-λ模型码率控制通过建立合适的r-d模型，利用r-d优化中的权衡参数λ，建立λ域r-d分析，表征码率与权衡参数之间的关系，通过改变权衡参数λ来调整输出码率。然而，由于编码器的不同，基于上述码率控制方法无法直接用于基于超先验可变码率图像压缩中。

技术实现要素：

4.本发明针对上述问题，针对基于超先验可变码率图像压缩方法无法针对目标码率快速给出网络应该输入的权衡参数，本发明设计了一种基于超先验可变码率图像压缩的个体r-λ模型码率控制方法，实现了对于任意图像，给定目标码率下，快速计算出应该输入网络的权衡参数。
5.本发明针对任意基于超先验可变码率图像压缩，为训练好的模型建立平均r-λ模型。
6.具体的，设计平均r-λ模型为：
7.λ＝α(e
βr-1)
8.其中，α和β是待拟合的参数。参数模型中减1的原因在于，当权衡参数为0时，码率也为0。
9.其次，利用训练好的模型使用5个权衡参数对kodak数据集中的每张图像进行编解码获得码率，并计算每个权衡参数下平均码率，因此可以获得5对权衡参数和码率，并利用这5对数据拟合出平均r-λ模型中α和β。注意，不同训练好的模型拟合的α和β不同。其中，5个权衡参数必须包含初始权衡参数λ0，且初始权衡参数λ0选择模型训练时最大权衡参数λ
max
的二分之一时，即其余四个权衡参数任选，尽可能分散。此外，记输入为初始权衡
参数λ0时，平均码率为r
avg0
。
10.然后，设计个体r-λ模型为：
[0011][0012]
其中，α和β为平均r-λ模型拟合的结果。ρ为初始权衡参数λ0时，编码器输出数据的香农熵r0与平均码率r
avg0
的比值，即
[0013]
最后，对于任意输入图像，首先计算出个体r-λ模型，给定目标码率rs，可以利用该图像的个体r-λ模型，计算出应该送入网络的权衡参数λs，通过编码器输出的码率将会很接近目标码率，从而实现码率控制。
[0014]
有益效果
[0015]
本发明是第一次实现基于超先验可变码率图像压缩的码率控制方法。为了验证本发明的有效性，针对三个不同的超先验可变码率图像压缩模型进行测试，本发明码率控制的码率平均相对误差在百分之一到百分之三之间。
附图说明
[0016]
图1、本发明的码率控制方法流程图；
具体实施方式
[0017]
首先，给定一个训练好的可变码率压缩模型，然后使用5个权衡参数分别输入网络对kodak数据集每张图像进行编解码获得码率，并计算每个权衡参数下平均码率，其中，5个权衡参数必须包含初始权衡参数λ0，且初始权衡参数λ0选择模型训练时最大权衡参数λ
max
的二分之一时，即其余参数为λ
max
的二十分之一，十分之一，四分之一和五分之四。此外，将这5对权衡参数和码率数据带入λ＝α(e
βr-1)，拟合出α和β。并额外记录初始权衡参数λ0时平均码率r
avg0
的值。
[0018]
然后，对于任意输入图像，将初始权衡参数λ0送入网络，获得编码器输出数据的香农熵r0，通过计算获得ρ。此时个体r-λ模型中α，β和ρ均已知。
[0019]
最后，对于给定目标码率r
target
，带入个体r-λ模型中，即可获得应该送入网络的权衡参数此时，网络输出的码率将很接近目标码率，从而实现了码率控制。
[0020]
本发明是第一次实现基于超先验可变码率压缩网络的码率控制方法。为了验证本发明的有效性，针对三个不同的超先验可变码率压缩网络进行测试，码率控制的平均相对误差在百分之一到百分之三之间。

技术特征：
1.一种基于超先验可变码率图像压缩的个体r-λ模型码率控制方法，其特征在于：对于任意图像，利用训练好的图像压缩模型，使用至少5个权衡参数对多张图像分别进行编解码，获得码率，并计算每个权衡参数下的平均码率；每个权衡参数和对应平均码率构成一组数据，利用多组数据拟合出平均r-λ模型中的参数α和β；将拟合出的参数α和β代入个体r-λ模型，即可根据给定的目标码率r
s
计算出对应输入图像的、应该送入图像压缩模型的权衡参数λ
s
，实现码率控制。2.根据权利要求1所述的一种基于超先验可变码率图像压缩的个体r-λ模型码率控制方法，其特征在于：所述的平均r-λ模型为：λ＝α(e
βr-1)其中，α和β是待拟合的参数。3.根据权利要求1或2所述的一种基于超先验可变码率图像压缩的个体r-λ模型码率控制方法，其特征在于：利用不同的训练好的图像压缩模型拟合的α和β不同。4.根据权利要求1或2所述的一种基于超先验可变码率图像压缩的个体r-λ模型码率控制方法，其特征在于：权衡参数必须包含初始权衡参数λ0，且初始权衡参数λ0选择图像压缩模型训练时，最大权衡参数λ
max
的二分之一，即的二分之一，即其余四个权衡参数任选。5.根据权利要求1或2所述的一种基于超先验可变码率图像压缩的个体r-λ模型码率控制方法，其特征在于：设计个体r-λ模型为：其中，α和β为平均r-λ模型拟合的结果，ρ为初始权衡参数λ0时，编码器输出数据的香农熵r0与平均码率r
avg0
的比值，即

技术总结
本发明针对基于超先验可变码率图像压缩方法无法针对目标码率快速给出网络应该输入的权衡参数的问题，提出了一种基于超先验可变码率图像压缩的个体R-λ模型码率控制方法。本方法首先针对基于超先验模型的可变码率压缩框架，通过挖掘测试样本集合的码率与失真优化中的权衡参数λ之间的关系，提出了平均R-λ模型；然后，假设个体R-λ模型与平均R-λ模型共享相同的结构，构建了自适应个体图像分布特性的个体R-λ模型，并在此基础上建立基于个体R-λ模型的码率控制算法，该算法通过调整权衡参数λ调节编码比特率，实现码率控制。本发明实现了对于任意图像，给定目标码率下，快速计算出应该输入网络的权衡参数，且码率控制的码率平均相对误差在百分之一到百分之三之间。平均相对误差在百分之一到百分之三之间。平均相对误差在百分之一到百分之三之间。

技术研发人员：施云惠张康富王瑾尹宝才
受保护的技术使用者：北京工业大学
技术研发日：2022.06.06
技术公布日：2022/8/30

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：施云惠张康富王瑾尹宝才
技术所有人：北京工业大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。