本申请涉及信息,尤其涉及一种图像预处理模型的训练、图像压缩方法、设备及计算机可读介质。
背景技术:
1、图像压缩、编码是日常应用中一项非常重要的技术,其中以jpeg(jointphotographic experts group,联合图像专家组)压缩方法,也就是jpeg/jpg格式的图像文件所对应的压缩编码方法最为常见。以一幅分辨率为1920×1080的彩色照片为例,如果不经过图像压缩,那么这张照片将要消耗约6mb的存储空间,1gb的存储最多只能存放不到200张照片。而存储为jpeg格式后,一般只需要以一定程度的图像质量损失为代价,就可以大大压缩图片的文件体积,例如1920x1080的图像在普通压缩率的处理下一般只需要100多kb的存储空间即可存储这张图像。
2、jpeg本身是一种信息有损的图像压缩技术,采用1~99来表示压缩质量因子,在压缩之前指定。压缩质量因子越高则压缩结果相较于原图的psnr(peak signal-to-noiseratio,峰值信噪比)越高,同时产生的文件大小也相对大一些;压缩质量因子越低则压缩结果相较于原图的pnsr越低,往往图像质量也越差,同时生成的压缩图像文件也越小。
3、jpeg标准已经有二三十年的历史了,是目前世界上应用最广泛的图像压缩标准。目前学术界及工业界也相继推出了一些新的图片压缩方案,例如heif(high efficiencyimage file format,高效率图像文件格式)、或是被视为jpeg继承者的jpeg-xl等等。虽然新压缩方案能够取得更高的压缩效率,不同的压缩方案之间基本都存在兼容性问题,因此会由于兼容性问题在实际应用和推广的过程中遇到各种各样的障碍。例如jpeg-xl相较jpeg能够取得更高的压缩效率,并且能够兼容jpeg编码,也就是说将jpeg转换成jpeg-xl不会损失图像精度,但其最大问题在于要支持jpeg-xl的解码则必须使用新的图像解码器,这使得一些老旧的设备或者系统需要进行相应的升级才能使用这一新标准。
4、因此,另一种提升压缩效率的思路是在jpeg压缩链路中进行一些改造来提升方法本身的压缩效率。例如一些方案中,采用先平滑后锐化的方式,将图像中不起眼的细小纹理进行抑制或抹除,并增强其他相对显著的纹理。但是采用这种方案一来很难平衡对图像中信息和噪声的控制,一旦控制不当则非常容易产生出另人眼感到不适的效果(例如过度锐化或者过度平滑),二来这种方案相较于直接对原始图像进行压缩而言,往往难以取得较高的psnr,因此实际效果不佳。
技术实现思路
1、本申请的多个方面提供一种模型训练、图像压缩方法、设备及计算机可读介质,用以解决目前的方案无法兼顾方案兼容性和压缩效率的问题。
2、本申请的一方面,提供了一种图像预处理模型的训练方法,其中,所述方法包括:
3、将训练集中的样本图像输入预处理模型,获取经过预处理的输出图像,并计算所述输出图像与样本图像之间的均方差;
4、将输出图像从空间域转换为频域,获取关于所述输出图像的频谱信息,并计算所述输出图像的频谱信息的熵;
5、基于输出图像与样本图像之间的均方差、以及所述输出图像的频谱信息的熵,设定损失函数;
6、采用训练集中的样本图像训练所述预处理模型,训练目标为优化所述损失函数至目标值。
7、本申请的另一方面,还提供了一种图像压缩方法,其中,所述方法使用前述图像预处理模型的的方法所训练完成的预处理模型,包括:
8、将原始图像输入所述预处理模型,获取经过预处理的输出图像;
9、将输出图像采用预设的压缩算法进行压缩,获取压缩图像。
10、此外,本申请实施例还提供了一种图像预处理模型的训练设备,其中,所述设备包括:
11、处理模块,用于将训练集中的样本图像输入预处理模型,获取经过预处理的输出图像,并计算所述输出图像与样本图像之间的均方差;将输出图像从空间域转换为频域,获取关于所述输出图像的频谱信息,并计算所述输出图像的频谱信息的熵;基于输出图像与样本图像之间的均方差、以及所述输出图像的频谱信息的熵,设定损失函数;
12、训练模块,用于采用训练集中的样本图像训练所述预处理模型,训练目标为优化所述损失函数至目标值。
13、本申请实施例还提供了一种图像压缩设备,其中,所述设备使用前述图像预处理模型的训练方法所训练完成的预处理模型,包括:
14、预处理模块,用于将原始图像输入所述预处理模型,获取经过预处理的输出图像;
15、图像压缩模块,用于将输出图像采用预设的压缩算法进行压缩,获取压缩图像。
16、本申请实施例还提供了一种电子设备,所述电子设备包括:
17、至少一个处理器;以及
18、与所述至少一个处理器通信连接的存储器;其中,
19、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述的模型训练方法或流量筛选方法。
20、本申请实施例还提供了一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令可被处理器执行以实现前述的模型训练方法或流量筛选方法。
21、本申请实施例所提供的方案中,在训练时将训练集中的样本图像输入预处理模型,获取经过预处理的输出图像,并计算所述输出图像与样本图像之间的均方差,然后将输出图像从空间域转换为频域,获取关于所述输出图像的频谱信息,并计算所述输出图像的频谱信息的熵,基于输出图像与样本图像之间的均方差、以及所述输出图像的频谱信息的熵,来设定损失函数,由此训练使用训练集中的样本图像训练所述预处理模型。其中。训练目标可以设置为优化所述损失函数至目标值,由于损失函数中包括了输出图像与样本图像之间的均方差、以及所述输出图像的频谱信息的熵,其中,所述均方差与处理前后图像的psnr相关,而频谱信息的熵则与输出图像在频谱上的复杂性相关,当优化损失函数后,即可使得预处理模型能够在psnr基本不变的情况下,降低图像的频谱复杂性。
22、在此基础上,使用训练完成的预处理模型对原始图像进行预处理后,再对使用预设的压缩算法其进行压缩处理,可以使得最终获取到的压缩图像,与直接使用原始图像进行压缩处理所获得的压缩图像相比,压缩率更高,且具有相近的图像质量。同时,由于本方案并不对压缩算法本身进行改动,而是对待压缩的原始图像进行预处理,因此兼容性好,不影响原本使用的压缩算法。
1.一种图像预处理模型的训练方法,其中,所述方法包括:
2.根据权利要求1所述的方法,其中,基于输出图像与样本图像之间的均方差、以及所述输出图像的频谱信息的熵,设定损失函数,包括:
3.根据权利要求1所述的方法,其中,所述预处理模型为卷积神经网络。
4.根据权利要求1所述的方法,其中,将输出图像从空间域转换为频域,包括:
5.一种图像压缩方法,其中,所述方法使用权利要求1至4中任一项所述的方法所训练完成的预处理模型,包括:
6.根据权利要求5所述的方法,其中,所述预设的压缩算法为jpeg编码算法。
7.一种图像预处理模型的训练设备,其中,所述设备包括:
8.一种图像压缩设备,其中,所述设备使用权利要求1至4中任一项所述的方法所训练完成的预处理模型,包括:
9.一种电子设备,所述电子设备包括:
10.一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令可被处理器执行以实现如权利要求1至6中任一项所述的方法。