1.一种基于一对多网络的减少图像压缩效应的方法,其特征在于,主要包括输入JPEG压缩图像(一);建议组件生成无伪影的候选图像(二);测量组件评估输出质量(三)。
2.基于权利要求书1所述的一对多网络,其特征在于,它被分解为建议元件和测量元件;建议组件以JPEG压缩图像作为输入,然后输出一系列无伪影的候选图像,由测量组件进一步估计其输出质量;一对多网络实现了从一个JPEG压缩图像有效地恢复无伪影的图像,为用户提供一系列高质量的候选图像,并让用户选择他们所喜欢的图像。
3.基于权利要求书1所述的输入JPEG压缩的图像(一),其特征在于,利用MATLAB的JPEG编码器生成JPEG压缩图像;JPEG编码器首先将图像分为8×8个编码块,然后对每个块应用离散余弦变换(DCT);在DCT之后,64个DCT系数中的每一个与量化表一起被均匀地量化;解码时,JPEG解码器对量化系数执行逆DCT以获得像素值。
4.基于权利要求书1所述的建议组件生成无伪影的候选图像(二),其特征在于,建议组件提供了一个F模型,将映射F开发为深层CNN;要启用一对多属性,在网络中引入辅助变量Z作为隐藏的附加输入;网络采用压缩图像Y作为输入;同时它从具有标准偏差1的以零为中心的正态分布对Z进行采样,然后将Y和Z两者馈送到网络中以进行非线性映射;
压缩图像Y和采样的Z作为两个不同分支的输入,这两个分支的输出被级联;在级联特征映射之上,进一步执行聚合子网络以生成无伪影预测;
在建议组件中,每个分支包含5个剩余单元,并且聚合子网络包括10个剩余单元;每一个剩余的单位包括两个批量规范化层,两个ReLU层和两个卷积层;
在将压缩图像转发到网络之前,通过步幅-2的4×4卷积层对其进行下采样;最后,网络输出由步幅-2的4×4解卷积层上采样,以保持图像大小。
5.基于权利要求书4所述的上采样,其特征在于,使用滤波器大小为4的步幅-2解卷积层进行上采样,将过滤器表示[w1,w2,w3,w4];假设对一个输入的常数[…,c,…]应用解卷积,其中c是标量;预期输出应该是常量;然而,实际输出是c*;如果要求实际输出满足预期输出,则训练的过滤器应该满足w1+w3=w2+w4;
要使最终输出为常数,可应用“移动和平均”策略,在获得解卷积输出(表示为deconv)之后,执行以下两个步骤:
1)重复deconv并将其右移1像素;
2)平均deconv和移位版本。
6.基于权利要求书1所述的测量组件评估输出质量(三),其特征在于,从建议组件获得一个输出后,采用测量组件估计是否令人满意,因此定义了三个测量损失函数:感知损失,自然损失和JPEG损失。
7.基于权利要求书6所述的感知损失,其特征在于,用于图像分类的预训练的深度网络的特征可以很好地描述感知信息;从较低层提取的特征倾向于保留照片上准确的信息,而较高层特征对颜色,纹理和形状差异不变;因此,感知损失被定义来促进和X共享类似的高层特征:
其中,φ是从网络计算的功能,Hφ是特征尺寸。
8.基于权利要求书6所述的自然损失,其特征在于,我们希望尽可能恢复无伪像的图像为“自然”图像,因此构建一个附加网络D来区分图像是从建议组件F生成还是一个自然图像;网络D执行二进制分类,并输出输入为“自然”的概率;将这个概率作为测量分量的第二损失加到的负对数上,激励具有高概率:
网络D也需要训练,它使用二进制熵损失作为其优化目标:
从公式(2)和公式(3)可以看出,网络F和网络D彼此竞争:网络F试图生成无伪影的图像其对于网络D难以与自然图像区分,同时训练网络D,避免网络F产生伪像。
9.基于权利要求书6所述的JPEG损失,其特征在于,JPEG标准由各种预定义的参数组成,通过利用这些参数,我们可以获得像素值的下限和上限;对于压缩,JPEG编码器通过量化表划分输入图像的DCT系数,然后将结果舍入到最接近的整数;JPEG解码器乘以后面的量化表进行减压;因此,压缩图像Y和对应的未压缩图像X之间的关系可以表示为:
其中,Xdct和Ydct分别是X和Y的DCT系数,Q是量化表,i和j是在DCT域的指标,公式(4)暗示我们写下以下的DCT系数范围约束:
所以每个恢复的无伪影图像也应满足式(5),我们提出以下JPEG损失:
其中,是的尺寸;可以看出,JPEG损失是截短的L2损失;DCT系数落在下限/上限之外(如:)的重构图像将被惩罚。
10.基于权利要求书6所述的三个测量损失函数,其特征在于,通过合并这三个损失函数来建立测量组件:
一对多网络使用批量梯度下降进行优化;图像准备为网络输入大小相同的的补丁;将λ1设置为0.1,λ2则需要一些特殊处理;JPEG编码器分别对每个8×8非重叠编码块执行量化;而对于与编码块边界未对准的片,我们不能获得其DCT系数;因此,我们根据给定的补丁设置不同的λ2值;一般来说,网络训练在每个迭代过程中包括两个主要步骤:
1)修正建议分量F,用方程(3)优化判别网络D;
2)修正网络D,用测量分量(即公式(7))优化提议分量F;如果输入块与JPEG编码块边界对准,则将λ2设置为0.1;否则将λ2设置为0。