本发明涉及数字图像取证技术领域,更具体地,涉及一种基于频谱分析和差分图像极值点距离分布的jpeg图像下采样因子估计方法。
背景技术:
近年来,随着图像编辑软件和处理技术的快速发展,不会留下视觉痕迹的数字图像内容篡改变得越来越容易,如果数字图像被恶意篡改传播,必然会对人们的生活造成恶劣的影响。这种现状就要求数字图像取证技术对数字图像能够进行准确的辨别。因此,如何实现数字图像在传播、共享和应用过程中的内容真实性和安全性的可靠认证具有重要的实际意义。
图像重采样检测是数字图像取证技术的一个重要分支。当一幅图像被篡改时,例如拷贝某幅图像的一部分到原始图像中,通常需要进行几何变换如缩放、旋转、拉伸等操作来掩盖篡改痕迹。而几何变换往往涉及到插值和重采样操作,图像重采样检测即是检测图像是否存在几何变换痕迹。有效的数字图像重采样检测技术在信息安全体系中发挥着非常重要的作用。图像重采样检测技术主要可以应用在:司法刑侦取证、保险理赔、新闻等应用领域中。
现有的图像重采样检测技术主要分为两种:一种基于像素相关性的方法,这类方法基于图像重采样中插值过程中相邻像素之间存在相关性,这种相关性体现为差分图像的二阶统计特征存在周期性。通过dft,这种周期性可以通过频谱的方式展现出了;另一种方法是基于机器学习,例如基于标准化能量密度的检测方法,该方法检测不同窗口大小的二阶差分图像的频率域标准化能量密度并将该特征用于训练svm分类器,但该方法并不适用于参数估计和jpeg压缩图像。
技术实现要素:
jpeg是目前最为主流的的图像格式。由于jpeg是有损压缩的,jpeg块效应会导致重采样检测方法检测到周期性的jpeg峰值,并且下采样的检测特征较弱。因此传统重采样检测技术很难有效取证jpeg图像下采样。本发明的目的在于克服现有技术的不足,提供一种基于频谱分析和差分图像极值点距离分布的jpeg图像下采样因子估计方法,能够有效地检测待测数字图像是否经过下采样操作,并估计其缩放因子。具有高效和鲁棒性高的优点。
为解决上述问题,本发明提供的技术方案为:一种基于频谱分析和差分图像极值点距离分布的jpeg图像下采样因子估计方法,其中,包括以下步骤:
s1.对待测图像进行色彩通道选择:如果待测图像是灰度图像则直接进行s2步骤,如果训练图像是彩色图像,则首先选择g通道再进行s2步骤;
s2.对s1步骤得到的图像计算其差分的局部极值点,并获取其相邻极值点距离的分布:对差分图像进行局部极值滤波,并计算相邻极值点的距离分布;
s3.获取下采样因子区间估计:对经过s2步骤得到的分布图并计算峰值周期t,得到区间估计
s4.计算差分频谱;对s1步骤得到的图像计算其差分的平方,再计算2d傅里叶变换并得到能量频谱图;
s5.获取下采样峰值点:结合s3得到的区间估计和s4的频谱图,选择满足估计区间的最高峰值点;
s6.估计下采样因子:s5得到的下采样峰值位置为p,则下采样因子估计值为
在本发明中,首次提出在差分图像极值点距离分布进行数字图像重采样篡改检测,充分利用了jpeg图像的块效应,能有效估计下采样区间。弥补了频谱估计方法的不确定性。
进一步地,所述的s3步骤具体包括:
s31.获得随机变量序列{xn},
s32.计算频率
s33.绘制p{i}的离散分布图,并对其进行x2检验是否服从几何分布,如果服从几何分布即检测不到jpeg块效应,否则计算峰值周期t。
进一步地,所述的s4步骤具体包括:
s41.对s1步骤得到的图像进行卷积操作,卷积核定义为[1,-2,1],得到差分图像;
s42.计算差分图像的平方,然后计算每列信号的方差得到特征向量[v1,v2,…,vn],;
s43.计算s42步骤得到的特征向量的傅里叶变换以及其频谱图;
进一步地,所述的s5步骤具体包括:
s51.根据s3所得区间估计限定s4所得频谱的频率区间:s3所得下采样因子区间估计为
因此频率区间为
s52.选择s51所得频率区间内具有最强频谱强度的频率fn
s53.计算下采样因子,其公式为
与现有技术相比,有益效果是:本发明首先计算差分图像极值点距离分布,充分利用了jpeg图像的块效应,能有效估计下采样区间。通过极值点距离分布得到的下采样区间估计来选定下采样峰值,以此获取下采样因子的最终估计。因此该算法解决了jpeg图像的下采样检测且检测准确率相较于现有算法有了极大的提升。
附图说明
图1为本发明方法流程图。
图2为本发明实施例中差分图像极值点距离分布直方图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本专利的限制。
如图1所示,一种基于频谱分析和差分图像极值点距离分布的jpeg图像下采样因子估计方法,其中,包括以下步骤:
步骤1:选取图像测试数据集:
本实例中使用dresden图像集中500幅原始未压缩图像。为避免图像中可能存在的cfa差值痕迹,每张图像都首先使用最近邻插值核缩小2倍。
步骤2.对待测图像进行色彩通道选择:测试图像集中所有图像都是彩色图像,则首先选择g通道再进行后续操作;
步骤3.对步骤2得到的图像计算其差分的局部极值点,并获取其相邻极值点距离的分布:对差分图像进行局部极值滤波,并计算相邻极值点的距离分布;
具体的处理过程如下:
s31.对步骤2得到的图像进行卷积操作,卷积核定义为[-11],得到差分图像;
s32.对s31得到的差分图像进行极值滤波,序列{xn}极值点定义为
xm={xn|xn>xn+δorxn>xn+δ}
δ为预设参数,在本算法内设定为4,找出所有极值点,计算水平方向上相邻极值点的距离,获得随机变量序列{xn},
s33.计算频率
s33.绘制p{i}的离散分布图,并对其进行x2检验是否服从几何分布,如果服从几何分布即检测不到jpeg块效应,否则必然存在周期性的jpeg块效应峰值,计算峰值周期t。
s34.获取下采样因子区间估计:对经过s3步骤得到的分布图并计算峰值周期t,得到区间估计
步骤4.计算差分频谱;对s1步骤得到的图像计算其差分的平方,再计算2d傅里叶变换并得到能量频谱图;
具体的处理过程如下:
s41.对s1步骤得到的图像进行卷积操作,卷积核定义为[1,-2,1],得到二阶差分图像;
s42.计算差分图像的平方,然后计算每列信号的方差得到特征向量[v1,v2,…,vn],;
s43.计算s42步骤得到的特征向量的傅里叶变换以及其能量频谱图;
步骤5.获取下采样峰值点:结合s3得到的区间估计和s4的频谱图,选择满足估计区间的最高峰值点;
进一步地,所述的s5步骤具体包括:
s51.根据s3所得区间估计限定s4所得频谱的频率区间:s3所得下采样因子区间估计为
因此频率区间为
s52.选择s51所得频率区间内具有最强频谱强度的频率fn
步骤6.估计下采样因子:s5得到的下采样峰值位置为p,则下采样因子估计值为
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。