一种基于截断DCT域系数的复制粘贴盲取证方法与流程

文档序号:11277330阅读:366来源:国知局
一种基于截断DCT域系数的复制粘贴盲取证方法与流程

本发明涉及数字图像的复制粘贴盲取证领域,尤其涉及一种基于截断dct(discretecosinetransform,离散余弦变换)域系数的复制粘贴盲取证方法。



背景技术:

随着互联网技术和多媒体技术的不断发展、数码相机的大量普及、以及图像编辑软件如photoshop等的广泛应用,人们对图像进行修改、编辑以及存储变得越来越容易。若伪造的数字图像改变了原有的信息,而被广泛应用在新闻媒体、科学研究、法庭证物等领域,将影响政治、经济和社会的稳定[1]。基于此现象而发展的图像盲取证技术具有广阔的应用前景,近几年已成为图像处理领域研究的热点问题之一。

图像的篡改方式众多,其中一种最常被使用的篡改方式为同幅图像内的复制粘贴篡改,即复制图像中的某一部分将其粘贴到该幅图像内的另一区域中,且两者没有任何的交集。一般情况下,因为同一幅图像的色彩、亮度都不会有很大的变化,因此篡改部分将很难引起人们的察觉。

目前,复制粘贴盲取证技术分为三类:基于图像像素点的匹配、自相关检测法以及基于图像块的匹配[2]

1、基于图像像素点的匹配:通过对图像像素点进行遍历比较来检测篡改区域。此方法原理简单、精确度高、逻辑链简单,对于没有经过任何后处理操作的复制粘贴图像检测效果明显,但是计算量巨大,鲁棒性极其不好。

2、自相关检测法[3]:其原理是复制和粘贴的图像块具有完全相同或相似性,因而具有很强的自相关性。该算法比较简单,计算的复杂度也不是很大,但当此算法适用于被复制粘贴篡改的区域尺寸小于整幅图像的25%的情况时,常出现准确率不高等情况。

3、基于图像块的匹配:通过寻找图像块中相同或相似块对的算法来对篡改区域进行检测定位。此算法原理简单,易于实现且适用广泛。

三类算法各有优劣,但由于基于图像块的匹配能够一定程度上降低时间复杂度,并具有较好地检测效果及一定的鲁棒性而得到广泛应用[4]

通过对上述的分析发现,复制粘贴盲取证领域目前面临的主要挑战为:算法的时间复杂度过高、以及对各种常用的后处理操作的鲁棒性不好,限制了实际应用范围。



技术实现要素:

本发明提供了一种基于截断dct域系数的复制粘贴盲取证方法,本发明有效地降低了时间复杂度以及具有更强的鲁棒性,可以应用于任何基于复制粘贴篡改方式的盲取证,详见下文描述:

一种基于截断dct域系数的复制粘贴盲取证方法,所述方法包括以下步骤:

对各子图像块分别进行dct变换操作,使用量化系数对各子图像块进行处理,再进行z字形扫描并进行截断操作,得到特征向量,按照滑动顺序将特征向量保存到矩阵a中;

对矩阵a进行字典排序得到矩阵b,并对矩阵b的每一个行向量,都与相邻的行向量进行匹配检测,若近似相同,计算转移向量;

遍历所有判定为近似相同的行向量对,获取所有的转移向量,从中找出主转移向量,去除与主转移向量不同的子块,剩余子块即为复制粘贴的篡改部分;

标识出待检测图像中被复制、粘贴区域,通过开操作去除孤立块,输出图像。

其中,判断近似相同的步骤具体为:

条件1:特征分量

判断是否成立,如果是,继续比较下一个特征分量;如果否,判定两个特征向量是不相同的;abs为绝对值符号,为特征分量;

条件2:特征分量

1)计算同时改变maxr和minr的值:如果maxr<rl,则maxr=rl;如果minr>rl,则minr=rl;

2)判断maxr-minr<t是否成立,如果成立,则继续比较下一个特征分量,反之则直接判定这两个特征向量不相同;

获取同时满足上述条件1、条件2的两个特征向量,该两个特征向量是近似相同的。

其中,所述计算转移向量的步骤具体为:

其中,d为转移向量,(x1,y1),(x2,y2)是两个图像子块的左上角位置。

其中,所述主转移向量具体为:

遍历所有判定为近似相同的行向量对,计算出各转移向量,对所有的转移向量进行概率统计,选取各转移向量中频率出现最多的转移向量作为主转移向量。

其中,所述方法还包括:

当不存在与主转移向量不同的子块时,表明待检测图像没有复制粘贴篡改。

本发明提供的技术方案的有益效果是:

1、选取量化截断的dct系数作为每个子块的特征向量,有效地降低了时间的复杂度;

2、对于添加高斯白噪声以及高斯模糊等篡改后常用的后处理操作,具有一定的鲁棒性;

3、通过找到所有相似匹配块的最大的主转移向量以及形态学上的开操作处理,提高了检测的精确度。

附图说明

图1为一种基于截断dct域系数的复制粘贴盲取证算法的流程图;

图2为z字形扫描顺序示意图;

图3为图像的复制粘贴区域对应相似块之间的转移向量示意图;

图4为各种不同复制粘贴篡改情况下的检测样例的示意图;

其中,(a)为被复制部分与粘贴的部分位于水平位置;(b)为被复制部分与粘贴的部分位于垂直位置;(c)为被复制部分与粘贴的部分位于正对角位置;(d)为被复制部分与粘贴的部分位于反对角位;(e)为被复制部分与粘贴的部分为不规则区域。此外,图像分为三栏,从左到右分别为原始图像,被篡改后的图像以及利用本方法检测出的效果图。

图5为抗噪声干扰的鲁棒性检测样例的示意图;

其中,(a)为信噪比为35db的加性高斯白噪声处理图像及测试结果;(b)为信噪比为25db的加性高斯白噪声处理图像及测试结果;(c)为信噪比为15.035db的加性高斯白噪声处理图像及测试结果。此外,图像分为三栏,从左到右分别为只经过复制粘贴篡改后的图像,经过复制粘贴篡改后再添加加性高斯白噪声后的图像以及利用本方法检测出的效果图。

图6为抗模糊处理的鲁棒性检测样例的示意图;

其中,(a)为参数设置为:n1=n2=5,σ2=1的高斯模糊处理后的待检测图像及其检测结果;(b)为参数设置为:n1=n2=5,σ2=2的高斯模糊处理后的待检测图像及其检测结果。此外,图像分为三栏,从左到右分别为只经过复制粘贴篡改后的图像,经过复制粘贴篡改后再添加高斯模糊后的图像以及利用本方法检测出的效果图。

图7为三种算法的检测性能比较的示意图;

图8为三种算法的时间复杂度比较的示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步地详细描述。

为了解决以上问题,需要能够全面、自动、准确提取子块的特征并进行定位与检测的算法。研究表明:dct变换的能量压缩特性可以使得在仅保留低频系数的情况下保留大部分重要信息,这在经过量化后系数矩阵中体现得更为明显,可以选择截断量化的dct系数作为每个子块的特征[5]

实施例1

本发明实施例提出了基于截断dct域系数的复制粘贴盲取证方法,参见图1,该方法包括以下步骤:

101:对各子图像块分别进行dct变换操作,使用量化系数对各子图像块进行处理,再进行z字形扫描并进行截断操作,得到特征向量,按照滑动顺序将特征向量保存到矩阵a中;

102:对矩阵a进行字典排序得到矩阵b,并对矩阵b的每一个行向量,都与相邻的行向量进行匹配检测,若近似相同,计算转移向量;

103:遍历所有判定为近似相同的行向量对,获取所有的转移向量,从中找出主转移向量,去除与主转移向量不同的子块,剩余子块即为复制粘贴的篡改部分;

104:标识出待检测图像中被复制、粘贴区域,通过开操作去除孤立块,输出图像。

其中,步骤102中的判断近似相同的步骤具体为:

条件1:特征分量

判断是否成立,如果是,继续比较下一个特征分量;如果否,判定两个特征向量是不相同的;abs为绝对值符号,为特征分量;

条件2:特征分量

1)计算同时改变maxr和minr的值:如果maxr<rl,则maxr=rl;如果minr>rl,则minr=rl;

2)判断maxr-minr<t是否成立,如果成立,则继续比较下一个特征分量,反之则直接判定这两个特征向量不相同;

获取同时满足上述条件1、条件2的两个特征向量,该两个特征向量是近似相同的。

其中,步骤103中的主转移向量具体为:

遍历所有判定为近似相同的行向量对,计算出各转移向量,对所有的转移向量进行概率统计,选取各转移向量中频率出现最多的转移向量作为主转移向量。

综上所述,本发明实施例通过上述步骤101-步骤104有效地降低了时间复杂度以及具有更强的鲁棒性,可以应用于任何基于复制粘贴篡改方式的盲取证,满足了实际应用中的多种需要。

实施例2

下面结合具体的实例、数学公式对实施例1中的方案进行进一步地介绍,详见下文描述:

201:将待检测图像i转换为灰度图像,并划分为若干个子图像块;

例如:设待检测图像i的大小为m×n,选取滑动块的大小为b×b,使其从待检测图像i的左上角开始按照从左到右,从上到下的顺序,以一个像素为单位依次进行滑动,最终达到待检测图像i的右下角,最终可得sum=(m-b+1)(n-b+1)个子图像块。

具体实现时,首先判断待检测图像i是否为灰度图像,如果不是则将其转换为灰度图像。本发明实施例用到的所有的实验图像都是来自t.-t.ng等人发布的数字图像取证的图像测试集[6],所有的图像都为大小为128×128的灰度图像,保存格式为bmp。在参数选取时,选取m=n=128,b=8。

具体实现时,还可以选用其他的测试集,本发明实施例对m、n以及b的取值不做限制,根据实际应用中的需要进行设定。

202:对获得的各子图像块分别进行dct变换操作,并使用量化系数q对各子图像块进行量化处理,而后再进行z字形扫描(如图2所示)并进行截断操作,得到所有子块的特征向量[p·b2],然后按照滑动顺序将所有子块的特征向量保存到矩阵a中;

例如:对于d×d大小的数字图像f(x,y),其dct变换及其idct(inversediscretecosinetransform,逆离散余弦变换)变换分别为:

其中,u,v=0,1,2,…,d-1,x,y=0,1,2,…,d-1。a(u)和a(v)为中间变量。

在上述公式中,当u=v=0时,余弦值取1,有这个分量为变化后的dct系数的最大值,也称为直流分量,其他系数都称为交流分量。

变换后的dct系数矩阵,从左上角到右下角对应的频率由直流和低频分量,向高频分量变化,并且在实际情况中,dct系数矩阵的较大值都集中在直流和低频分量中。特别的是,量化后高频系数基本上全变成了0。

因此,可以根据该特性来对特征向量进行降维处理,即每个子块的dct系数只考虑低频部分。然而,在dct的特征向量中不能再以矩阵的形式保存,必须将变换后的系数按照从低频到高频的顺序进行排列,这样才会方便降维和之后的匹配处理。因此,必须将量化的dct系数矩阵按照zigzag的排列方式进行扫描成一个大小为1×b2的行向量,并将p(0<p≤1)(本例中p=0.25)作为截断因子截断保留k(k=[p×b2])个分量(本例中k=16)。

特征向量在截断前还会被量化系数q量化,即特征向量中的每个分量都除以q然后取整。则经过量化和降维处理之后的特征向量为:

203:对特征向量矩阵a进行字典排序得到矩阵b,其大小为(m-b+1)(n-b+1)×[p·b2],并对矩阵b的每一个行向量都与其相邻的nf个行向量进行匹配检测,其中nf应满足:j-i<nf≤(m-b+1)(n-b+1),(本例中nf=3)如果匹配结果为近似相同,则计算两者之间的转移向量;

在寻找相似子块之前,首先对特征向量矩阵a进行字典排序得到矩阵b,随即两两比较它们之间(即特征向量矩阵a排序后的矩阵b之间)的相似程度,如果判断为近似相同,则对应的两子块判定为相似子块对,然后记录相似子块对之间的转移向量d:

其中(x1,y1),(x2,y2)是两个图像子块的左上角位置的坐标。复制粘贴区域对应子块间具有统一的转移向量,如图3所示。

下面详细介绍两个行向量进行匹配检测的具体过程:

当待检测图像经过压缩、加噪,模糊等攻击后,那么被复制子块的特征向量与粘贴子块的特征向量可能不是完全相等的,而是很相似的。因此需要在此引入一种判断子块对应特征向量是否相同的方法。如果两个子块的特征向量的每个对应的分量是几乎相等的,则可认为这两个子块是近似相关的。

下面用一个具体的实例来说明判断两个子块对应的特征向量是否近似相同的具体过程:

例如:分别为两个子块的特征向量,判断该两个子块的对应的特征向量是否近似相同的过程如下:

其中,s和t这两个参数在编程时被预定义,maxr被初始化一个足够小的数,minr被初始化成一个足够大的数,分别为特征分量。那么具体的判断流程为:

条件1:对于每个1≤l≤k,

判断是否成立,如果是,继续比较下一个特征分量;如果否,判定两个特征向量是不相同的;

其中,abs为绝对值符号;本发明实施例中s=4,具体实现时,还可以根据实际应用中的需要对s的取值进行设定,本发明实施例对此不做赘述。

条件2:对于每个1≤l≤k,

1)计算的值,同时对应改变maxr和minr的值:如果maxr<rl,

则maxr=rl;如果minr>rl,则minr=rl;

2)判断maxr-minr<t(本例中t=0.0625)是否成立,如果成立,则继续比较下一个特征分量,反之则直接判定这两个特征向量不相同。

具体实现时,还可以根据实际应用中的需要对t的取值进行设定,本发明实施例对此不做赘述。

获取同时满足上述条件1、条件2的两个特征向量,该两个特征向量是近似相同的。

204:遍历所有判定为近似相同的行向量对,并统计出所有的转移向量,扫描所有的转移向量,找出其中的主转移向量,再去除所有与主转移向量不同的对应子块,剩余的子块即可判定为复制粘贴的篡改部分,如果没找到,即可判断该待检测图像中没有出现复制粘贴篡改,流程结束,反之转入下一步;

对于去除错误匹配的子块对,可以使用确定主转移向量的方法来实现精准复制粘贴区域判定。其原理是复制区域d1和粘贴区域d2都具有统一的转移向量,如图3所示,而与极少数的相似区域所产生的转移向量相比,复制粘贴区域d1,d2的转移向量占绝大多数,所以去除那些个别少数的转移向量,所留下的对应的子块对区域极为复制粘贴部分。

下面详细介绍一下找出主转移向量的具体过程:

遍历所有判定为近似相同的行向量对,计算出各转移向量d,对所有的转移向量d进行概率统计,选取各转移向量d中频率出现最多的转移向量作为主转移向量。

205:分别标识出待检测图像中的被复制区域和粘贴区域,使用开操作去除地图上可能的孤立块,然后将处理完的图像可视化输出,流程结束。

由于特征向量经过了截断和量化,可能会有一些误检出来的孤立区域,因此,采用形态学上的开操作[7],以移除一些孤立的块。

具体移除孤立块的步骤为本领域技术人员所公知,本发明实施例对此不做赘述。

综上所述,本发明实施例通过上述步骤201-步骤205有效地降低了时间复杂度以及具有更强的鲁棒性,可以应用于任何基于复制粘贴篡改方式的盲取证,满足了实际应用中的多种需要。

实施例3

下面结合具体的计算公式、图4-图8对实施例1和2中的方案进行可行性验证,详见下文描述:

本实验用到的所有实验的自然图像都来自t.-t.ng等人发布的用于数字图像取证的图像测试集[6],其中所有的图像都为大小为128×128像素,均为灰度图像,保存格式为bmp。

为了测试检测算法能够检测篡改区域位置的精确度,如下一些参数被计算。记输入篡改图像的复制区域为d1,粘贴区域为d2,检测算法检测出来的复制区域为r1,粘贴区域为r2,有效检测acc,无效检测f分别定义为:

其中,|.|为一个区域的面积,∩为两个区域的交集,∪为两个区域的并。acc和f体现了检测算法检测出的区域和待检测图像中实际存在的篡改区域的接近程度。

实验中将本算法与以下两种算法进行对比:

fridrich算法[2],其图像特征块的处理方式为dct;

popescu算法[8],其图像特征块的处理方式为pca(principalcomponentanalysis)。

为了更好的验证本算法对于复制粘贴篡改检测的准确性,对选取的300张自然图像进行了复制粘贴篡改,并且综合考虑了各种可能的篡改情况,对得到的所有的有效检测acc,无效检测f作平均处理,得到平均有效检测平均无效检测

此外,为了验证本算法的鲁棒性,分别进行了噪声添加及模糊处理等操作,如图5和图6所示,并将各算法的检测性能进行了列表比较,如图7所示。当对待检测图像添加高斯噪声后的信噪比snr=35或25db时,检测效果与添加噪声前的检测效果检测一致;但当snr小于20.035时,检测效果急剧下降。

通过与popescu算法进行比较发现,popescu算法在信噪比低于25db时,检测效果就会急剧变差,因此本算法在抗噪声处理上具有更好的鲁棒性;当对待检测图像进行高斯模糊处理时,其中参数设置为:n1=n2=5,σ2=1或者σ2=2,检测效果也很好,可以验证本算法在抗模糊处理上也具有一定的鲁棒性。此外,将三种算法的时间复杂度进行了比较,如图8可知,本算法在一定程度上降低了时间复杂度。综上,实验结果验证了本方法的可行性与优越性。

参考文献:

[1]周琳娜.数字图像盲取证技术研究[d].北京邮电大学,2007.

[2]j.fridrich,d.soukal,j.lukas.detectionofcopy-moveforgeryindigitalimages[a].in:proceedingsofthedigitalforensicresearchworkshop[c],usa,2003:1-10.

[3]单薇.基于复制粘贴的数字图像篡改检测研究[d].苏州大学,2014.

[4]赵俊红.图像内容被动取证技术的研究[d].华南理工大学,2011.

[5]s.a.khayam.thediscretecosinetransform(dct):theoryandapplication[m].uppersaddleriver,nj,usa:prenticehallpress,aug.2003,32-41.

[6]t.-t.ng,j.hsu,s.-f.chang.columbiaimagesplicingdetectionevaluationdataset,http://www.ee.columbia.edu/ln/dvmm/downloads/authspliceddataset/authspliceddataset.htm.

[7]rafealc.gonzalez,richarde.woodsp.,“digitalimageprocessing”,edition2nd,addison-wesleypp.528-532,1992.

[8]a.popescu,h.farid.exposingdigitalforgeriesbydetectingduplicatedimageregions[r],technicalreporttr2004-515,dartmouthcollege,2004.

本领域技术人员可以理解附图只是一个优选实施例的示意图,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1