基于小波变换和主成分分析的图像区域篡改检测方法

文档序号:6422944阅读:154来源:国知局
专利名称:基于小波变换和主成分分析的图像区域篡改检测方法
技术领域
本发明属于数字图像取证技术领域,涉及一种基于小波变换和主成分分析的图像区域篡改检测方法。
背景技术
随着图像编辑技术和处理工具的迅速发展,数字图像越来越容易被篡改而使得人眼难以辨识,越来越多高品质、以假乱真的篡改和伪造图像得到广泛传播。由于受到应用场合的限制,以嵌入附加信息为主要思想的主动取证技术已经无法满足图像发展的需要,而数字图像盲取证技术不必事先对图像做任何预处理,依据图像本身统计特征等自然属性的变化来判断图像的真实性,且对图像的拍摄来源没有特定的限制,只需取证方自己就可以进行图像的分析,因此具有更好的实用性。复制-粘贴图像篡改是在同一幅图像内的篡改操作,由于其不会引起图像在亮度、色彩等人眼观察方面比较明显的变化而引起人们视觉上的怀疑,目前已成为一种最简单、最常见的图像篡改技术。对该篡改操作取证的主要依据是,如果图像进行了复制-粘贴篡改操作,则复制区域与其相对应的粘贴区域基本上是相似的,目前此类问题的图像取证技术算法计算量大,鲁棒性较差。

发明内容
本发明的目的是提供一种基于小波变换和主成分分析的图像区域篡改检测方法, 改进了现有技术存在的图像取证技术算法计算量大,鲁棒性较差的问题。本发明所采用的技术方案是,一种基于小波变换和主成分分析的图像区域篡改检测方法,该方法按以下步骤实施,步骤a、判断待检测图像是否为灰度图,若不是,将其转换为灰度图;步骤b、设待检测的灰度图像大小为MXN,将该灰度图像按行从左到右,从上到下的顺序划分为只有一行或一列不相同的、大小为mXn的重叠子块,并用各重叠子块左上角坐标来表示该重叠子块在待测图像中的空间位置,共得到(M-m+1) X (N-n+1)个重叠子块;步骤c、将步骤b分块得到的共(M-m+1) X (N-n+1)个、大小为mXn的各重叠子块进行一次Haar小波变换,得到其低频分量LL1,其大小变为m/2Xn/2 ;步骤d、对步骤c得到的各重叠子块的低频分量LL1进行PCA变换,变换过程中的累积贡献率取为99%,提取各重叠子块的特征向量Vi (i = 1,2,Λ,(M-m+1) X (N-n+1)),并转换为行特征向量矩阵,即每一行表示一个子块的特征;步骤e、对步骤d得到的特征向量矩阵按行进行字典排序,并记录各特征向量所代表的图像子块在原待测图像中的空间位置;步骤f、对步骤e排序后的各特征向量进行相似度匹配,即将特征向量Vi与其相邻 21范围内的所有特征向量v」(j e [i-l,i+l],i兴j)进行Pearson相关系数计算,搜寻Vj 是否 两足
si. arg min (R >= Rth) (2)Δ = U+U > Aift其中,Rth为相关性阈值,用来衡量提取的特征向量之间的相似性;Ath为位移阈值,选取位移阈值Δ Α+ ; 1为搜寻的范围,、若满足O),则将其标记为0,即为待测图像的篡改区域;否则,则标记为1,即为待测图像的正常区域。本发明的图像区域篡改检测方法,其特征还在于,步骤f中,进行相似子块匹配时,采用相关性准则,即计算各图像子块特征向量间的Pearson相关系数,如果块对特征向量间的相关性系数越大,则它们的相似度也就越大,Pearson相关系数计算公式为
_8] R{XJ)= M^xilr J)⑴其中,X和Y是待测图像各子块的特征向量,C(X,Y)为向量X和Y的互协方差, C (X,X)、C (Y,Y)分别是X和Y的自协方差。本发明方法的有益效果是,主要从图像特征向量的降维和判别阈值的设定标准来进行考虑,降低了图像块特征向量矩阵的维数,并缩小了块匹配所需搜索的空间,将小波分解和主成分分析方法结合起来所提取的图像块特征具有很好的鲁棒性。


图1是本发明方法的图像分块过程示意图,其中,a表示第一个图像子块的位置示意图,b表示第二个图像子块的位置示意图,c表示第三个图像子块的位置示意图,d表示第N-I个图像子块的位置示意图,e表示第N个图像子块的位置示意图,f表示第N+1个图像子块的位置示意图,g表示第N+2个图像子块的位置示意图,h表示第(M-I) X (N-I)个图像块(即最后一行右边最后一个)的位置示意图。
具体实施例方式下面结合附图和具体实施方式
对本发明进行详细说明。一般来说,对数字图像内容的篡改都是针对图像中某块重要的连通区域,因此区域复制粘贴篡改的假设如下1)复制的是一个连通的且内部无空洞的区域;2)可以同时有多处复制粘贴,但每个复制的区域只能进行一次粘贴,且粘贴的区域可以根据需要进行几何旋转;3)复制与对应的粘贴区域在空间上有一定的位移,且两者不能有重合的区域;4) 复制的区域应不会太小。那么,图像区域复制粘贴篡改取证实质就是判断篡改图像中是否存在着复制粘贴区域对,并定位出相应区域。一般来说,伪造者对一幅图像经过复制粘贴篡改后,还会对其
4进行一些常见的后续处理操作,如加入噪声、进行JPEG压缩、模糊处理等,从而减弱篡改拼接的痕迹,达到以假乱真的效果。由此复制的区域与粘贴的区域的值就不会完全相等,如果仅仅从像素值上进行比较,取证算法将会失败,因此需要寻求对后处理操作鲁棒性很好的特征来进行检测。因此,本发明基于模糊块匹配法,参照图1中的八个分图,先将待测图像分成各重叠子块,然后对各子块进行DWT变换,得到各图像子块的低频逼近分量作为图像子块的特征向量,然后对各特征向量进行匹配计算,得到初始的匹配结果,并按照规定标定相似的图像块对,再利用数学形态学进行处理,输出最终的检测结果。其算法可描述为(1)重叠子块的划分设待测图像大小为MXN,要将其划分成的各图像子块大小为mXn,(图像子块必须要小于篡改区域,但也不能太小),将待测图像以该大小的像素按照只有1行或1列不相同,从左到右、从上到下的顺序进行划分,则共得到(M-m+1) X (N-n+1)个重叠图像子块。进行重叠图像子块划分时,随着分块的增大,检测的速度加快,但同一阈值条件下,漏检的可能性也增大;相反,若分块太小,虽然检测的准确性有所提高,但检测的计算量增大、检测的速度降低,并且还可能会出现大量的误检现象,因此必须根据待测图像的大小、人工估计的可疑篡改区域以及进行反复的实验来最终确定合适的分块大小。(2)重叠子块的特征提取待测图像经过重叠子块划分后,对各子块分别进行Haar小波变换,得到其低频逼近分量,虽然将小波低频近似系数作为各子块特征和原图像子块相比数据已进行了压缩, 但特征维数还是比较高,数据存在着冗余,如果直接利用它们进行计算,耗时会比较多、效果并非很好,而主成分分析法能够以较少的维数特征来代替原来数据,且基本保留原始数据的信息。因此,为了使数据进一步压缩,采用主成分分析法对各图像重叠子块的小波低频分量进行二次特征提取,同时为保留尽量多的图像信息。(3)图像子块的匹配得到特征向量矩阵后需要对各图像子块进行相似度匹配,即寻找其相似子块,如果图像中存在区域复制-粘贴篡改,则粘贴部分与复制部分相对应的特征向量会比较接近,为了缩小块匹配搜寻范围、提高计算速度,先将特征向量矩阵中的所有向量,按照第一个特征值进行字典排序,并记录各个特征向量所表示图像子块的位置,这样每个特征向量只需在与它相邻的一定空间范围内寻找其符合阈值的相似子块,从而能够减少不必要的计算,缩短计算时间、提高算法的效率。进行相似子块匹配时,采用应用最广泛的相关性准则,即计算各图像子块特征向量间的Pearson相关系数,如果块对特征向量间的相关性系数越大,则它们的相似度也就越大。Pearson相关系数计算公式为R(XJ)=^mSm⑴其中,X和Y是待测图像各子块的特征向量,在本发明中是小波变换结合主成分分析而得到的,C(X,Y)为向量乂和¥的互协方差,(》,《、(化,幻分别是X和Y的自协方差。(4)篡改区域定位
在进行图像子块匹配时利用匹配阈值得到各相似子块对,并结合相关阈值来定位篡改区域,然后利用数学形态学对初步结果进行处理,设定一定的面积阈值来消除一些小的孤立区域,最终实现篡改图像的准确定位。在进行图像检测时,为了能定位出篡改区域,定义以下阈值4. 1)相关性阈值Rth 用来衡量提取的特征向量之间的相似性。4. 2)位移阈值Ath 在进行子块间的相似度匹配时,由于重合区域的存在,它们所对应向量的相似度必然很高,易造成高虚警现象,因此若选取的图像块大小为mXn,则选取位移阈值Δ沩>^Jmxm + nxn ;4.3)面积阈值Sth:由于拍摄、制作或经过后处理等方面原因,一般在自然图像中, 不小于整幅图像大小的0. 85%的大面积区域存在着相似性的可能性是很小的,因此如果在检测过程中,出现一幅图像中存在大面积的相似区域,则它极有可能是经过复制篡改过。 因此若原图像大小为MXN,则选取面积阈值Sth > MXNX η Χ0. 85%, η为受损系数,0 < η ^ I0基于上述的理论,本发明所述的方法,按照以下步骤实施步骤a、判断待检测图是否为灰度图,若不是,将其转换为灰度图;步骤b、设待测图像大小为MXN,将待测图像按行从左到右,从上到下的顺序划分为只有一行或一列不相同的,大小为mXn的重叠子块,并用各重叠子块左上角坐标来表示该重叠子块在待测图像中的空间位置,共得到(M-m+1) X (N-n+1)个重叠子块,分块过程如图1的各个图示所示(设图像大小为MXN,图中每个小方格代表一个像素,要将图像划分为大小为2X2的重叠子块,先从左到右一次移动一列进行重叠分块,然后从上到下一次移动一行进行重叠分块)。由于分块的大小影响着检测的速度和效果,需要根据实验具体情况确定最佳重叠子块的分块大小,即先依据篡改区域的大小来确定分块的大小并查看初步的检测结果,然后反复比较试验,逐步校正调整分块的大小,得到最佳的分块大小、最佳的检测结果;步骤c、将步骤b分块得到的共(M-m+1) X (N-n+1)个,大小为mXn的各重叠子块进行一次Haar小波变换,得到其低频分量LL1,其大小变为m/2Xn/2 ;步骤d、对步骤c得到的各重叠子块的低频分量LL1进行PCA变换,变换过程中的累积贡献率取为99%,提取各重叠子块的特征向量Vi (i = 1,2,Λ,(M-m+1) X (N-n+1)),并转换为行特征向量矩阵,即每一行表示一个子块的特征;步骤e、对步骤d得到的特征向量矩阵按行进行字典排序,并记录各特征向量所代表的图像子块在原待测图像中的空间位置,用该子块左上角的坐标(x,y)来表示;步骤f、对步骤e排序后的各特征向量进行相似度匹配,即将特征向量Vi与其相邻 21范围内的所有特征向量Vj(j e [i-l,i+l],i兴j)进行Pearson相关系数计算,搜寻Vj 是否 两足s.t. argmin(i >=i ift) (2)
权利要求
1.一种基于小波变换和主成分分析的图像区域篡改检测方法,其特征在于,该方法按以下步骤实施,步骤a、判断待检测图像是否为灰度图,若不是,将其转换为灰度图; 步骤b、设待检测的灰度图像大小为MXN,将该灰度图像按行从左到右,从上到下的顺序划分为只有一行或一列不相同的、大小为mXn的重叠子块,并用各重叠子块左上角坐标来表示该重叠子块在待测图像中的空间位置,共得到(M-m+1) X (N-n+1)个重叠子块;步骤C、将步骤b分块得到的共(M-m+1) X (N-n+1)个、大小为mXn的各重叠子块进行一次Haar小波变换,得到其低频分量LL1,其大小变为m/2Xn/2 ;步骤d、对步骤c得到的各重叠子块的低频分量LL1进行PCA变换,变换过程中的累积贡献率取为99%,提取各重叠子块的特征向量Vi (i = 1,2, A, (M-m+1) X (N-n+1)),并转换为行特征向量矩阵,即每一行表示一个子块的特征;步骤e、对步骤d得到的特征向量矩阵按行进行字典排序,并记录各特征向量所代表的图像子块在原待测图像中的空间位置;步骤f、对步骤e排序后的各特征向量进行相似度匹配,即将特征向量Vi与其相邻21 范围内的所有特征向量Vj(j e [i-l,i+l],i兴j)进行Pearson相关系数计算,搜寻、是否满足
2.根据权利要求1所述的图像区域篡改检测方法,其特征在于,步骤f中,进行相似子块匹配时,采用相关性准则,即计算各图像子块特征向量间的Pearson相关系数,如果块对特征向量间的相关性系数越大,则它们的相似度也就越大,Pearson相关系数计算公式为
全文摘要
本发明公开了一种基于小波变换和主成分分析的图像区域篡改检测方法,该方法的步骤主要包括将原始图像进行重叠分块,然后对得到的各图像子块进行小波变换,并将得到的各低频成分通过主成分分析方法提取各子块的特征,降低了各子块矩阵维数,从而得到待测图像的特征向量矩阵,然后对其进行字典排序缩小了图像子块匹配所需搜索的空间范围,最后利用定义的判别阈值实现对篡改区域的准确定位。本发明方法提高了篡改图像检测算法的运算效率,提高了鲁棒性,更加灵活实用。
文档编号G06T7/40GK102184537SQ20111010265
公开日2011年9月14日 申请日期2011年4月22日 优先权日2011年4月22日
发明者刘涵, 韩莎莎 申请人:西安理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1