一种基于隐写分析的图像拼接篡改检测方法及装置制造方法

文档序号:6542038阅读:204来源:国知局
一种基于隐写分析的图像拼接篡改检测方法及装置制造方法
【专利摘要】本发明公开一种基于隐写分析的图像拼接篡改检测方法及装置。其方法包括以下步骤:选取若干未经拼接篡改的图像作为原始图像,使用图像处理软件对原始图像,以图像拼接的方式对图像文件进行篡改,获取拼接篡改后的图像;使用高级隐写分析统计模型对原始图像和拼接篡改后的图像提取特征;根据得到的特征,用原始图像与拼接篡改后的图像对分类器进行训练,得到分类器模型;提取待测图像的特征,根据分类器模型判断待测图像是否被拼接篡改。本发明可以作为一种有效的手段将图像隐写分析方法应用于图像拼接篡改检测,对数字图像的真实性进行鉴别,从而为检测图像拼接篡改提供准确有效的自动化技术手段。
【专利说明】一种基于隐写分析的图像拼接篡改检测方法及装置
【技术领域】
[0001]本发明涉及多媒体内容取证领域,更具体地,涉及一种基于隐写分析的图像拼接篡改检测方法及装置。
【背景技术】
[0002]作为保障图像信息安全的两个重要技术手段,图像隐写分析和篡改检测技术已成为多媒体信息安全领域的研究热点。图像隐写分析是针对数字隐写的逆向分析技术,其主要目的是检测秘密信息的存在性,并作为一条测试隐写算法安全性的有效途径。图像篡改检测是数字图像盲取证技术的重要研究内容之一,它是在不依赖任何预签名提取或预嵌入信息的前提下,直接通过分析图像数据的固有特征,来鉴别数字图像的真实性。
[0003]图像拼接篡改,作为最普遍、最基本的图像篡改手段,往往是图像篡改操作的第一步。图像拼接,是指把同一幅图像或者不同图像的一部分复制,直接或经过调整处理后,粘贴到同一幅或另一幅图像上的操作。拼接篡改本身具有很大的信息欺骗性,而且很难被人眼识别处理,图像拼接检测在图像篡改检测中占极其重要的地位。
[0004]高分辨率的数码相机,功能强大的个人电脑及各种图像处理软件的普及与应用,如GNU Gimp>Adobe Photoshop,使得一般的用户都能轻而易举的实现对数字图像的拼接篡改而不留下明显的痕迹。如果虚假的相片被滥用,必将带来一些问题,如涉及到法律证据的真实性、新闻图像的真实性、个人的隐私保护等,检测图像拼接篡改,进而鉴别图像数据的真实性有着非常重要的意义。

【发明内容】

[0005]本发明旨在至少在一定程度上解决上述技术问题。
[0006]本发明的首要目的是提供一种简单有效的基于隐写分析的图像拼接篡改检测方法。
[0007]本发明的进一步目的是提供一种简单有效的基于隐写分析的图像拼接篡改检测装置。
[0008]为解决上述技术问题,本发明的技术方案如下:
一种基于隐写分析的图像拼接篡改检测方法,包括以下步骤:
S1:选取若干未经拼接篡改的图像作为原始图像,使用图像处理软件对原始图像,以图像拼接的方式对图像文件进行篡改,获取拼接篡改后的图像;
52:使用高级隐写分析统计模型对原始图像和拼接篡改后的图像提取特征;
53:根据步骤S2中得到的特征,用原始图像与拼接篡改后的图像对分类器进行训练,得到分类器模型;
S4:提取待测图像的特征,根据分类器模型判断待测图像是否被拼接篡改。
[0009]在一种优选的技术方案中,步骤SI中,原始图像通过拍摄设备拍摄得到且未经压缩;原始图像的原始性是本发明检测准确率的重要因素。[0010]在一种优选的技术方案中,步骤SI中,对原始图像文件进行拼接篡改时考虑图像语义,使人眼难以识别;此举的目的是使数据样本更接近真实情况,从而提高检测的准确率。
[0011]在一种优选的技术方案中,步骤S2中,使用的高级隐写分析统计模型为数字图像隐写分析富模型,对原始图像和拼接篡改后的图像提取特征具体包括以下步骤:
(1)计算图像的残差矩阵:如果图像为彩色图象,首先将彩色图像转成灰度图像,或者选择彩色图像RGB通道的其中一个通道,分别利用线性和非线性滤波器,对图像进行滤波操作,分别得到不同的残差矩阵;
(2)对得到的残差矩阵进行归一化:以q>0的量化步长对残差矩阵进行量化,接着以T>0对残差矩阵进行截断,只保留在[_T,T]范围的系数;
(3)利用共生矩阵计算残差矩阵的统计特征:对于每个不同的残差矩阵,对于水平方向和垂直方向,分别利用共生矩阵统计同一方向相邻四个系数之间的相关性,得到四维度的共生矩阵系数。组合所有的共生矩阵系数特征,组织成向量形式,得到图像的富模型统计特征。
[0012]在一种优选的技术方案中,步骤(2)中,选取的参数为T=q=2。
[0013]在一种优选的技术方案中,步骤S3中,分类器是支持向量机(SVM)或多分类器集成(Ensemble)5SVM是现代分类技术中常用的分类器,而多分类器集成是将相互之间具有独立决策能力的分类器联合起来,使得分类的准确率更高。
[0014]一种基于隐写分析的图像拼接篡改检测装置,包括:
拼接篡改模块:用于对选未经拼接篡改的原始图像以图像拼接的方式对图像文件进行篡改,构造拼接篡改后的图像;
特征提取模块:用于使用高级隐写分析统计模型对原始图像和拼接篡改后的图像提取特征;
分类器训练模块:用于根据提取到的特征,用原始图像与拼接篡改后的图像对分类器进行训练,得到分类器模型;
图像检测模块:用于根据待测图像的特征和分类器模型判断待测图像是否被拼接篡改。
[0015]与现有技术相比,本发明技术方案的有益效果是:本发明根据图像隐写分析中所利用的自然图像统计特性,建立起图像隐写模型和图像拼接篡改模型的联系,将图像隐写分析方法用于检测图像拼接篡改,依据隐写分析方法提取图像统计特征,结合现有的分类技术如Ensemble、SVM等对特征进行分类,可以准确有效地对数字图像的拼接篡改行为进行检测,进而鉴别图像信息的真实性,为图像拼接篡改检测提供有效的自动化技术手段。本发明对图像拼接篡改的检测准确率高于现有的专用拼接检测方法
【专利附图】

【附图说明】
[0016]图1是图像拼接篡改过程示意图。
[0017]图2是本专利特征的提取与分类器模型的构造的示意图。
[0018]图3是本专利利用分类器对待测图像做拼接篡改检测判断示意图。
[0019]图4是利用Ensemble技术比较隐写分析、拼接检测方法的性能示意图。[0020]图5是利用SVM技术比较隐写分析、拼接检测方法的性能示意图。
【具体实施方式】
[0021]附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺
寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
[0022]下面结合附图和实施例对本发明的技术方案做进一步的说明。
[0023]本发明方法通过以下步骤对待测图像文件拼接篡改进行辨识:
特征的提取与分类器模型的构造:
(1)拼接篡改图像集的构造:从成像设备上取得未经篡改的原始图像。这些图像应包括各种不同型号的相机、不同的室内室外场景、不同的人物风景内容,且保留原始的未经压缩的格式。为了使得训练比较准确,图像集的数量应该尽可能多;如图1所示,从收集的图像集中选择图像,使用图像处理软件,或者是程序,以图像拼接的方式对图像文件进行篡改,得到拼接篡改图像集。拼接篡改过程考虑图像语义,拼接图像做到人眼难以识别;
(2)如图2所示,对无篡改图像集与经拼接篡改图像集中的每个图像文件,选取一些高级隐写分析统计模型,分别对图像提取其特征:
本实施例采用数字图像隐写分析富模型作为示例说明。富模型通过线性滤波和非线性滤波,构建106个子模型用于统计相邻像素点之间的相关性。组合这些子模型的统计特征形成富模型特征。具体的方法和步骤如下:
a.首先计算图像的残差矩阵。本方法主要针对灰度图像,对于彩色图像,则先转成灰度图像,或者选择图像RGB通道的其中一个通道进行特征提取。分别利用线性和非线性滤波器,对图像进行滤波操作,分别得到不同的残差矩阵。滤波器模板大小可以为3*3,5*5,或者其他自定义形状,优选的是3*3。具体方法是选用模板大小为3*3线性滤波器,对于每个被操作的像素点,由其八相邻点像素值相加得到的预测值减去该像素点像素值的两倍,得到该点的残差值。对图像的每个像素进行操作,从而得到整个图像的残差矩阵;
b.然后对a得到的残差矩阵进行归一化。以q>0的量化步长对残差矩阵进行量化,接着以T>0对残差矩阵进行截断,只保留在[_T,T]范围的系数。具体方法是先将残差矩阵系数除以q,取整,然后将残差矩阵中大于T和小于-T的系数置为O。这里的参数q和T优选的为q=T=2 ;
c.最后利用共生矩阵计算残差矩阵的统计特征。对于每个不同的残差矩阵,对于水平方向和垂直方向,分别利用共生矩阵统计同一方向相邻四个系数之间的相关性,得到四维度的共生矩阵系数。组合所有的共生矩阵系数特征,组织成向量形式,得到图像的富模型统计特征;
(3)如图2所示,利用现有的分类技术如Ensemble或SVM对(3)中得到的图像特征进行训练,得到一个能检测图像拼接篡改的分类器模型(Model);
利用分类器对待测图像做检测判断:
(4)首先按步骤(2)中的隐写分析方法提取待测图像的特征,然后利用步骤(3)中得到的分类器Model进行判别。[0024]本发明方法的原理如下:
图像隐写分析和拼接篡改检测主要依据秘密信息的嵌入和拼接篡改操作导致的异常统计特征来实现。自然图像反映客观世界中不同景物空间结构关系所呈现的视觉信息,具有区域平稳特性,相邻像素值或是系数值之间有着很强的相关性。
[0025]隐写信息嵌入,拼接篡改操作,都会破坏载体图像相邻像素值或系数值之间的相关性,从而对载体图像的统计特性产生影响。嵌入的信息,拼接的图像片段,一般与载体图像内容相互独立,有着不同的统计特性,从而破坏了原图像统计上的一些特性,如平滑度、规律性、连续性、一致性以及周期性。这些破坏使得被隐写图像和被拼接篡改图像,在统计特性上不同于原始图像,从而留下了嵌入操作和拼接操作的痕迹。
[0026]不同内容的图像区域具有不同的统计特性,为了消除图像内容的影响而保留更多的细节信息,统计模型通常针对图像的高频信息。基于图像高频信息的统计特征,建立原始图像模型和非原始图像模型,利用建立的模型将这两类图像区分开。这种方法对通用隐写分析和拼接检测都是有效的。
[0027]根据图像隐写分析方法和篡改检测方法的内在联系,提出可以将隐写分析方法直接用于拼接篡改检测。实验验证了不同空、频域隐写分析方法用于拼接检测,并与相应专用拼接检测方法做比较。实验结果证实了隐写分析方法对拼接篡改检测有效,有良好的对抗JPEG压缩鲁棒性,检测准确率甚至高于相应专用的拼接检测方法。
[0028]因此,本发明根据图像隐写分析中所利用的自然图像统计特性,建立起图像隐写模型和图像篡改模型的联系,把图像隐写分析方法应用于图像的拼接检测,以达到鉴定图像真假的目的。
[0029]下面给出本发明方法的一些实验结果。
[0030]从成像设备上取得未经篡改的图像,这些图像包括各种不同型号的相机、不同的室内室外场景、不同的人物风景内容,且保留原始未压缩的格式。这些图像称为“原始图像”。
[0031]使用图像处理软件,对选取的图像,分别以图像拼接的方式对图像文件进行篡改,得到拼接篡改图像集。拼接篡改过程考虑图像语义,被拼接篡改的图像人眼难以识别出来。这些图像我们称为“拼接篡改后的图像”。
[0032]然后分别使用Ensemble或SVM训练,下面的所有实验中,随机选择50%的数据用于训练,剩余的50%用于测试。为了验证专利的有效性,我们做了以下部分的实验。
[0033]隐写分析方法用于拼接检测的实验:
此部分测试针对经过拼接篡改的图像文件,对2100个图像进行实验,其中包括1050个原始图像文件和1050个拼接篡改后的图像文件。
[0034]分别比较拼接检测方法、空域隐写分析方法、频域隐写分析方法。考虑不同特征维度方法,这里选用特征维度分别为7290、266的两个拼接检测方法,特征维度分别为34671、686、110的三个空域隐写分析方法,特征维度分别为7850、972、548的三个频域隐写分析方法,分别用ensemble和SVM技术,在相同的实验条件下进行比较。
[0035]考虑篡改操作后,对图像进行了压缩处理,检验算法是否鲁棒、是否依然有效。将所有图像按照相同的压缩因子Q生成JPEG图像,考虑不同的压缩因子Q=95、90、85、80、75,生成不同的图像数据库,分别进行算法的检测准确率比较。[0036]分别利用Ensemble和SVM技术,以压缩因子Q为横坐标,准确率为纵坐标,比较不同的隐写分析方法与拼接检测方法。结果见图4、图5。
[0037]图4是利用Ensemble技术比较隐写分析、拼接检测方法的性能示意图,图5是利用SVM技术比较隐写分析、拼接检测方法的性能示意图。
[0038]实验结果表明,总体上,各种检测方法之间的准确率高低关系,在两种不同分类器下是一致的。不管是拼接检测方法,还是隐写分析方法,特征维度越高的方法,准确率越高。这是由于特征维度越高,反映图像细节的统计特征更加细致,更有利于捕捉到拼接操作引起的变化。
[0039]虽然篡改是在空域上进行,频域隐写分析方法也能检测,这是因为拼接操作引起的破坏在DCT中高频系数上是有所体现。按照不同的Q压缩成JPEG图像,这个过程损失了图像细节信息,包括了篡改的部分细节。随着Q的下降,损失的细节越来越多,三类方法的准确率分别下降。
[0040]所以,实验结果证实了隐写分析方法对拼接检测有效,有良好的对抗JPEG压缩鲁棒性,检测准确率甚至高于专用的拼接检测方法。
[0041]相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
【权利要求】
1.一种基于隐写分析的图像拼接篡改检测方法,其特征在于,包括以下步骤: S1:选取若干未经拼接篡改的图像作为原始图像,使用图像处理软件对原始图像,以图像拼接的方式对图像文件进行篡改,获取拼接篡改后的图像; 52:使用高级隐写分析统计模型对原始图像和拼接篡改后的图像提取特征; 53:根据步骤S2中得到的特征,用原始图像与拼接篡改后的图像对分类器进行训练,得到分类器模型; S4:提取待测图像的特征,根据分类器模型判断待测图像是否被拼接篡改。
2.根据权利要求1所述的基于隐写分析的图像拼接篡改检测方法,其特征在于,步骤SI中,原始图像通过拍摄设备拍摄得到且未经压缩。
3.根据权利要求1所述的基于隐写分析的图像拼接篡改检测方法,其特征在于,步骤Si中,对原始图像文件进行拼接篡改时考虑图像语义,使人眼难以识别。
4.根据权利要求1所述的基于隐写分析的图像拼接篡改检测方法,其特征在于,步骤S2中,使用的高级隐写分析统计模型为数字图像隐写分析富模型,对原始图像和拼接篡改后的图像提取特征具体包括以下步骤: (1)计算图像的残差矩阵:如果图像为彩色图象,首先将彩色图像转成灰度图像,或者选择彩色图像RGB通道的其中一个通道,分别利用线性和非线性滤波器,对图像进行滤波操作,分别得到不同的残差矩阵; (2)对得到的残差矩阵进行归一化:以q>0的量化步长对残差矩阵进行量化,接着以T>0对残差矩阵进行截断,只保留在[_T,T]范围的系数; (3)利用共生矩阵计算残差矩阵的统计特征:对于每个不同的残差矩阵,对于水平方向和垂直方向,分别利用共生矩阵统计同一方向相邻四个系数之间的相关性,得到四维度的共生矩阵系数;组合所有的共生矩阵系数特征,组织成向量形式,得到图像的富模型统计特征。
5.根据权利要求4所述的基于隐写分析的图像拼接篡改检测方法,其特征在于,步骤(2)中,选取的参数为T=q=2。
6.根据权利要求1所述的基于隐写分析的图像拼接篡改检测方法,其特征在于,步骤S3中,分类器是SVM或Ensemble。
7.一种基于隐写分析的图像拼接篡改检测装置,其特征在于,包括: 拼接篡改模块:用于对选未经拼接篡改的原始图像以图像拼接的方式对图像文件进行篡改,构造拼接篡改后的图像; 特征提取模块:用于使用高级隐写分析统计模型对原始图像和拼接篡改后的图像提取特征; 分类器训练模块:用于根据提取到的特征,用原始图像与拼接篡改后的图像对分类器进行训练,得到分类器模型; 图像检测模块:用于根据待测图像的特征和分类器模型判断待测图像是否被拼接篡改。
【文档编号】G06T7/00GK103914839SQ201410118902
【公开日】2014年7月9日 申请日期:2014年3月27日 优先权日:2014年3月27日
【发明者】丘晓青, 李昊东, 骆伟祺, 黄继武 申请人:中山大学, 深圳大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1