一种基于文件头和压缩参数的jpeg图片原始性检测方法

文档序号:6620369阅读:356来源:国知局
一种基于文件头和压缩参数的jpeg图片原始性检测方法
【专利摘要】本发明公开一种基于文件头和压缩参数的JPEG图片原始性鉴别方法,其包括以下步骤:从待检测的图片的文件头和压缩参数中提取N维特征,N为正整数,并根据各特征的属性设置其特征值为A或B;构建决策模型:统计N维特征中A或B出现的个数并设置一个阈值T,T为自然数,如果A的个数大于阈值T,则图片非原始图片,否则图片为原始图片;依据决策模型对待检测的图片做检测判断。本发明适用于多媒体取证中的JPEG图片原始性鉴别,具有简单有效、检测准确率高的优点。
【专利说明】一种基于文件头和压缩参数的JPEG图片原始性检测方法

【技术领域】
[0001] 本发明涉及多媒体内容取证领域,更具体地,涉及一种基于文件头和压缩参数的 JPEG图片原始性检测方法。

【背景技术】
[0002] 随着数字图像处理技术的快速发展,借助专业的图像编辑软件例如Photoshop、 A⑶see、GIMP和美图秀秀等,即使普通用户也能篡改数字图像而不留下明显的视觉痕迹,这 使得数字图像的真实性不断受到质疑,颠覆了人们"眼见为实"的传统观念。近年来,数字 图像的篡改已经影响到政治、法律、传媒等方方面面,因此图像认证技术变得十分重要。
[0003] 图像认证技术可分为主动认证和被动认证两类。典型的主动认证技术包括数字水 印和数字签名。这两种方法都需要事先对图片附加额外的信息,认证时从图片中提取相应 信息,然后与事先附加信息进行匹配判别。而在实际的应用中,更多的情况下我们不可能获 得有效的附加信息,因此主动认证方法有很大局限性。这种情况下,就需要借助于被动式的 认证技术。图像被动认证技术不需要任何附加的信息,而是利用和分析图像的一些内在特 征,来达到认证的目的。
[0004] 针对JPEG图像的原始性的被动取证算法主要分为两部分:基于信号处理的方式 和基于文件头和码流的方式。由于JPEG有损压缩模式中存在编解码的取整和截断误差,大 多数基于信号处理方式的算法涉及统计相关性,但是这类算法有一个较强假设前提,即事 先假设有或者没有某种方式的篡改,例如判别有没有粘贴-复制操作,因此实际应用中当 需要判别一种未知的篡改种类的图片时,往往会出现误判;又由于JPEG特殊的编码格式, 其文件头和码流结构在图像篡改前后会出现较大的差异,因此基于文件头信息的被动取证 也涌现出来,但是此类算法不仅需要庞大的数据库支撑,而且鲁棒性较差,不能抵抗反取证 操作。
[0005] 因此,从实际应用角度出发,亟需一种准确率较高、鲁棒性较高、不需要庞大数据 库支持的被动取证算法。


【发明内容】

[0006] 本发明为克服上述现有技术所述的至少一种缺陷(不足),提供一种高效并且简 单的基于文件头和压缩参数的JPEG图片原始性检测方法。
[0007] 为解决上述技术问题,本发明的技术方案如下:
[0008] 当原始JPEG图片经过图像编辑软件重新压缩,会在JPEG文件头、全图的JPEG的 压缩参数和缩略图的JPEG压缩参数上留下痕迹,本发明提出一种基于文件头和压缩参数 的JPEG图片原始性检测方法,包括以下步骤:
[0009] S1 :从待检测的图片的文件头和压缩参数中提取N维特征,N为正整数,并根据各 特征的属性设置其特征值为A或B ;
[0010] S2 :构建决策模型:统计N维特征中A或B出现的个数并设置一个阈值T,T为自 然数,如果A或B的个数大于阈值T,则图片非原始图片,否则图片为原始图片;
[0011] S3 :依据决策模型对待检测的图片做检测判断。
[0012] 由于实验样本不可能覆盖所有型号的数码相机,所以考虑到误检,可以通过阈值Τ 进行控制。
[0013] 在一种优选的方案中,所述Ν = 13, Τ = 0,即只要13维特征中有一项或一项以上 的特征值为〇,则判断该图片非原始图片。
[0014] 在一种优选的方案中,所述A = 0, Β = 1,Ν维特征及其特征值的设置方法为:
[0015] 从文件头的EXIF信息提取特征:
[0016] (1)比较文件头EXIF信息里的"DateTime"属性值与"DateTimeDigitized"属性 值,若两个属性值不为空且不同,则特征值为〇,否则为1 ;
[0017] (2)提取文件头EXIF信息里的"Software"属性值,如果属性值里含有图像编辑软 件的信息,则特征值为〇,否则为1 ;
[0018] (3)判断文件头里是否有"AppO"标记位,如果有则特征值为0,否则为1 ;
[0019] 根据全图的JPEG压缩参数提取特征:
[0020] (4)提取全图的JPEG的量化表,如果与第一图像处理软件固有的全图量化表相 同,则特征值为〇,否则为1 ;
[0021] (5)提取全图的量化表标记位"FFDB"的个数,如果个数等于1,则特征值为1,否则 为〇 ;
[0022] (6)提取全图的哈夫曼表,如果和JPEG编码的默认哈夫曼表相同,则特征值为1, 否则为〇 ;
[0023] (7)提取全图的JPEG的哈夫曼表标记位"FFC4"的个数,如果个数等于1,则特征 值为1,否则为0 ;
[0024] (8)提取全图的YCbCr采样率,如果是2X2或者是2X1,则特征值为1,否则为0 ;
[0025] 根据缩略图的JPEG压缩参数提取特征:
[0026] (9)提取缩略图的JPEG的量化表,如果与第二图像处理软件固有的缩略图量化表 相同,则特征值为〇,否则为1,
[0027] (10)提取缩略图中量化表标记位"FFDB"的个数,如果个数等于1,则特征值为1, 否则为〇 ;
[0028] (11)提取缩略图的哈夫曼表,如果和JPEG编码的默认哈夫曼表相同,则特征为1, 否则为〇 ;
[0029] (12)提取缩略图的JPEG的哈夫曼表标记位"FFC4"的个数,如果个数等于1,则特 征值为1,否则为〇;
[0030] (13)提取缩略图的YCbCr采样率,如果是2X1,则特征值为1,否则为0。
[0031] 由于第一图像处理软件固有的全图量化表,所以对应维的特征可以用来检测图像 是否被第一图像处理软件编辑过。同理,因为第二图像处理软件固有的的缩略图的量化表, 所以对应维的特征可以用来检测图像是否被第二图像处理软件编辑过。
[0032] 在一种优选的方案中,所述第一图像处理软件为Photo shop,第二处理软件为 Photoshop或ACDsee。因为Photoshop才有其固有的全图量化表,所以对应的这维特征是 用来排除Photoshop,同理,因为Photoshop和ACDsee才有其固有的缩略图的量化表,所以 对应的这维特征是用来排除Photoshop和A⑶see的。
[0033] 与现有技术相比,本发明技术方案的有益效果包括:
[0034] 本发明从JPEG压缩和编码的根源出发,统计原始JPEG图片和经过软件压缩后的 JPEG的多种区别,因此本发明具有较高的准确率和鲁棒性,不需要庞大数据库支持等优点。 本发明的决策模型,通过将N维特征中0出现的个数与预设的阈值T比较,得到决策结果, 因此可以根据检测样本的不同设置不同的阀值T,从而提高了检测的准确率;本发明的检 测过程,只需要从头文件、全图以及缩略图中提取N维特征并设置其特征值,即可根据决策 模型进行判断,因此简便方法较现有技术更为简便。

【专利附图】

【附图说明】
[0035] 图1为JPEG图片篡改的一般过程。
[0036] 图2为本发明图片原始性鉴别的流程。

【具体实施方式】
[0037] 下面结合附图和实施例对本发明的技术方案做进一步的说明。
[0038] 实施例1
[0039] 当原始JPEG图片经过图像编辑软件重新压缩,会在JPEG文件头、全图的JPEG的 压缩参数和缩略图的JPEG压缩参数上留下痕迹,如图2所示,本发明提出一种基于文件头 和压缩参数的JPEG图片原始性鉴别方法,包括以下步骤:
[0040] S1 :从待检测的图片的文件头和压缩参数中提取13维特征,并根据各特征的属性 设置其特征值为〇或1 ;
[0041] S2 :构建决策模型:统计N维特征中0出现的个数并设置一个阈值T,T为自然数, 如果Α的个数大于阈值Τ,则图片非原始图片,否则图片为原始图片;
[0042] S3 :依据决策模型对待检测的图片做检测判断。
[0043] 因为由于实验样本不可能覆盖所有型号的数码相机,所以考虑到误检,可以通过 阈值T进行控制。在具体实施过程,设置T = 0,即只要13维特征中有一项或一项以上的特 征值为〇,则判断该图片非原始图片。
[0044] 在具体实施过程中,所述13维特征及其特征值的设置方法为:
[0045] 从文件头的EXIF信息提取特征:
[0046] (1)比较文件头EXIF信息里的"DateTime"属性值与"DateTimeDigitized"属性 值,若两个属性值不为空且不同,则特征值为〇,否则为1 ;
[0047] (2)提取文件头EXIF信息里的"Software"属性值,如果属性值里含有如果属性值 里含有图像编辑软件的信息,如"Photoshop"、"ACD Systems"、"6頂?"、"11^加",则特征值 为〇,否则为1 ;
[0048] (3)判断文件头里是否有"AppO"标记位,如果有则特征值为0,否则为1 ;
[0049] 根据全图的JPEG压缩参数提取特征:
[0050] (4)提取全图的JPEG的量化表,如果与Photoshop软件固有的全图量化表相同,则 特征值为〇,否则为1 ;
[0051] (5)提取全图的量化表标记位"FFDB"的个数,如果个数等于1,则特征值为1,否则 为Ο ;
[0052] (6)提取全图的哈夫曼表,如果和JPEG编码的默认哈夫曼表相同,则特征值为1, 否则为〇 ;
[0053] (7)提取全图的JPEG的哈夫曼表标记位"FFC4"的个数,如果个数等于1,则特征 值为1,否则为〇 ;
[0054] (8)提取全图的YCbCr采样率,如果是2X2或者是2X1,则特征值为1,否则为0 ;
[0055] 根据缩略图的JPEG压缩参数提取特征:
[0056] (9)提取缩略图的JPEG的量化表,如果与Photoshop或ACDsee软件固有的缩略图 量化表相同,则特征值为〇,否则为1,
[0057] (10)提取缩略图中量化表标记位"FFDB"的个数,如果个数等于1,则特征值为1, 否则为〇 ;
[0058] (11)提取缩略图的哈夫曼表,如果和JPEG编码的默认哈夫曼表相同,则特征为1, 否则为〇 ;
[0059] (12)提取缩略图的JPEG的哈夫曼表标记位"FFC4"的个数,如果个数等于1,则特 征值为1,否则为〇;
[0060] (13)提取缩略图的YCbCr采样率,如果是2X1,则特征值为1,否则为0。
[0061] 本发明方法的原理如下:
[0062] 当原始JPEG图片按图1所示的过程经过图像编辑软件重新压缩,或多或少会在 JPEG文件头、全图的JPEG压缩参数和缩略图的JPEG压缩参数上留下痕迹。故在本实施例 中使用了 13维特征,这些特征在不同的数码相机之间不存在差异性,而在数码相机和图像 处理软件之间差异较大。
[0063] 下面对13维特征分别做出解释:
[0064] "DateTime"属性值表示保存图片的时间,"DateTimeDigitized"属性值表示拍摄 图片的时间。因此当JPEG是原始图片时,如果文件头里有这些属性值,这两个属性值是一 样的;当JPEG被篡改后,"DateTime"的值是篡改后保存图片的时间,因此两个属性值就不 一致。
[0065] "Software"属性值表示JPEG图片被哪一种软件保存。一些图片处理软件在篡改 图片后,会将该属性值设置成自己的logo,例如软件名称Photoshop和美图秀秀等。
[0066] "AppO"标记位,数码相机不使用这个标记位,而经过图像处理软件保存后,会有此 标记位。
[0067] 全图的JPEG的量化表,Photoshop使用其固有的,不同于目前所有相机的量化表, 因此通过该特征,可以判别是否经过Photoshop处理。
[0068] 全图的量化表标记位的个数,数码相机使用1个标记位,而图像处理软件,例如 Picasa,GIMP使用多个标记位。
[0069] 全图的哈夫曼表,数码相机采用和Independent JPEG Group所发布的JPEG程序 中默认的哈夫曼表,而图像处理软件可以使用最优哈夫曼表等。
[0070] 全图的哈夫曼表标记位的个数,数码相机使用1个标记位,而图像处理软件,例如 Picasa,GIMP使用4个标记位。
[0071] 全图的YCbCr采样率,数码相机一般采用2X2和2X1的形式,图像软件有可能采 用其他形式,例如美图秀秀和Photoshop通常采用IX 1。
[0072] 缩略图的量化表,Photoshop和A⑶See使用不同于相机的量化表,因此通过该特 征,可以判别是否经过Photoshop和A⑶See处理。
[0073] 缩略图的量化表标记位的个数,数码相机使用1个标记位,而图像处理软件,例如 Picasa,GIMP使用多个标记位。
[0074] 缩略图的哈夫曼表,数码相机采用和Independent JPEG Group所发布的JPEG程 序中默认的哈夫曼表,而Photoshop使用其固有的表。
[0075] 缩略图的哈夫曼表标记位的个数,数码相机使用1个标记位,而图像处理软件,例 如Picasa,GIMP等使用4个标记位。
[0076] 缩略图的YCbCr采样率,相机采用2X 1,经过有些图像处理软件,例如Photoshop 采用2X2。
[0077] 采用本发明的实验及其结果:
[0078] (1)同库实验
[0079] ①选取正样本:选取2600张原始JPEG图片,来源于26种不同型号的数码照相机, 相机型号如表1所示。
[0080] 表 1
[0081]

【权利要求】
1. 一种基于文件头和压缩参数的JPEG图片原始性检测方法,其特征在于,包括以下步 骤: 51 :从待检测的图片的文件头和压缩参数中提取N维特征,N为正整数,并根据各特征 的属性设置其特征值为A或B; 52 :构建决策模型:统计N维特征中A或B出现的个数并设置一个阈值T,T为自然数, 如果Α的个数大于阈值Τ,则图片非原始图片,否则图片为原始图片; 53 :依据决策模型对待检测的图片做检测判断。
2. 根据权利要求1所述的基于文件头和压缩参数的JPEG图片原始性检测方法,其特征 在于,所述N = 13, T = 0。
3. 根据权利要求2所述的基于文件头和压缩参数的JPEG图片原始性检测方法,其特征 在于,所述A = 0, B = 1,N维特征及其特征值的设置方法为: (1) 比较文件头EXIF信息里的"DateTime"属性值与"DateTimeDigitized"属性值,若 两个属性值不为空且不同,则特征值为〇,否则为1 ; (2) 提取文件头EXIF信息里的"Software"属性值,如果属性值里含有图像编辑软件的 信息,则特征值为〇,否则为1 ; (3) 判断文件头里是否有"AppO"标记位,如果有则特征值为0,否则为1 ; (4) 提取全图的JPEG的量化表,如果与第一图像处理软件固有的全图量化表相同,则 特征值为〇,否则为1 ; (5) 提取全图的量化表标记位"FFDB"的个数,如果个数等于1,则特征值为1,否则为 〇 ; (6) 提取全图的哈夫曼表,如果和JPEG编码的默认哈夫曼表相同,则特征值为1,否则 为〇 ; (7) 提取全图的JPEG的哈夫曼表标记位"FFC4"的个数,如果个数等于1,则特征值为 1,否则为0 ; (8) 提取全图的YCbCr采样率,如果是2X2或者是2X1,则特征值为1,否则为0 ; (9) 提取缩略图的JPEG的量化表,如果与第二图像处理软件固有的缩略图量化表相 同,则特征值为〇,否则为1 ; (10) 提取缩略图中量化表标记位"FFDB"的个数,如果个数等于1,则特征值为1,否则 为〇 ; (11) 提取缩略图的哈夫曼表,如果和JPEG编码的默认哈夫曼表相同,则特征为1,否则 为〇 ; (12) 提取缩略图的JPEG的哈夫曼表标记位"FFC4"的个数,如果个数等于1,则特征值 为1,否则为0 ; (13) 提取缩略图的YCbCr采样率,如果是2X1,则特征值为1,否则为0。
4. 根据权利要求3所述的基于文件头和压缩参数的JPEG图片原始性检测方法,其特征 在于,所述第一图像处理软件为Photoshop,第二处理软件为Photoshop或AO)see。
【文档编号】G06T1/00GK104102861SQ201410340251
【公开日】2014年10月15日 申请日期:2014年7月16日 优先权日:2014年7月16日
【发明者】陈超, 黄继武, 骆伟祺 申请人:中山大学, 深圳大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1