一种基于彩色关系特征的图像近似拷贝检测方法

文档序号:6481924阅读:133来源:国知局
专利名称:一种基于彩色关系特征的图像近似拷贝检测方法
技术领域
本发明属于多媒体数据库管理,多媒体数字版权保护领域。具体涉及到一 种能快速、有效地从图像数据库中检索出给定数字图像近似拷贝版本的方法。
背景技术
数字图像的近似拷贝指的是一幅图像在经过一些常规数字图像处理操作后 的不同版本。这些修改后的版本其视觉上与原始图像很相近,但质量上却有所 差异。判别给定的图像是否为己有图像库(或网络)中某一图像数据的近似拷 贝版本,这对减少数据库的冗余性、维护数字版权等都有着十分重要的意义。
图像近似拷贝的检测类似但有别于传统的基于内容的图像检索(content based image retrieval),因为它仅需识别来自同一图像的不同近似版本,而不必考虑 与其内容相似(如都是"日出"内容图像)但不是出自于同一图像的其它数据。 由于在许多实际的应用当中,图像库数据量往往是巨大的。因此,近似拷 贝检测算法需要满足一定检测正确率的情况下,还须要求算法的时间复杂度(检 索速度)与空间复杂度(存储图像特征的大小)都比较低。现有的一些方法常 需综合图像数据颜色、纹理、局部结构等特征去表示图像的内容(一般均上100 维特征)。在特征提取时,需要将图像从空域变换到其它的频率域空间,如DCT、 DWT等。这样其算法的时间、空间复杂度都会比较高,而且部分方法仅对某些特 定图像处理操作鲁棒,如JPEG压縮、加噪,而对其他常用图像处理操作,如几 何变换,随机剪切等鲁棒性比较差。

发明内容
本发明的目的在于针对现有方法时间、空间复杂度较高等缺陷,提供一种 基于彩色关系特征的图像近似拷贝检测方法。
为了实现上述发明目的,采用的技术方案如下
一种基于彩色关系特征的图像近似拷贝检测方法,包括如下步骤
(1) 将一幅图像分成多个图像块祝/t(y),并计算每一个S汰(/)的红、绿、蓝
三个颜色通道上像素值的平均值,再根据这三个平均值的大小排列组成六种关 系case ! (/=1,2,3,4,5,6);
(2) 统计步骤(1)中各图像块S仪(/)中的颜色所属关系,令满足关系^w /的图像块集合为f,计算《占所有图像分块中的百分比//(/),从而得到整幅图 像的鲁棒特征[//(1),//(2),//(3),//(4),//(5),//(6)];
(3) 计算图像/与图像/'之间相似度的距离1)(仏//')=力邵)-//'(/) j,其
'=1
中,i/,/Z'分别表示图像/,/'的鲁棒特征,并从图像训练集中提取阈值T,根据图 像间的相似度距离与阈值T的比较确定两幅图像是否为近似拷贝。
本发明主要利用了图像各颜色通道间的大小统计关系特征,具体为图像RGB 颜色空间上3种颜色(即Red, Green和Blue通道上数据的平均值)6种大小排 序关系的统计数据。本发明分成二个歩骤(1)记录图像分块的颜色关系特征; (2)图像鲁棒特征的提取;(3)阈值的选取方法与图像近似拷贝的识别。
所述步骤a)记录图像分块颜色关系特征的具体方法是首先把待测彩色 图像/ (设其大小为MxAO分解为无重叠&x&大小的小块,设为S议(刀,要-求
& = 8/t,"A^' = l,2,...S,其中^[M][!]表示图像分块的总个数,然后对于每一个
彩色图像小块5汉(力,计算其R(Red) , G(Green) , B(Blue)三个颜色通道上像素的平均值,设为u/), g。力'),,并记录这三个平均值属丁以下哪种关系
ra犯1:u./)》g證(./)2U力 c汰w 2:/ 丄/)》1力)^ 。力.)
匿3:g證(/)^u/)^(./) 匿4:G衝C/)》5。mC/)^U乂)
匿5:Jg_(./)2 7 。w(./)2g"ve(./)
匿6:5騰(/^g,c/)^u力
所述步骤(2)图像鲁棒特征的提取的具体方法是统计步骤(1)中各小
块微(y)中的颜色所属关系,设满足关系c必,e /的图像块集合为^
《={舰(/) l [Uj'),g證(/),u川".匿#/}
其中,/ e [1,2,3,4,5,6],./ e [1,2,…,5"];
并计算这6种颜色关系各占所有图像分块中的百分比
邵)=各
广l
其中,S,H^表示属于关系esse /图像块集合的元素个数;//(/)表示图像 巾满足关系/的图像块占所有图像块的比例;//(Z)的精度要求为2位或2以上的 有效数字的十进制小数。从而得到图像/的鲁棒特征表示为 [//(1),//(2),//(3),//(4),//(5),//(6)]。从大量的实验数据和理论分析得到,该特征对大
部分常用的图像处理操作具有较好的鲁棒性,也即是说图像在经过各种图像处 理操作后,该特征的差异不大。而对于不出自同一幅图像的不同图像,该特征 区分度也较高。因此,能满足数字图像近似拷贝检测的要求。
由于[//(1),//(2),//(3),//(4),//(5),^/(6)]这6个数字的和为1。为进一步节省图像特征的存储空间,只需记录图像的前5个特征,即[//(l),/f(2),//(3),i/(4),i/(5)]。 而/f (6)可由i/(6) = 1 - - //(2) - i/(3) - 7/(4) - //(5)得到。
所述歩骤(3)阈值的选取方法与图像近似拷贝的识别的具体方法为首先 选取一定数量的图像(一般不少于500幅)作为原始图像集,并针对所要考虑 的图像操作(如包括一般的图像压缩、噪声干扰、图像增强、剪切、旋转、模 糊、添加文字说明等),模拟图像近似拷贝的过程,生成出'系列原始图像的近 似拷贝版本作为图像训练集;然后按照歩骤(1)、 (2)提取出每幅图像的6个特 征;定义图像/与图像川司相似度的距离。为
其中,T/,fT分别表示图像/,/'的特征,可知0^/3(//,//')《2; 然后按以下情况,统计两类图像间的距离 (a)原始图像两两之间的距离;
(b )原始图像与其对应近似拷贝版本之间的距离;
通过大量实验数据表明,集合(a)中的距离近似均值为1的高斯分布,而 集合(b)巾的距离往往很靠近0;因此,可根据具体识别系统所考虑的图像处理 集合以及检测率等要求,选择一个恰当的阈值T,将这两类情况(是否图像的近 似拷贝)区分开当两图像间的距离小于此阈值T时,认为图像是近似拷贝版本, 而大于T时,则认为是非近似拷贝版本。
利用本发明能够快速提取出数字图像的鲁棒特征表示,并能通过该特征有 效地判断两幅图像/,/'是否为近似拷贝版本。与现有方法相比,本发明的时间、 空间复杂度均较低,并且能抵抗大部分常用的图像处理操作。


图l为本发明的流程示意图2为图像无重复分块示意图3为三幅测试图像(Lena, Baboon, P印pers)鲁棒特征的柱状图4为图像鲁棒特征的Hash值表示示意图5为三幅测试图像与其对应近似拷贝版本的距离示意图6是600幅训练图像两两间距离的直方图7是600幅训练图像与其对应近似拷贝版本间距离的直方图8是训练数据的R0C曲线。
具体实施方式
下面结合附图对本发明作进一歩说明。
本发明的流程图如附图i所示,包括歩骤a)记录图像分块的颜色关系
特征;(2)图像鲁棒特征的提取;(3)阈值的选取方法与图像近似拷贝的识别。
每个歩骤具体如下
步骤(1)、记录图像分块的颜色关系特征
假设待检测的图像为/,其大小为MxiV。首先按图示2所示,将/分解为 无重叠区域的&xBz(这里设定& = 16 )大小的图像块,记为
舰(y),y",2,…,s,s = [#][#]。对于每个彩色图像小块B汰(y),首先计算其R、 G和 B三个颜色通道上的灰度平均值,得到LC/),(^,力),U7'),并根据以下6种情况
对得到的3个平均值进行归类
匿l:iCG證C/)K力 c騰2:Uy)^U力2G猜(力c應4:G認(j')^U/^U力
冊e 6:Ave(/')2G。rea)2U_/) 步骤(2)、图像鲁棒特征的提取
统计步骤(1)中图像各小块5汰(./)的颜色所属关系,设满足关系cssei的 图像块集合为f,即
f ={舰(力I [U/),G^C/),^力')]".匿#''} 其中,z'e[,2,3,4,5,6], /e[l,2,…,S] 计算这6种关系各占所有图像分块中的百分比
其巾,S,=|f l表示图像分块中满足关系case i的个数;外')则表示满足关 系i的分块占所有图像分块的比例。
6
可以证明0S邵)化且有Z邵)1
!=1
经过大量实验数据得到,//(0要求是2位或2位以上有效数字的十进制小数 (这里实验设定为2位)。图3是三个典型的图像(Lena, Baboon, P印pers) 特征的柱状图,可以看到不同图像其值得分布是不一致的。
为了进一歩缩减图像特征的存储空间(即降低算法的空间复杂度),仅需记 录图像的前5个特征数据,即[i/(l),//(2),i/(3),i/(4),//(5)],而第6个特征数据可
由//(6) = 1-^/f(/)得到。如图4所示,在存储图像特征时,把前5个特征(十 进制具有2位有效数字的小数)转换为二进制表示。可以得到一个长度为35(35=7
9X5)比特的Hash值。也即任意一幅彩色图像,利ffl本发明均压縮为35比特。 与现有大部分算法相比,其空间复杂度大大降低。
歩骤(3)、阈值的选取方法与图像近似拷贝的识别
随机选取了 6000幅彩色图像做测试,首先从中选取出10%的图像作为训练 的原始图像集,即600幅。对于每一幅图像,利用"Imagemagick"软件按下表 参数产生出100幅与之对应的近似拷贝版本
图像处理操作参数说明编号#
JPEG compressionQF:50 to 901 5
J"PEG2000 compressionQF:50 to 906 10
Sealing0.5 Lo 211 15
RotationDegree:5 15 90 180 27016 20
Cropping5% to 25%21 25
Framing10% with random color26 30
Region Tampering3% to 15%31 35
AWGNSnr:20db to 40db36 40
Median Filtering3X3 to 11X1141 45
Average Filtering3X3 to 11X1146 50
Gamma Correction1/1. 5, 1/2, 1. 5, 2, 2. 2551 55
Changing Saturation50% to 130%56 60
Changing Brightness70% to 120%61 65
Motion BlurringAngle: 72 t。 288,66 70
radius 10, sigma:10
Radial BlurringAngle:2 to 1071 75
SwirlAngle: 10 to 9076 80
ShsirpenRadius:10 sigma: 10 to 5081 85
RollRolled percentage: 2% to丄0%86 90
FlippingHorizontal Direction9丄
DespecklingDefault setting92
Changing ContrastIncrease/Decrease using93, 94
default settings
RisingIncrease/Decrease 10% using95' 96
default settings
SpreadThe distance is 2 and 597, 98
Shear[1 0 0;0.2 1 0;0 0 1]99, 100
10然后按照步骤(1)、 (2)提取出每幅图像的6个特征;按如T公式讣算图像 /与图像川司相似度距离"
,,//')=力邵)-賜|
其中,//,f/'分别表示图像/,/'的特征。 然后按以下情况,统计两类图像间的距离 (a)原始图像两两之间的距离;
(b )原始图像与其对应近似拷贝版本之间的距离。
测试1:若原始图像集仅为Lena, Baboon与Peppers三幅图像,则(a)为 D(i/丄,/^) = 1.24,= 0"3, ZJ(/^,/Z" 0.67 , i/L,//fl,f"分别表示Lom:i, Baboon 与P印pers图像的鲁棒特征;
而原始图像与其对应的近似拷贝版本间距离(b)如图5所示。可以看到所 有距离均小于0.2。
因此选取阈值7' e (0.2,0.67)时,可以将这两类图像完全区分开。
测试2:为了得到一个比较恰当的阈值,对600副图像进行了训练,剩F的 5400幅图像作为测试的原始图像集合。图6所示的是600副图像两两间距离的 直方图,可以看到它近似均值为1的高斯分布;图7是600幅训练图像与其对 应近似拷贝版本间距离的直方图,其距离分布很靠近0。
根据系统检测率的要求,可得到较优的阈值T。为此定义<formula>formula see original document page 11</formula>图8是得到的ROC (Receiver Operating Characteristic)曲线,T可按 照如下的公式得到
t ,潛(r)十[i-潛(r)]、
!T = argmax(-^~^-
r 2
在实验中,经过训练得到了=0.27。然后利用该阈值T对测试图像集合进行 检测,得到较好的检测结果TPR=98. 5%, FPR=2. 53%。
由于本发明的时间、空间复杂度都较低,在实际的应用当中,还口」"以作为 图像近似拷贝检测的预处理步骤,快速地去除图像库中非近似拷贝的版本(FPR 小于某一设定的阈值),这样可大大降低图像的搜索空间,然后再结合其它的检 测算法进一步提高系统的效率。
1权利要求
1、一种基于彩色关系特征的图像近似拷贝检测方法,其特征在于包括如下步骤(1)将一幅图像分成多个图像块Blk(j),并计算每一个Blk(j)中红、绿、蓝三个颜色通道上像素的平均值,再根据这三个平均值的大小排列组成六种关系case i(i=1,2,3,4,5,6);(2)统计步骤(1)中各图像块Blk(j)中的颜色所属关系,令满足关系case i的图像块集合为Pi,计算Pi占所有图像分块中的百分比H(i),从而得到整幅图像的鲁棒特征[H(1),H(2),H(3),H(4),H(5),H(6)];(3)计算图像I与图像I′之间相似度的距离其中,H,H′分别表示图像I,I′的鲁棒特征,并从图像训练集中提取阈值T,根据图像间的相似度距离与阈值T的比较确定两幅图像是否为近似拷贝。
2、 根据权利要求1所述的基于彩色关系特征的图像近似拷贝检测方法, 其特征在于所述步骤(1)的图像分块为把大小为MxiV的图像/分解为S个 无重叠& x &大小的图像块刀,其中S = [!][1]表示图像块的总个数。
3、 根据权利要求1或2所述的基于彩色关系特征的图像近似拷贝检测 方法,其特征在于所述步骤(1)确定的关系C"M /具体如下匿IK力""力.)"厨(力匿2:i 證(力;^。力^G證C0 騰3:G。J力^U/^Uy) 匿4:G歸(力》U/^U力其中l力),G。力HC/)为分块舰(力中红、绿、蓝三个颜色通道上像 素值的平均值。
4、 根据权利要求1所述的基于彩色关系特征的图像近似拷贝检测方法, 其特征在于所述步骤(2)确定的/Z(/)的精度为具有2位或2以上有效数字 的十进制小数。
5、 根据权利要求4所述的基于彩色关系特征的图像近似拷贝检测方法, 其特征在于所述步骤(2)只记录图像的其中5个鲁棒特征,即 [//(1),//(2),//(3),//(4),//(5)], 而//(6)可通过如下公式计算获得,即 //(6) = 1 - 7/(1) - //(2) -. //(3) - //(4) - //(5)。
6、 根据权利要求1所述的基于彩色关系特征的图像近似拷贝检测方法, 其特征在于所述步骤(3)从图像训练集中提取阈值T具体如下首先选取一定数量的原始图像作为原始图像库,并模拟图像近似拷贝 的过程,生成一系列原始图像的近似拷贝版本作为图像训练集;然后按照步骤(1)、 (2)提取出每幅图像的6个鲁棒特征,根据鲁棒特 征计算任意图像/与图像/'之间相似度的距离;再统计原始图像之间、原始图像与其对应近似拷贝图像之间的距离;根据统计的距离确定一个恰当的阈值T,当两图像间的距离小于此阈值 时,认为图像是近似拷贝,而大于T时,则认为是非近似拷贝版本。
全文摘要
本发明提供一种基于彩色关系特征的图像近似拷贝检测方法,包括步骤(1)记录图像分块的颜色关系特征;(2)图像鲁棒特征的提取;(3)阈值的选取方法与图像近似拷贝的识别。利用本发明能够快速提取出数字图像的鲁棒特征表示,并能通过该特征有效地判断两幅图像I,I′是否为近似拷贝版本。与现有方法相比,本发明的时间、空间复杂度均较低,并且能抵抗大部分常用的图像处理操作。
文档编号G06F17/30GK101504655SQ200910037650
公开日2009年8月12日 申请日期2009年3月6日 优先权日2009年3月6日
发明者骆伟祺, 黄继武 申请人:中山大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1