基于图像库空域和频域特征的图像摘要获取方法与流程

文档序号：12365734阅读：912来源：国知局

本发明涉及一种图像处理，特别涉及一种基于图像库空域和频域特征的图像摘要获取方法。
背景技术：
：近年来，数字媒体的内容安全问题一直受到人们的广泛关注。由于图像在数字媒体中占有重要地位，各种图像处理工具的普遍应用使数字图像很容易被篡改，需要采取专门的技术措施来保证其真实性和可信性。图像摘要又称为图像Hash，它是通过特定的单向映射从图像中提取的特征码，能反映图像的实质内容，因此常用于图像防伪认证。图像摘要通常应具备以下基本性质：1)抗碰撞性，即不同图像的摘要应有重大差异；2)感知稳健性，图像通过正常处理如滤波、增强、压缩后图像实质内容不变，摘要也不发生显著变化；3)安全性，密钥不同时生成的摘要完全不同。感知稳健性是图像摘要与密码学Hash函数的重要区别，后者如MD5和SHA-1，它们对原始数据极为敏感，只要有微小变化就会导致完全不同的摘要值。由于摘要反映图像实质内容，所以图像摘要方法中关键的一步就是特征提取，它直接关系到摘要的性能。特征提取可以在空域或变换域进行。基于空域的方法中，Kozat等人将图像看作矩阵，利用矩阵不变性构造图像摘要。首先将图像伪随机分割成大小相同的互相重叠的图像区域，并运用奇异值分解SVD(或者DCT和DWT)对图像区域进行特征提取，同时对特征伪随机排列构造二次图像，最后用SVD变换提取二次图像的特征以构成Hash值，该方法由SVD的不变性保证摘要的稳健性；Xiang等人提出了一种基于图像全局直方图的图像摘要算法，该方法首先对图像做高斯低通滤波，然后得到图像亮度分量的直方图，最后对直方图进行量化得到图像摘要。由于图像经过几何变换后图像的直方图没有发生大的改变，因此该方法对旋转，剪裁和平移等几何变换具有鲁棒性，但缺点是容易伪造出与原始图像具有相同直方图但视觉内容不同的图像；唐振军等人利用非负矩阵分解提取特征构成图像摘要，首先对整幅图像进行处理，构成二次图像再做非负矩阵分解，然后对系数矩阵进行量化得到图像Hash，该方法的长度较短，对大部分常规处理具有很好的鲁棒性，同时能够检测图像篡改，但缺点是由于二次图像是由图像随机分块得到的，因此对旋转和剪裁等几何变换不鲁棒。在基于变换域的方法中，F.Lefebvre等人利用Radon变换构成了一种图像摘要算法，首先图像经过Radon变换后计算亮度投影的特征向量，并用主成分分析提取两个最大的特征值所对应的特征向量构成摘要值，该方法对常规的图像处理如压缩、滤波、小角度旋转、缩放具有较好的稳健性，但对纹理图像的鲁棒性较差；唐胜等人设计了基于图像关键块DCT系数的摘要方法。该方法首先对图像所有块做DCT变换，然后选择图像关键块中的低频DCT量化系数作为特征构造数据矩阵，再将PCA应用于数据矩阵，最后用量化后的特征向量矩阵作为图像摘要。这些方法统一的特点是利用图像本身提取特征构成图像摘要，因此攻击者容易伪造具有相似摘要的攻击图像，安全性能有待进一步提高。技术实现要素：本发明是针对图像摘要安全性的问题，提出了一种基于图像库空域和频域特征的图像摘要获取方法，该方法对大部分保持内容的图像处理具有鲁棒性，由于对图像做了分块处理，因此对大角度旋转不具有鲁棒性，该方法具有很低的碰撞率，可以用于图像认证，该方法利用了图像库中的特征构成图像摘要，具有较高的安全性能。本发明的技术方案为：一种基于图像库空域和频域特征的图像摘要获取方法，具体包括如下步骤：1)利用图像库构成词典；2)对输入图像做预处理，将其规格化为相同尺寸，然后将按词典中图像块大小对输入图像进行图像分块，之后提取图像特征构成中间摘要，中间摘要包括三部分：标志位F，空域特征向量S和频域特征向量D；3)标志位F是对判断图像块是否含有有效信息，计算图像的显著图，通过比较图像块是否存在于显著区域，若图像块大部分在显著区域，则认为该图像块为有效图像块，则该位置为1，否则置为0；4)空域特征向量S则是对含有有效信息的图像块提取其颜色和纹理特征构成子特征向量，和词典中的N类子词典中心比较，选择最接近的子词典，再和子词典中的各个单词进行比较，最终用词典中的单词代替图像块的特征，将所有有效图像块对应的词典单词连接起来构成空域特征向量S；5)频域特征向量D则是对每个图像块进行DCT变换，得到每一个图像块的DCT系数，提取出DCT系数中的直流系数和低频交流系数来构造DCT特征点，对所有图像块的DCT特征点求均值得到重心：(xa，ya)，使用DCT特征点(xi，yi)和重心(xa，ya)之间的欧氏距离构造频域特征向量D；6)最后利用密钥对标志位F和频域特征向量D置乱后与空域特征向量S连接起来构成图像摘要。所述利用图像库构成词典具体步骤如下：A：读入图像库中的每幅图像，对图像做预处理，将其规格化为相同尺寸：M×M，再将预处理后的图像分成L×L的图像块；B：判断图像块是否含有信息，主要是计算图像的显著图，通过比较图像块是否存在于显著区域，若图像块大部分在显著区域，则认为该图像块为有效图像块，否则为无效图像块，直接舍弃；C：对有效图像块提取图像块的特征构成特征向量，将所有图像中的有效图像块的特征向量连接起来构成特征矩阵；D：对特征矩阵进行聚类，将其聚类为N个子词典，最后存储聚类中心，每个子词典中单词数目和单词构成词典。本发明的有益效果在于：本发明基于图像库空域和频域特征的图像摘要获取方法，具有较好的稳健性和唯一性，能够检测篡改图像。它可以广泛应用于图像认证、图像检索和图像内容安全等领域。附图说明图1为本发明利用图像库特征构成词典的框图；图2为本发明图像摘要生成框图；图3为本发明常规图像处理对Hash的影响示意图；图4为本发明唯一性分析结果图；图5为本发明原图像与篡改图像以及Hash距离实例图。具体实施方式本发明基于图像库空域和频域特征的图像摘要获取方法：利用图像库的特征生成图像摘要主要是利用已有的图像库生成词典，词典中包含N个子词典以及若干个单词。图像在生成摘要时通过将自身特征与词典中的单词进行比较，最终由词典中的单词构成图像摘要，由于攻击者没有词典，因此这类算法的安全性很高。1、利用图像库构成词典：如图1所示利用图像库特征构成词典的框图，包括以下几个步骤：(1)读入图像库中的每幅图像，对图像做预处理，将其规格化为相同尺寸：M×M，再将预处理后的图像分成L×L的图像块；(2)判断图像块是否含有信息，主要是计算图像的显著图，通过比较图像块是否存在于显著区域，若图像块大部分在显著区域，则认为该图像块为有效图像块，否则为无效图像块，直接舍弃；(3)对有效图像块提取图像块的特征构成特征向量，将所有图像中的有效图像块的特征向量连接起来构成特征矩阵；(4)对特征矩阵进行聚类，将其聚类为N个子词典，最后存储聚类中心，每个子词典中单词数目和单词构成词典。2、图像摘要生成：图像摘要生成框图如图2所示。主要包含以下几个步骤：(1)首先对输入图像做预处理，将其规格化为相同尺寸，然后将图像分块分块大小与词典中图像块大小相同。之后提取图像特征构成中间摘要，中间摘要包括三部分：标志位F，空域特征向量S和频域特征向量D。(2)标志位F是对判断图像块是否含有有效信息，方法与词典生成中的方法相同，若含有有效信息，则该位置为1，否则置为0。(3)空域特征向量S则是对含有有效信息的图像块提取其颜色和纹理特征构成子特征向量，和所选词典中的N类子词典中心比较，选择最接近的子词典，再和子词典中的各个单词进行比较，最终用词典中的单词代替图像块的特征，将所有有效图像块对应的词典单词连接起来构成空域特征向量S。颜色特征是将颜色空间从RGB转变为HSV，然后转为H2SV取四个分量的均值后乘以100后取整；纹理特征则包括Tamura纹理特征的粗糙度，对比度，图像块的倾斜度(skewness)和峰度(kurtosis)并取整。(4)频域特征向量D则是对每个图像块进行DCT变换，得到每一个图像块的DCT系数，提取出DCT系数中的直流系数和低频交流系数来构造DCT特征点。对所有图像块的DCT特征点求均值得到重心：(xa，ya)。使用DCT特征点(xi，yi)和重心(xa，ya)之间的欧氏距离构造频域特征向量D。(5)最后利用密钥对标志位F和频域特征向量D置乱后与空域特征向量S连接起来构成图像摘要。3、图像摘要距离计算：接收方具有和发送方相同的词典。接收方收到可能经过攻击后的图像以及正确的图像摘要H1。图像认证包括以下几个步骤：(1)首先对接收图像按照图像摘要生成方法求出摘要H2＝[F2,S2,D2]。(2)对接收到的摘要利用密钥恢复出各个特征向量，即H1＝[F1,S1,D1]。(3)根据标志位F中的标志调整空域特征向量S，若标志位F为0则在空域特征向量S中补零，使得两幅图像相同位置图像块的特征在空域特征向量S中也位于相同位置。调整后的空域特征向量S分别记为S'1和S'2。将空域特征向量S和频域特征向量D连接起来构成特征向量V1＝[S'1,D1]和V2＝[S'2,D2]。(4)特征向量V1和V2之间的欧氏距离即为两个图像Hash的距离。若距离小于阈值，则认为收到的图像与发送的图像是相似图像，否则图像是被攻击的图像。4、具体实施方案及性能分析：在实施方案中对参数做如下设置：图像规格化大小M＝256，图像块大小L＝8，子词典的个数N＝26。因此图像块的总个数为32×32＝1024，标志向量F为1024bit，空域特征向量S为1024×8＝8192个整数，频域特征向量为1024个整数，每个整数用8bit表示，因此最终图像Hash是长度为1024+8192*8+1024*8＝74752bits。5、稳健性分析：在稳健性分析中，对5幅512×512的测试图像Airplane，House，Lena，Baboon和Peppers进行各种常规处理，包括用StirMark4.0进行JPEG压缩编码、添加噪声、嵌入水印；用Photoshop进行亮度调整、对比度调整和旋转；用MATLAB进行Gamma校正和3×3Gauss平滑滤波。表1列出了稳健性性能分析中各种常规图像处理所用参数。对原始图像的Hash与经过不同处理后图像的Hash计算距离(见图像摘要距离计算中步骤(4))，如图3所示。图中横轴的序号对应于表1列出的各种处理序号，纵轴表示Hash距离。除图像旋转之外，大部分处理引起的Hash变化不大，距离均在1000左右。旋转角度大于1°时，Hash距离急剧上升，这是因为采用了分块方案，旋转使图形块内容发生重大变化。可见本方法对图像旋转以外的常规图像处理具有良好的稳健性。表16、唯一性性能分析：图像Hash的唯一性又称为抗碰撞性，即两幅内容不同的图像应具有完全不同的图像Hash。图5给出1000幅不同图像生成的C21000＝499500个图像对的Hash距离的概率分布图。均值和标准差分别为2269.6.1和236。可以看出距离基本都大于1000。7、阈值确定：首先建立Hash距离数据集，其中包括3000个不同图像对Hash距离和3000个相似图像对Hash距离。相似图像对包括JPEG，Gamma校正和图像缩放。经过鲁棒性实验和唯一性实验可以知道阈值范围在800至1500，对数据集进行大津法分析。最终得到的最优阈值为993。方便起见将阈值定为1000。8、检错率和碰撞率：定义检错率和碰撞率如下：表2给出本方法所得的检错率和碰撞率。在图像Hash的性能指标中，碰撞率和检错率都很重要。从表2中可以看出本方法具有较低的碰撞率。表2阈值P检错率P碰撞率本方法10000.00372.01×10-69、篡改检测分析图5为原图像与篡改图像以及Hash距离实例图，此为篡改检测的一些实例。可以看出所有图像对的距离都大于确定的阈值T(1000)。总之，本专利提出的方法具有较好的稳健性和唯一性，能够检测篡改图像。它可以广泛应用于图像认证和图像检索领域。当前第1页1 2 3

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：赵琰;赵倩;
技术所有人：上海电力学院;
我是此专利的发明人

上一篇：一种运动背景下的多颜色物料筛选计数系统的制作方法与工艺
上一篇：一种折叠尾翼的铆接装配装置及方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。