基于频谱特征分析的图像重复检测方法

文档序号:6615730阅读:185来源:国知局
专利名称:基于频谱特征分析的图像重复检测方法
技术领域
本发明涉及计算机应用技术领域的多媒体检索技术,是一种基于频谱 特征分析的图像重复检测方法。
背景技术
随着多媒体技术和计算机网络的飞速发展,全世界包括数字图像、音 频、视频在内的多媒体数据正在以惊人的速度进行增长。特别是图像数据, 由于其直观、内容表达丰富、可以进行个性化编辑等因素,非常受到用户 的青睐。但是,每天新生成的海量级的图像数据,由于其巨大的冗余性, 无情地吞噬了我们有限的存储空间,并且淹没了很多有用的信息,从而给 用户的图像数据搜索带来了很大的麻烦。如何才能使用户有效地利用信息 并对所需多媒体资源的快捷定位、方便获取以及有效管理已经是一个亟待 解决的问题,特别是那些为用户服务的互联网搜索公司以及个性化数据供 应商更是希望能够低成本地维护和更新图像数据库。然而,目前诸如
google、 yahoo以及百度等成熟的商业图像搜索引擎几乎都是用文本来索 引图像的,这样就会导致在数据库出现大量的文本索引不同而内容几乎一 样的图像,从而占用了大量的宝贵的存储空间;更严重的是,用户检索服 务的质量会严重下降,因为检索出来的图像存在很大的重复性,直接会影 响用户的使用心情,造成用户的不满。因此,图像数据库中的重复检测问 题显得尤为重要,然而重复检测问题的核心是图像表达。只要数据库中的 图像索引做得好,就能有效地进行图像重复检测。
图像表达的本质是寻找一个合适的特征映射函数,该函数能够将图像 映射到一个不仅类内相似度高而且类间相似度也低的高维空间。在图像表 达研究领域,大致存在两种类型的特征映射函数,它们分别是基于底层视 觉特征和高层语义特征,我们称它们为底层特征映射函数和高层语义特征映射函数。底层特征映射函数主要是获得图像的一些底层信息,这些信息 主要包括颜色、纹理、梯度等。该函数的主要优点是操作方便,灵活度高, 计算复杂度低等,其主要缺点是缺乏图像的高层语义信息。相比之下,高 层语义特征映射函数主要是获得图像里的存在的目标或者整个图像场景 的语义信息,其主要优点是能够有效进行图像理解,从而较准确地表达图 像,但是,其主要的缺点是计算复杂度高,需要设定参数较多,灵活度低, 不能够被大规模地使用。综合以上两种映射函数的优缺点以及图像数据库 重复检测问题本身的特性,我们决定采用底层特征映射函数去捕获图像信 息,其主要原因如下(1)图像数据库的规模比较大,对计算复杂度的要 求非常严格;如果采用高层语义特征映射函数的话,数据库维护和更新的 代价非常巨大。(2)图像重复检测这个问题本身对图像内容表达的要求不 高。通常,两幅重复的图像是可以通过一些变换进行相互转换的,这些变 换主要包括平移、旋转以及尺度,且其变换幅度非常小。底层特征映射函 数完全可以处理以上这些变换所造成的影响。(3)底层特征映射函数灵活
度高,易于计算机处理;而高层语义特征映射函数正好相反,它受到诸多
因素的限制,需要事先设置很多的经验参数,不利于计算机处理。于是在 这种背景下,我们提出了一种融合图像颜色和梯度信息的特征。在该特征 中,图像颜色信息是通过图像的频谱来体现的,而图像梯度信息主要是通 过图像梯度方向直方图的频谱来体现的。在以下几个部分,我们将详细介 绍该特征。

发明内容
本发明提出了一种基于频谱特征分析的图像重复检测方法,这种方法 采用了集成了图像颜色和梯度信息的图像索引,,应用于图像重复检测领 域。
本发明提出的基于频谱分析的图像重复检测方法,包括 采用下采样模块对图像进行下采样,用于缩短图像频谱分析的计算时
间;
采用频谱分析模块对图像进行频谱分析,用于提取下采样后的图像的
低频谱信息,得到图像像素的颜色信息;采用频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图
像梯度分布特征;
采用索引生成模块融合图像颜色和梯度信息,作为图像索引; 以图像索引为依据,检测图像是否重复。
进一步,所述下采样后的图像的低频谱信息包括旋转、平移以及尺度 不变。
进一步,所述下釆样后的图像梯度分布特征具有旋转、平移以及尺度 不变的性质。
进一步,所述频谱分析步骤包括 对图像进行傅立叶变换,获取其幅度谱; 对幅度谱进行对数极坐标映射形成一幅新的图像; 对这幅新的图像进行傅立叶变换,获得幅度谱; 仅保留低频谱信息,用来刻画图像颜色分布的特征。 进一步,所述梯度信息分析步骤包括 提取图像每一个像素的梯度,统计所有像素的梯度方向; 将方向空间量化为n个等级;
将每一个像素的梯度方向映射到相应的等级,构建成了一个梯度方向 直方对直方图进行傅立叶变换,取其幅度谱; 将幅度谱作为刻画图像梯度信息的特征。
本发明提出的基于频谱特征分析的图像重复检测方法,使用的图像底 层特征较好地表达了图像中的结构和细节信息;其作为图像索引,可以有 效地检测出图像数据库中文本索引不同而内容几乎一样的图像,从而极大 地节约了宝贵的存储空间,从而提高了用户检索服务的质量。


图l为本发明系统结构框图2为本发明检测重复山河图像的应用实例;
图3为本发明检测重复飞机图像实例;图4为本发明检测重复溪流图像实例。
具体实施例方式
下面将结合附图对本发明加以详细说明,应指出的是,所描述的实施 例仅旨在便于对本发明的理解,而对其不起任何限定作用。
本发明总体结构由以下三个模块组成 一、下采样模块,该模块的功 能是对图像进行下采样。二、频谱分析模块,该模块的功能是进行图像频 谱分析和图像梯度信息分析。三、图像索引生成模块,该模块的任务是将 频谱分析模块得到的两种特征统一起来,从而形成一个对图像旋转、平移 以及尺度变化非常鲁棒的图像索引。我们利用这个索引来进行图像重复检 测。图l显示了本发明的整体结构。
下面详细给出该发明技术方案中所涉及的各个细节问题的说明。
1) 通过下采样模块对图像进行下采样。
首先将图像进行下采样,这样做的目的是降低计算复杂度,同时也能 获取图像大尺度的结构信息。通常,下采样率是0.5,也就是图像的尺寸 变成原来的一半。此外,如果要处理的图像是彩色图像,那么我们首先将 彩色图像转换为灰度图像。
2) 通过频谱分析模块对图像进行频谱分析。
对下釆样后的图像进行傅立叶变换,获取其幅度谱;然后对幅度谱进 行对数极坐标映射形成一幅新的图像;接着对这幅新的图像进行傅立叶变 换,获得幅度谱;最后仅保留一些低频率的谱信息。经过以上处理后所获 得的谱信息是不变于图像尺度、旋转以及平移变换的,这些属性可以通过 我们以下的理论分析得到证实。
给定一幅原始图像/。(A力,我们对它进行旋转、尺度以及平移变换 后得到一幅新的图像/6&,力,其中旋转角度是",尺度因子是^, X 方向的平移量为A,以及^方向的平移量为^,以上变换过程可以用以 下的公式说明
厶(x,y) = /。 [cr(xcosQf + _y sin qO — x0,ct(—x since +_y cos cO-y。]。 我们分别对/。"力和厶(&力迸行傅立叶变换,得到对应的频谱《(",v)和
《(",V)。根据傅立叶变换理论,F。(W,V)和《(M,V)存在以下的关系
7二 e- 'v) {尸。cr_1(wcos" +vsina)o, cr-、-w sin a + vcos a)
其中,^(",v)是y;(x,力的相位谱,该相位谱与旋转角度、尺度因子以及
平移量有关;但如果我们只考虑幅度频谱i巧(",力i,就会发现^(",v)l是平移
不变的,艮口
《(w, v) = a—2 Fa cr—cos a+ vsina)0,cr_1(—w sin a+ vcosa)。
以上公式表明,iF。(",v)l和^(",v)l之间是通过旋转角度"和尺度因子CT 之间联系的。然后我们在极坐标系0,。里重新表达lF。(",v)l和lF々,v)1,即
1/ = r cos辦口v 二 r sin(9。从而可以衍生出以下的关系
4 cos久r sin 0|; / (仏r), 0 cos《r sin P)|
经过一些简化运算,我们可以得出
这样图像旋转转换就被转换为沿着角度轴^的平移和半径轴r的尺度变 换。接着,我们进一步将/^(r,。的半径轴r映射到对数坐标系里,这样
我就有了以下的关系式
/一 义)=4 。 = CT—% ("K 其中,2 = k)g(。, flog(a)。这样以来,图像的旋转和平移就被简化为沿 着义轴和〃轴的平移;然后我们对/^W,义)进行傅立叶变换;根据傅立叶 变换理论,我们有以下的关系
F6p/(《,o = ,2e,(M,— , O 。
我们对l^,(《,OI进行归一化,然后取其作为最后的频谱特征,这样 IF^(^OI是旋转、尺度和平移不变的。
3) 通过频谱分析模块对图像进行梯度信息分析。 提取下采样后的图像每一个像素的梯度,然后统计所有像素的梯度方
向;接着,我们将方向空间等间隔量化为36个等级;然后我们将每一个 像素的梯度方向映射到相应的等级,这样构建成了一个梯度方向直方图; 然后对直方图进行傅立叶变换,取其幅度谱。由于梯度方向直方图本身具 有尺度和平移不变的属性,再加上傅立叶变换后去幅度谱,这样以来得到 的特征有具有旋转不变的特性。
4) 通过索引生成模块融合图像颜色和梯度信息,实现特征集成。第二步得到的谱特征和第三步得到的梯度方向直方图谱特征,它们都 具有旋转、尺度以及平移不变的属性。我们将这两种特征组合起来作为一 幅图像的索引,分别使用欧式距离来度量两幅图像之间的距离,另外再定 义一个阈值来判别两幅图像是否重复;如果两种距离的和小于这个阈值,
我们就认为比较的两幅图像是重复的;反之亦然。
图2、图3以及图4给出了我们图像重复检测系统的三个应用实例。 在图2中,我们选中数据库中的一幅含有山河的图像,对其提取我们提出 的基于频谱分析的图像底层特征,然后利用该特征进行图像匹配,从而挑 选出数据库中与检索图像重复的4张图片。在图3中,我们选中数据库中
的一幅含有飞机的图像,对其提取我们提出的基于频谱分析的图像底层特 征,然后利用该特征进行图像匹配,从而挑选出数据库中与检索图像重复 的3张图片。在图4中,我们选中数据库中的一幅含有溪流的图像,对其 提取我们提出的基于频谱分析的图像底层特征,然后利用该特征进行图像 匹配,从而挑选出数据库中与检索图像重复的3张图片。
以上所述,仅为本发明中的具体实施方式
,但本发明的保护范围并不 局限于此,任何熟悉该技术的人在本发明所揭露的技术范围内,可理解想 到的变换或替换,都应涵盖在本发明的包含范围之内,因此,本发明的保 护范围应该以权利要求书的保护范围为准。
权利要求
1. 一种基于频谱分析的图像重复检测方法,其特征在于,包括通过下采样模块对图像进行下采样,用于缩短图像频谱分析的计算时间;通过频谱分析模块对图像进行频谱分析,用于提取下采样后的图像的低频谱信息,得到图像像素的颜色信息;通过频谱分析模块对图像进行梯度信息分析,用于获取下采样后的图像梯度分布特征;通过索引生成模块融合图像颜色和梯度信息,作为图像索引;以图像索引为依据,检测图像是否重复。
2. 根据权利要求1所述的方法,其特征在于,所述下采样后的图像的低 频谱信息包括图像的旋转、平移以及尺度不变。
3. 根据权利要求1所述的方法,其特征在于,所述下采样后的图像梯度 分布特征具有旋转、平移以及尺度不变的性质。
4. 根据权利要求1所述的方法,其特征在于,所述频谱分析步骤包括对图像进行傅立叶变换,获取其幅度谱; 对幅度谱进行对数极坐标映射形成一幅新的图像; 对这幅新的图像进行傅立叶变换,获得幅度谱; 仅保留低频谱信息,用来刻画图像颜色分布的特征。
5. 根据权利要求1所述的方法,其特征在于,所述梯度信息分析步骤包 括提取图像每一个像素的梯度,统计所有像素的梯度方向; 将方向空间量化为n个等级;将每一个像素的梯度方向映射到相应的等级,构建成了一个梯度方向 直方图;对直方图进行傅立叶变换,取其幅度谱;将幅度谱作为刻画图像梯度信息的特征,
全文摘要
本发明是一种基于频谱特征分析的图像重复检测方法,包括通过下采样模块对图像进行下采样,通过频谱分析模块对图像进行频谱分析;用于提取图像像素的颜色信息;通过频谱分析模块对图像进行梯度信息分析;用于获取下采样后的图像梯度分布特征,该特征具有旋转、平移以及尺度不变的性质;通过索引生成模块融合图像颜色和梯度信息,作为图像索引。采用这种方法可以极大地减少数据库的存储冗余度,提高了现有检索系统的检索性能和效率。
文档编号G06F17/30GK101470730SQ20071030420
公开日2009年7月1日 申请日期2007年12月26日 优先权日2007年12月26日
发明者偶 吴, 玺 李, 胡卫明 申请人:中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1