一种大规模图像检索方法

文档序号:6620892阅读:167来源:国知局
一种大规模图像检索方法
【专利摘要】本发明公开了一种大规模图像检索方法,包含如下步骤:图像特征提取;哈希函数投影向量学习;哈希函数偏移量学习;图像特征降维;图像特征编码;图像检索。本发明能够对大规模图像进行快速检索。首先,通过学习判别式的哈希函数,提高了编码之间的判别性,从而更好地区分不同类别的图像特征;其次,利用哈希函数对图像特征进行降维和编码,减少图像特征的存储需求和检索过程的计算开销。本发明实现了高效、准确的大规模图像检索,因此具有较高的使用价值。
【专利说明】一种大规模图像检索方法

【技术领域】
[0001] 本发明属于计算机图像检索领域,特别是一种大规模图像检索方法。

【背景技术】
[0002] 随着互联网的快速发展,各种网络资源日益丰富,网络数据规模也以指数级的速 度增长。在互联网上存在的各种类型数据中,图像占据了大部分,目前已达到了海量规模: 2010年,著名网站Flickr统计的图片总量超过了 50亿。这样的数据还在持续以惊人的速 度增长,若干年后将达到难以想象的规模。毫无疑问,从如此大的数据库中快速、准确地搜 索用户需要的数据变得十分重要,同时也存在巨大的困难。例如,给定一幅图像,如何在大 规模的数据库中快速并且准确地搜索到与给定图像相似的图像是目前热门的研究课题,然 而这类应用往往存在两个重要的问题:
[0003] 1)图像特征通常是高维数据,存储要求高且计算效率较低;
[0004] 2)大规模数据的检索方式对效率有很高的要求。
[0005] 针对这些问题,哈希索引算法在近些年被提出,其基本思想是利用多个哈希函数 把高维空间中的特征映射到低维空间,哈希索引算法中最主要的一个步骤就是特征编码, 近年来有很多研究人员通过引进机器学习算法学习哈希函数来构造编码,然而目前的方法 还存在判别性不足等问题。


【发明内容】

[0006] 发明目的:本发明为了解决现有技术中的问题,提出了一种大规模图像检索方法, 从而有效解决大规模数据下,图像特征的快速、准确编码、检索的问题。


【发明内容】
[0007] :本发明公开了一种大规模图像检索方法,包含如下步骤:
[0008] 步骤1,图像特征提取:对待检索图像和图像数据库的每一幅图像提取特征;
[0009] 步骤2,哈希函数投影向量学习:随机选取出图像数据库中若干图像的特征,组成 图像特征训练集,利用图像特征训练集学习哈希函数投影向量;
[0010] 步骤3,哈希函数偏移量学习:利用图像特征训练集学习哈希函数偏移量,从而得 到哈希函数;
[0011] 步骤4,图像特征降维:利用哈希函数对待检索图像和图像数据库的每一幅图像 的图像特征进行降维,得到每一幅图像的低维特征向量;
[0012] 步骤5,图像特征编码:对每一幅图像的低维特征向量进行量化,得到每一幅图像 的图像特征编码;
[0013] 步骤6,图像检索。
[0014] 步骤1图像特征提取具体包括如下步骤:
[0015] 本发明对图像特征的种类没有特别的限制,只要经过计算,每幅图像最终得到一 个特征向量,作为图像特征即可。在图像检索领域常用的特征大多数都符合这个要求,例如 局部二元模式(Local Binary Pattern, LBP)直方图、颜色直方图特征、GIST特征等。
[0016] 步骤2哈希函数投影向量学习具体包括如下步骤:
[0017] 首先,从大规模图像特征数据库中随机选取一部分作为图像特征训练集,表示为 X二{x^Xg,…,xN} (= Md,其中IR表示实数,每一个图像特征xie都是一个d维的列向量,每 一个图像特征都有一个类别标签y ie,ie取值1至N。假设图像特征共有η类,则yie的取值 为区间[l,n]内的一个自然数,类别标签组成标签集合1/ = {>^2,'"以1^!?将图像特征训 练集中的图像特征按不同类别进行分组,得到分组表示为G = {gl,g2,…,gn},其中η表示 图像特征类别数, gi表示第i组图像特征的集合,i取值1至η。分组标准为图像内容,举 例来说,图像训练集中有三类图像,第一类为汽车,第二类为人,第三类为飞机,那么,汽车、 人、飞机的图像各自被归为一组,汽车对应gi,其标签为yi = 1 ;人对应g2,其标签为y2 = 2 ; 飞机对应&,其标签为y3 = 3。分组可以采用人工分组,也可以采用现有的计算机自动处理 分组方法(例如,参见参考文献:付岩,王耀威,王伟强,高文.SVM用于基于内容的自然图像 分类和检索[J].计算机学报,2003:26(10) ,1262-1265)。
[0018] 然后,对每一组图像特征学习哈希函数投影向量。对第i组图像特征学习哈希函 数投影向量的过程如下:将第i组图像特征作为一个集合M,将除第i组以外的n-1组图像 特征组合成集合C。考虑到学习到的哈希函数能够获得较好的判别性,且保持Μ中图像特征 的局部性,包括以下部分:
[0019] (1)对于集合Μ中的图像特征,通过计算近邻之间的距离来衡量Μ类的类内散列 度。
[0020] (2)对于集合C中的图像特征,通过计算图像特征与图像特征中心的距离来衡量C 类的类内散列度。
[0021] (3)通过计算Μ和C中图像特征中心的距离来衡量类间离散度。
[0022] 定义学习哈希函数的目标如下:
[0023]

【权利要求】
1. 一种大规模图像检索方法,用于从图像数据库中找到与待检索图像最相似的k幅图 像,k为自然数,其特征在于,包含以下步骤: 步骤1,图像特征提取:对待检索图像和图像数据库的每一幅图像提取特征; 步骤2,哈希函数投影向量学习:随机选取出图像数据库中若干图像的特征,组成图像 特征训练集,利用图像特征训练集学习哈希函数投影向量; 步骤3,哈希函数偏移量学习:利用图像特征训练集学习哈希函数偏移量,从而得到哈 希函数; 步骤4,图像特征降维:利用哈希函数对待检索图像和图像数据库的每一幅图像的图 像特征进行降维,得到每一幅图像的低维特征向量; 步骤5,图像特征编码:对每一幅图像的低维特征向量进行量化,得到每一幅图像的图 像特征编码; 步骤6,图像检索。
2. 根据权利要求1所述的一种大规模图像检索方法,其特征在于,步骤2包括如下步 骤: 首先,将图像特征训练集中的图像特征按不同类别进行分组,得到分组表示为G = {gi,g2,…,gj,其中η为图像特征类别总组数,gi表示第i组图像特征,i取值1至η ; 然后,对每一组图像特征学习哈希函数投影向量:对第i组图像特征学习哈希函数投 影向量的过程如下:将第i组图像特征作为一个集合M,将除第i组以外的n-1组图像特征 组合成集合C,通过最小化集合Μ和C各自的类内散列度、最大化Μ和C之间的类间散列度 来学习哈希函数投影向量; 最后,将每一组图像特征学习到的哈希函数投影向量进行组合。
3. 根据权利要求2所述的一种大规模图像检索方法,其特征在于,步骤3包括如下步 骤: 首先,在每组图像特征gi中随机采集m个图像特征对,将所有组的图像特征对组成一 个集合P,则集合P中有nXm个图像特征对; 然后,任选两组图像特征gia,gib,ia,ib取值分别为1至η且ia不等于ib,每组随机选 取一个图像特征组成一个图像特征对,总共选取nXm个图像特征对,组成集合Q ; 最后,通过最小化集合P中图像特征对的编码值差异、最大化集合Q中图像特征对的编 码值差异,为步骤2中每一个哈希函数投影向量学习一个哈希函数偏移量,将哈希函数投 影向量和其对应的哈希函数偏移量组合,得到哈希函数。
4. 根据权利要求3所述的一种大规模图像检索方法,其特征在于,步骤4包括如下步 骤: 对于任意一个图像特征,用每个哈希函数对其进行运算,一个哈希函数和一个图像特 征经过运算得到一个实数,将所有哈希函数运算得到的实数拼接,形成图像特征对应的低 维特征向量。
5. 根据权利要求4所述的一种大规模图像检索方法,其特征在于,步骤5包括如下步 骤: 首先,对低维特征向量进行取符号操作,并用〇替换其中的-1,得到低维特征向量的二 进制编码; 然后对二进制编码从左到右每8位为一个字节,转换为十进制数,末尾不足8位的编码 加〇凑足8位; 最后,将每个字节得到的十进制数拼接得到一个向量,作为图像特征的编码。
6.根据权利要求1所述的一种大规模图像检索方法,其特征在于,步骤6中图像检索包 括如下步骤: 根据待检索图像编码BqUOTy,取出图像特征数据库中编码和待检索图像编码BqUOTy相同 的所有图像特征,并作为检索候选集; 计算检索候选集中每个图像特征和待检索图像的图像特征的欧氏距离,并按照欧氏距 离由小到大输出对应k幅图像。
【文档编号】G06F17/30GK104112018SQ201410348791
【公开日】2014年10月22日 申请日期:2014年7月21日 优先权日:2014年7月21日
【发明者】杨育彬, 毛晓蛟 申请人:南京大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1