一种基于特征差异性的改进图像搜索方法

文档序号:9911264阅读:385来源:国知局
一种基于特征差异性的改进图像搜索方法
【技术领域】
[0001] 本发明涉及计算机视觉、模式识别、图像检索、搜索引擎等技术领域,具体涉及一 种基于特征差异性的改进图像搜索方法。
【背景技术】
[0002] 随着信息技术和互联网的发展,网络上的多媒体数据量急剧增长,用户对此类数 据的检索需求亦在提升。图像检索也被越来越多的用户关注并使用。
[0003] 由于图像拍摄的角度、环境有着很大的差异,使得图像检索的准确度很难达到用 户的需求。且图像中的信息量很大,因此实时地从海量图片中搜索到相似图片也较之文本 搜索困难。本发明在不明显提高时间复杂度的情况下能提升一些图像检索的性能,具有很 大的价值。
[0004] 目前图像检索的主流技术是基于SIFT特征(参见文献【1】D.G. Lowe distinctive image features from scale-invariant keypoints,International Journal of Computer Vision,vo 1 ·60,no · 2,pp ·91-110,2004·)和词袋模型(Bag-of-words)对图像进 行表达,然后利用倒排索引的技术完成检索过程。
[0005] 该类技术从每副图像提取一些关键区域,然后在关键区域处提取一些高维特征, 然后利用词袋模型进行量化得到最终的表达。在完成所有图像的表达后利用统计模型计算 出每个visual word的tf-idf权重,最后利用倒排文件检索(参见文献【2】J . Si vie, A.Zisserman, Video Google: A text retrieval approach to object matching in videos, IEEE International Conference on Computer Vision,pp·1470-1477,2003·以 及文南犬【3 】J . Phi lb in,0 . Chum,M . I sard,e t al,0bject retrieval with large vocabularies and fast spatial matching,IEEE Conference on Computer Vision and Pattern Recognition,pp.1-8,2007.)〇
[0006] 针对该方法的一些缺陷,一些弥补缺陷提升性能的方法被提出,且不会较大提升 时间耗费。且一些方法能以兼容的方式结合起来使性能得到更大的提升。
[0007] l)Philbin(参见文献【3】J.Philbin,0.Chum,M· Isard,et al,0bject retrieval with large vocabularies and fast spatial matching, IEEE Conference on Computer Vision and Pattern Recognition,pp. 1_8,2007.)于2007年提出使用大词典与利用空间 信息的re-rank策略完成大规模的图像检索,该方法被广泛作为baseline使用。
[0008] 2)卩11;!_113;!_11(参见文献【4】0.〇111111,<1.?11;!_113;!_11, <1.3;!_¥;!_。,6七&1,1'〇七&1^。&11: Automatic query expansion with a generative feature model for object retrieval,IEEE International Conference on Computer Vision,pp·1-8,2007·)于 2007年Query expansion的方法提升搜索的召回率,即使用初始搜索结果对query进行信息 补充。
[0009] 3) Jggou(参见文献【5】H. j6gou,M.Douze,C. Schmid, Improving bag-〇f-features for large scale image search,International Journal of Computer Vision,vol.87, no. 3,pp. 316-336,2010.)于2008年提出了弱化量化误差影响的Hamming Embedding方法, 每个SIFT描述子除了量化到一个Visual word外,还与一个二进制编码绑定,该二进制编码 与描述子与Visual word的残差相关。
[0010] 4)1168〇11(参见文献【6】!1.11吨〇11,]\1.0〇1126,〇.3(3111111(1,0111:116 131^81:;[1168801!· visual elements, IEEE Conference on Computer Vision and Pattern Recognition, pp. 1169-1176,2009.)于2009年提出在图像中,往往有很多word会很大概率多次出现。 Jegou在Hamming Embedding的基础上利用更详尽的量化信息进行统计,解决Intra-burstiness(图像内)和Inter-burstiness(图像间)问题。
[0011] 5)〇1&七:1^61(1(参见文献【7】1(.〇1&七;1^61(1,]\?11;[113;[11,厶.218861'1]1&113打;[(^611七 retrieval of deformable shape classes using local self-similarities,IEEE International Conference on Computer Vision Workshops,pp·264-271,2009·)于2009 年提出使用自相似性描述子来表达图像,同事选择特征时采用一个描述子与其最近邻和次 近邻的距离比作为依据。
[0012] 6)Chum(参见文献【8】0.Chum,J.Matas.Unsupervised discovery of c〇-occurrence in sparse high dimensional data,IEEE Conference on Computer Vision and Pattern Recognition ,pp · 3416-3423,2010 ·)于2010年提出通过检测一些word的共发 性来来减少一些重复元素的重复得分。
[0013] 7 ) Arandjclovid (参见文献【9】R · Arandjelovk、A · Zi sserman · Three things everyone should know to improve object retrieval, IEEE Conference on Computer Vision and Pattern Recognition,pp.2911-2918,2012·)于2012年在Query expansion的 基础上提出discriminative query expans ion,通过调整各个特征的权重提升搜索性能。
[0014] 8)21161^(参见文献【10】1^.21161^,3.此1^,2丄;[11,6七&1,14)-1101'1111(^;1^01'1&坪6 scale image search, IEEE Conference on Computer Vision and Pattern Recognition, pp. 1626-1633,2013.)于2013年提出在计算idf权重时考虑tf权重,来计算各 个word的权重。
[0015] 9)]^『6 1(参见文献【11】]\]^代1,〇.1(〇(311,?.?61'〇11&.6『&卩11-匕&86(1¥1811已1 saliency,Advances in neural information processing systems,pp·545-552,2006·) 于2006年提出使用图模型计算图像的显著性。
[0016] 本发明中旨在使用原始SIFT描述子(而非量化后的特征)解决visual elements
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1