一种基于特征差异性的改进图像搜索方法

文档序号：9911264阅读：385来源：国知局

一种基于特征差异性的改进图像搜索方法
【技术领域】
[0001] 本发明涉及计算机视觉、模式识别、图像检索、搜索引擎等技术领域，具体涉及一种基于特征差异性的改进图像搜索方法。
【背景技术】
[0002] 随着信息技术和互联网的发展，网络上的多媒体数据量急剧增长，用户对此类数据的检索需求亦在提升。图像检索也被越来越多的用户关注并使用。
[0003] 由于图像拍摄的角度、环境有着很大的差异，使得图像检索的准确度很难达到用户的需求。且图像中的信息量很大，因此实时地从海量图片中搜索到相似图片也较之文本搜索困难。本发明在不明显提高时间复杂度的情况下能提升一些图像检索的性能，具有很大的价值。
[0004] 目前图像检索的主流技术是基于SIFT特征(参见文献【1】D.G. Lowe distinctive image features from scale-invariant keypoints,International Journal of Computer Vision，vo 1 ·60，no · 2，pp ·91-110，2004·)和词袋模型（Bag-of-words)对图像进行表达，然后利用倒排索引的技术完成检索过程。
[0005] 该类技术从每副图像提取一些关键区域，然后在关键区域处提取一些高维特征，然后利用词袋模型进行量化得到最终的表达。在完成所有图像的表达后利用统计模型计算出每个visual word的tf-idf权重，最后利用倒排文件检索（参见文献【2】J . Si vie， A.Zisserman, Video Google: A text retrieval approach to object matching in videos, IEEE International Conference on Computer Vision，pp·1470-1477，2003·以及文南犬【3 】J . Phi lb in，0 . Chum，M . I sard，e t al，0bject retrieval with large vocabularies and fast spatial matching,IEEE Conference on Computer Vision and Pattern Recognition,pp.1-8,2007.)〇
[0006] 针对该方法的一些缺陷，一些弥补缺陷提升性能的方法被提出，且不会较大提升时间耗费。且一些方法能以兼容的方式结合起来使性能得到更大的提升。
[0007] l)Philbin(参见文献【3】J.Philbin,0.Chum，M· Isard，et al，0bject retrieval with large vocabularies and fast spatial matching, IEEE Conference on Computer Vision and Pattern Recognition，pp. 1_8,2007.)于2007年提出使用大词典与利用空间信息的re-rank策略完成大规模的图像检索，该方法被广泛作为baseline使用。
[0008] 2)卩11；!_113；!_11(参见文献【4】0.〇111111，<1.?11；!_113；!_11， <1.3;!_￥；!_。，6七&1，1'〇七&1^。&11: Automatic query expansion with a generative feature model for object retrieval，IEEE International Conference on Computer Vision，pp·1-8，2007·)于 2007年Query expansion的方法提升搜索的召回率，即使用初始搜索结果对query进行信息补充。
[0009] 3) Jggou(参见文献【5】H. j6gou，M.Douze，C. Schmid, Improving bag-〇f-features for large scale image search，International Journal of Computer Vision，vol.87， no. 3，pp. 316-336，2010.)于2008年提出了弱化量化误差影响的Hamming Embedding方法，每个SIFT描述子除了量化到一个Visual word外，还与一个二进制编码绑定，该二进制编码与描述子与Visual word的残差相关。
[0010] 4)1168〇11(参见文献【6】!1.11吨〇11，]\1.0〇1126，〇.3(3111111(1，0111:116 131^81:;[1168801!· visual elements, IEEE Conference on Computer Vision and Pattern Recognition, pp. 1169-1176,2009.)于2009年提出在图像中，往往有很多word会很大概率多次出现。 Jegou在Hamming Embedding的基础上利用更详尽的量化信息进行统计，解决Intra-burstiness(图像内）和Inter-burstiness(图像间）问题。
[0011] 5)〇1&七:1^61(1(参见文献【7】1(.〇1&七;1^61(1，]\?11；[113；[11，厶.218861'1]1&113打;[(^611七 retrieval of deformable shape classes using local self-similarities,IEEE International Conference on Computer Vision Workshops，pp·264-271，2009·)于2009 年提出使用自相似性描述子来表达图像，同事选择特征时采用一个描述子与其最近邻和次近邻的距离比作为依据。
[0012] 6)Chum(参见文献【8】0.Chum,J.Matas.Unsupervised discovery of c〇-occurrence in sparse high dimensional data,IEEE Conference on Computer Vision and Pattern Recognition ,pp · 3416-3423,2010 ·)于2010年提出通过检测一些word的共发性来来减少一些重复元素的重复得分。
[0013] 7 ) Arandjclovid (参见文献【9】R · Arandjelovk、A · Zi sserman · Three things everyone should know to improve object retrieval, IEEE Conference on Computer Vision and Pattern Recognition,pp.2911-2918,2012·)于2012年在Query expansion的基础上提出discriminative query expans ion，通过调整各个特征的权重提升搜索性能。
[0014] 8)21161^(参见文献【10】1^.21161^，3.此1^，2丄;[11，6七&1，14)-1101'1111(^;1^01'1&坪6 scale image search, IEEE Conference on Computer Vision and Pattern Recognition, pp. 1626-1633,2013.)于2013年提出在计算idf权重时考虑tf权重，来计算各个word的权重。
[0015] 9)]^『6 1(参见文献【11】]\]^代1，〇.1(〇(311，？.？61'〇11&.6『&卩11-匕&86(1￥1811已1 saliency,Advances in neural information processing systems,pp·545-552,2006·) 于2006年提出使用图模型计算图像的显著性。
[0016] 本发明中旨在使用原始SIFT描述子(而非量化后的特征)解决visual elements

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：凌强;杜彬彬;李峰;
技术所有人：中国科学技术大学;
我是此专利的发明人

上一篇：一种包含道路行进方向的增强型矢量数字地图制作方法
上一篇：一种登录方法、装置及电子设备的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。