一种基于大规模图像检索方法

文档序号：8445562阅读：262来源：国知局

一种基于大规模图像检索方法
【技术领域】
[0001] 本发明涉及信息检索领域，特别是一种基于大规模图像检索方法。
【背景技术】
[0002] 智能终端设备如智能手机、平板电脑，以及数码相机和数码摄像机的普及和便携化，使这些多媒体采集设备已经成为人们日常生活中不可缺少的一部分。同时智能终端与互联网之间的交互越来越方便，人们大量地使用这些设备来上传、浏览和交流拍摄的数字图像。据统计，仅在Flickr上就有2000万的图像浏览次数。截止2011年8月，Flickr上的图像总数已达60亿张。相对于文字的信息而言，数字图像具有直观易于理解、信息层次感强、重点突出的特点。面对这无比庞大的图像数据库，人们自然会产生这样的需要：从这海量图像中寻找满足自己要求的图像。因此，人们开发了各种各样的图像检索系统，以满足不同人群的各式各样的需求。
[0003] 基于内容的图像检索（ContentBasedImageRetrieval,CBIR)模型的核心思想是模拟人对图像的认知，通过对图像的内容进行计算机层面的分析，根据内容建立语义索弓丨，记录图像深入层面的信息，从而更好地理解用户的需求，呈现有多个在线的基于内容的图像检索系统，比如国外的TinEye，GoogleImages和百度的百度识图等。

【发明内容】

[0004] 为解决现有技术存在的问题，本发明提供一种基于大规模图像检索方法。
[0005] 实现本发明的技术方案为：
[0006] 步骤1，对库图像进行离线检索，提取库图像的底层局部特征进行量化，对量化后的库图像数据进行处理得到图像的特征描述关于位置的权重信息，并根据权重信息建立图像数据集倒排索引结构；
[0007] 步骤2,对查询图像进行在线检索，提取查询图像数据集的底层局部特征进行量化，对量化后的查询图像数据集用saliency-detection方法得到图像的特征描述关于位置的权重信息；
[0008] 步骤3,根据库图像的每个特征描述，利用倒排索引计算每幅查询图像中的各个特征描述之间的相似性，并输出相似值；
[0009] 步骤4,将所有相似值按照由大到小排列得到最大值列表。
[0010] 本发明采用以下技术手段进一步实现发明目的：
[0011] (1)步骤1的具体过程为：
[0012] 步骤1. 1，提取库图像的底层局部特征，包括特征及其矢量描述；
[0013] 步骤1. 2,选取库图像的初始聚类中心参数；
[0014] 步骤1. 3,根据SIFT特征的矢量描述与聚类中心参数矢量描述之间的欧式距离进行k-means聚类；
[0015] 步骤1. 4,对量化过后的特征描述在尺度和方向角上采用saliency-detection方法进行位置加权；
[0016] 步骤1. 5,建立图像数据集倒排索引结构。
[0017] (2)步骤2的具体过程为：
[0018] 步骤2. 1，提取查询图像的底层局部特征，包括SIFT特征及其矢量描述；
[0019] 步骤2. 2,选取查询图像的初始聚类中心参数；
[0020] 步骤2. 3,根据SIFT特征的矢量描述与聚类中心参数矢量描述之间的欧式距离进行k-means聚类；
[0021] 步骤2. 4,对量化过后的特征描述在尺度和方向角上采用saliency-detection方法进行位置加权。
[0022] (3)步骤3采用几何一致性验证过滤特征描述，其具体方法为：
[0023] 步骤3. 1，利用倒排索引结构，先过滤在方向角上不一致的库图像SIFT特征描述子，并计算相似性得分的最大值；
[0024] 步骤3. 2,利用倒排索引结构，再过滤在尺度上不一致的库图像SIFT特征特征描述子，并计算相似性得分最大值；
[0025] 步骤3. 3,选取在尺度和方向角上相似性得分函数较小的作为该SIFT特征描述子的查询图像与库图像的相似性得分；
[0026] 步骤3. 4,遍历查询图像中所有SIFT特征描述子完成步骤3. 1~3. 3。
[0027] 计算相似性得分的函数为Sj=Sj+fsd (xi;j, )，其中Xi,j为每一幅查询图像的SIFT描述子，Yi，为每一个库图像的SIFT描述子，fsd (x,y) =sd(tf-idf(q(x)))，tf_idf(q(x)) =f(x，y)，f()是反映SIFT描述子之间相似性的函数。
【主权项】
1. 一种基于大规模图像检索方法，其特征在于，包括以下步骤：步骤1，对库图像进行离线检索，提取库图像的底层局部特征并进行量化，对量化后的库图像数据进行处理得到图像的特征描述关于位置的权重信息，并根据权重信息建立图像数据集倒排索引结构；步骤2,对查询图像进行在线检索，提取查询图像数据集的底层局部特征进行量化，对量化后的查询图像数据集用saliency-detection方法得到图像的特征描述关于位置的权重信息；步骤3,根据库图像的每个特征描述，利用倒排索引计算每幅查询图像中的各个特征描述之间的相似性，并输出相似值；步骤4,将所有相似值按照由大到小排列得到最大值列表。
2. 根据权利要求1所述的基于大规模图像检索方法，其特征在于，步骤1的具体过程为：步骤1. 1，提取库图像的底层局部特征，包括特征及其矢量描述；步骤1. 2,选取库图像的初始聚类中心参数；步骤1. 3,根据SIFT特征的矢量描述与聚类中心参数矢量描述之间的欧式距离进行 k-means 聚类；步骤1. 4,对量化过后的特征描述在尺度和方向角上采用saliency-detection方法进行位置加权；步骤1. 5,建立图像数据集倒排索引结构。
3. 根据权利要求2所述的基于大规模图像检索方法，其特征在于，步骤1. 2中采用随机或者先验知识选取库图像的初始聚类中心参数。
4. 根据权利要求1所述的基于大规模图像检索方法，其特征在于，步骤2的具体过程为：步骤2. 1，提取查询图像的底层局部特征，包括SIFT特征及其矢量描述；步骤2. 2,选取查询图像的初始聚类中心参数；步骤2. 3,根据SIFT特征的矢量描述与聚类中心参数矢量描述之间的欧式距离进行 k-means 聚类；步骤2. 4,对量化过后的特征描述在尺度和方向角上采用saliency-detection方法进行位置加权。
5. 根据权利要求4所述的基于大规模图像检索方法，其特征在于，步骤2. 2中采用随机或者先验知识选取库图像的初始聚类中心参数。
6. 根据权利要求1所述的基于大规模图像检索方法，其特征在于，步骤3采用几何一致性验证过滤特征描述，其具体方法为：步骤3. 1，利用倒排索引结构，先过滤在方向角上不一致的库图像SIFT特征描述子，并计算相似性得分的最大值；步骤3. 2,利用倒排索引结构，再过滤在尺度上不一致的库图像SIFT特征特征描述子，并计算相似性得分最大值；步骤3. 3,选取在尺度和方向角上相似性得分函数较小的作为该SIFT特征描述子的查询图像与库图像的相似性得分；步骤3. 4,遍历查询图像中所有SIFT特征描述子完成步骤3. 1~3. 3。
7. 根据权利要求6所述的基于大规模图像检索方法，其特征在于，计算相似性得分的函数为Sj= Sj+f^Uy, yd，其中Xu为每一幅查询图像的SIFT描述子，yi，为每一个库图像的 SIFT 描述子，fsd (X，y) = sd (tf-idf (q (X)))，tf-idf (q (X)) = f (X，y)，f ()是反映 SIFT 描述子之间相似性的函数。
8. 根据权利要求7所述的基于大规模图像检索方法，其特征在于，f()为ε -search相似性函：
9. 根据权利要求7所述的基于大规模图像检索方法，其特征在于，f()为k-NN相似性函，
10. 根据权利要求6所述的基于大规模图像检索方法，其特征在于，最大值列表包括以下元素：相似性得分，以及每个相似性得分所对应的库图像索引和查询图像索引。
【专利摘要】本发明提供一种基于大规模图像检索方法，包括：步骤1，对库图像进行离线检索，提取底层局部特征进行量化后，处理得到图像的特征描述关于位置的权重信息，建立图像数据集倒排索引结构；步骤2，对查询图像进行在线检索，提取底层局部特征进行量化后，处理得到图像的特征描述关于位置的权重信息；步骤3，根据库图像的每个特征描述，利用倒排索引计算每幅查询图像中的各个特征描述之间的相似性，并输出相似值；步骤4，将所有相似值按照由大到小排列得到最大值列表。本发明从产生视觉词典的聚类算法、图像匹配算法入手，分析和探讨聚类算法的特点，考虑聚类过程中特征空间的特征分布统计信息，得出效果均值加权方案，提高匹配精度。
【IPC分类】G06F17-30
【公开号】CN104765764
【申请号】CN201510064437
【发明人】陈秋平
【申请人】南京理工大学
【公开日】2015年7月8日
【申请日】2015年2月6日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈秋平;
技术所有人：南京理工大学;
我是此专利的发明人

上一篇：一种基于时间窗口可移动的动态数据快速处理方法
上一篇：一种基于概念格的异构空间信息服务分类的语义匹配方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。