一种基于大规模图像检索方法

文档序号:8445562阅读:262来源:国知局
一种基于大规模图像检索方法
【技术领域】
[0001] 本发明涉及信息检索领域,特别是一种基于大规模图像检索方法。
【背景技术】
[0002] 智能终端设备如智能手机、平板电脑,以及数码相机和数码摄像机的普及和便携 化,使这些多媒体采集设备已经成为人们日常生活中不可缺少的一部分。同时智能终端与 互联网之间的交互越来越方便,人们大量地使用这些设备来上传、浏览和交流拍摄的数字 图像。据统计,仅在Flickr上就有2000万的图像浏览次数。截止2011年8月,Flickr上 的图像总数已达60亿张。相对于文字的信息而言,数字图像具有直观易于理解、信息层次 感强、重点突出的特点。面对这无比庞大的图像数据库,人们自然会产生这样的需要:从这 海量图像中寻找满足自己要求的图像。因此,人们开发了各种各样的图像检索系统,以满足 不同人群的各式各样的需求。
[0003] 基于内容的图像检索(ContentBasedImageRetrieval,CBIR)模型的核心思想 是模拟人对图像的认知,通过对图像的内容进行计算机层面的分析,根据内容建立语义索 弓丨,记录图像深入层面的信息,从而更好地理解用户的需求,呈现有多个在线的基于内容的 图像检索系统,比如国外的TinEye,GoogleImages和百度的百度识图等。

【发明内容】

[0004] 为解决现有技术存在的问题,本发明提供一种基于大规模图像检索方法。
[0005] 实现本发明的技术方案为:
[0006] 步骤1,对库图像进行离线检索,提取库图像的底层局部特征进行量化,对量化后 的库图像数据进行处理得到图像的特征描述关于位置的权重信息,并根据权重信息建立图 像数据集倒排索引结构;
[0007] 步骤2,对查询图像进行在线检索,提取查询图像数据集的底层局部特征进行量 化,对量化后的查询图像数据集用saliency-detection方法得到图像的特征描述关于位 置的权重信息;
[0008] 步骤3,根据库图像的每个特征描述,利用倒排索引计算每幅查询图像中的各个特 征描述之间的相似性,并输出相似值;
[0009] 步骤4,将所有相似值按照由大到小排列得到最大值列表。
[0010] 本发明采用以下技术手段进一步实现发明目的:
[0011] (1)步骤1的具体过程为:
[0012] 步骤1. 1,提取库图像的底层局部特征,包括特征及其矢量描述;
[0013] 步骤1. 2,选取库图像的初始聚类中心参数;
[0014] 步骤1. 3,根据SIFT特征的矢量描述与聚类中心参数矢量描述之间的欧式距离进 行k-means聚类;
[0015] 步骤1. 4,对量化过后的特征描述在尺度和方向角上采用saliency-detection方 法进行位置加权;
[0016] 步骤1. 5,建立图像数据集倒排索引结构。
[0017] (2)步骤2的具体过程为:
[0018] 步骤2. 1,提取查询图像的底层局部特征,包括SIFT特征及其矢量描述;
[0019] 步骤2. 2,选取查询图像的初始聚类中心参数;
[0020] 步骤2. 3,根据SIFT特征的矢量描述与聚类中心参数矢量描述之间的欧式距离进 行k-means聚类;
[0021] 步骤2. 4,对量化过后的特征描述在尺度和方向角上采用saliency-detection方 法进行位置加权。
[0022] (3)步骤3采用几何一致性验证过滤特征描述,其具体方法为:
[0023] 步骤3. 1,利用倒排索引结构,先过滤在方向角上不一致的库图像SIFT特征描述 子,并计算相似性得分的最大值;
[0024] 步骤3. 2,利用倒排索引结构,再过滤在尺度上不一致的库图像SIFT特征特征描 述子,并计算相似性得分最大值;
[0025] 步骤3. 3,选取在尺度和方向角上相似性得分函数较小的作为该SIFT特征描述子 的查询图像与库图像的相似性得分;
[0026] 步骤3. 4,遍历查询图像中所有SIFT特征描述子完成步骤3. 1~3. 3。
[0027] 计算相似性得分的函数为Sj=Sj+fsd (xi;j, ),其中Xi,j为每一幅查询图像 的SIFT描述子,Yi,为每一个库图像的SIFT描述子,fsd (x,y) =sd(tf-idf(q(x))),tf_idf(q(x)) =f(x,y),f()是反映SIFT描述子之间相似性的函数。
【主权项】
1. 一种基于大规模图像检索方法,其特征在于,包括以下步骤: 步骤1,对库图像进行离线检索,提取库图像的底层局部特征并进行量化,对量化后的 库图像数据进行处理得到图像的特征描述关于位置的权重信息,并根据权重信息建立图像 数据集倒排索引结构; 步骤2,对查询图像进行在线检索,提取查询图像数据集的底层局部特征进行量化,对 量化后的查询图像数据集用saliency-detection方法得到图像的特征描述关于位置的权 重信息; 步骤3,根据库图像的每个特征描述,利用倒排索引计算每幅查询图像中的各个特征描 述之间的相似性,并输出相似值; 步骤4,将所有相似值按照由大到小排列得到最大值列表。
2. 根据权利要求1所述的基于大规模图像检索方法,其特征在于,步骤1的具体过程 为: 步骤1. 1,提取库图像的底层局部特征,包括特征及其矢量描述; 步骤1. 2,选取库图像的初始聚类中心参数; 步骤1. 3,根据SIFT特征的矢量描述与聚类中心参数矢量描述之间的欧式距离进行 k-means 聚类; 步骤1. 4,对量化过后的特征描述在尺度和方向角上采用saliency-detection方法进 行位置加权; 步骤1. 5,建立图像数据集倒排索引结构。
3. 根据权利要求2所述的基于大规模图像检索方法,其特征在于,步骤1. 2中采用随机 或者先验知识选取库图像的初始聚类中心参数。
4. 根据权利要求1所述的基于大规模图像检索方法,其特征在于,步骤2的具体过程 为: 步骤2. 1,提取查询图像的底层局部特征,包括SIFT特征及其矢量描述; 步骤2. 2,选取查询图像的初始聚类中心参数; 步骤2. 3,根据SIFT特征的矢量描述与聚类中心参数矢量描述之间的欧式距离进行 k-means 聚类; 步骤2. 4,对量化过后的特征描述在尺度和方向角上采用saliency-detection方法进 行位置加权。
5. 根据权利要求4所述的基于大规模图像检索方法,其特征在于,步骤2. 2中采用随机 或者先验知识选取库图像的初始聚类中心参数。
6. 根据权利要求1所述的基于大规模图像检索方法,其特征在于,步骤3采用几何一致 性验证过滤特征描述,其具体方法为: 步骤3. 1,利用倒排索引结构,先过滤在方向角上不一致的库图像SIFT特征描述子,并 计算相似性得分的最大值; 步骤3. 2,利用倒排索引结构,再过滤在尺度上不一致的库图像SIFT特征特征描述子, 并计算相似性得分最大值; 步骤3. 3,选取在尺度和方向角上相似性得分函数较小的作为该SIFT特征描述子的查 询图像与库图像的相似性得分; 步骤3. 4,遍历查询图像中所有SIFT特征描述子完成步骤3. 1~3. 3。
7. 根据权利要求6所述的基于大规模图像检索方法,其特征在于,计算相似性得分的 函数为Sj= Sj+f^Uy, yd,其中Xu为每一幅查询图像的SIFT描述子,yi,为每一个库图像 的 SIFT 描述子,fsd (X,y) = sd (tf-idf (q (X))),tf-idf (q (X)) = f (X,y),f ()是反映 SIFT 描述子之间相似性的函数。
8. 根据权利要求7所述的基于大规模图像检索方法,其特征在于,f()为ε -search相 似性函:
9. 根据权利要求7所述的基于大规模图像检索方法,其特征在于,f()为k-NN相似性 函,
10. 根据权利要求6所述的基于大规模图像检索方法,其特征在于,最大值列表包括以 下元素:相似性得分,以及每个相似性得分所对应的库图像索引和查询图像索引。
【专利摘要】本发明提供一种基于大规模图像检索方法,包括:步骤1,对库图像进行离线检索,提取底层局部特征进行量化后,处理得到图像的特征描述关于位置的权重信息,建立图像数据集倒排索引结构;步骤2,对查询图像进行在线检索,提取底层局部特征进行量化后,处理得到图像的特征描述关于位置的权重信息;步骤3,根据库图像的每个特征描述,利用倒排索引计算每幅查询图像中的各个特征描述之间的相似性,并输出相似值;步骤4,将所有相似值按照由大到小排列得到最大值列表。本发明从产生视觉词典的聚类算法、图像匹配算法入手,分析和探讨聚类算法的特点,考虑聚类过程中特征空间的特征分布统计信息,得出效果均值加权方案,提高匹配精度。
【IPC分类】G06F17-30
【公开号】CN104765764
【申请号】CN201510064437
【发明人】陈秋平
【申请人】南京理工大学
【公开日】2015年7月8日
【申请日】2015年2月6日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1