一种快速高效的近似重复图像匹配方法

文档序号：6637371阅读：315来源：国知局

一种快速高效的近似重复图像匹配方法
【专利摘要】本发明公开了一种快速高效的近似重复图像匹配方法。本方法为：1)提取训练图像库中每一图像的ORB特征并对每一图像的ORB特征进行非线性映射，构建该训练图像库的视觉词汇表；2)根据已构建的视觉词汇表，利用局部约束线性编码对训练图像库中每一图像非线性映射的ORB特征进行稀疏编码；3)提取待匹配图像的ORB特征并对其进行非线性映射，然后根据所建视觉词汇表对该待匹配图像非线性映射的ORB特征进行稀疏编码；4)计算待匹配图像的稀疏编码与该训练图像库中图像的稀疏编码相似度，若相似度超过设定阈值，则匹配成功，否则匹配失败。本发明降低了硬量化方法的重构误差，极大地提高了匹配的速度，可以用来实时匹配。
【专利说明】-种快速高效的近似重复图像匹配方法

【技术领域】
[0001] 本发明设及计算机视觉领域，特别设及一种近似图像匹配（Near-Duplicate Image Match)方法。

【背景技术】
[0002] 随着多媒体技术和现代信息处理技术的快速发展，特别是云计算、微信、微博等大规模移动应用的推广，图像/视频数量正在呈爆炸式增长，该就不可避免的存在了大量的近似重复图像，给信息存储和用户检索带来非常的不便。因此近似重复图像匹配吸引了一些学者的兴趣。通过近似重复图像匹配的研究，一方面可W实现图像版权保护，其次在图像捜索引擎中，用于过滤掉检索结果中的重复图像，从而提高用户的检索质量，另外，在基于内容的敏感信息监控中，用于监控敏感图像的传播，因此，近似重复图像匹配有非常重要的研究意义和应用价值。
[0003] 通常近似重复图像是由某幅源图像通过某些变换得到的，一般可W产生近似重复图像的变换包括平移、缩放、旋转、图像色调的变化、添加网址或商标、格式变化、分辨率变化等等。近似重复图像匹配最常用的框架有W下两类：基于词包模型炬ag of Words)的方法和基于索引的方法。词包模型的框架主要包括提取表示图像视觉的局部特征，对局部特征量化或编码，然后通过编码融合形成最终的直方图向量来表示图像，最后度量图像直方图向量之间的相似性。基于索引的框架比较流行的是将提取的图像的特征通过哈希编码处理成一个紧凑的显著的哈希串，该样相近的特征点W很高的概率被处理成相似的哈希串，在捜索的过程中，仅仅捜索那些相似的哈希串，从而降低了捜索的时间复杂度，但是最终的检测结果并不是很令人满意，同时它还需要大量的存储空间。因此，近年来，研究工作基本上是采用词包模型的框架来做近似重复图像匹配。
[0004] 当前非常流行的词包模型框架不仅用在近似重复图像匹配上，还用在图像检索、图像分类等其他应用上。由于SIFT特征具有旋转、尺度不变性等良好的特征，目前匹配方法中广泛使用SIFT局部特征，并配合欧式距离的聚类算法进行图像匹配，但是目前的方法存在速度慢、噪声大且准确度较差等问题。另一方面，词包模型的另外一个缺陷就是词量化的问题，一般的技术都采用硬量化的方式，从而导致了一个局部特征点只能映射到词汇表中的一个单词上，相似的局部特征有可能映射为不同的单词，因此造成了明显的重构误差。

【发明内容】

[0005] 针对现有的词包模型技术中局部特征点提取速度慢、噪声大、单词硬量化、图像匹配速度慢等技术问题，本发明的目的是提供一种快速高效的近似重复图像匹配方法。本发明综合分析了各项技术的特点，首先提取图像的ORB局部特征，并对ORB特征进行非线性映射，然后利用局部约束线性编码对非线性映射后的局部特征进行稀疏编码，W及对得到的稀疏编码构建倒排索引，通过该一系列综合技术处理，使得方案在避免噪声大的同时，能够提高匹配速度。
[0006] 本发明的技术方案为；
[0007] 一种快速高效的近似重复图像匹配方法，其步骤为：
[000引 1)提取训练图像库中每一图像的ORB特征并对每一图像的ORB特征进行非线性映射，构建该训练图像库的视觉词汇表；
[0009] 2)根据已构建的视觉词汇表，利用局部约束线性编码对训练图像库中每一图像非线性映射的ORB特征进行稀疏编码；
[0010] 3)提取待匹配图像的ORB特征并对其进行非线性映射，然后根据所建视觉词汇表对该待匹配图像非线性映射的ORB特征进行稀疏编码；
[0011] 4)计算待匹配图像的稀疏编码与该训练图像库中图像的稀疏编码相似度，若相似度超过设定阔值，则匹配成功，否则匹配失败。
[0012] 进一步的，所述构建所述视觉词汇表的方法为：
[0013] 21)对每一图像的每一 ORB特征进行非线性映射，即首先对ORB特征1范数归一化，然后对ORB特征向量的每一维进行开平方根运算；
[0014] 22)对训练图像库中所有图像经过非线性映射后的ORB特征利用聚类算法进行聚类，根据聚类结果构建视觉词汇表。
[0015] 进一步的，所述聚类算法中根据非线性映射后的ORB特征之间的己氏距离进行聚类。
[0016] 进一步的，利用公

【权利要求】
1. 一种快速高效的近似重复图像匹配方法，其步骤为： 1) 提取训练图像库中每一图像的ORB特征并对每一图像的ORB特征进行非线性映射，构建该训练图像库的视觉词汇表； 2) 根据已构建的视觉词汇表，利用局部约束线性编码对训练图像库中每一图像非线性映射的ORB特征进行稀疏编码； 3) 提取待匹配图像的ORB特征并对其进行非线性映射，然后根据所建视觉词汇表对该待匹配图像非线性映射的ORB特征进行稀疏编码； 4) 计算待匹配图像的稀疏编码与该训练图像库中图像的稀疏编码相似度，若相似度超过设定阈值，则匹配成功，否则匹配失败。
2. 如权利要求1所述的方法，其特征在于，所述构建所述视觉词汇表的方法为： 21) 对每一图像的每一ORB特征进行非线性映射，即首先对ORB特征1范数归一化，然后对ORB特征向量的每一维进行开平方根运算； 22) 对训练图像库中所有图像经过非线性映射后的ORB特征利用聚类算法进行聚类，根据聚类结果构建视觉词汇表。
3. 如权利要求2所述的方法，其特征在于，所述聚类算法中根据非线性映射后的ORB特征之间的巴氏距离进行聚类。
4. 如权利要求2所述的方法，其特征在于
对ORB特征进行所述非线性映射；其中，ORB特征向量X的第i维分量，d为ORB特征向量的维数。
5. 如权利要求1所述的方法，其特征在于，利用下列公式对所述ORB特征进行稀疏编
其中，条件I1Ci= 1保证了局部约束编码的平移不变性， JT SJ-IrCi -I5Vi 表示元素都为1的向量的转置，Y=Iiy1,y2, . . .，Yi, . . .，yN]表示N个维数为d的非线性映射后的ORB特征，〇表示向量内元素两两相乘，d为ORB特征的维数，CiGRM是对非线性映射后的第i个ORB特征yi局部约束线性编码后的稀疏向量。
6. 如权利要求5所述的方法，其特征在于，采用最大值融合方法对图像进行编码融合，得到该图像的稀疏编码。
7. 如权利要求1-5任一所述的方法，其特征在于，根据图像的稀疏编码对该训练图像库建立倒排索引，得到一倒排索引文件，步骤4)中利用该倒排索引文件，计算该待匹配图像与训练图像库中的所有图像的相似度。
8. 如权利要求7所述的方法，其特征在于，所述倒排索引文件的结构为：倒排索引的每一条记录表示一个单词，对应的值为所包含该视觉单词的图像ID列表以及对应的TF-IDF 值。
9. 如权利要求8所述的方法，其特征在于，计算该视觉单词对应的TF-IDF值的方法为： TF为该视觉单词的频率，即在其所在图像稀疏编码中的非零元素，
|d|表示该训练图像库中图像的总数，IDiI表示的是包含视觉单词i的图像数目。
【文档编号】G06K9/64GK104504406SQ201410733832
【公开日】2015年4月8日申请日期:2014年12月4日优先权日:2014年12月4日
【发明者】李莉, 戴帅夫, 刘丙双申请人:长安通信科技有限责任公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李莉;戴帅夫;刘丙双;
技术所有人：长安通信科技有限责任公司;
我是此专利的发明人

上一篇：一种全符号msd快速加法器的制造方法
上一篇：基于Unicode编码利用不可见字符隐藏信息的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。