面向图像检索的自适应哈希重排方法

文档序号：6592669阅读：426来源：国知局

专利名称：面向图像检索的自适应哈希重排方法
技术领域：
本发明属于图像检索技术领域，涉及到利用图像哈希方法进行基于内容的图像检索，特别涉及到一种面向图像检索的自适应哈希重排方法。
背景技术：
基于内容的图像检索是以图像视觉特征间的相似性作为度量标准进行检索，其任务是从图像库中找到与检索图像在内容上相似的图像。传统的检索方法用高维的欧式特征向量表示图像，并利用线性扫描的方式对图像库进行检索。然而对于海量图像库进行检索时，由于图像数量庞大，相应的特征存储空间庞大，线性扫描方式的检索效率非常低。而图像哈希方法将高维的欧式特征映射为简洁的二值哈希码，极大降低了特征的存储空间，而且哈希码间汉明距离的计算速度也明显快于欧氏距离的计算；同时，采用近似最近邻法检索相似图像，也可以有效地提高检索效率。利用哈希方法进行图像检索的主要步骤如下:首先对检索图像提取高维的视觉特征，然后选择适当的哈希方法将高维特征映射成哈希码，最后通过计算检索图像的哈希码与图像库中哈希码间的汉明距离，按由小到大的顺序返回检索结果。依赖汉明距离进行度量的哈希方法确实提高了检索效率，但是也存在明显的缺点。由于汉明距离是整数，对于海量图像库来说，可能有成千上万幅图像和检索图像的距离相等；而且汉明距离只体现了不同哈希码的个数，而忽略了哈希码位置对相似性的影响。而对于与检索图像汉明距离相等的图像，返回的顺序非常重要，因此有必要对哈希检索后的图像进行重排。目前，哈希重排方法主要有两大类:先映射后排序法和先排序后映射法。先映射后排序法是先对图像生成哈希码，并构造加权汉明距离对返回图像进行重排。它的特点是使汉明距离连续化，能够大大减少汉明距离相等的图像数量。如Query-Adaptive Ranking [Y.Jiang, J.Wang,and S.Chang.Lost in Binarization:Query-Adaptive Ranking forSimilar Image S earch with Compact Codes.1n proceedings of ICMR，2011]是先映身寸后排序法的代表。先排序后映射法是先根据图像欧式特征间的相似性从图像库中筛选出相似图像，然后对这些图像生成哈希码，再按照传统的汉明距离对返回图像进行重排。如QsRank[X.Zhang, L.Zhang, and H.Shum.QsRank: Query-Sensitive Hash Code Ranking forEfficient ε -neighbor Search.1n proceedings of CVPR, 2012]是先排序后映射法的典型方法。但由于先排序后映射法先利用图像视觉特征间的欧式距离筛选相似图像，因此时间和空间复杂度都较高，检索效率较低。

发明内容
本发明要解决的技术难题是克服现有技术的缺陷，发明一种先映射后排序的哈希重排方法一自适应哈希重排方法，首先从训练库中图像提取高维的视觉特征，然后选择适当的哈希方法将高维特征映射成哈希码，根据训练库图像中各类哈希码不同维数间的相关性，得到各类图像的权重向量；再通过计算检索图像的哈希码与图像库中哈希码间的汉明距离，按由小到大的顺序返回检索结果；依据检索结果计算检索图像的自适应权重，利用检索图像的自适应权重向量构造加权汉明距离，并利用加权汉明距离对返回图像进行重排，得到更准确的检索结果。目的是解决海量图像检索中返回图像的排序问题，尤其是有效地解决了返回图像中距离相等的图像的排序问题，提高了检索的准确率。本发明的技术方案是:对于训练图像库中的每类图像，提取图像的视觉特征向量，并生成哈希码,对类内哈希码不同维数间的相关性进行学习，为每类图像生成特定的类权重向量。对于检索图像，计算检索图像和图像库中图像的汉明距离并返回检索结果，依据检索结果计算检索图像的自适应权重。利用检索图像的权重构造自适应汉明距离，对检索结果进行重排，得到更准确的检索结果。具体实现步骤包括:1、选择检索图像q，确定图像库IM和训练库T;选择检索图像q，确定包含有N幅图像的图像库IM和包含M幅图像的训练库T,IM= {IM” IM2,...，IMn} , T= (T1, T2,, Tj ,其中:0〈Μ<Ν;2、提取图像的视觉特征，构成图像特征库GM和训练特征库GT ；对于图像库IM和训练库T中的每一幅图像，利用gist描述符提取图像的视觉特征，每一幅图像用一个512维的gist特征向量表示；图像库IM中所有图像的特征向量构成图像特征库GM，GnHGMpGM2，…，Gny，其中，GIM eMisrx512，肢表示实数
集，图像特征库中的每个特征向量和图像库中的每幅图像一一对应；训练库T中所有图
像的特征向量构成训练特征库GT，GT=IGT1, GT2,GTM}，其中，GT G RMx512，训练特
征库中的每个特征向量和训练库中的每幅图像一一对应；检索图像q的特征向量为G,，
Gq G R1x5u ；3、分别对图像特征库和训练特征库中的每个特征向量生成维数为d的哈希码；利用已有的哈希方法，如LSH、SKLSH或ITQ哈希方法分别对图像特征库GIM和训练特征库GT中的每个特征向量生成维数为d的哈希码，分别表示为ΗΙ={ΗΙ” HI2,...，HIJ 和 HT= (HT1, HT2,...HTj，其中 HI e {O, l}NXd 是 NXd 维的矩阵，矩阵的每个元素为O或者I ;HT e {O, l}MXd是MXd维的矩阵，矩阵的每个元素为O或者I ;设训练库T中共包含k类图像，其中k为正整数，则训练库T的哈希码HT按其
类别也可表示力"二 {Hc卜其中#Ci表示训练库T中第i类所有
图像的哈希码集合，这里i e [l，k];以训练库的第i类为例，其哈希码集合可表示为
hC1 = K/(ii，hv)，...，&、」，为1% Xi/的矩阵，每个矩阵元素为O或I的哈希码，
其中wCi为训练库T的第i类图像所包含的图像数目；4、对训练库图像训练得到类权重向量；通过比较训练库T中第i类哈希码中的每个列向量，统计每列中值为O和I的个数，分别记为mmOc Γ和mm\c丨.，表示训练库τ中第i类哈希码Zfci中第r维哈希码上0和I的个数，其中r e [i，d];计算训练库τ中第i类哈希码对应的类权重向量，其中w是d维的向量，向量中的每个元素是大于 ο 小于 I 的小数；令 max—mmi c, = max {num Oc r, mim I c r}
表示第i类哈希码开中第r列上o或i的最大个数，则有:max— numc = (max— numc {,max— numc 2,,max_mimc d}，表示
max_ numc
rj的各列上o或i的最大个数；令
权利要求
1.一种面向图像检索的自适应哈希重排方法，其特征在于，采用先映射后排序的哈希重排方法，首先提取训练库中图像的高维视觉特征向量，并选择适当的哈希方法将高维视觉特征映射成哈希码，根据训练库图像中各类哈希码不同维数间的相关性，为每类图像生成特定的类权重向量；再通过计算检索图像的哈希码与训练库中哈希码间的汉明距离，按由小到大的顺序返回检索结果；依据检索结果计算检索图像的自适应权重向量，利用检索图像的自适应权重向量构造加权汉明距离，并利用加权汉明距离对返回图像进行重排，得到更准确的检索结果；具体步骤如下: 1)、选择检索图像q，确定图像库頂和训练库T; 选择检索图像q，确定包含有N幅图像的图像库IM和包含M幅图像的训练库T,即IM= {IM” IM2,...，IMn} , T= (T1, T2,, Tj , 其中:0〈Μ〈Ν ； 2)、提取图像的视觉特征，构成图像特征库GIM和训练特征库GT; 对于图像库IM和训练库T中的每一幅图像，利用gist描述符提取图像的视觉特征，每一幅图像用一个512维的gist特征向量表示；图像库IM中所有图像的特征向量构成图像特征库GM，GIM= (GIM1, GIM2,GMN}，其中，
全文摘要
本发明涉及面向图像检索的自适应哈希重排方法，属于图像检索技术领域，涉及到利用图像哈希方法进行基于内容的图像检索。该方法采用先映射后排序的哈希重排方法，先提取训练库中图像的高维视觉特征向量，选择适当的哈希方法将高维视觉特征映射成哈希码，为每类图像生成特定的类权重向量；计算检索图像的哈希码与训练库中哈希码间的汉明距离，按由小到大的顺序返回检索结果；依据检索结果计算检索图像的自适应权重向量，利用检索图像的自适应权重向量构造加权汉明距离，并利用加权汉明距离对返回图像进行重排，得到更准确的检索结果；该方法根据不同的检索图像计算特定的权重，具有一般性，且在没有增加计算复杂度的同时明显提高了检索效果。
文档编号G06F17/30GK103226585SQ20131012316
公开日2013年7月31日申请日期2013年4月10日优先权日2013年4月10日
发明者孔祥维, 卢佳音, 付海燕申请人:大连理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孔祥维;卢佳音;付海燕
技术所有人：大连理工大学
我是此专利的发明人

上一篇：手写体数字识别方法及装置的制作方法
上一篇：手写体数字识别方法及装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。