指数权重VLAD特征的权重处理方法及装置与流程

文档序号:15183229发布日期:2018-08-17 07:16阅读:439来源:国知局
本发明涉及图像检索领域,具体而言,涉及一种指数权重vlad特征的权重处理方法及装置。
背景技术
:基于内容的图像检索作为计算机视觉领域的一个重要研究问题,在过去的十年里受到国内外学者的广泛关注,具体的,基于内容的图像检索是指从图像数据库中查找出与待检索图像相似的图像,在特征量化的过程中,采用局部特征聚合描述符(vectoroflocallyaggregateddescriptors,简称vlad)算法,先将图像的sift特征进行聚类,然后统计一幅图像中所有sift特征与其相近聚类中心的累积残差来表示最终的图像特征;这种方法能考虑到特征间关联的同时对图像的局部信息有更细致的刻画,使最终所得图像特征对各类图像变换具有更高鲁棒性。由于相关技术中的主成分分析降维方法的降维矩阵是按照特征值从大到小排列的,所以降维后向量的前几个数据往往远大于平均值,这样会对特征的提取造成较大干扰,因为若是前几个数据出现了差错,在比较特征向量相似度时就容易产生较大误差,所以理想情况是使特征向量中前几个过大的数据按一定比例缩小,而使后面变化不大的数据尽量保持不变。因此,急需一种指数权重vlad特征的权重处理方法及装置,以解决相关技术中的图像特征由于没有进行准确的降维和权重修正处理导致计算相似度时产生较大误差的技术问题。技术实现要素:本发明的主要目的在于提供一种指数权重vlad特征的权重处理方法,以解决相关技术中的图像特征由于没有进行准确的降维和权重修正处理导致计算相似度时产生较大误差的技术问题。为了实现上述目的,根据本发明的一个方面,提供了一种指数权重vlad特征的权重处理方法,用于将vlad特征处理得到权重特征。根据本发明的指数权重vlad特征的权重处理方法包括:接收目标图像的第一特征;对所述第一特征执行降维操作,得到所述第一特征的低维特征向量;以及对所述低维特征向量按照预设权重处理得到权重特征向量。进一步的,所述接收目标图像的第一特征包括:提取所述目标图像的局部特征,其中,所述局部特征为通过sift算法计算得到的局部描述子;对所述局部特征进行聚类,得到聚类中心;根据所述局部特征和所述聚类中心,得到所述第一特征,其中,所述第一特征为所述目标图像的vlad特征向量。进一步的,所述对所述第一特征执行降维操作,得到所述第一特征的低维特征向量包括:通过所述第一特征的差别方差,得到所述第一特征的相关性;通过所述第一特征的特征向量和特征值,得到降维矩阵;根据所述相关性和所述降维矩阵进行映射,得到低维特征向量。进一步的,所述对所述低维特征向量按照预设权重处理得到权重特征向量包括:根据所述低维特征向量和权重指数函数,得到权重特征向量,其中,所述权重指数函数为g(x)=1-e-x,e表示自然常数e。进一步的,所述对所述低维特征向量按照预设权重处理得到权重特征向量之后包括:对所述低维特征向量进行范围筛选;通过归一算法对筛选后的所述低维特征向量进行归一化操作,其中,所述归一算法为m表示2倍的所述低维特征向量的平均值;对归一化后的所述低维特征向量通过余弦距离进行度量,得到相似度。为了实现上述目的,根据本发明的另一方面,提供了一种指数权重vlad特征的权重处理装置,用于将vlad特征处理得到权重特征。根据本发明的指数权重vlad特征的处理装置包括:第一特征接收单元,用于接收目标图像的第一特征;降维操作单元,用于对所述第一特征执行降维操作,得到所述第一特征的低维特征向量;权重操作单元,用于对所述低维特征向量按照预设权重处理得到权重特征向量。进一步的,所述第一特征接收单元包括:局部特征提取模块,用于提取所述目标图像的局部特征;聚类模块,用于对所述局部特征进行聚类,得到聚类中心;特征获取模块,用于根据所述局部特征和所述聚类中心,得到第一特征。进一步的,所述降维操作单元包括:相关性获取模块,用于通过所述第一特征的差别方差,得到所述第一特征的相关性;降维矩阵获取模块,用于通过所述第一特征的特征向量和特征值,得到降维矩阵;映射模块,用于根据所述相关性和所述降维矩阵进行映射,得到低维特征向量。进一步的,所述权重操作单元包括:权重特征向量获取模块,用于根据所述低维特征向量和权重指数函数,得到权重特征向量。为了实现上述目的,根据本发明的另一方面,提供了一种图像检索系统,包括所述指数权重vlad特征的处理装置。在本发明实施例中,采用接收目标图像的第一特征的方式,通过对第一特征执行降维操作,达到了对低维特征向量按照预设权重处理得到权重特征向量的目的,从而实现了提高相似度计算精确度的技术效果,进而解决了由于相关技术中的图像特征由于没有进行准确的降维和权重修正处理导致计算相似度时产生较大误差的技术问题。附图说明构成本发明的一部分的附图用来提供对本发明的进一步理解,使得本发明的其它特征、目的和优点变得更明显。本发明的示意性实施例附图及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1是根据本发明所述的权重处理方法的流程示意图;图2是根据本发明所述接收目标图像的第一特征方法的流程示意图;图3是根据本发明所述对第一特征执行降维操作方法的流程示意图;图4是根据本发明所述对低维特征向量按照预设权重处理方法的另一实施例的流程示意图;图5是根据本发明所述的权重处理装置的框图示意图;图6是根据本发明所述的第一特征接收单元的框图示意图;图7是根据本发明所述的降维操作单元的框图示意图;图8是根据本发明所述的权重操作单元的框图示意图;图9是根据本发明所述的降维后的所述第一特征的直方图;图10是根据本发明所述的权重指数函数示意图;图11是根据本发明所述的权重特征向量示意图;以及图12是根据本发明所述的归一化后的特征向量示意图。具体实施方式为了使本
技术领域
的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。在本发明中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本发明及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本发明中的具体含义。此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。如图1所示,该方法包括如下的步骤s101至步骤s103:步骤s101,接收目标图像的第一特征,优选的,对数据库中的每一张图像采用传统算法提取sift特征,把这些特征用聚类算法进行无监督学习聚为256个类别,每一个类别也是一个128维的sift特征,对每一副图片都提取sift特征,把一副图片的所有sift特征都量化所述256个聚类中心上,并统计各聚类中心的累积残差,最后得到一副图片的vlad特征(即所述第一特征);步骤s102,对所述第一特征执行降维操作,得到所述第一特征的低维特征向量,优选的,对所述第一特征采用主成分分析进行降维,将其维度降为n维,得到所述低维特征向量;降维不仅是对数据精简维度,更重要的是经过降维去除了噪声,发现了数据中的模式;步骤s103,对所述低维特征向量按照预设权重处理得到权重特征向量,优选的,通过预设的权重指数函数作为权重和所述低维特征向量的每一个数据相乘,得到所述权重特征向量。如图2所示,根据本申请的另一可选实施例,进一步的,所述接收目标图像的第一特征包括如下的步骤s201至步骤s203:步骤s201,提取所述目标图像的局部特征,其中,所述局部特征为通过sift算法计算得到的局部描述子,优选的,对数据库中的每一张图像采用传统算法提取sift特征,具体用到opencv里的siftfeaturedetector和siftdescriptorextractor类,生成局部描述子;sift特征是基于物体上的一些局部外观的兴趣点而与图像大小和旋转无关,对于光线、噪声、微视角改变的容忍度较高;sift特征是高度显著的局部特征,在母数庞大的特征数据库中,很容易辨识物体而且鲜有误认;使用sift特征描述子对于部分遮挡的物体也有较高的辨识度,甚至只需要3个以上的sift特征就足以计算出位置与方位;在现今的电脑硬件和小型的数据库条件下,辨识速度可接近即时运算,sift特征信息量大,适合在海量数据库中快速准确匹配;步骤s202,对所述局部特征进行聚类,得到聚类中心,优选的,提取图片的sift特征,有几十万个sift特征就够了,把这些特征用聚类算法进行无监督学习聚为256个类别,每一个类别也是一个128维的sift特征;具体的无监督学习的具体方法流程为:把提取的sift特征保存为mat矩阵文件,矩阵的每一行表示一个128维的sift特征向量,矩阵行数即为向量的个数;从矩阵中选择256个sift特征作为初始聚类中心;计算每个sift特征到聚类中心的距离以决定该sift特征被分配到哪一个聚类中心;重新计算sift特征被分配后的聚类中心,依次迭代;计算标准测度函数,直到达到最大迭代次数,否则,继续迭代。步骤s203,根据所述局部特征和所述聚类中心,得到所述第一特征,其中,所述第一特征为所述目标图像的vlad特征向量,优选的,对每一副图片都提取sift特征,把一副图片的所有sift特征都量化到256个聚类中心上,并统计各聚类中心的累积残差,最后得到一副图片的vlad特征(即所述第一特征);具体的,sift特征量化的具体步骤为:检测出一副图片中所有的sift特征点;取出一个sift特征,并依次计算它到256个聚类中心的距离,找到距离最近的聚类中心,并计算该sift特征和距离最近聚类中心的偏差,把这个偏差累加到该聚类中心上,对所述sift特征依次执行偏差计算;最后统计256个聚类中心上的累积偏差即得到图片的vlad向量(即所述第一特征)。如图3所示,根据本申请的另一可选实施例,进一步的,所述对所述第一特征执行降维操作,得到所述第一特征的低维特征向量包括如下的步骤s301至步骤s303:步骤s301,通过所述第一特征的差别方差,得到所述第一特征的相关性;步骤s302,通过所述第一特征的特征向量和特征值,得到降维矩阵;步骤s303,根据所述相关性和所述降维矩阵进行映射,得到低维特征向量。如图9所示,图9为降维后的vlad特征直方图,具体的,vlad特征采用主成分分析进行降维,将其维度降为n维,得到特征;降维不仅是对数据精简维度,更重要的是经过降维去除了噪声,发现了数据中的模式。经过上述步骤s301至步骤s303,即可把高维数据降维到低维数据,而尽量保持数据间的关系不发生改变。降维后的新特征是旧特征的线性组合,降维使得这些线性组合的样本方差最大化,使新特征互不相关,从旧特征到新特征的映射中捕获数据的固有变异性(该部分是否为针对上述处理自然产生的效果)。根据本申请的另一可选实施例,进一步的,所述对所述低维特征向量按照预设权重处理得到权重特征向量包括:根据所述低维特征向量和权重指数函数,得到权重特征向量,其中,所述权重指数函数为g(x)=1-e-x,e表示自然常数e,优选的,通过观察图9的特征向量直方图可以发现它在二维坐标系下的分布类似于指数函数,所以考虑用图10所示的指数函数作为权重和特征向量的每一个数据相乘,但是在权重和数据相乘的时候还会有一个问题:当x取值很接近0的时候权重值g(x)也很接近0,当权重过小时会抹掉特征向量的前几个数据,这样会造成特征向量的部分数据无效,在度量特征向量相似度时反而会增大误差,所以在取离散g(x)值作权重的时候不能从0开始取值;经过大量实验我们取得的经验值是从x=0.41开始取值,步长设为0.15效果最佳;表1为按上述x初值和步长取值得到的离散权重g(x);将图9的特征向量和图10的离散权重相乘可得到新的特征向量直方图,如图11所示,可见特征向量的前几个较大的数据被削减,而后续数据基本维持不变。表1离散权重g(x)取值示意图x0.410.560.710.861.011.16...g(x)0.340.430.510.580.640.69...如图4所示,根据本申请的另一可选实施例,进一步的,所述对所述低维特征向量按照预设权重处理得到权重特征向量之后包括如下的步骤s401至步骤s403:步骤s401,对所述低维特征向量进行范围筛选,优选的,对vlad特征进行指数权重相乘后,任然存在一些过大的数值,这些过大的数值就是造成识别率不稳定的因素,所以还需要对个别过大的数值进行归一化处理,做归一化处理的时候既要保持大部分平稳数据不变,又要保持归一化之后的数据维持原来的比例关系,所以在做归一化之前先进行一次判断,对权重vlad向量中数值大于m的数据才进行归一化处理,并归一化到m-1.5m之间;步骤s402,通过归一算法对筛选后的所述低维特征向量进行归一化操作,其中,所述归一算法为m表示2倍的所述低维特征向量的平均值,优选的,f(x)为归一化之后的数据,e的指数乘以100是防止数据过小对数值变化没有影响,除以3是防止指数下降太快造成vlad向量的数据不能维持原有的比例关系,归一化之后的向量如图12所示;步骤s403,对归一化后的所述低维特征向量通过余弦距离进行度量,得到相似度,优选的,采用余弦距离进行度量相似度,和欧式距离不同的是,余弦距离更多的是从方向上区分差异,而对绝对的数值不敏感。从以上的描述中,可以看出,本发明实现了如下技术效果:在本发明实施例中,采用接收目标图像的第一特征的方式,通过对第一特征执行降维操作,达到了对低维特征向量按照预设权重处理得到权重特征向量的目的,从而实现了提高相似度计算精确度的技术效果,进而解决了由于相关技术中的图像特征由于没有进行准确的降维和权重修正处理导致计算相似度时产生较大误差的技术问题。需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。根据本发明实施例,还提供了一种用于实施上述指数权重vlad特征的权重处理方法的装置。如图5所示,该装置包括:第一特征接收单元10,用于接收目标图像的第一特征,优选的,对数据库中的每一张图像采用传统算法提取sift特征,把这些特征用聚类算法进行无监督学习聚为256个类别,每一个类别也是一个128维的sift特征,对每一副图片都提取sift特征,把一副图片的所有sift特征都量化所述256个聚类中心上,并统计各聚类中心的累积残差,最后得到一副图片的vlad特征(即所述第一特征);降维操作单元20,用于对所述第一特征执行降维操作,得到所述第一特征的低维特征向量,优选的,对所述第一特征采用主成分分析进行降维,将其维度降为n维,得到所述低维特征向量;降维不仅是对数据精简维度,更重要的是经过降维去除了噪声,发现了数据中的模式;权重操作单元30,用于对所述低维特征向量按照预设权重处理得到权重特征向量,优选的,通过预设的权重指数函数作为权重和所述低维特征向量的每一个数据相乘,得到所述权重特征向量。如图6所示,进一步的,所述第一特征接收单元10包括:局部特征提取模块11,用于提取所述目标图像的局部特征,优选的,对数据库中的每一张图像采用传统算法提取sift特征,具体用到opencv里的siftfeaturedetector和siftdescriptorextractor类,生成局部描述子;聚类模块12,用于对所述局部特征进行聚类,得到聚类中心,优选的,把所述sift特征用聚类算法进行无监督学习聚为256个类别,每一个类别也是一个128维的sift特征;特征获取模块13,用于根据所述局部特征和所述聚类中心,得到第一特征,优选的,对每一副图片都提取sift特征,把一副图片的所有sift特征都量化到所述256个聚类中心上,并统计各聚类中心的累积残差,最后得到一副图片的vlad特征(即所述第一特征)。如图7所示,进一步的,所述降维操作单元20包括:相关性获取模块21,用于通过所述第一特征的差别方差,得到所述第一特征的相关性;降维矩阵获取模块22,用于通过所述第一特征的特征向量和特征值,得到降维矩阵;映射模块23,用于根据所述相关性和所述降维矩阵进行映射,得到低维特征向量。如图8所示,进一步的,所述权重操作单元30包括:权重特征向量获取模块31,用于根据所述低维特征向量和权重指数函数,得到权重特征向量,优选的,所述权重指数函数作为权重和特征向量的每一个数据相乘。根据本发明实施例,还提供了一种图像检索系统,包括所述的指数权重vlad特征的处理装置。显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1