基于相关保持映射和一分类器的图像视频搜索排序方法

文档序号：6581560阅读：454来源：国知局

专利名称：基于相关保持映射和一分类器的图像视频搜索排序方法
技术领域：
本发明涉及面向多媒体信息检索领域，特别涉及基于相关保持映射和一分类器的图像视频搜索排序方法。
背景技术：
随着网络上图像、视频等资源的日益丰富，从海量数据中快速准确地获取用户所需的信息已经越来越重要。基于内容的图像或视频检索是指通过对图像或视频内容进行分析提取图像或视频的视觉特征，从特定数据库或网络中查找到具有指定特征或含有特定内容的图像或视频。但由于基于内容的图像或视频检索方法存在着计算量大，计算复杂度高，占用更多的存储空间等不足，因此很难在网络检索中获得实质应用。图像或视频搜索排序技术是利用视觉信息改进初始查询结果的过程，可以很好的解决上述问题。图像或视频搜索排序应用中存在着大量排序信息。排序信息包括数据的相关性等级信息、数据的优先级关系信息以及建立其之上的关系对、关系序列等信息。利用标注信息进行图像或视频排序是目前主要的方法之一，标注信息的获取可以通过相关反馈、伪相关反馈和隐相关反馈等途径。其中，相关性等级信息广泛应用于信息检索中的模型训练中。在大多数情况下，根据与查询的相关性的高低手动地或自动地对每个文档进行不同相关性等级的标注，例如“非常相关”、“一般相关”和“不相关”等。样本的相关性等级信息不同于传统的类标号信息，前者是在信息检索中用来衡量文档与查询之间相关程度的度量，后者指的是机器学习与模式识别领域中一类事物所共同具有的属性。例如在传统的模式分类任务中，同一类的事物会具有共同的特征，不同类的事物具有不同的特征。然而，在排序应用中，由于样本按照与查询相关的程度分为不同的相关性等级，这样即使不同相关性等级的样本之间，也可能由于与查询相关而存在不同程度的相关性，此外具有相同的相关性等级样本之间，由于相关性等级的不同也会具有不同程度的相关性或者不具有相关性。因此并不能直接将样本的相关性等级信息作为样本的类别标号信息对样本进行处理。发明人在实现本发明的过程中，发现现有图像/视频的搜索排序技术中存在以下问题图像或视频搜索排序中需要对图像或视频提取视觉特征，视觉特征具有高维特性。样本的类别标号不等同于样本的相关性等级信息，传统的维数约简算法往往是针对分类任务提出的，而分类任务与排序任务并不相同，因此直接应用于图像或视频搜索排序中并不合理。图像或视频搜索排序中的样本数据与查询主题存在着不同程度的相关性，样本数据之间也存在着不同程度的相关性，而数据之间的这种复杂关系用超球体分布的形式可以很好的描述。超球体内是与查询最相关的样本，靠近球体的位置是与查询一般相关的样本，最外面则是与查询不相关的样本。一方面，目前并没有能解决这种数据分布的维数约简方法。另一方面，传统的图像或视频的搜索排序方法设计中并没有考虑到数据呈现超球形分布这一特点。不同于传统的一分器SVDD(Support Vector Data Description), SVDD是利用核变换的思想将样本映射到高维空间里，认为其在未知的高维空间中目标样本是具有超球体分布。因为核变换具有不可控性及未知性，在实际中很难操作。

发明内容
本发明提供了基于相关保持映射和一分类器的图像视频搜索排序方法，本发明减少了用户标注负担，提高了检索性能，提升用户的搜索体验，详见下文描述基于相关保持映射和一分类器的图像视频搜索排序方法，所述方法包括以下步骤(1)通过人工标注或自动标注从样本的特征向量集合中选择若干个与查询最相关的样本及与查询不相关的样本，组成训练样本集合；(2)利用所述训练样本集合，作为基于超球体分布的维数约简模块的输入，获取维数约简模型；(3)利用所述维数约简模型对所有样本及训练样本集合进行变换，得到维数约简后的所有样本新特征矩阵及训练样本新特征矩阵L(4)利用所述训练样本新特征矩阵t中与查询最相关的样本作为基于一分类器的排序学习模型的输入，训练得到排序模型f(t)；(5)将所述所有样本新特征矩阵f中的任意一个样本ti作为所述排序模型f (t)的输入，由大到小排列输出所有样本排序后的结果。在步骤(I)之前所述本方法还包括1)获取图像或视频数据；2)对所述基于文本的搜索结果提取视觉特征获取所有样本的特征向量集合。所述利用所述训练样本集合，作为基于超球体分布的维数约简模块的输入，获取维数约简模型具体包括1)假设存在变换向量w e R11，对训练样本集合中任意一个样本Xi,使得变换后的新样本为 Yi=W1Xi (1≤i ≤r+h)；2)计算与查询最相关的所有新样本的中心向量；
权利要求
1.基于相关保持映射和一分类器的图像视频搜索排序方法，其特征在于，所述方法包括以下步骤(1)通过人工标注或自动标注从样本的特征向量集合中选择若干个与查询最相关的样本及与查询不相关的样本，组成训练样本集合；(2)利用所述训练样本集合，作为基于超球体分布的维数约简模块的输入，获取维数约简模型；(3)利用所述维数约简模型对所有样本及训练样本集合进行变换，得到维数约简后的所有样本新特征矩阵f及训练样本新特征矩阵L ;(4)利用所述训练样本新特征矩阵t中与查询最相关的样本作为基于一分类器的排序学习模型的输入，训练得到排序模型f(t)；(5)将所述所有样本新特征矩阵中的任意一个样本ti作为所述排序模型f(t)的输入，由大到小排列输出所有样本排序后的结果。
2.根据权利要求1所述的基于相关保持映射和一分类器的图像视频搜索排序方法，其特征在于，在步骤(1)之前所述本方法还包括1)获取图像或视频数据；2)对所述基于文本的搜索结果提取视觉特征获取所有样本的特征向量集合。
3.根据权利要求1所述的基于相关保持映射和一分类器的图像视频搜索排序方法，其特征在于，所述利用所述训练样本集合，作为基于超球体分布的维数约简模块的输入，获取维数约简模型具体包括1)假设存在变换向量we RD，对训练样本集合中任意一个样本Xi，使得变换后的新样本为
4.根据权利要求3所述的基于相关保持映射和一分类器的图像视频搜索排序方法，其特征在于，所述约束条件具体为构造最相关样本与中心向量的距离度量Sk，所述距离度量Sk越小越好，Se定义如下
5.根据权利要求4所述的基于相关保持映射和一分类器的图像视频搜索排序方法，其特征在于，所述利用所述训练样本新特征矩阵￡中与查询最相关的样本作为基于一分类器的排序学习模型的输入，训练得到排序模型f(t)具体为1)通过所述训练样本新特征矩阵￡构建目标函数Re(W)；2)通过拉格朗日求解所述目标函数Re(w)，得到排序模型f (t)。
全文摘要
本发明公开了基于相关保持映射和一分类器的图像视频搜索排序方法，通过人工标注或自动标注从样本的特征向量集合中选择若干个与查询最相关的样本及与查询不相关的样本，组成训练样本集合；利用所述训练样本集合，作为基于超球体分布的维数约简模块的输入，获取维数约简模型；利用所述维数约简模型对所有样本及训练样本集合进行变换，得到维数约简后的所有样本新特征矩阵及训练样本新特征矩阵利用所述训练样本新特征矩阵中与查询最相关的样本作为基于一分类器的排序学习模型的输入，训练得到排序模型f(t)；将所述所有样本新特征矩阵中的任意一个样本ti作为所述排序模型f(t)的输入，由大到小排列输出所有样本排序后的结果。提高了检索性能，减少了用户标注负担，提升了用户搜索体验。
文档编号G06F17/30GK103049570SQ20121059485
公开日2013年4月17日申请日期2012年12月31日优先权日2012年12月31日
发明者冀中, 苏育挺, 井佩光申请人:天津大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冀中;苏育挺;井佩光
技术所有人：天津大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。