图像检索方法和装置的制作方法

文档序号:6385424阅读:139来源:国知局
专利名称:图像检索方法和装置的制作方法
技术领域
本发明涉及图像检索技术,特别是涉及一种图像检索方法和装置。
背景技术
基于关键词的图像检索技术是当前主流的图像检索技术,然而由于错误标签的存在以及检索关键词语言的模糊性,通过基于关键词的图像检索技术检索得到图像通常不够准确。

发明内容
基于此,有必要针对现有图像检索技术的检索结果不够准确的问题,提供一种能够提高检索精度的图像检索方法和装置。一种图像检索方法,包括如下步骤获取检索关键字,并根据检索关键字从数据库中筛选得到图像集合;根据图像特征建立图像集合的第一谱图模型,得到图像集合中的两两图像之间的相似关系;根据相似关系建立半监督学习模型;根据半监督学习模型对图像集合进行去噪,得到去噪图像集合;返回去噪图像集合作为检索关键字所对应的检索结果。一种图像检索装置,包括获取模块,用于获取检索关键字,并根据检索关键字从数据库中筛选得到图像集合;建模模块,用于根据图像特征建立图像集合的第一谱图模型,得到图像集合中的两两图像之间的相似关系;学习模块,用于根据相似关系建立半监督学习模型;去噪模块,用于根据半监督学习模型对图像集合进行去噪,得到去噪图像集合;发送模块,用于返回去噪图像集合作为检索关键字所对应的检索结果。上述图像检索方法和装置,通过获取检索关键字,并根据检索关键字从数据库中筛选得到图像集合,根据图像特征建立图像集合的第一谱图模型,得到图像集合中的两两图像之间的相似关系,根据相似关系建立半监督学习模型,根据半监督学习模型对图像集合进行去噪,得到去噪图像集合,返回去噪图像集合作为检索关键字所对应的检索结果,通过在对检索到的图像集合进行全局去噪,提高了图像检索的精确度。


图1为一个实施例中图像检索方法流程示意图;图2为一个实施例中图像检索装置结构示意图;图3为在另一个实施例中图像检索方法的流程示意图。
具体实施例方式下面结合具体的实施例及附图对图像检索方法和装置的技术方案进行详细的描述,以使其更加清楚。如图1所示,在一个实施例中,一种图像检索方法,包括如下步骤S110,获取检索关键字,并根据检索关键字从数据库中筛选得到图像集合。本实施例中,获取用户在搜索引擎中输入的用于检索图像的字词作为关键字,根据该关键字从图像数据库中或者其他包含有图的数据库中筛选图像,可以是根据对图像的描述、图像名称、图像所在网页的内容等基于文本的检索技术。S130,根据图像特征建立图像集合的第一谱图模型,得到图像集合中的两两图像之间的相似关系。本实施例中,先获取图像集合中的获取图像特征值,如图像的RGB值(红绿蓝三个颜色的强度值)、亮度值、色调、饱和度或者图层数等图像特征。根据该图像特征值建立图像的特征向量,该特征向量是多维向量,每一维通过一种图像特征值表示。根据特征向量将图像集合通过第一节点集合X = (X1, ···, XnI表示,其中Xn是一个多维向量,每个Xn代表一张图像,Xn的一个维度表示一个特征值,将图像通过节点集合中的一个向量表示,便于后续计算。根据第一节点集合建立关系矩阵W,当i关j时,Wij = exp (-1 | X1-Xj | |2/ σ 2),当i=j时,Wij = 0,通过关系矩阵W表示各图像之间的相似度关系。进一步的,对相似矩阵W做归一化处理,将图像之间的相似度关系通过O与I之间的数据表示,得第一归一化边矩阵
S = D_1/2WD_1/2,其中D是对角元素为4 =U; 的对角矩阵,即该对角元素为Wij所在列的所有元素的和。归一化边矩阵是基于两两节点之间的相互关系建立的,可用于发掘节点集合的内部结构。 S150,根据相似关系建立半监督学习模型。本实施例中,先获取第一节点集合中前P个节点,将P个节点标定为正样本,例如,对于η个节点的集合X = (X1,…,χρ, χρ+1,…,χη},其前P个节点被标定为正样本,P可为预设值,也可通过谱聚类算法对节点结合进行计算得到。定义查询向量y,y是一个多维向量,对于已标定节点,y = Yi = I (i ^ P),对于未标定节点,y = yu = O (p+1 ^ u ^ η), Yi或者yu是多维向量y中的一个维度的值。定义预测标签向量f,其中fi(l i η)表示节点Xi预测标签,f是多维向量。进一步的,根据定义的y和f建立预测标签向量f的能量函数
nff. 2Π
令—~/=)λ)2其中μ是平衡因子,可以是预设值,
hM λ/^ιιμ卜丨
f f 2
d =Yil WI彳是平滑风险项,若Xi和Xj有较大的Wij,则保持仁和仁更
U V /-尸 I ' ψη 扎
η
接近-ΣΚ -Λ):是经验风险项,保持f与原始的标定I相比变化不大。最后,根据该能量函数E(f)对f求微分可得E(f)的全局最小解f= (1-α)(1-aSrY也就是得到的半监督学习模型,其中a = 1/(1+μ),I是单位矩阵,S =D-l/2WD-l/2,其中D是对角元素为4 =[; t %的对角矩阵。将检索得到的图像集合中排在前P位的图像作为正样本,设置其标签为1,将图像集合中其他图像的标签设置为0,将设置好标签的图像集合组成二进制向量y,通过半监督学习模型计算,可以求得重新排序分数f。对f种的每以维数值从大到小排序,可得节点序列,可以对图像集合进行重新排序,排在前列的节点和正样本中的节点排列顺序比较接近。S170,根据半监督学习模型对图像集合进行去噪,得到去噪图像集合。在一个实施例中,上述步骤S170具体包括以下步骤根据半监督学习模型获取单节点预测的标签,得到标签矩阵F* = (1-QS)-1Ly1.…,yi,-,yn] = (1-asr1其中是基于单节点标定的查询向量V而对Xi的预测标签;根据标签矩阵进行谱聚类分析,得到多个类团;
ryscore 1V、^ t -*根据所签矩阵及类团定义所述节点的主导分数为乃 =LjJ,-根据不等式Aif)</ 杉(¥(/·'',)判断噪声类团,其中Af(该示对类团c中的数据取平均,IfU表示对k个类团取平均,β是预设值;去除噪声类团所对应的噪声图像集合,得到去噪图像集合。本实施例中,半监督模型中的节点通常会形成主要的类团,而噪声图像对应的节点会稀释类团的密度,可以将位于同一几何形状内的节点当作同一个类团,而噪声则是离散的异常值。具体可以通过学习一个映射g(·)将原始空间扭曲到新的空间炽力「R",使得所有的异常值能形成一个新的类团,且所有的类团相互分开,这样便于将噪声去除。根据半监督学习模型获取单节点预测的标签,得到标签矩阵F* = (1-QS)-1Ly1.…,Yi, -,Yn] = (1-a Sr1其中,/·:,4是基于单节点标定的查询向量V而对Xi的预测标签,如果Xi和\属于同一类团的值应较大,且<和在各维度k = 1,…,η的值较相近,而异常节点在几乎所有维度的值应该较小。定义映射g: X -Rn,:然后基于x* = g(x)建立谱图,得到归一化边矩阵s*和归一化图拉普拉斯L* =1-S*,令Ην,ΛΧ ι}为L*的特征值和特征向量对,且λ i彡…(λη。L*是块状对角矩阵,同一类团之间的元素拥有较大的绝对值。L*较小的部分特征值对应的特征向量保持着同样的块状结构,令其组成Uk= [Vl,V2,…,vk],其中k是X*中类团的数量,可由L*的从小到大排列的特征值中`第k个与第k+Ι个出现最大间隔值所决定。然后用K均值法将{(人(/,·)};!,聚成k类,其中包括由离散的噪声节点形成的类。如果对F*每行求和,噪声对应的行其和较小。根据标签矩阵及类团定义Xi的主导分数为Mk胃:同时用C e {I,…,k}
表示类团的标号。则可以根据不等式¥ η < β硬(η)判断噪声类团,其中f 表示对类团C中的数据取平均,f ο表示对k个类团取平均,β是阈值因子,可以是预设值,去除噪声类团所对应的噪声图像集合后,即得到去噪图像集合。S190,返回去噪图像集合作为检索关键字所对应的检索结果。
本实施例中,将去噪后的图像集合返回给搜索引擎,作为检索关键字所对应的检索结果,即完成图像的检索。上述图像检索方法,通过获取检索关键字,并根据检索关键字从数据库中筛选得至IJ图像集合,根据图像特征建立图像集合的第一谱图模型,得到图像集合中的两两图像之间的相似关系,根据相似关系建立半监督学习模型,根据半监督学习模型对图像集合进行去噪,得到去噪图像集合,返回去噪图像集合作为检索关键字所对应的检索结果,通过在对检索到的图像集合进行全局去噪,提高了图像检索的精确度。在一个实施例中,上述步骤S190具体包括以下步骤对去噪图像集合建立第二谱图模型,得到去噪图像集合所对应的第二节点集合X ’以及基于X ’的第二归一化边矩阵S’ ;根据谱图模型建立最大化函数
权利要求
1.一种图像检索方法,包括如下步骤 获取检索关键字,并根据所述检索关键字从数据库中筛选得到图像集合; 根据图像特征建立所述图像集合的第一谱图模型,得到所述图像集合中的两两图像之间的相似关系; 根据所述相似关系建立半监督学习模型; 根据所述半监督学习模型对所述图像集合进行去噪,得到去噪图像集合; 返回所述去噪图像集合作为所述检索关键字所对应的检索结果。
2.根据权利要求1所述的图像检索方法,其特征在于,所述根据图像特征建立所述图像集合的第一谱图模型,得到所述图像集合中的两两图像之间的相似关系的步骤包括 获取图像特征值,建立图像的特征向量; 根据所述特征向量将所述图像集合通过第一节点集合X = (X1, ···, χη}表示,其中χη是一个多维向量,χη的一个维度表示一个特征值; 根据所述第一节点集合建立关系矩阵W,其中,当i关j时,Wij = exp (- |χ「χ」| V σ 2);当 i = j 时,Wij = O ; 对所述相似矩阵W做归一化处理得第一归一化边矩阵S = D_1/2WD_1/2,其中D是对角元素为
3.根据权利要求2所述的图像检索方法,其特征在于,所述根据所述相似关系建立半监督学习模型的步骤包括 获取所述第一节点集合中前P个节点,将所述P个节点标定为正样本; 定义查询向量y,其中对于已标定节点,y = Yi = I (i≤ p),对于未标定节点,y = yu =O(p+1 ≤ u ≤ η); 定义预测标签向量f,其中fi(l ≤ i ≤ η)表示节点xi预测标签; 建立所述预测标签向量f的能量函数
4.根据权利要求3所述的图像检索方法,其特征在于,所述根据所述半监督学习模型对所述图像集合进行去噪,得到去噪图像集合的步骤为 根据所述半监督学习模型获取单节点预测的标签,得到标签矩阵F* = (1-QS)-1Ly1.…,Y1, -,yn] = (1-asr1其中是基于单节点标定的查询向量V而对Xi的预测标签;根据所述标签矩阵进行谱聚类分析,得到多个类团; 根据所述标签矩阵及类团定义所述节点的主导分数为
5.根据权力要求4所述的图像检索方法,其特征在于,所述返回所述去噪图像集合作为所述检索关键字所对应的检索结果的步骤为 对所述去噪图像集合建立第二谱图模型,得到所述去噪图像集合所对应的第二节点集合X ’以及基于X ’的第二归一化边矩阵s’ ;根据所述第二谱醒型建立最大化函数
6.一种图像检索装置,包括 获取模块,用于获取检索关键字,并根据所述检索关键字从数据库中筛选得到图像集合; 建模模块,用于根据图像特征建立所述图像集合的第一谱图模型,得到所述图像集合中的两两图像之间的相似关系; 学习模块,用于根据所述相似关系建立半监督学习模型; 去噪模块,用于根据所述半监督学习模型对所述图像集合进行去噪,得到去噪图像集合; 发送模块,用于返回所述去噪图像集合作为所述检索关键字所对应的检索结果。
7.根据权利要求6所述的图像检索装置,其特征在于,所述建模模块还用于获取图像特征值,建立图像的特征向量,根据所述特征向量将所述图像集合通过第一节点集合X ={χ1; ···, xj表示,其中χη是一个多维向量,χη的一个维度表示一个特征值,根据所述第一节点集合建立关系矩阵W,其中,当i关j时,Wij = exp (- |χ「χ」| I2/。2);当i = j时,Wij=0,对所述相似矩阵W做归一化处理得第一归一化边矩阵S = D_1/2WD_1/2,其中D是对角元素为
8.根据权利要求7所述的图像检索装置,其特征在于,所述根据所述学习模块还用于获取所述第一节点集合中前P个节点,将所述P个节点标定为正样本,定义查询向量y,其中对于已标定节点,y = Yi = I (i p),对于未标定节点,y = yu = O (p+1彡u彡η),定义预测标签向量f,其中fi(l < i < η)表示节点Xi预测标签,建立所述预测标签向量f的能量 函数
9.根据权利要求8所述的图像检索转装置,其特征在于,所述根据所述去噪模块还用于根据所述半监督学习模型获取单节点预测的标签,得到标签矩阵F*= (1-QS)-1Ly1.-,yi,-,yn] = (1-aSr1其中,<是基于单节点标定的查询向量V而对Xi的预测标签,根据所述标签矩阵进行谱聚类分析,得到多个类团,根据所述标签矩阵及类团定义所述节点的主导分数为
10.根据权力要求9所述的图像检索装置,其特征在于,所述发送模块还用于对所述去噪图像集合建立第二谱图模型,得到所述去噪图像集合所对应的第二节点集合X’以及基于X’的第二归一化边矩阵s',根据所述第二谱图模型建立最大化函数
全文摘要
本发明提供一种图像检索方法和装置。所述方法包括获取检索关键字,并根据所述检索关键字从数据库中筛选得到图像集合;根据图像特征建立所述图像集合的第一谱图模型,得到所述图像集合中的两两图像之间的相似关系;根据所述相似关系建立半监督学习模型;根据所述半监督学习模型对所述图像集合进行去噪,得到去噪图像集合;返回所述去噪图像集合作为所述检索关键字所对应的检索结果。上述图像检索方法和装置,通过建立图像集合的谱图模型,建立半监督学习模型,根据半监督学习模型对图像集合进行去噪,返回去噪后的图像集合作为检索关键字所对应的检索结果,在对检索到的图像集合进行全局去噪,提高了图像检索的精确度。
文档编号G06F17/30GK103064941SQ20121057237
公开日2013年4月24日 申请日期2012年12月25日 优先权日2012年12月25日
发明者陈世峰, 曹琛 申请人:深圳先进技术研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1