一种高精度图像检索方法与流程

文档序号:12748012阅读:426来源:国知局

本发明属于图像检索技术领域,尤其涉及一种高精度图像检索方法。



背景技术:

从20世纪70年代开始,有关图像检索的研究就已开始,当时主要是基于图像检索技术,描述图像的特征,如绘画作品的作者、年代、流派、尺寸等。到90年代以后,出现了对图像的内容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术,即基于内容的图像检索技术。

自从Wright将稀疏表示应用于人脸识别,使用稀疏模型表示图像成为了研究的热点。稀疏表示在人脸识别中的成功应用,为其在图像分类和检索领域的应用提供了重要参考。同图像分类相比,稀疏表示在图像检索中的应用较少。对图像进行离散正弦变换,将变换量化后的系数作为稀疏矩阵,然后引入隐语义索引法进行图像检索。由于该算法缺少稀疏向量学习模型,所以并不是严格意义上稀疏表示法。Kang对图像的SIFT算子进行稀疏矩阵表示,并将其用于拷贝图像检索和图像识别中。稀疏表示分类法将图像的底层特征向量表示转化为一组字典集的线性组合,即稀疏系数向量,将利用底层向量的分类问题转化为利用稀疏系数向量进行分类。对于存在遮挡、破损和噪声污染的人脸图像,仍能达到接近100%的正确识别率。因此可以间接缓解语义鸿沟对分类和检索造成的不理影响。



技术实现要素:

本发明就是针对上述问题,提供一种准确率高、效率高的高精度图像检索方法。

为实现上述目的,本发明包括以下步骤。

对于图像库中的第i类对象,给定训练样本iA,1。

inA=aLa∈R(1)。

其中i,ja表示第i类的第j个训练样本对应的特征向量;第i类中的任意样本y∈Rd由iA线性表示i,1i,1i,nii。

y=xa+L+xa=Ax(2)。

其中inx=xLx∈R是样本对应的系数向量;训练样本集A包含所有类别11,11,2,dn,iCCnA=ALALA=aaLa∈R×,y=Ax(3)。

其中iCix=xLxLx=LxL∈R,除第i类外,其他类训练样对应的系数为0;在测试样本y∈Rd时,通过求解线性方程y=Ax获得稀疏向量x;当d>n时,线性方程是超定的,稀疏向量x获得唯一的解;当d<n时,方程是欠定的,稀疏向量x的解不唯一,将x的求解问题转化为求解满足如下条件的最小化问题。

minxs.t.y=Ax(4)。

考虑图像噪声的存在,公式(3)变成y=Ax+e(5),其中e是一个满足2e<ε的噪声项;对于稀疏向量x的估计就变成x=argminxs.t.2y−Ax≤ε(6)。

作为一种优选方案,本发明假设图像库内有C类图像,将第i类的in幅图像表示成特征向量,所有类别共n幅训练图像组成特征集;对于给定的测试图像q,用相同的方法提取其d维特征向量t;根据公式(6)获得样本t的稀疏向量x。

作为另一种优选方案,本发明对测试图像进行预分类。

2mintiC=t−xδx(7)。

其中δx表示将对应第i类的x稀疏保持不变,其他类为0;对于测试图像;设有M幅图像MIsLIs与其属于同一类;且都属于第m类;则根据公式(8)对该类的图像进行K近邻搜索。

mimi110D=x%δx%−s%δs%(8)。

其中s%是稀疏系数向量。

另外,本发明从每类中抽取训练图像,提取特征向量组成矩阵F;提取测试图像特征向量t,给定误差容忍度ε,且ε>0;对F和t进行2范数归一化;最小化算法求解。

x%=argminxs.t.2y−Ax≤ε。

根据稀疏向量x%,计算测试图像对所有类的归属度2argmintiC=t−x%x%,查询图像属于第m类,该类共M幅图像,计算每幅图像的稀疏向量s%,然后根据mmD=x%δx%−s%δs%,对该类的图像进行排序,返回检索结果。

本发明有益效果。

本发明提出一种基于稀疏分类的图像检索方法,通过稀疏表示将图像的底层特征转换为图像库字典集各元素的线性组合,弥补了由于底层特征差异导致的检索准确率较低的问题。在Corel库,微软商品库的实验结果证明,相对于直接利用K最近邻法搜索图像库,本发明提出的方法可大大提高准确率和召回率,尤其是对于图像种类较多的微软商品库(包含100类商品图像),当召回率为70%时,检索的准确率仍然超过70%。

具体实施方式

本发明包括以下步骤。

对于图像库中的第i类对象,给定训练样本iA,1。

inA=aLa∈R(1)。

其中i,ja表示第i类的第j个训练样本对应的特征向量;第i类中的任意样本y∈Rd由iA线性表示i,1i,1i,nii。

y=xa+L+xa=Ax(2)。

其中inx=xLx∈R是样本对应的系数向量;训练样本集A包含所有类别11,11,2,dn,iCCnA=ALALA=aaLa∈R×,y=Ax(3)。

其中iCix=xLxLx=LxL∈R,除第i类外,其他类训练样对应的系数为0;在测试样本y∈Rd时,通过求解线性方程y=Ax获得稀疏向量x;当d>n时,线性方程是超定的,稀疏向量x获得唯一的解;当d<n时,方程是欠定的,稀疏向量x的解不唯一,将x的求解问题转化为求解满足如下条件的最小化问题。

minxs.t.y=Ax(4)。

考虑图像噪声的存在,公式(3)变成y=Ax+e(5),其中e是一个满足2e<ε的噪声项;对于稀疏向量x的估计就变成x=argminxs.t.2y−Ax≤ε(6)。

作为一种优选方案,本发明假设图像库内有C类图像,将第i类的in幅图像表示成特征向量,所有类别共n幅训练图像组成特征集;对于给定的测试图像q,用相同的方法提取其d维特征向量t;根据公式(6)获得样本t的稀疏向量x。

作为另一种优选方案,本发明对测试图像进行预分类。

2mintiC=t−xδx(7)。

其中δx表示将对应第i类的x稀疏保持不变,其他类为0;对于测试图像;设有M幅图像MIsLIs与其属于同一类;且都属于第m类;则根据公式(8)对该类的图像进行K近邻搜索。

mimi110D=x%δx%−s%δs%(8)。

其中s%是稀疏系数向量。

另外,本发明从每类中抽取训练图像,提取特征向量组成矩阵F;提取测试图像特征向量t,给定误差容忍度ε,且ε>0;对F和t进行2范数归一化;最小化算法求解。

x%=argminxs.t.2y−Ax≤ε。

根据稀疏向量x%,计算测试图像对所有类的归属度2argmintiC=t−x%x%,查询图像属于第m类,该类共M幅图像,计算每幅图像的稀疏向量s%,然后根据mmD=x%δx%−s%δs%,对该类的图像进行排序,返回检索结果。

对于欧氏特征,不同维数的特征值之间没有必然的联系,例如图像512维的gist特征的前10维特征值和后10维特征值在数值上毫无规律和相关性。而利用稀疏模型对欧氏特征进行稀疏化后,图像的稀疏特征却存在一定的规律,稀疏特征的非零值集中在与该图像属于同一类的训练图像所对应的位置(维数)上,也就是说,稀疏化的过程是对欧氏特征进行映射的过程。相对于欧氏特征,同类图像映射后的特征(稀疏特征)会更加集中,更有利于K近邻搜索。

以上内容是结合具体的优选实施方式对本发明作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明,对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明所提交的权利要求书确定的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1