一种快速局部约束低秩编码的图像分类方法

文档序号:9433116阅读:531来源:国知局
一种快速局部约束低秩编码的图像分类方法
【技术领域】
[0001] 本发明涉及一种利用快速局部约束低秩编码的方法进行图像分类,此方法快速并 精度较高,是一种基于图像内容的数据驱动的分类方法。
【背景技术】
[0002] 图像分类属于计算机视觉的一个重要研究方向,它包括图像的预处理,特征的表 达与分类器的设计,其中特征表达包括图像特征的提取、特征的降维和特征的编码。特征提 取主要是通过图像中各种内容表现出来的颜色、亮度、纹理、形状及像素的空间分布等属性 对图像描述。特征表达式指在最基本的特征基础上进行统计(矢量量化)、编码或其他方法 以形成一幅图像最后的特征,通常情况下会比原始的基本特征具有更好的性能;良好的特 征表达能够提升图像分类和识别的性能。
[0003] 近几年对于特征描述表示的方法比较多,有视觉词包模型(bag of words,B0W)、 基于稀疏编码的空间金字塔模型(Sparse Coding Spatial Pyramid Matching,ScSPM)、 局部约束线性编码(Locality-constrained Linear Coding,LLC)、结构低秩表示的图像分 类方法(Structured Low-rank Representation, SLRR)和低秩稀疏分解的图像分类方法 (Low-rank Sparse Coding,LRSC),这些方法在一定程度上克服了一些难题,不过依然都存 在不足。
[0004] 视觉词包模型(bag of words,B0W)虽然易于构建,但忽略了同类图像具有一定 的空间结构相似性。基于稀疏编码的空间金字塔模型(Sparse Coding Spatial Pyramid Matching,ScSPM)忽略了局部描述子之间的相关性,而且对特征的变化和噪声敏感,而且 计算量很大,耗内存。局部约束线性编码(Locality-constrained Linear Coding,LLC), 这种局部性一定程度上导致了稀疏性,相对于稀疏编码使得算法的运算量大大减小,速度 提高,但LLC忽略了特征之间的整体结构化特征的空间信息。结构低秩表示的图像分类 方法(Structured Low-rank Representation, SLRR),对人脸识别有较好的效果,尤其适 用于有严重噪声(如遮挡、光照角度变化等)的图像分类。低秩稀疏分解的图像分类方 法(Low-rank Sparse Coding) (LRSC)分类精度得到了一定提高,但还是忽略了局部空间 信息;其中稀疏部分对编码仍然很敏感。基于空间金字塔的快速低秩表示的图像分类方法 (Fast Low-rank Representation based Spatial Pyramid Matching, LrrSPM),此方法的 分类速度是ScSPM的5~16倍,但是分类精度低于ScSPM和LLC方法。
[0005] 目前图像分类方法大都采用稀疏编码和低秩表示的编码方式,但是鉴于稀疏编码 对图像的变化和噪声较敏感,非常耗内存;采用低秩表示的编码方式在精度和计算复杂度 间得到一个平衡。

【发明内容】

[0006] 鉴于目前分类方法在分类效果及分类速度方面的缺陷,本发明提出一种快速局部 约束低秩编码的图像分类方法,该方法包括字典学习部分,训练部分和测试部分三个部分。 字典学习部分要求对图像库内所有图像提取图像的SIFT特征,经过K-means聚类得到字 典;训练部分首先对训练集中的图像提取SIFT特征,然后求得SIFT特征在字典下的特征编 码表示,采用局部约束的低秩编码方法,同时考虑图像的全局结构一致性和局部空间相似 性,得到特征编码矩阵,经过空间金字塔匹配核、池化后得到最终的特征表示矩阵,采用SVM 方法对特征表示矩阵和类标记进行训练,建立分类模型。测试部分首先对任意一张图像进 行特征提取,然后求得在其字典下编码矩阵,经过空间金字塔匹配核、池化得到特征表示矩 阵后,输入训练得到的SVM分类器,得到该图像所属的分类结果。
[0007] 为实现本发明目的而采用的技术方案是这样的,一种快速局部约束低秩编码的图 像分类方法,包括字典学习部分、训练部分和测试部分。
[0008] 所述字典学习部分步骤过程如下:
[0009] 1)利用SIFT特征提取方法对图像库所有图像进行局部特征提取,得到输入特征 向量矩阵X = [XdX2,…,xj e Rmxn,其中Xie Rn是特征向量矩阵的第i个分量向量,其 中m为向量的维数,η为向量个数。
[0010] 2)利用K-means方法聚类或者其他字典学习方法,对所有图像提取的特征向量矩 阵X进行聚类处理,得到过完备字典D= [C^d2,…,dk] GRmxk,其中m是字典的维数,k为 字典基的数目,满足字典过完备性m << k,k通常为256,1024, 4096等。
[0011] 所述训练部分步骤过程如下:
[0012] i)从图像库中选取部分图像作为训练图像,利用SIFT特征提取方法对所有训 练图像进行局部特征提取,得到输入特征向量矩阵X' = [Χι',χ2',···,χη'] eRmXn。其中Xl' e Rn是特征向量矩阵的第i个分量向量,其中m为向量的维数,n为向量个数。
[0013] ii)计算每个特征向量X1和字典向量之间的欧式距离P i,计算公式如下:
[0015] dist (xj,D) = [dist (xj,(I1),…,dist (x/,dk) ]T,dist (xj,(Ii)是特征向量 X;' 与每一个字典向量山间的欧式距离,σ是调整局部约束速度的权重。
[0016] iii)计算局部约束低秩编码的特征表示向量Ζ,计算公式为:
[0018] 其中λ1; λ2>〇是权重;Ρι为上述步骤ii计算得到的欧氏距离Ρι。
[0019] iv)对得到的特征表示向量Z采用空间金字塔匹配方法进行处理,将Z分成21 X 21块,其中1 = 1,2, 4,分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中 每个字块的Zi进行最大池化,即z ; = max{ I z H I,I z2i I,…,I Zm I },得到最终的低秩编码的第 i向量Z1,其中Z]1是第j块中的第i个元素 ,j = 2 1XS1,通过这个过程得到最后的特征表 示矩阵Z'。
[0020] V)将特征表示矩阵Z'输入SVM分类器,根据每类图像类别标签和其对应的特征表 示矩阵Z',学习得到SVM分类器的核函数。
[0021] 所述测试部分步骤过程如下:
[0022] I)对图像库中剩余的所有图像提取SIFT特征,得到输入特征向量矩阵X* =
[X1*, X1*,…,Xn*] e Rmxn,其中Xi* e Rn是特征向量矩阵的第i个分量向量。
[0023] II)计算每个特征向量X1*和字典向量之间的欧式距离P1,计算公式如下:
[0025] dist (Xi*, D) = [dist (Xi*, (I1),…,dist (Xi*, dk) ]T,dist (Xi*, (Ii)是特征向量 Xi* 与每一个字典向量山间的欧式距离,σ是调整局部约束速度的权重。
[0026] III)计算局部约束低秩编码的特征表示向量Ζ*,计算公式为:
[0028] 其中λ λ 2>〇是权重;p ^为上述步骤II计算得到的欧氏距离。
[0029] IV)采用空间金字塔匹配方法,将特征表示向量Ζ*分成21 X 2?,其中1 = 1,2, 4, 分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中每个字块的Z1*进行 最大池化,保持特征表示向量具有一定的鲁棒性,即Zi* = maXl^Zdl, |z2i*|,…,|ζμ*|}, 得到最终的低秩编码的第i向量Z1*,其中Ζ]1*是第j块中的第i个元素 ,j = S1XS1,这样 得到最后的特征表示矩阵Z*'。
[0030] V)将特征表示矩阵Z*'输入训练部分得到的SVM分类器,得到待分类图像所属的 类别标签。
[0031] VI)统计测试分类图像正确
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1