一种快速局部约束低秩编码的图像分类方法

文档序号：9433116阅读：531来源：国知局

一种快速局部约束低秩编码的图像分类方法
【技术领域】
[0001] 本发明涉及一种利用快速局部约束低秩编码的方法进行图像分类，此方法快速并精度较高，是一种基于图像内容的数据驱动的分类方法。
【背景技术】
[0002] 图像分类属于计算机视觉的一个重要研究方向，它包括图像的预处理，特征的表达与分类器的设计，其中特征表达包括图像特征的提取、特征的降维和特征的编码。特征提取主要是通过图像中各种内容表现出来的颜色、亮度、纹理、形状及像素的空间分布等属性对图像描述。特征表达式指在最基本的特征基础上进行统计（矢量量化）、编码或其他方法以形成一幅图像最后的特征，通常情况下会比原始的基本特征具有更好的性能；良好的特征表达能够提升图像分类和识别的性能。
[0003] 近几年对于特征描述表示的方法比较多，有视觉词包模型（bag of words，B0W)、基于稀疏编码的空间金字塔模型（Sparse Coding Spatial Pyramid Matching，ScSPM)、局部约束线性编码（Locality-constrained Linear Coding，LLC)、结构低秩表示的图像分类方法（Structured Low-rank Representation, SLRR)和低秩稀疏分解的图像分类方法 (Low-rank Sparse Coding，LRSC)，这些方法在一定程度上克服了一些难题，不过依然都存在不足。
[0004] 视觉词包模型（bag of words，B0W)虽然易于构建，但忽略了同类图像具有一定的空间结构相似性。基于稀疏编码的空间金字塔模型（Sparse Coding Spatial Pyramid Matching，ScSPM)忽略了局部描述子之间的相关性，而且对特征的变化和噪声敏感，而且计算量很大，耗内存。局部约束线性编码（Locality-constrained Linear Coding，LLC)，这种局部性一定程度上导致了稀疏性，相对于稀疏编码使得算法的运算量大大减小，速度提高，但LLC忽略了特征之间的整体结构化特征的空间信息。结构低秩表示的图像分类方法（Structured Low-rank Representation, SLRR)，对人脸识别有较好的效果，尤其适用于有严重噪声（如遮挡、光照角度变化等）的图像分类。低秩稀疏分解的图像分类方法（Low-rank Sparse Coding) (LRSC)分类精度得到了一定提高，但还是忽略了局部空间信息；其中稀疏部分对编码仍然很敏感。基于空间金字塔的快速低秩表示的图像分类方法 (Fast Low-rank Representation based Spatial Pyramid Matching, LrrSPM)，此方法的分类速度是ScSPM的5~16倍，但是分类精度低于ScSPM和LLC方法。
[0005] 目前图像分类方法大都采用稀疏编码和低秩表示的编码方式，但是鉴于稀疏编码对图像的变化和噪声较敏感，非常耗内存；采用低秩表示的编码方式在精度和计算复杂度间得到一个平衡。

【发明内容】

[0006] 鉴于目前分类方法在分类效果及分类速度方面的缺陷，本发明提出一种快速局部约束低秩编码的图像分类方法，该方法包括字典学习部分，训练部分和测试部分三个部分。字典学习部分要求对图像库内所有图像提取图像的SIFT特征，经过K-means聚类得到字典；训练部分首先对训练集中的图像提取SIFT特征，然后求得SIFT特征在字典下的特征编码表示，采用局部约束的低秩编码方法，同时考虑图像的全局结构一致性和局部空间相似性，得到特征编码矩阵，经过空间金字塔匹配核、池化后得到最终的特征表示矩阵，采用SVM 方法对特征表示矩阵和类标记进行训练，建立分类模型。测试部分首先对任意一张图像进行特征提取，然后求得在其字典下编码矩阵，经过空间金字塔匹配核、池化得到特征表示矩阵后，输入训练得到的SVM分类器，得到该图像所属的分类结果。
[0007] 为实现本发明目的而采用的技术方案是这样的，一种快速局部约束低秩编码的图像分类方法，包括字典学习部分、训练部分和测试部分。
[0008] 所述字典学习部分步骤过程如下：
[0009] 1)利用SIFT特征提取方法对图像库所有图像进行局部特征提取，得到输入特征向量矩阵X = [XdX2,…，xj e Rmxn，其中Xie Rn是特征向量矩阵的第i个分量向量，其中m为向量的维数，η为向量个数。
[0010] 2)利用K-means方法聚类或者其他字典学习方法，对所有图像提取的特征向量矩阵X进行聚类处理，得到过完备字典D= [C^d2，…，dk] GRmxk，其中m是字典的维数，k为字典基的数目，满足字典过完备性m << k，k通常为256,1024, 4096等。
[0011] 所述训练部分步骤过程如下：
[0012] i)从图像库中选取部分图像作为训练图像，利用SIFT特征提取方法对所有训练图像进行局部特征提取，得到输入特征向量矩阵X' = [Χι'，χ2'，···，χη'] eRmXn。其中Xl' e Rn是特征向量矩阵的第i个分量向量，其中m为向量的维数，n为向量个数。
[0013] ii)计算每个特征向量X1和字典向量之间的欧式距离P i，计算公式如下：
[0015] dist (xj，D) = [dist (xj，(I1)，…，dist (x/，dk) ]T，dist (xj，(Ii)是特征向量 X;' 与每一个字典向量山间的欧式距离，σ是调整局部约束速度的权重。
[0016] iii)计算局部约束低秩编码的特征表示向量Ζ，计算公式为：
[0018] 其中λ1; λ2>〇是权重；Ρι为上述步骤ii计算得到的欧氏距离Ρι。
[0019] iv)对得到的特征表示向量Z采用空间金字塔匹配方法进行处理，将Z分成21 X 21块，其中1 = 1，2, 4,分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中每个字块的Zi进行最大池化，即z ; = max{ I z H I，I z2i I，…，I Zm I }，得到最终的低秩编码的第 i向量Z1，其中Z]1是第j块中的第i个元素，j = 2 1XS1,通过这个过程得到最后的特征表示矩阵Z'。
[0020] V)将特征表示矩阵Z'输入SVM分类器，根据每类图像类别标签和其对应的特征表示矩阵Z'，学习得到SVM分类器的核函数。
[0021] 所述测试部分步骤过程如下：
[0022] I)对图像库中剩余的所有图像提取SIFT特征，得到输入特征向量矩阵X* =
[X1*, X1*,…，Xn*] e Rmxn，其中Xi* e Rn是特征向量矩阵的第i个分量向量。
[0023] II)计算每个特征向量X1*和字典向量之间的欧式距离P1，计算公式如下：
[0025] dist (Xi*, D) = [dist (Xi*, (I1)，…，dist (Xi*, dk) ]T，dist (Xi*, (Ii)是特征向量 Xi* 与每一个字典向量山间的欧式距离，σ是调整局部约束速度的权重。
[0026] III)计算局部约束低秩编码的特征表示向量Ζ*，计算公式为：
[0028] 其中λ λ 2>〇是权重；p ^为上述步骤II计算得到的欧氏距离。
[0029] IV)采用空间金字塔匹配方法，将特征表示向量Ζ*分成21 X 2?，其中1 = 1，2, 4，分别代表不同的三层对应的空间金字塔分块的个数。然后针对每层中每个字块的Z1*进行最大池化，保持特征表示向量具有一定的鲁棒性，即Zi* = maXl^Zdl, |z2i*|,…，|ζμ*|}，得到最终的低秩编码的第i向量Z1*,其中Ζ]1*是第j块中的第i个元素，j = S1XS1,这样得到最后的特征表示矩阵Z*'。
[0030] V)将特征表示矩阵Z*'输入训练部分得到的SVM分类器，得到待分类图像所属的类别标签。
[0031] VI)统计测试分类图像正确

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：范敏;王芬;杜思远;
技术所有人：重庆大学;
我是此专利的发明人

上一篇：基于局部约束线性编码的车身颜色识别方法
上一篇：图像处理方法和装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。