一种图像分类方法

文档序号:8457572阅读:402来源:国知局
一种图像分类方法
【技术领域】
[0001 ] 本发明属于数字图像处理技术领域。
【背景技术】
[0002] 图像理解是一个转变"像素值决定"的过程:它将以图标形式的图像表示方式转化 为另一种知识符号的形式,也即是图像的各个像素块内包含了怎样的内容。其中,图像分类 是图像理解的一个分支,它在基于内容的图像检索、物体分类与识别和场景分类中具有广 泛的应用。在计算机视觉中,一个基本的问题是怎样让计算机像人类一样"看"事物。实际 中,虽然我们每一秒内都接受巨大数量的视觉数据,但是我们几乎并没有意识到我们正在 以相当快的速度处理它们。对物体,比如桌子、乒乓球或者一个高山流山场景进行分类,进 行分类更是非常容易的事情。但目前机器人的视觉与人眼的视觉是无法比拟的。
[0003] 人工智能结合了计算机科学、神经科学、数学、心理学、哲学和认知科学等领域的 工作。与此同时,在许多领域都去了很大的进步。例如,在认知科学方面的进步使我们有足 够的理由相信,我们的大脑处理信息是以"至上而下"的方式,而不是"至下而上"的方式。 结合认知科学上取得的成果,图像分类主要采取类似的两种不同的技术路线:一种是"至下 而上"的方法,利用图像中物体的类别来判定图像的类别;另一种是"至上而下"的方法,直 接从整幅图像来判定图像的类别。
[0004] 目前,较多的研宄都聚焦在了第二种技术路线上。从而,避开了图像分割,并通过 融合一个图像的全局特征来进行分类。
[0005] 采用"自上而下"技术路线。此种技术由于避开了图像分割,从而使图像分类 任务变得简明和有效。主要的思路是首先提取出图像的全局或者局部特征;然后,对这 些特征进行编码;接下里,进行向量的池化;最后,用分类器进行分类。比如,文献Chang E j Goh Kj Sychay G,et al. CBSA:content-based soft annotation for multimodal image retrieval using Bayes point machines[J]. Circuits and Systems for Video Technology,IEEE Transactions on,2003, 13(1) :26-38 中提到了全局特征;文献 Szummer M,Picard R W. Indoor-outdoor image classification[C]//Content-Based Access of Image and Video Database, 1998. Proceedings.,1998IEEE International Workshop on. IEEE,1998:42-51使用全局特征来对图像进行分类。
[0006] 常用的图像分类算法框架有:
[0007] 空间金字塔匹配 SPM :Lazebnik S,Schmid C,Ponce J. Beyond bags of features:Spatial pyramid matching for recognizing natural scene categories[C]//Computer Vision and Pattern Recognition, 2006IEEE Computer Society Conference on.IEEE,2006,2:2169-2178.
[0008] 基于稀疏编码的空间金字塔匹配ScSPM :Yang J,Yu K,Gong Y,et al. Linear spatial pyramid matching using sparse coding for image classification[C]// Computer Vision and Pattern Recognition, 2009. CVPR 2009. IEEE Conference on.IEEE, 2009:1794-1801.
[0009] SPM方法需要用到非线性核,训练时间较长;ScSPM方法编码时间过长,抵消了后 面运用线性核的整体效果。

【发明内容】

[0010] 本发明所要解决的技术问题是,提供一种能同时提升分类精度与效率的图像分类 方法。
[0011] 本发明为解决上述技术问题所采样的技术方案是,一种图像分类方法,包括以步 骤:
[0012] 1)训练阶段:
[0013] 对训练样本图像同时提取SIFT特征与协方差矩阵特征;
[0014] 对图像的SIFT特征与图像的协方差矩阵特征分别进行局部约束线性编码LLC得 到图像的SIFT特征稀疏编码与图像的协方差矩阵特征稀疏编码;
[0015] SIFT特征稀疏编码经基于空间金字塔匹配SPM框架的池化处理后得到图像的 SIFT特征表示,协方差矩阵特征稀疏编码经池化后得到图像的协方差特征表示;
[0016] 将SIFT特征表示与协方差特征表示进行级联后形成最终的样本图像的特征,将 最终的样本图像的特征输入线性分类器训练;
[0017] 2)分类阶段:
[0018] 对待分类的图像同时提取SIFT特征与协方差矩阵特征;
[0019] 对图像的SIFT特征与图像的协方差矩阵特征分别进行局部约束线性编码LLC得 到图像的SIFT特征稀疏编码与图像的协方差矩阵特征稀疏编码;
[0020] SIFT特征稀疏编码经基于SPM框架的池化处理后得到图像的SIFT特征表示,协方 差矩阵特征稀疏编码经池化后得到图像的协方差特征表示;
[0021] 将SIFT特征表示与协方差特征表示进行级联后形成最终的图像表示,将最终的 图像表示向量输入训练好的线性分类器得到分类结果。
[0022] 本发明的有益效果是,保留了 SPM框架,在SIFT特征提取技术基础上,结合协方差 矩阵特征提取技术和LLC技术,协方差矩阵特征融合了多种特征,这些特征对尺度、旋转和 光照变化不敏感。LLC的编码速度快,效率高,为线性分类提供了基础。线性分类器的使用 缩短了训练时间。分类精度提高的同时,又增强了系统的鲁棒性。
【附图说明】
[0023] 图1是本发明流程图。
【具体实施方式】
[0024] 为了方便地描述本
【发明内容】
,首先对一些术语进行说明。
[0025] 特征区域:特征区域是在图像上均匀划分出来的栅格,这些栅格中包含了图像的 边缘纹理和方向信息。这些信息对于特定的图像都是非常稳定的,它们代表了图像的大体 轮廓,具有较好区分性。
[0026] 特征描述子:特征描述子(Descriptor)是对特征区域附近局部特征的定量化数 据描述,一个好的特征描述子应该能够充分表达特征点局部图像的形状和纹理结构,具备 高的鲁棒性、独特性和区分性。通俗地说,就是用一个向量来表示一个局部区域的特征。
[0027] 稀疏编码:由于自然图像信号的稀疏性,图像信号I(x,y)可分解为一组基的线性 组合。
[0028]
【主权项】
1. 一种图像分类方法,其特征在于,包括以步骤: 1) 训练阶段: 对训练样本图像同时提取SIFT特征与协方差矩阵特征; 对图像的SIFT特征与图像的协方差矩阵特征分别进行局部约束线性编码LLC得到图 像的SIFT特征稀疏编码与图像的协方差矩阵特征稀疏编码; SIFT特征稀疏编码经基于空间金字塔匹配SPM框架的池化处理后得到图像的SIFT特 征表示,协方差矩阵特征稀疏编码经池化后得到图像的协方差特征表示; 将SIFT特征表示与协方差特征表示进行级联后形成最终的样本图像的特征,将最终 的样本图像的特征输入线性分类器训练; 2) 分类阶段: 对待分类的图像同时提取SIFT特征与协方差矩阵特征; 对图像的SIFT特征与图像的协方差矩阵特征分别进行局部约束线性编码LLC得到图 像的SIFT特征稀疏编码与图像的协方差矩阵特征稀疏编码; SIFT特征稀疏编码经基于SPM框架的池化处理后得到图像的SIFT特征表示,协方差矩 阵特征稀疏编码经池化后得到图像的协方差特征表示; 将SIFT特征表示与协方差特征表示进行级联后形成最终的图像表示,将最终的图像 表示向量输入训练好的线性分类器得到分类结果。
2. 如权利要求1所述一种图像场景分类方法,其特征在于,所述池化方式具体为最大 值池化max-pooling〇
3. 如权利要求1所述一种图像分类方法,其特征在于,基于空间金字塔匹配SPM框架 的池化将图像分为3层,第0层将整幅图像作为一个区域,第1层将整幅图像均匀划分为4 个区域,第2层将整幅图像均匀划分为16个区域;按从左往右、从上到下的顺序对各层中的 各个区域对应的稀疏编码矩阵进行池化得到各区域的向量,再顺序将各区域的向量加权后 级联得到图像的特征表示。
4. 如权利要求3所述一种图像场景分类方法,其特征在于,第0层权值为1/4,第1层 权值为1/4,第2层权值为1/2。
【专利摘要】本发明提供一种图像分类方法,保留了SPM框架,在SIFT特征提取技术基础上,结合协方差矩阵特征提取技术和LLC技术,协方差矩阵特征融合了多种特征,这些特征对尺度、旋转和光照变化不敏感。LLC的编码速度快,效率高,为线性分类提供了基础。线性分类器的使用缩短了训练时间。分类精度提高的同时,又增强了系统的鲁棒性。
【IPC分类】G06K9-62
【公开号】CN104778476
【申请号】CN201510168725
【发明人】解梅, 马争, 张达明, 于国辉
【申请人】电子科技大学
【公开日】2015年7月15日
【申请日】2015年4月10日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1