基于显著性指导非监督特征学习的图像分类方法

文档序号:9667786阅读:325来源:国知局
基于显著性指导非监督特征学习的图像分类方法
【技术领域】
[0001] 本发明涉及一种基于显著性指导非监督特征学习的图像分类方法,属于机器学习 与计算机视觉技术领域。
【背景技术】
[0002] 随着多媒体技术的发展,图像分类已成为计算机视觉领域研究的重点,图像分类 是依据图像具有的某种属性而将其划分到预先设定的不同类别中,如何将图像进行有效的 表达是提高图像分类准确率的关键,特征的选择与提取问题是图像分类目前存在的难点问 题。随着移动互联网的迅速发展,人类社会已进入大数据时代。SIFT、H0G等这些传统的特 征学习虽能提取图像的某些特征,在图像分类中也取得了较好的效果,但这种人工设计特 征方法存在一定的缺陷。而传统的有监督特征学习方法,通过学习人工标注数据,在大数据 时代下显得不合时宜。

【发明内容】

[0003] 为解决现有技术的不足,本发明的目的在于提供一种基于显著性指导非监督特征 学习的图像分类方法,将深度学习网络结构中融入计算机视觉中一些方法与理论,以提高 图像特征的有效表示,从而达到理想的分类结果。
[0004] 为了实现上述目标,本发明采用如下的技术方案:
[0005] -种基于显著性指导非监督特征学习的图像分类方法,其特征是,包括如下步 骤:
[0006] 1)显著性指导的像素点采集:采用显著性检测算法对图像像素点进行采集,通过 获取图像的显著图,采集到图像中具有代表性表示的像素点;
[0007] 2)非监督特征学习:采用稀疏自编码来训练代表性的像素点,获取图像特征;
[0008] 3)图像卷积:分别用图像数据集中训练样本和测试样本对步骤2)中的图像特征 进行卷积操作;
[0009] 4)局部对比归一化:对步骤3)中获取的训练样本和测试样本的卷积特征进行局 部减法和除法归一化;
[0010] 5)空间金字塔池化:从三个不同空间尺度对步骤4)中获取的卷积图像特征进行 平均池化操作;
[0011] 6)融合中央先验:分别计算图像数据集中训练样本和测试样本的中央先验值,将 该值与步骤5)多尺度池化特征分别进行融合操作;
[0012] 7)图像分类:用步骤6)中所获训练样本的特征值来训练分类器,将步骤6)中所 获训练样本的特征值输入已训练的分类器中实现图像分类。
[0013] 前述的基于显著性指导非监督特征学习的图像分类方法,其特征在于,所述步骤 1)具体步骤为:
[0014] 1. 1)采用上下文感知显著性检测算法,计算图像数据集中训练集的显著图,数据 集中每幅图像具有相同的分辨率;
[0015] 1. 2)将每幅显著图中像素点按照灰度值的大小进行降序排列;
[0016] 1. 3)从每幅显著图中选取64个像素点,按照像素点灰度值的大小,从顶部5%中 选取50个正像素点以及从底部30 %中选取14个负像素点;
[0017] 1.4)计算每幅显著图中满足要求的像素点的坐标信息[X,Y],按照此坐标找出该 显著图对应原始RGB图像中的正负像素点。将每一个像素点设定为一个样本,从而获得非 监督特征学习的样本集。
[0018] 前述的基于显著性指导非监督特征学习的图像分类方法,其特征在于,所述步骤 2) 的具体步骤为:
[0019] 2. 1)选用稀疏自编码器作为非监督特征学习工具,设定网络采用的可视层节点为 M,隐藏层节点为N;
[0020] 2. 2)将所得的正负像素样本集作为稀疏自编码的输入,通过非监督的学习预训练 所述网络;通过不断迭代网络输入层与隐藏层之间的权重,实现数据特征的学习与特征提 取,所获特征记为W,W是N行、Μ列大小的矩阵。
[0021] 前述的基于显著性指导非监督特征学习的图像分类方法,其特征在于,所述步骤 3) 中的具体步骤为:
[0022] 3. 1)将W转为8*8卷积核,产生Ν*3个卷积核;
[0023] 3. 2)分别获取图像数据集中训练样本、测试样本中每幅图像R、G、Β三通道值;
[0024] 3. 3)将每幅图像的三通道值分别与当前特征中的3个卷积核进行二维卷积获取 特征值;
[0025] 3. 4)对获取的三通道特征值进行求和操作,记为X;
[0026] 3. 5)利用LRel激活函数计算出X的激活值y;
[0027]LRel激活函数如下
[0028] 前述的基于显著性指导非监督特征学习的图像分类方法,其特征在于,所述步骤 4) 中具体步骤为:
[0029] 4. 1)设置K*K高斯核,将其作为权重窗口;
[0030] 4. 2)将训练图像数据与测试图像数据的激活值分别进行局部减法操作;
[0031] 4. 3)将激活值进行局部减法操作的结果除以标准差,最终得出训练样本与测试样 本经过卷积与局部对比归一化操作后的特征值。
[0032] 前述的基于显著性指导非监督特征学习的图像分类方法,其特征在于,所述步骤 5) 中具体步骤为:
[0033] 5. 1)设定空间金字塔池化三种尺度分别为1、2、3 ;
[0034] 5. 2)计算当前尺度下池化窗口以及池化步长的大小;
[0035] 5. 3)通过循环来获取所得特征的所有二维特征块,特征块每维的大小为池化窗口 的尺寸;
[0036] 5. 4)对当前的特征块求取平均值。
[0037] 前述的基于显著性指导非监督特征学习的图像分类方法,其特征在于,所述步骤 6) 中具体步骤为:
[0038] 6. 1)设定图像数据集中每幅图像的大小为H*H,计算图像的中心点坐标位置 [midpointX,midpointY];
[0039] 6. 2)计算图像中每个像素点与中心点的距离,将距离值存于大小为Η行Η列的矩 阵中;
[0040] 6. 3)通过调整大小操作,将步骤6. 2)中的所得矩阵转换为Η*Η行的列向量;
[0041] 6. 4)通过点乘操作,将步骤6. 3)中所得列向量与步骤5)所得多尺度金字塔池化 特征分别进行融合,得到三个尺度的融合特征;
[0042] 6. 5)将步骤6. 4)中得到的三个尺度的融合特征进行列相连,得到训练样本与测 试样本最终有效特征的表示。
[0043] 前述的基于显著性指导非监督特征学习的图像分类方法,其特征在于,所述步骤 7)的具体步骤为:
[0044] 7. 1)选用开源的liblinear作为分类器,将得到的训练样本的特征集及对应的样 本标签对liblinear进行十折交叉训练,寻取最优参数C;
[0045] 7. 2)用已训练好的分类器模型对测试样本进行预测。
[0046] 本发明所达到的有益效果:本发明将显著性检测算法应用于无监督特征训练样本 的采集,可获取具有代表性的样本。区别于传统的人工设计特征与监督特征学习,采用了深 度学习中稀疏自编码网络来训练无标签的样本。对于获取的卷积图像特征,使用了计算机 视觉中局部对比归一化、中央先验等技术和方法进行后续操作处理,以获得更本质的表示, 以提高分类精度。池化单元具有平移不变性,能保证图像整体上发生平移后也能提取特征 进行匹配;池化能对局部对比归一化后特征进行降维处理,防止分类器过拟合;多尺度的 金字塔池化,能够获取多个尺度的池化特征,能够显著地提高图像的分类精度。本发明结合 了liblinear分类器,降低了分类时间消耗,提高了分类精度。
【附图说明】
[0047] 图1是本发明的流程图。
【具体实施方式】
[0048] 下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明 的技术方案,而不能以此来限制本发明的保护范围。
[0049] 本实施例以STL-10数据库为例,该数据库包含10类RGB图像,每幅图像的大小为 96*96。其中,用于无监督训练时无标签图像数为100000,用于有监督训练的训练样本数为 5000,测试样本数为8000。
[0050] 结合本发明的步骤,具体过程如下:
[0051] 1. 1)使用上下文感知显著性检测算法,计算无标签数据样本中每幅图像的显著 图。
[0052] 1. 2)将每幅显著图中像素点按照灰度值的大小进行降序排列。
[0053] 1.3)从每幅显著图中选取64个像素点,按照像素点灰度值的大小,其中从顶部 5 %中选取50个正像素点以及从底部30 %中选取14个负像素点。
[0054] 1.4)计算每幅显著图中满足要求的像素点的坐标信息[X,Y],按照此坐标找出该 显著图对应原始RGB图像中的正负像素点。将每一个像素点设定为一个样本,从而获得无 监督特征学习的样本集。
[0055] 2. 1)采用的可视层节点为M,Μ= 64*3,隐藏层节点为N= 900。
[0056] 2. 2)用非监督的学习训练所述网络,通过不断迭代网络输入层与隐藏层之间的权 重,迭代次数设为600,所获数据特征记为W,W是900行192列大小的矩阵。
[0057] 3. 1)分别获取图像数据库中训练样本、测试样本中每幅图像R、G、B三通道值。
[0058] 3. 2)将非监督特征学习所获数据特征W转为8*8卷积核,每个特征可产生3个卷 积核,与每幅图像R、G、B三通道值相对应,分别进行二维卷积操作来获取特征值。
[0059] 3. 3)对获取的三通道特征值进行求和操作,所求的和记为X。
[0060] 3. 4)利用LRel激活函数计算出步骤3中所求和X的激活值y。
[0061] 4. 1)设置9*9大小的高斯核,将其作为权重窗口。
[0062] 4. 2)将激活值y进行局部减法操作。
[0063] 4. 3)将步骤4. 2)的结果除以标准差。
[0064] 4. 4)
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1