一种基于图像中层特征的场景分类方法

文档序号：9667791阅读：1303来源：国知局

一种基于图像中层特征的场景分类方法
【技术领域】
[0001] 本发明涉及一种图像分类方法，尤其是一种基于图像中层特征学习的场景图像分类方法，用于室内及室外自然场景图像的分类。
【背景技术】
[0002] 目前，随着越来越多智能移动机器人走进人们的日常生活，并在军事、商场、医院、家庭等各种领域发挥重要作用，人们对智能移动机器人系统的自动定位需求越来越迫切。移动机器人只有准确地知道自身的位置以及所处的工作空间，才能安全有效地进行自主运动，为人类服务。场景图像分类作为图像理解的重要研究内容，是机器视觉和模式识别领域的重要研究问题。应用于移动机器人的场景图像分类，旨在使机器人能够像人一样认知和理解场景所包含的语义信息，以增强移动机器人对场景理解的能力。其难点在于如何有效地区分场景类内的差异性和场景类间的相似性。
[0003] 基于场景识别的机器人视觉自定位方法使用人类能够直接理解的高层语义信息如"走廊"、"厨房"等作为视觉特征，非常适合于机器人在复杂环境中的自定位问题。李桂芝等 [1]使用多通道Gabor滤波器提取场景图像的全局纹理特征，并使用支持向量机来分类识别室内、走廊、门厅等场景，进而实现机器人的逻辑定位。Ullah等[2]使用Harris角点特征检测子和SIFT特征描述子提取局部特征，并使用支持向量机作为分类器实现基于局部特征的地点识别。局部特征虽然在精确特征匹配方面能够获得较好的效果，但是由于缺乏中高层语义，导致推广能力不尽人意。
[0004] 在日常生活中，人类的视觉系统总能够寻找场景中最具代表性的某些区域来进行对场景的理解和识别。即人类视觉系统能够快速地从场景图像中提取表征场景内容的中层特征。与底层特征相比，由于图像的中层特征更接近于人类认知场景的行为过程，近几年，基于中层特征的图像分类吸引越来越多的研究人员的注意。图像中层特征与图像的低层特征相比，包含的信息更加丰富，更适合描述现实世界的表象分布，同时也不需要高层特征实体的语义基础。所以，将中层特征应用于场景分类领域，具有巨大的优势和潜力。
[0005] 参考文献：
[0006] [1]李桂芝，安成万，杨国盛等.基于场景识别的移动机器人定位方法研究[J]. 机器人，2005, 27 (2) : 123-127
[0007] [2]UllahMM,PronobisA?CaputoB?etal.Towardsrobustplacerecognition forrobotlocalization[C].InProc.ofIEEEICRA. 2008:530-537
[0008] [3]Ming-MingCheng，ZimingZhang，Wen-YanLin，PhilipTorr，BING:Binarized NormedGradientsforObjectnessEstimationat300fps.InProc.ofIEEECVPR, 2014.
[0009] [4]S.Singh,A.Gupta,andA.A.Efros.Unsuperviseddiscoveryofmid-level discriminativepatches.InProc.ofECCV,2012.
[0010] [5]DalaiN，TriggsB.Histogramsoforientedgradientsforhuman detection[C].InProc.ofIEEECVPR2005,1:886-893.

【发明内容】

[0011] 本发明的目的在于提供一种基于中层特征学习的图像分类方法，利用中层特征更好地模拟人类的视觉特性，以解决图像分类中图像鉴别性不足和代表性不强的问题。即要使分类得到的物体图像满足出现频率高，且和其他视觉物体具有显著区别，又可以在大量图片中以较高的召回率和精确率检测出来。为了达到上述目的，本发明所采用的技术方案是：首先利用一种快速查找图像中近似物体区域（可能存在物体的区域）的学习方法，得到近似区域图像块，并将得到的图像块作为图像的中层特征特征。然后，在得到的大量中层特征的基础上，基于支持向量机设计分类算法，实现场景的分类，为了进一步提高分类效果，定义评价指标函数，优化分类结果。
[0012] 本发明是采用以下技术手段实现的：
[0013] -种基于图像中层特征的场景分类方法，其实现过程包括以下步骤：
[0014] 步骤1 :图像中层特征学习
[0015] 步骤1. 1 :利用安装于机器人平台的摄像机采集场景图像，得到训练图像和：测试图像。对训练图像标注物体区域，并将标注区域的图像块尺寸缩放至为8X8像素区域，计算该区域的64维梯度范数特征。随机采样图像非标注区域，得到的图像块同样进行尺寸缩放至8X8像素区域，并计算其64维梯度范数特征；
[0016] 步骤1. 2 :将标注区域得到的梯度范数特征作为物体模板训练的正样本，非标注区域得到的梯度范数特征作为物体模板训练的负样本，利用线性支持向量机训练得到一个 64维的模板向量weRsxs;
[0017] 步骤1. 3 :对模版向量w进行二值化，方法如下：
[0018] 输入：w，Nw;
[0019] 初始化残差：ε=w;
[0020] 循环开始：j= 1到Nw
[0021] aj=sign(ε)
[0022] β.〗= < a .j，ε >/I |a.j| I
[0023] ε-ε-β々j;
[0024] 循环结束
[0025] 输出：{A}:-V
[0026] 其中Nw表示基向量的个数，a# {-1，1} 64表示基向量，其中j= 1，. . .，NW，h表示基向量对应的系数，最终可将模版向量w表示成为如下形式：
[0027]
(1)
[0028] 用二进制向量进一步表示a,，可得：
[0029] =α)-α]
[0030] 其中e1〇,l]·64，《丨表示对< 取反运算。模板向量w与模板向量w的二值化向量b的点积就可由下式表示：
[0031]
(2)
[0032]由于一个十进制数可以由其二进制数的最高几位来近似，则二值化64维的梯度范数特征近似表示为：
[0033]
C.3)
[0034] 其中，Ng为十进制数所对应的二进制数的高位个数，b k(k = 1，. . .，Ng)表示二值化数值中的第k个高位的数值。
[0035] 步骤1.4 :将测试图像集中的图像压缩至IXH。尺寸，其中{WaXH。}表示图像的尺寸，其中WQXHQe{10, 20, 40, 80, 160, 320}，共有 36 种；
[0036] 步骤1. 5 :在各种尺寸的图像下，计算每幅图像的二值化梯度范数特征，利用8X8 大小的窗口进行滑动扫描，计算得到每个窗口的二值化梯度范数特征gl，则在位置1处的二值化梯度范数与模板匹配得分可表示为s1:
[0037] Sl = <w, gl> (4)
[0038] 1 = (i,x,y) (5)
[0039] 其中1表示位置信息，i表示缩放后图像的尺寸，（x，y)表示图像的坐标值。公式 (4)可表示为：
[0040]
[0041 ]
[0042] 步骤1.6:将缩放得到的36种不同尺寸的图像按比例缩放为原图像尺寸，就可以得到物体的区域。尽管得到的物体区域尺寸大小各异，然而对于一般的物体，其尺寸长宽比不会过大，所以我们对上述步骤得到的物体区域进行提纯。对缩放得到的36种不同大小、匹配得分以及提纯后最终物体的得分这三者的关系建立线性模型，即利用公式（7)计算得到提纯后的最终物体的得分。每种窗口大小选择Μ个得分最高的作为最终物体区域：
[0043] 〇!=￥；· Sj+t；(7)
[0044] 上式中的Vl，h为线性模型的参数，t误差项。这两个参数可用线性支持向量机学习得到。即用36种不同尺寸图像中在位置1处的二值化梯度范数与模板匹配得分作为训练样本，利用线性支持向量机的方法训练得到Vl，t1<3
[0045] 步骤2 :基于中层特征场景分类
[0046] 步骤2. 1 :将以上"图像中层特征学习步骤"得到的中层特征作为分类器的训练集 H，将Η分为A和B两部分；
[0047] 步骤2. 2 :统计集合Η中所有图像块的大小，按图像块尺寸大小进行排序后，找出图像尺寸的中位数aXb，并将集合Η中所有图像缩放至aXb大小，在该尺度下计算各个图像块的方向梯度直方图（H0G)特征，计算方法如下：
[0048] (1)将图像灰度化，并计算图像每个像素的梯度信息；
[0049] (2)将图像划分成若干个8X8像素的细胞单元，对每个细胞单元360度的梯度方向分成9个方向块，并进行细胞单元内像素的规定权重投影，得到细胞单元的梯度直方图；
[0050] (3)将相邻的若干细胞单元组成一个区域，并串联图像内所有区域的梯度直方图，得到整个图像的H0G特征。
[0051] 步骤2. 3 :用k-means算法对预处理过的样本集A的HOG特征进行聚类，并将聚类结果去掉聚类中含有图像块少于k个的类；
[0052] 步骤2. 4:分别选取每个聚类中的图像作块为正样本，其他聚类中图像块作为负样本，利用线性支持向量机学习一个形状模板，并用该类的形状模板在其他聚类中进行扫描，取得分最高的m个图像块来更新每个聚类，在此基础上重新训练得到新的形状模板；
[0053] 步骤2. 5 :利用交叉验证方法，对以上步骤（1)至步骤（4)进行多次重复实验，并将多次实验结果的平均值作为最终的聚类结果；
[0054] 步骤2. 6 :根据评级指标S，对交叉验证得到的聚类进行评级。评级指标S包含两项：纯度和鉴别性。其中，纯度指每个聚类中前r个图像块的检测得分之和，用Si表示；鉴别性为聚类内图像在集合中出现个数的比率，记为S2:
[0055]
[0056] 其中，NA为聚类内图像在集合A中出现的个数，NAUB为聚类内图像在集合{AUB} 中出现的个数。则分级指标用纯度和鉴别性的线性组合表示为：
[0057] S=S!+λS2 (9)
[0058] λ为（〇,1)之间的常数，表示判别性在该分级指标中所占的比重；
[0059] 步骤

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨金福;张强;张珊珊;陈浩;
技术所有人：北京工业大学;
我是此专利的发明人

上一篇：图像标注方法和电子设备的制造方法
上一篇：一种半监督分类方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。