一种基于图像中层特征的场景分类方法_2

文档序号:9667791阅读:来源:国知局
2. 7 :根据评级得分,选取得分最高的前η个聚类;
[0060] 步骤2. 8 :输入测试图像,进行滑动窗口扫描,根据图像与各聚类模板的匹配分数 高低进行分类。
[0061] 本发明与现有技术相比,具有以下明显的优势和有益效果:
[0062] 本发明通过在提取中层特征的基础上,设计分类器,对场景图像进行分类。由于中 层特征能够有效表达场景图像的内容,更接近于人类视觉系统的认知机理,所以基于中层 特征的场景分类方法能够有效提高学习系统的推广能力。此外,在中层特征提取的过程中, 根据物体与背景的梯度模式不同,用梯度范数特征对图像特征进行扫描,并对特征进行二 值化处理,可以大大提高特征提取的效率,保证算法的实时性,满足机器人场景的实际应用 需要。
【附图说明】
[0063] 图1图像中层特征学习过程示意图;
[0064] 图2中层特征图像块提取中模板训练过程示意图;
[0065] 图3方向梯度直方图(H0G)特征提取过程示意图;
[0066] 图4中层特征场景分类流程示意图图;
[0067] 图5本方法的实施流程图。
【具体实施方式】
[0068] 为了使本领域的人员能够更好的理解和使用本发明,下面将结合附图对本发明的 技术方案进行进一步描述。
[0069] 1.利用安装于机器人平台的摄像机采集场景图像,得到训练图像和测试图像。对 训练图像标注物体区域,并将标注区域的图像块尺寸缩放至为8X8像素区域,计算该区域 的64维梯度范数特征。随机采样图像非标注区域,得到的图像块同样进行尺寸缩放至8X8 像素区域,并计算其64维梯度范数特征。
[0070] 2.将标注区域得到的梯度范数特征作为物体模板训练的正样本,非标注区域得到 的梯度范数特征作为物体模板训练的负样本,利用线性支持向量机训练得到一个64维的 模板向量we Rsxs,模板训练过程如图2。
[0071] 3.二值化模版w。
[0072] 4.将测试图像集中的图像压缩至WQXH。尺寸,其中{ffQXH。}表示图像的尺寸,其 中WQXHQe{10, 20, 40, 80, 160, 320},共有36种。在各种尺寸的图像下,计算每幅图像的 二值化梯度范数特征,利用8X8大小的窗口进行滑动扫描,其中滑动窗口是逐像素点移动 的。计算得到每个窗口的二值化梯度范数特征gl,和在位置1处的二值化梯度范数与模板 匹配得分可表示为Sl。
[0073] 5.将缩放得到的36种不同尺寸的图像按比例缩放为原图像尺寸,就可以得到物 体的区域。尽管得到的物体区域尺寸大小各异,然而对于一般的物体,其尺寸长宽比不会 过大,所以我们对上述步骤得到的物体区域进行提纯。对缩放得到的36种不同大小、匹配 得分以及提纯后最终物体的得分这三者的关系进行建模,计算得到提纯后的最终物体的得 分。每种窗口大小选择Μ个得分最高的作为最终物体区域。
[0074] 6.得到的中层特征作为分类器的训练集Η,将Η分为Α和Β两部分。统计集合Η中所有图像块的大小,按图像块尺寸大小进行排序后,找出图像尺寸的中位数aXb,并将集 合Η中所有图像缩放至aXb大小,在该尺度下计算各个图像块的方向梯度直方图(H0G)特 征,计算图像H0G特征过程如图3。
[0075] 7.用k-means聚类算法对预处理过的样本集A的H0G特征进行聚类,并将聚类的 结果去掉聚类中含有图像块少于k个的类。分别选取每个聚类中的图像作块为正样本,其 他聚类中图像块作为负样本,利用线性支持向量机学习一个形状模板,并用该类的形状模 板在其他聚类中进行扫描,取得分最高的m个图像块来更新每个聚类,在此基础上重新训 练新的形状模板。
[0076] 8.利用交叉验证方法,进行多次重复实验,并将多次实验结果的平均值作为最终 的聚类结果。
[0077] 9.根据评级指标S,对最终的聚类结果进行评级。评级指标S包含两项:纯度和鉴 别性。其中,纯度指每个聚类中前r个图像块的检测得分之和;鉴别性为聚类内图像在集合 中出现个数的比率,根据评级得分,选取得分最高的前η个聚类。
[0078] 10.输入测试图像,进行滑动窗口扫描,根据图像与各聚类模板的匹配分数高低进 行分类。整个分类过程如图4。
[0079]最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方 案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是本领域的普通 技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和 范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。
【主权项】
1. 一种基于图像中层特征的场景分类方法,其特征在于:该方法的实现过程包括以下 步骤, 步骤1:图像中层特征学习 步骤1. 1 :利用安装于机器人平台的摄像机采集场景图像,得到训练图像和:测试图 像;对训练图像标注物体区域,并将标注区域的图像块尺寸缩放至为8X8像素区域,计算 该区域的64维梯度范数特征;随机采样图像非标注区域,得到的图像块同样进行尺寸缩放 至8X8像素区域,并计算其64维梯度范数特征; 步骤1. 2 :将标注区域得到的梯度范数特征作为物体模板训练的正样本,非标注区域 得到的梯度范数特征作为物体模板训练的负样本,利用线性支持向量机训练得到一个64 维的模板向量we Rsxs; 步骤1. 3 :对模版向量w进行二值化,方法如下: 输入:w,Nw; 初始化残差:ε = w ; 循环开始:j = 1到Nw循环结束 输出:其中Nw表示基向量的个数,af {-1,1} 64表示基向量,其中j = 1,. . .,NW,β,表示基 向量对应的系数,最终可将模版向量w表示成为如下形式:用二进制向量进一步表示a j,可得:其中表示对<取反运算;模板向量w与模板向量w的二值化向量b的 点积就可由下式表示:由于一个十进制数可以由其二进制数的最高几位来近似,则二值化64维的梯度范数 特征可以近似表示为:其中,Ng为十进制数所对应的二进制数的高位个数,b k(k = 1,...,Ng)表示二值化数 值中的第k个高位的数值; 步骤1.4:将测试图像集中的图像压缩至IXH。尺寸,其中{WWH。}表示图像的尺寸, 其中 WQXHQe {10, 20, 40, 80, 160, 320},共有 36 种; 步骤1. 5 :在各种尺寸的图像下,计算每幅图像的二值化梯度范数特征,利用8X8大小 的窗口进行滑动扫描,计算得到每个窗口的二值化梯度范数特征gl,则在位置1处的二值化 梯度范数与模板匹配得分可表示为S1: Si = < w, g !> (4) I = (i, X, y) (5) 其中1表示位置信息,i表示缩放后图像的尺寸,(X,y)表示图像的坐标值; 公式(4)可表示为:步骤1. 6 :将缩放得到的36种不同尺寸的图像按比例缩放为原图像尺寸,就可以得到 物体的区域;尽管得到的物体区域尺寸大小各异,然而对于一般的物体,其尺寸长宽比不会 过大,所以我们对上述步骤得到的物体区域进行提纯;对缩放得到的36种不同大小、匹配 得分以及提纯后最终物体的得分这三者的关系建立线性模型,即利用公式(7)计算得到提 纯后的最终物体的得分;每种窗口大小选择M个得分最高的作为最终物体区域: O1= V ; · Sj+t; (7) 上式中的Vl,h为线性模型的参数,t i为误差项;这两个参数可用线性支持向量机学习 得到;即用36种不同尺寸图像中在位置1处的二值化梯度范数与模板匹配得分作为训练样 本,利用线性支持向量机的方法训练得到 Vl,t1; 步骤2 :基于中层特征场景分类 步骤2. 1 :将以上"图像中层特征学习步骤"得到的中层特征作为分类器的训练集H,将 H分为A和B两部分; 步骤2. 2 :统计集合H中所有图像块的大小,按图像块尺寸大小进行排序后,找出图像 尺寸的中位数aXb,并将集合H中所有图像缩放至aXb大小,在该尺度下计算各个图像块 的方向梯度直方图(HOG)特征,计算方法如下: (1) 将图像灰度化,并计算图像每个像素的梯度信息; (2) 将图像划分成若干个8X8像素的细胞单元,对每个细胞单元360度的梯度方向分 成9个方向块,并进行细胞单元内像素的规定权重投影,得到细胞单元的梯度直方图; (3) 将相邻的若干细胞单元组成一个区域,并串联图像内所有区域的梯度直方图,得到 整个图像的HOG特征; 步骤2. 3 :用k-means算法对预处理过的样本集A的HOG特征进行聚类,并将聚类结果 去掉聚类中含有图像块少于k个的类; 步骤2. 4:分别选取每个聚类中的图像作块为正样本,其他聚类中图像块作为负样本, 利用线性支持向量机学习一个形状模板,并用该类的形状模板在其他聚类中进行扫描,取 得分最高的m个图像块来更新每个聚类,在此基础上重新训练得到新的形状模板; 步骤2.5 :利用交叉验证方法,对以上步骤(1)至步骤(4)进行多次重复实验,并将多 次实验结果的平均值作为最终的聚类结果; 步骤2.6 :根据评级指标S,对交叉验证得到的聚类进行评级;评级指标S包含两项:纯 度和鉴别性;其中,纯度指每个聚类中前r个图像块的检测得分之和,用S1表示;鉴别性为 聚类内图像在集合中出现个数的比率,记为S 2:其中,Na为聚类内图像在集合A中出现的个数,Naub为聚类内图像在集合{A U B}中 出现的个数;则分级指标用纯度和鉴别性的线性组合表示为: S = S1+ λ S2 (9) λ为(0, 1)之间的常数,表示判别性在该分级指标中所占的比重; 步骤2. 7 :根据评级得分,选取得分最高的前η个聚类; 步骤2. 8 :输入测试图像,进行滑动窗口扫描,根据图像与各聚类模板的匹配分数高低 进行分类。
【专利摘要】本发明公开了一种基于图像中层特征的场景分类方法,属于场景图像分类领域。首先利用一种快速查找图像中物体区域的方法,得到物体区域图像块,并将得到的区域图像块作为图像的中层特征。然后对中层特征图像块进行聚类,并利用SVM为每个聚类训练一个形状模板,同时根据评级指标,选取评级得分最高的n个形状模板。最后,根据测试图像与n个形状模板的匹配得分实现场景图像分类。本发明解决了场景图像分类中图像鉴别性不足和代表性不强的问题。
【IPC分类】G06K9/62
【公开号】CN105426924
【申请号】CN201510927766
【发明人】杨金福, 张强, 张珊珊, 陈浩
【申请人】北京工业大学
【公开日】2016年3月23日
【申请日】2015年12月14日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1