一种基于多分辨率框架的物体识别检测方法

文档序号：6599848阅读：135来源：国知局

专利名称：：一种基于多分辨率框架的物体识别检测方法
技术领域：
：本发明属于计算机视觉领域，涉及一种物体识别检测方法。技术背景本发明中涉及到的
背景技术：
有(1).快速鲁棒性(SpeededUpRobustFeatures,SURF)图像局部特征描述符(见文献[1]):SURF具有尺度及旋转不变，对于光照变化具有很好鲁棒性的特征，而且相比于其他局部特征，这种特征采取了不同的特征提取方式，增加了特征的提取速度，同时降低了描述的维数，并且具有较好的特征特异性，达到很好的识别率，近几年在计算机视觉的多个方面得到了应用。(2).在众多物体识别检测算法中，基于有监督学习的物体检测算法能够准确快速地检测出图像中想要类别的物体，而并不把其他类别的物体检测出来，即在检测的同时识别物体，而且这种物体检测算法能够对单张图像进行物体检测，对于复杂场景也能取得比较好的检测效果。例如，AgarwaK见文献[2])等人提出使用Forstner感兴趣点检测子检测图像特正，然后通过SnoW(SparseNetworkofWinnows)学习框架训练分类器，利用该分类器形成多尺度空间的分类活动图，通过分析活动图实现物体的检测。Dalal(见文献[3])等人提出利用梯度方向柱状图，结合SVM分类器实现人脸的检测，并达到很好的效果。但是这些算法依然面临很多的问题和挑战，如尺度变化、旋转变化、平移变化、光照变化、视角变化等问题。
发明内容本发明的目的在于客服现有技术的上述不足，提供一种能够在具有尺度变化、视角变化、旋转变化、亮度变化、部分遮挡等复杂条件下准确并快速的检测到物体位置的物体识别检测方法。为此，本发明采用如下的技术方案一种基于多分辨率框架的物体识别检测方法，包括构造多分辨率框架分类器和多分辨率框架下物体检测两部分，步骤如下第一步分别选择所要分类物体的正负样本图像，正样本为所要分类别的物体图像，负样本为非该类物体的任意其他物体图像，设原始图像分辨率为R，构造用于分类器的训练集T(R)，；第二步将训练集T(R)分别作不同采样率σ的采样，得到图像的分辨率分别为r=1,2,3……R的各个分辨率下的图像训练集合T(r)；第三步按照下列方法得到物体分类器C(r)，最终得到一个包含各个分辨率的层次分类器H(r)，H(r)是由R个单独的分类器C(r)构成从图像训练集合T(r)中，分别提取正样本和负样本中所有图像的SURF特征描述符，正负样本特征描述符分别存储两个集合之中；(b)利用K-means聚类方法，对正负样本集的特征描述符进行聚类分析；(c)将正负样本集合的聚类结合，形成图像特征词典；(d)根据正负样本集合在聚类中的索引，求出每幅图像聚类直方图，并根据正负样本对应相应的标签，将直方图数据和标签进行支持向量机训练，得到分辨率r下的分类器C(r)；第四步将待检测的图像根据多分辨率分类器的构造流程分别提取R个分辨率不同分辨率的图像，然后对不同分辨率的测试图像再依次提取不同尺度S的多尺度图像，s=1,2,3……S，尺度因子为β；第五步在每个分辨率图像的各个尺度空间使用相同大小的窗口进行检测，在不同分辨率之间窗口使用不同的窗口进行检测，每个分辨率的窗口大小为(^，hr)=(w,h)/ah，w,h分别是原始分辨率窗口的长和宽，a是固定常数；第六步对于每个分辨率r和尺度s，所有初始检测窗口的状态全部初始化为1，使用分类器C(r)以同样窗口大小检测分辨率r的各个尺度空间图像，在尺度空间s上，将检测为0，即不包含物体的窗口区域丢弃，将检测为1即包含物体的窗口区域保留，传递到r+1分辨率同一尺度空间s中去，依次进行，直到检测到最高分辨率R，得到最高分辨率R中不同尺度空间s包含物体的区域；第七步在原始分辨率下R各个尺度空间通过使用Mean-shift聚类的方法来得到物体的最终位置。作为优选实施方式，其中第三步的步骤(b)包括下列步骤利用K-means聚类方法，将正负样本集的特征描述符分别聚成K类，各自形成K个关键字，并且得到每幅图像中特征描述符的聚类索引，即每个特征符存在哪个聚类当中，同时记下每个聚类中心的中心数值。本发明通过总结当前主要的物体识别检测技术的优缺点和适用范围，根据目前在物体分类识别中有比较好性能的图像局部特征描述符的特点，构造了一种基于局部特征描述符的物体分类器，并根据现有的物体检测技术的实现算法中面临的问题，提出了一种在图像多分辨率框架下利用物体分类器逐区域进行物体检测的方法，得到很好的目标识别检测效果。本发明能够有效解决物体识别和检测中所面临的尺度变化、旋转变化、平移变化、光照变化、视角变化等带来的问题，在多分辨率物体检测框架下，可以有效解决使用滑动窗口方法带来的物体检测时间过长的问题，准确并快速的检测到物体的位置。图1基于多分辨率框架的物体识别检测方法总体流程图；图2的(a)、(b)(c)(d)(e)(f)图像分别为σ=0,1,4,16，64，256的多尺度表示；图3多分辨率框架；图4(a)、(b)分别为640X480分辨率下多分辨率物体检测效果和传统方法检测效果。表1单分辨率物体检测和多分辨率物体检测时间对照表。具体实施例方式本发明提出了基于多分辨率框架的物体识别检测方法，将快速鲁棒性特征描述符(SURF)结合文本分类中常用的简单模型Bag-of-word(词袋模型)模型和SVM(支持向量机)相结合，构造了基于SURF特征的有监督学习二元物体分类器；在上述分类器的基础上，将基于SURF特征的SVM分类器与图像的多分辨率理论结合，在不同的分辨率空间下进行物体的检测。本发明能够有效解决物体识别和检测中所面临的尺度变化、旋转变化、平移变化、光照变化、视角变化等带来的问题，在多分辨率物体检测框架下，可以有效解决使用滑动窗口方法带来的物体检测时间过长的问题，准确并快速的检测到物体的位置。本发明是基于多分辨率框架的物体识别检测方法，图1为总体流程图，具体包括以下步骤1.多分辨率框架分类器的构造；以下是多分辨率框架下的快速鲁棒性特征分类器流程(1).选取用于分类器构造的训练集和测试集。从一个图像数据库(对于本发明的物体检测算法主要使用ETH-80，CaltechlOl和ThePASCALVisualObjectClassesChallenge2006三种数据库，具体见参考文献[4]、[5]和[6])中分别选择所要分类物体的正负样本图像，对于物体检测系统，正样本一股采用只包含该类物体的图像，尽可能少的包含背景，以减少背景的干扰，正样本集构造时可以进行预处理，将正样本做一些手动分割，只提取图像中的物体图像作为正样本，负样本一股采用不包含物体只包含背景的图像或者包含其他物体的图像；(2).设图像的分辨率分别为r=1,2,3……R，R为原始图像分辨率，图像的采样率为σ，将原分辨率R下的训练集T(R)分别作不同采样率σ的采样(可以采用简单的隔行采样，采样率σ=0.5)得到各个分辨率下的图像集合T(r)，这些图像集合分别成为各个分辨率下的训练集，这样构成了多个训练集合；(3).在各个分辨率r下，分别提取各个训练集T(r)中每个图像的SURF特征和特征符，通过Bag-of-word模型和SVM在每个分辨率r下各自构造物体分类器C(r)，不同分辨率下可以采用不同的聚类数量，这样在每个图像分辨率下都对应一个分类器，可以在不同的分辨率下设置不同的分类器C(r)判断物体类别的阈值。这样从图像的低分辨率到图像的高分辨率逐渐训练分类器，最终得到一个包含各个分辨率的层次分类器H(r)，H(r)是由R个单独的分类器C(r)构成。其中C(r)的具体构造过程如下(a)从分辨率r下图像集合T(r)中，分别提取正样本和负样本中所有图像的SURF特征描述符，正负样本特征描述符分别存储两个集合之中；(b).利用K-means聚类方法，将正负样本集的特征描述符分别聚成K类，各自形成K个关键字，并且得到每幅图像中特征描述符的聚类索引，即每个特征符存在哪个聚类当中，同时记下每个聚类中心的中心数值；(c).将正负样本集合的聚类结合，形成一个大小为2K的图像特征词典，以备测试图像形成图像特征直方图查询；(d)根据(b)中正负样本集合在聚类中的索引，求出每幅图像聚类直方图，并根据正负样本对应相应的标签，将直方图数据和标签送入SVM进行训练，得到分辨率r下的分类器C(r)。2.多分辨率框架下物体的检测(1)将测试图像根据多分辨率分类器的构造流程分别提取R个分辨率不同分辨率的图像，然后对不同分辨率的测试图像再依次提取不同尺度s的多尺度图像，s=1,2,3……S，尺度因子为β，尺度越大，所做的高斯滤波的尺度因子越大。这样就得到了测试图像的多分辨率图像和每个分辨率下的多尺度图像；(2)得到各个分辨率各个尺度的图像后，在每个分辨率图像的各个尺度空间使用相同大小的窗口进行检测，在不同分辨率之间窗口使用不同的窗口进行检测，每个分辨率的窗口大小为(wr,hr)=(w,h)/ah，其中w，h分别是原始分辨率窗口的长和宽，a是固定的常数。检测在同一分辨率下不同的尺度空间可以同时进行，互不影响，不同分辨率之间必须从低到高顺序进行；(3)对于每个分辨率r和尺度s，所有初始检测窗口的状态全部初始化为1，即默认包含物体，使用分类器C(r)以同样窗口大小检测分辨率r的各个尺度空间图像，在尺度空间s上，将检测为0，即不包含物体的窗口区域丢弃，将检测为1即包含物体的窗口区域保留，传递到高一分辨率即r+Ι分辨率同一尺度空间s中去，依次进行，直到检测到最高分辨率R，这个就得到了最高分辨率R中不同尺度空间s包含土体的区域；(4)由于使用这种窗口分类的方法对于物体在尺度和位置的一些小的改变并不敏感，所以分类器会在一个位置附近重复检测多次，为了得到物体最后的位置，需要再原始分辨率下各个尺度空间通过使用Mean-shift聚类的方法来得到物体的最终位置。图2为图像的多尺度表示，图3为多分辨率框架，图4(a)、(b)分别为多分辨率检测效果和数据库(试验使用的是ThePASCALVisualObjectClassesChallenge2006图像数据库)给定标准检测效果的对照，对两幅图的差异用矩形框进行标记。从表1可以看出通过快速鲁棒性特征的分类器在物体多分辨率检测框架下取得了很好的检测效果，能够在包括尽量少的背景空间下完整的检测到待测物体，取得了比较好的检测率。<table>tableseeoriginaldocumentpage6</column></row><table>表1单分辨率物体检测和多分辨率物体检测时间对照表参考文献[1]Bay.H,Tuytelaars.Τ,Goo1.LV.Surf:Speededuprobustfeatures.InTheninthEuropeanConferenceonComputerVision,2006.[2]Agarwal,S.,A.Awan,andD.Roth,Learningtodetectobjectsinimagesviaasparse,part-basedrepresentation.PatternAnalysisandMachinelntelligence,IEEETransactionson,2004.26(11):p.1475—1490.[3]Dalai,N.andB.Triggs.Histogramsoforientedgradientsforhumandetection.inComputerVisionandPatternRecognition,2005.CVPR2005.IEEEComputerSocietyConferenceon.2005.[4]http://www.mis.informatik.tu-darmstadt.de/Research/Projects/categorization/eth80-db.html.[5]http://www.vision,caltech.edu/ImageDatasets/CaltechlOl/[6]http://www.pascal-network,org/challenges/VOC/voc2006/index,html权利要求一种基于多分辨率框架的物体识别检测方法，包括构造多分辨率框架分类器和多分辨率框架下物体检测两部分，步骤如下第一步分别选择所要分类物体的正负样本图像，正样本为所要分类别的物体图像，负样本为非该类物体的任意其他物体图像，设原始图像分辨率为R，构造用于分类器的训练集T(R)，；第二步将训练集T(R)分别作不同采样率σ的采样，得到图像的分辨率分别为r＝1，2，3……R的各个分辨率下的图像训练集合T(r)；第三步按照下列方法得到物体分类器C(r)，最终得到一个包含各个分辨率的层次分类器H(r)，H(r)是由R个单独的分类器C(r)构成从图像训练集合T(r)中，分别提取正样本和负样本中所有图像的SURF特征描述符，正负样本特征描述符分别存储两个集合之中；(b)利用K-means聚类方法，对正负样本集的特征描述符进行聚类分析；(c)将正负样本集合的聚类结合，形成图像特征词典；(d)根据正负样本集合在聚类中的索引，求出每幅图像聚类直方图，并根据正负样本对应相应的标签，将直方图数据和标签进行支持向量机训练，得到分辨率r下的分类器C(r)；第四步将待检测的图像根据多分辨率分类器的构造流程分别提取R个分辨率不同分辨率的图像，然后对不同分辨率的测试图像再依次提取不同尺度s的多尺度图像，s＝1，2，3……S，尺度因子为β；第五步在每个分辨率图像的各个尺度空间使用相同大小的窗口进行检测，在不同分辨率之间窗口使用不同的窗口进行检测，每个分辨率的窗口大小为(wr，hr)＝(w，h)/aR-r，w，h分别是原始分辨率窗口的长和宽，a是固定常数；第六步对于每个分辨率r和尺度s，所有初始检测窗口的状态全部初始化为1，使用分类器C(r)以同样窗口大小检测分辨率r的各个尺度空间图像，在尺度空间s上，将检测为0，即不包含物体的窗口区域丢弃，将检测为1即包含物体的窗口区域保留，传递到r+1分辨率同一尺度空间s中去，依次进行，直到检测到最高分辨率R，得到最高分辨率R中不同尺度空间s包含物体的区域；第七步在原始分辨率下R各个尺度空间通过使用Mean-shift聚类的方法来得到物体的最终位置。2.根据权利要求1所述的基于多分辨率框架的物体识别检测方法，其特征在于，其中的第三步的步骤(b)包括下列步骤利用K-means聚类方法，将正负样本集的特征描述符分另IJ聚成K类，各自形成K个关键字，并且得到每幅图像中特征描述符的聚类索引，即每个特征符存在哪个聚类当中，同时记下每个聚类中心的中心数值。全文摘要本发明属于计算机视觉领域，涉及一种基于多分辨率框架的物体识别检测方法，包括下列步骤将快速鲁棒性特征描述符(SURF)与文本分类中常用的简单模型Bag-of-word(词袋模型)模型和SVM(支持向量机)相结合，构造了基于SURF特征的有监督学习二元物体分类器；在上述分类器的基础上，将基于SURF特征的SVM分类器与图像的多分辨率理论结合，在不同的分辨率空间下进行物体的检测。本发明能够有效解决物体识别和检测中所面临的尺度变化、旋转变化、平移变化、光照变化、视角变化等带来的问题，在多分辨率物体检测框架下，可以有效解决使用滑动窗口方法带来的物体检测时间过长的问题，准确并快速的检测到物体的位置。文档编号G06K9/62GK101807256SQ20101013414公开日2010年8月18日申请日期2010年3月29日优先权日2010年3月29日发明者付磊,张加万,张怡,高中杰申请人:天津大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张加万;付磊;张怡;高中杰
技术所有人：天津大学
我是此专利的发明人

上一篇：设备安装资料设计系统的制作方法
上一篇：移动终端中记录备份的方法和装置、及恢复的方法和装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。