一种视觉目标检测与识别方法

文档序号：9929805阅读：651来源：国知局

一种视觉目标检测与识别方法
【技术领域】
[0001] 本发明属于视觉目标检测与识别领域，具体设及一种视觉目标检测与识别方法。
【背景技术】
[0002] 目标检测是把感兴趣的目标(如标志、车辆、行人等)从图像或者视频帖的背景中检测出来并精确定位的过程，通常是利用目标的特征和位置区域来实现目标检测。由于图像背景复杂、目标与背景相互交错、各种仿射变换W及光照不均等条件的限制，到目前为止要取得理想的目标检测结果仍是一个难题。
[0003] 近年来，经过研究人员的不断努力，在某些约束环境下已经提出了一些有效的目标检测方法。传统的目标检测方法包括背景差法、帖差法、光流法和基于模板的检测方法等。然而，由于目标形状和外貌千差万别，使得运用常规的基于图像处理的目标检测方法往往不能达到较好的检测效果。为此，研究人员提出了基于统计学习的目标检测方法，如 Viola等人在文献"Robust Real-Time Object Detection"中提出了一种快速的人脸检测算法，采用化ar特征描述待检测区域的信息，并结合级联分类器和滑动窗定位对待检测区域是否包含目标进行判别，得益于积分图像和级联分类器的加速作用，该算法可W实现人脸目标的实时检测，且具有较高的检测率。Dalal等人在文献巧istograms of Oriented Gradients for Human Detection"中提出了利用册G特征和SVM分类器的行人检测算法，该方法分为训练和预测两个阶段:在训练阶段，对训练样本提取册G特征，并利用SVM分类器训练得到一个行人分类器;在预测阶段，利用滑动窗口对图像进行扫描，利用训练得到的分类器对候选窗口进行判别，最后在尺度空间融合检测结果，得到最终的行人区域。另外， Felzenszwalb等人在文南犬('A Discriminatively Trained,Multiscale ,Deformable Part Model"中提出了利用可变形部件模型进行目标检测的方法，首先通过册G特征模板来刻画目标整体及其每一个可变形部件，然后对运些部件进行匹配，在较大分辨率尺度下使用根滤波器匹配整个目标，在较细分辨率尺度下使用部件滤波器匹配目标的局部组成区域，最后将不同分辨率尺度下的匹配结果相结合，在目标检测过程中，每个检测窗口的得分等于所有部件的匹配得分减去模型变化的代价。该方法在训练模型时需要训练得到每一个可变形部件的HOG模型，W及衡量部件位置分布的代价参数。运些基于统计学习的目标检测方法在一些公开的数据集上取得了很好的结果，然而，在实际应用中，使用单一方法往往并不能得到比较理想的检测结果，主要原因在于一方面，实际应用中所要处理的图像或者视频帖往往比数据集要复杂，单一视觉特征或模型无法很好适用于运些复杂情况，为了提高检测的准确性，往往需要同时使用多种视觉特征和目标模型；另一方面，运些方法的计算复杂度一般都比较高，如果不加改动直接使用的话时间代价太大，所W通常会根据实际应用场景结合多种方法，取长补短，在检测效果和检测速度上取得平衡。
[0004] 综上所述，现有的目标检测技术的不足之处主要在于：常规的基于图像处理的目标检测方法无法适用于形状复杂和外貌差别很大的目标;而基于统计学习的目标检测方法由于鲁棒性和复杂度的原因，需要根据实际应用场景做出相应调整和优化。

【发明内容】

[0005] 针对现有技术的不足，本发明提出了一种视觉目标检测与识别方法，该技术首先结合多种视觉特征和级联分类器从图像中获取目标的候选区域，快速过滤掉大部分非目标的图像区域，然后利用强视觉特征和强分类器对候选区域进行二次判别验证，进一步去除较难分辨的非目标区域，获得最终更准确的检测结果。
[0006] 本发明所提出的一种视觉目标检测与识别方法，包括W下步骤：
[0007] (1)对于待检测的每种目标，准备一定数量的正样本，同时准备不少于正样本数量的负样本，所述正样本和负样本一起构成了训练样本；
[000引（2)对所述训练样本提取多种基本视觉特征，然后基于运些特征训练一个级联分类器，作为目标的初步检测模型；
[0009] (3)对所述训练样本提取强视觉特征，并基于此特征训练一个强分类器，作为目标的二次判别验证模型；
[0010] (4)在检测阶段，利用滑动窗策略对待检测图像进行扫描，对每个扫描窗口利用步骤(2)中所述的目标初步检测模型进行检测，获得目标的候选区域；
[0011] (5)利用步骤(3)中所述的二次判别验证模型对步骤(4)中所述目标的候选区域进行二次判别验证，进一步去除较难分辨的非目标区域，获得最终的目标检测结果。
[0012] 进一步，上述一种基于多特征级联分类器和二次判别验证的目标检测方法，所述步骤(1)中准备的正样本数量一般不少于300个，负样本数量一般为正样本数量的2-5倍，另外需要从样本中截取出目标区域，并将目标区域缩放到统一大小。
[0013] 进一步，上述一种基于多特征级联分类器和二次判别验证的目标检测方法，所述步骤(2)中目标初步检测模型训练，提取的基本视觉特征包括颜色、梯度幅值和梯度方向直方图等，将运些特征作为输入，并利用Adaboost算法训练级联分类器。
[0014] 进一步，上述一种视觉目标检测与识别方法，所述步骤(3)中目标二次判别模型训练，提取的强视觉特征包括SIFT (Sca Ie-In variant Feature Trans form)特征、SURF (Speeded Up Robust FeaUires)特征等，对特征进行聚类量化，并统一特征维度，利用量化后的特征作为输入训练强分类器。
[0015] 进一步，上述一种视觉目标检测与识别方法，所述步骤(4)中利用滑动窗策略从检测图像中得到多个检测窗口，并采用所述的级联分类器对每个窗口进行预测，保留那些预测得分超过阔值的窗口作为目标候选区域，在滑动过程中对窗口进行一定范围的尺度缩放，W适应尺度变化。
[0016] 进一步，上述一种视觉目标检测与识别方法，所述步骤(5)中二次判别验证过程，对上述目标候选区域采用所述的强分类器（比如SVM分类器)进行进一步预测，去掉那些预测得分小于预先设定阔值的候选区域，将留下的区域作为最终的检测结果。
[0017] 本发明的有益效果在于：与现有方法相比，本发明能够更好地兼顾检测速度与检测准确率，并且对实际应用环境下的图像和视频数据具有较好的鲁棒性。本发明之所W具有上述效果，其原因在于:本发明在获得候选区域阶段利用了多种视觉特征，增强了对复杂目标的鲁棒性;然后利用级联分类器快速过滤掉大部分非目标区域，保证了检测速度，也为后续基于强特征和强分类器的二次判别验证奠定了基础;最后，利用描述能力更强的局部特征和分类性能更好的强分类器对候选区域进行二次判别验证，进一步去除较难分辨的非目标区域，有效提高了检测的准确性。
【附图说明】
[0018] 图1是本发明的技术流程图。
[0019] 图2是获取候选窗示意图。
【具体实施方式】
[0020] 下面结合附图和具体实施例对本发明作进一步详细的描述。
[0021] 本发明是一种视觉目标检测与识别方法，其整体流程如图1所示，具体包含W下步骤：
[0022] (1)对于待检测的目标类别，准备训练正样本和负样本，并提取多种视觉特征。
[0023] 对于待检测的每种目标，准备一定数量的正样本(一般数目不少于300)，和一定数量的负样本(数量不少于正样本，一般为正样本的2~5倍），并从正样本中截取出目标区域，将它们缩放到统一大小W方便后续特征提取。
[0024] 接着对训练样本提取多种视觉特征，本实施例中，提取的视觉特征包括颜色化SV)、梯度幅值和梯度方向直方图化0G)S种，并将运S种特征拼接起来得到鲁棒性更好的组合特征。
[0025] (2)利用组合特征训练一个级联分类器，作为目标的初步检测模型。
[0026] 本实施例中采用Adaboost算法实现基于组合特征的级联分类器训练，训练过程为迭代循环优化方式。具体地，首先在给定的样本空间S上初始化一个分布Dinit,然后采用循环迭代的方式不断优化:算法执行T轮选择，其中T为预先设定的最大循环迭代次数，在每次循环t中，选择一个分类误差et = err化t，S，Dt)最小的弱分类器，并根据此误差计算相应的权1

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：彭宇新;唐攀攀;
技术所有人：北京大学;
我是此专利的发明人

上一篇：一种针对多姿态人脸的人脸检测系统及方法
上一篇：一种自动驾驶中基于双目摄像头的道路安全检测系统及其方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。