一种视觉目标检测与识别方法

文档序号:9929805阅读:651来源:国知局
一种视觉目标检测与识别方法
【技术领域】
[0001] 本发明属于视觉目标检测与识别领域,具体设及一种视觉目标检测与识别方法。
【背景技术】
[0002] 目标检测是把感兴趣的目标(如标志、车辆、行人等)从图像或者视频帖的背景中 检测出来并精确定位的过程,通常是利用目标的特征和位置区域来实现目标检测。由于图 像背景复杂、目标与背景相互交错、各种仿射变换W及光照不均等条件的限制,到目前为止 要取得理想的目标检测结果仍是一个难题。
[0003] 近年来,经过研究人员的不断努力,在某些约束环境下已经提出了一些有效的目 标检测方法。传统的目标检测方法包括背景差法、帖差法、光流法和基于模板的检测方法 等。然而,由于目标形状和外貌千差万别,使得运用常规的基于图像处理的目标检测方法往 往不能达到较好的检测效果。为此,研究人员提出了基于统计学习的目标检测方法,如 Viola等人在文献"Robust Real-Time Object Detection"中提出了一种快速的人脸检测 算法,采用化ar特征描述待检测区域的信息,并结合级联分类器和滑动窗定位对待检测区 域是否包含目标进行判别,得益于积分图像和级联分类器的加速作用,该算法可W实现人 脸目标的实时检测,且具有较高的检测率。Dalal等人在文献巧istograms of Oriented Gradients for Human Detection"中提出了利用册G特征和SVM分类器的行人检测算法,该 方法分为训练和预测两个阶段:在训练阶段,对训练样本提取册G特征,并利用SVM分类器训 练得到一个行人分类器;在预测阶段,利用滑动窗口对图像进行扫描,利用训练得到的分类 器对候选窗口进行判别,最后在尺度空间融合检测结果,得到最终的行人区域。另外, Felzenszwalb等人在文南犬('A Discriminatively Trained,Multiscale ,Deformable Part Model"中提出了利用可变形部件模型进行目标检测的方法,首先通过册G特征模板来刻画 目标整体及其每一个可变形部件,然后对运些部件进行匹配,在较大分辨率尺度下使用根 滤波器匹配整个目标,在较细分辨率尺度下使用部件滤波器匹配目标的局部组成区域,最 后将不同分辨率尺度下的匹配结果相结合,在目标检测过程中,每个检测窗口的得分等于 所有部件的匹配得分减去模型变化的代价。该方法在训练模型时需要训练得到每一个可变 形部件的HOG模型,W及衡量部件位置分布的代价参数。运些基于统计学习的目标检测方法 在一些公开的数据集上取得了很好的结果,然而,在实际应用中,使用单一方法往往并不能 得到比较理想的检测结果,主要原因在于一方面,实际应用中所要处理的图像或者视频帖 往往比数据集要复杂,单一视觉特征或模型无法很好适用于运些复杂情况,为了提高检测 的准确性,往往需要同时使用多种视觉特征和目标模型;另一方面,运些方法的计算复杂度 一般都比较高,如果不加改动直接使用的话时间代价太大,所W通常会根据实际应用场景 结合多种方法,取长补短,在检测效果和检测速度上取得平衡。
[0004] 综上所述,现有的目标检测技术的不足之处主要在于:常规的基于图像处理的目 标检测方法无法适用于形状复杂和外貌差别很大的目标;而基于统计学习的目标检测方法 由于鲁棒性和复杂度的原因,需要根据实际应用场景做出相应调整和优化。

【发明内容】

[0005] 针对现有技术的不足,本发明提出了一种视觉目标检测与识别方法,该技术首先 结合多种视觉特征和级联分类器从图像中获取目标的候选区域,快速过滤掉大部分非目标 的图像区域,然后利用强视觉特征和强分类器对候选区域进行二次判别验证,进一步去除 较难分辨的非目标区域,获得最终更准确的检测结果。
[0006] 本发明所提出的一种视觉目标检测与识别方法,包括W下步骤:
[0007] (1)对于待检测的每种目标,准备一定数量的正样本,同时准备不少于正样本数量 的负样本,所述正样本和负样本一起构成了训练样本;
[000引(2)对所述训练样本提取多种基本视觉特征,然后基于运些特征训练一个级联分 类器,作为目标的初步检测模型;
[0009] (3)对所述训练样本提取强视觉特征,并基于此特征训练一个强分类器,作为目标 的二次判别验证模型;
[0010] (4)在检测阶段,利用滑动窗策略对待检测图像进行扫描,对每个扫描窗口利用步 骤(2)中所述的目标初步检测模型进行检测,获得目标的候选区域;
[0011] (5)利用步骤(3)中所述的二次判别验证模型对步骤(4)中所述目标的候选区域进 行二次判别验证,进一步去除较难分辨的非目标区域,获得最终的目标检测结果。
[0012] 进一步,上述一种基于多特征级联分类器和二次判别验证的目标检测方法,所述 步骤(1)中准备的正样本数量一般不少于300个,负样本数量一般为正样本数量的2-5倍,另 外需要从样本中截取出目标区域,并将目标区域缩放到统一大小。
[0013] 进一步,上述一种基于多特征级联分类器和二次判别验证的目标检测方法,所述 步骤(2)中目标初步检测模型训练,提取的基本视觉特征包括颜色、梯度幅值和梯度方向直 方图等,将运些特征作为输入,并利用Adaboost算法训练级联分类器。
[0014] 进一步,上述一种视觉目标检测与识别方法,所述步骤(3)中目标二次判别模型训 练,提取的强视觉特征包括SIFT (Sca Ie-In variant Feature Trans form)特征、SURF (Speeded Up Robust FeaUires)特征等,对特征进行聚类量化,并统一特征维度,利用量化 后的特征作为输入训练强分类器。
[0015] 进一步,上述一种视觉目标检测与识别方法,所述步骤(4)中利用滑动窗策略从检 测图像中得到多个检测窗口,并采用所述的级联分类器对每个窗口进行预测,保留那些预 测得分超过阔值的窗口作为目标候选区域,在滑动过程中对窗口进行一定范围的尺度缩 放,W适应尺度变化。
[0016] 进一步,上述一种视觉目标检测与识别方法,所述步骤(5)中二次判别验证过程, 对上述目标候选区域采用所述的强分类器(比如SVM分类器)进行进一步预测,去掉那些预 测得分小于预先设定阔值的候选区域,将留下的区域作为最终的检测结果。
[0017] 本发明的有益效果在于:与现有方法相比,本发明能够更好地兼顾检测速度与检 测准确率,并且对实际应用环境下的图像和视频数据具有较好的鲁棒性。本发明之所W具 有上述效果,其原因在于:本发明在获得候选区域阶段利用了多种视觉特征,增强了对复杂 目标的鲁棒性;然后利用级联分类器快速过滤掉大部分非目标区域,保证了检测速度,也为 后续基于强特征和强分类器的二次判别验证奠定了基础;最后,利用描述能力更强的局部 特征和分类性能更好的强分类器对候选区域进行二次判别验证,进一步去除较难分辨的非 目标区域,有效提高了检测的准确性。
【附图说明】
[0018] 图1是本发明的技术流程图。
[0019] 图2是获取候选窗示意图。
【具体实施方式】
[0020] 下面结合附图和具体实施例对本发明作进一步详细的描述。
[0021] 本发明是一种视觉目标检测与识别方法,其整体流程如图1所示,具体包含W下步 骤:
[0022] (1)对于待检测的目标类别,准备训练正样本和负样本,并提取多种视觉特征。
[0023] 对于待检测的每种目标,准备一定数量的正样本(一般数目不少于300),和一定数 量的负样本(数量不少于正样本,一般为正样本的2~5倍),并从正样本中截取出目标区域, 将它们缩放到统一大小W方便后续特征提取。
[0024] 接着对训练样本提取多种视觉特征,本实施例中,提取的视觉特征包括颜色 化SV)、梯度幅值和梯度方向直方图化0G)S种,并将运S种特征拼接起来得到鲁棒性更好 的组合特征。
[0025] (2)利用组合特征训练一个级联分类器,作为目标的初步检测模型。
[0026] 本实施例中采用Adaboost算法实现基于组合特征的级联分类器训练,训练过程为 迭代循环优化方式。具体地,首先在给定的样本空间S上初始化一个分布Dinit,然后采用循 环迭代的方式不断优化:算法执行T轮选择,其中T为预先设定的最大循环迭代次数,在每次 循环t中,选择一个分类误差et = err化t,S,Dt)最小的弱分类器,并根据此误差计算相应的 权1
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1