一种基于AdaBoost分类器的行人检测模型训练方法

文档序号:6538846阅读:865来源:国知局
一种基于AdaBoost分类器的行人检测模型训练方法
【专利摘要】本发明公开了一种基于AdaBoost训练器的行人检测模型训练方法,首先在AdaBoost训练过程中实时统计样本权重值的和,当其退化到一定程度时,则用当前已经训练好的弱分类器组去扫描非行人图像中的误检窗口,并作为困难样本添加到负样本训练集中,然后减小退化程度阈值,以降低样本更新频率,最后通过随机抽样剔除部分负样本,减少负样本训练集数量,以减少训练过程计算量。该方法能在不改变特征提取方法的前提下,最大限度的提升分类器的训练效果,提升最终检测精度。
【专利说明】—种基于AdaBoost分类器的行人检测模型训练方法
【技术领域】:
[0001]本发明主要涉及到基于静态图像的行人检测领域,特指一种基于AdaBoost分类器的行人检测模型训练方法。
【背景技术】:
[0002]交通事故是和平时期造成人员伤亡和财产损失的重要原因,其中,有行人参与的交通事故约占交通事故总量的14%,行人在道路交通中的安全问题倍受全社会广泛关注,研究人员开始致力于车辆辅助驾驶技术来降低行人在道路交通中的事故率,行人检测技术在其中显得尤为重要。由于行人兼具刚性和柔性物体的特性,外观易受穿着、尺度、遮挡、姿态和视角等影响[4],使得行人检测成为计算机视觉的研究难点与热点。
[0003]近些年来,机器学习的方法被引入到行人检测的研究中来,检测准确率得到了提升,目前行人检测的研究主要集中于特征提取和分类器的选择。Pepageorgios等人第一次提出了滑窗的方法用于检测,他们采用了 SVM和多尺度Haar小波过完备基结合的方式进行检测,Viola和Jones等人基于这种思路,引入了积分图思想和AdaBoost快速分类器(VJ)。上述两种思路构成了如今行人检测算子的基石。而后Dalal等人基于行人整体轮廓特征,提出方向梯度直方图特征(HOG),HOG特征结合SVM分类器,检测准确率取得了革命性的进步。Dollar等人融合Viola和Dalal的思想,提出积分通道特征(ChnFtr),结合AdaBoost分类器,提升了检测速度和检测准确度。
[0004]AdaBoost,是英文“Adaptive Boosting”(自适应增强)的缩写,是一种机器学习方法,由Yoav Freund和Robert Schapire提出[1]。AdaBoost方法是一种迭代算法,在每一轮中加入一个新的弱分类器,直到达到某个预定的足够小的错误率或者达到预定的弱分类器数。AdaBoost方法的自适应在于:前一个分类器分错的样本会被用来训练下一个分类器。AdaBoost方法对于噪声数据和异常数据很敏感。但在一些问题中,相比于大多数学习算法,AdaBoost方法相对于大多数其它学习算法而言,不会很容易出现过拟合现象。AdaBoost方法中使用的分类器可能很弱(比如出现很大错误率),但只要它的分类效果比随机好一点(比如两类问题分类错误率略小于0.5),就能够改善最终得到的模型。而错误率高于随机分类器的弱分类器也是有用的,因为在最终得到的多个分类器的线性组合中,可以给它们赋予负系数,同样也能提升分类效果。
[0005]无论基于何种方法,都需要大量样本训练出一个准确率高的分类器用于检测。为了更好的对比不同算法的效果,研究者们提出了一系列标准数据集用于行人检测算法的研究,常用的有MIT数据集、INRIA数据集、ETH数据集和Caltech数据集,这些数据集都由两部分样本集组成,分别用于训练和测试,每部分数据集都包含行人图像集合和非行人图像集合,即为正样本图像和负样本图像。其中MIT和INRIA由静态图像构成,ETH和Caltech由视频帧序列组成。在获取训练集过程中,正样本需要根据注释文件,从正样本图像中提取固定分辨率的行人图像,一般全部用于分类器的训练,负样本可以从负样本图像帧框图获得海量的非行人图像,研究者可以根据自己实际需求进行裁剪和筛选,所获取的正负样本训练集的图像分辨率均为64*128。近些年来,在行人检测领域的研究中,研究者们大多只关注特征设计和分类器选择,而忽视了训练样本信息的合理利用,不能充分挖掘出所使用方法的效果。对于海量的负样本信息,如何对其进行充分合理的裁剪和筛选,对降低分类器的误检率、提升分类器训练效率起着至关重要的作用。

【发明内容】
:
[0006]本发明要解决的技术问题在于:目前大部分行人检测方法主要关注于特征和分类器的选择以及优化上,而忽视了训练过程中对海量负样本的合理应用,本发明旨在提供一种基于AdaBoost分类器的行人检测模型训练方法,结合AdaBoost弱分类器训练过程,根据样本训练集权值的退化程度,对负样本训练集进行合理的动态调整,保持负样本训练集的多样性,提升弱分类器的训练效率,能有效提升最终分类模型的准确度,优化训练过程的效率,减少训练时间。
[0007]为了解决上述技术问题,本发明提出的技术方案是:一种基于AdaBoost分类器的行人检测模型训练方法,其特征在于:首先通过已知的标准行人数据集确定初始正负样本训练集及正负样本的权重,然后在AdaBoost训练过程中实时统计训练集中样本权重值的和,当训练集发生明显的权重退化时,用当前已经训练好的弱分类器组去滑窗扫描检测原始数据集中的非行人图像,并将误检窗口图像作为困难样本添加到负样本训练集中,然后通过随机抽样剔除部分负样本;最后减小退化程度阈值,降低训练集更新频率,继续AdaBoost训练过程,直至最终得到行人检测模型。
[0008]上述基于AdaBoost分类器的行人检测模型训练方法的具体实现步骤是:
[0009]1)确定初始正负样本训练集:
[0010]首先,选择一个行人检测标准数据集,其中包括包含行人的正样本图像和不包含行人的负样本图像。根据数据集的注释文件,从正样本图像中框图获取64*128的行人图像并进行镜面处理后提取图像积分通道特征,构成了正样本训练集
【权利要求】
1.一种基于AdaBoost分类器的行人检测模型训练方法,其特征在于:首先通过已知的标准行人数据集确定初始正负样本训练集及正负样本的权重,然后在AdaBoost训练过程中实时统计训练集中样本权重值的和,当训练集发生明显的权重退化时,用当前已经训练好的弱分类器组去滑窗扫描检测原始数据集中的非行人图像,并将误检窗口图像作为困难样本添加到负样本训练集中,然后通过随机抽样剔除部分负样本;最后减小退化程度阈值,降低训练集更新频率,继续AdaBoost训练过程,直至最终得到行人检测模型。
2.根据权利要求1所述基于AdaBoost分类器的行人检测模型训练方法,其特征在于,具体包括如下步骤: 1)确定初始正负样本训练集: 首先,选择一个行人检测标准数据集,其中包括包含行人的正样本图像和不包含行人的负样本图像;根据所述数据集的注释文件,从正样本图像中框图获取64*128的行人图像并进行镜面处理后提取图像积分通道特征,构成了正样本训练集5+={(Χι,+ 1),...,(χ ν,+丨)卜其中Ν=2416,负样本图像中框图获取无数64*128的非行人图像,并将其看作海量负样本原始数据H ^ ={(x, -1),...,Ux ,-1)},(Λ;.4+00),再通过在每幅负样本图像上随机框取固定数量的非行人图像,从S_中获取初始负样本训练集S = U-V- 1K',一Oi,其中N_=20,000 ;因此,初始训练集为S = S+ US0 =I(X15J1)5-..,(Xiv,^)) Ν=Ν++Ν-; 2)初始化正负样本训练集的权重为:
【文档编号】G06K9/66GK103902968SQ201410066461
【公开日】2014年7月2日 申请日期:2014年2月26日 优先权日:2014年2月26日
【发明者】熊志辉, 张茂军, 王炜, 徐玮, 赖世铭, 高晨旭 申请人:中国人民解放军国防科学技术大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1