基于类Haar和AdaBoost分类器的快速增量学习方法

文档序号:6474966阅读:320来源:国知局
专利名称:基于类Haar和AdaBoost分类器的快速增量学习方法
技术领域
本发明涉及一种基于类Haar和AdaBoost分类器的快速增量学习方法,属于图像 检测技术领域。
背景技术
在基于机器学习识别方法中,基于类Haar特征与AdaBoost分类器的识别方法由 于其识别性能好、检测速度快、能够满足实时性应用要求在车辆识别、人脸检测等领域获得 了成功应用,但AdaBoost分类器相比较SVM(Support Vector Machines,支持向量机)等分 类器,其训练过程非常耗时,而学习机的识别性能是一个累积提升的过程,增量学习是提高 学习机性能的最直接、最有效的方式,然而,基于类Haar特征与AdaBoost分类器的方法本 身具有计算量大、耗时长,其传统增量学习方法是将上一次学习完毕的学习机对新增加的 训练样本集进行识别,将未正确识别的样本集与上一次学习所用训练样本集混合在一起作 为新的训练样本训练集重新进行学习,使得训练所需时间越来越长,导致学习机不能灵活 的扩展,大大限制了该识别方法的应用前景。

发明内容
本发明的所要解决的技术问题是针对现有基于类Haar特征与AdaBoost分类器的 方法AdaBoost方法增量学习过程中存在的计算量大、耗时长问题,提出一种快速增量学习 方法本发明为实现上述发明目的采用如下技术方案一种基于类Haar和AdaBoost分类器的快速增量学习方法,所述快速增量学习方 法对于未正确识别的新增加的训练样本集,采用原始训练样本集所得到的关键类Haar特 征集为基础,通过增加新的关键类Haar特征来完成学习机的增量学习,具体步骤如下设新增加的未正确识别训练样本集合为Δ,样本集合Δ的样本数量为m,Δ与原 始训练样本集合的并集为Ω,样本并集Ω的样本总数为η,基于原始训练样本集合得到的 关键类Haar特征集为Γ ;样本集合Δ的初始权值为U1 (i) = 1/m,其中i = 1,2,···, m ; 样本并集Ω的初始权值为Vl (i'丨二!/⑴,其中广=1,2,…,n;m、n均为自然数;A、归一化样本并集Ω的权值1^')=力(0/1>々');
/=1B、基于样本集合Δ寻找关键特征
m1)归一化样本集合Δ的权值凡⑴二 Ut(I)IYjUtH),其中t代表迭代次数,t = 1,
/=1
2,…,T,T为自然数;2)在样本集合△上构造弱分类器集合,采用(1)式寻找分类误差最小的弱分类器 Φ i和关键类Haar特征δ,
权利要求
一种基于类Haar和AdaBoost分类器的快速增量学习方法,其特征在于所述快速增量学习方法对于未正确识别的新增加的训练样本集,采用原始训练样本集所得到的关键类Haar特征集为基础,通过增加新的关键类Haar特征来完成学习机的增量学习,具体步骤如下设新增加的未正确识别训练样本集合为Δ,样本集合Δ的样本数量为m,样本集合Δ与原始训练样本集合的并集为Ω,样本并集Ω的样本总数为n,基于原始训练样本集合得到的关键类Haar特征集为Γ;样本集合Δ的初始权值为u1(i)=1/m,其中i=1,2,…,m;样本并集Ω的初始权值为v1(i′)=1/(n),其中i′=1,2,…,n;m、n均为自然数;A、归一化样本并集Ω的权值 <mrow><msub> <mi>v</mi> <mi>t</mi></msub><mrow> <mo>(</mo> <msup><mi>i</mi><mo>&prime;</mo> </msup> <mo>)</mo></mrow><mo>=</mo><msub> <mi>v</mi> <mi>t</mi></msub><mrow> <mo>(</mo> <msup><mi>i</mi><mo>&prime;</mo> </msup> <mo>)</mo></mrow><mo>/</mo><munderover> <mi>&Sigma;</mi> <mrow><mi>t</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msub> <mi>v</mi> <mi>t</mi></msub><mrow> <mo>(</mo> <msup><mi>i</mi><mo>&prime;</mo> </msup> <mo>)</mo></mrow><mo>;</mo> </mrow>B、基于样本集合Δ寻找关键特征1)归一化样本集合Δ的权值其中t代表迭代次数,t=1,2,…,T,T为自然数;2)在样本集合Δ上构造弱分类器集合,采用(1)式寻找分类误差最小的弱分类器φt和关键类Haar特征δ, <mrow><msub> <mi>&epsiv;</mi> <mi>t</mi></msub><mo>=</mo><mfrac> <mn>1</mn> <mn>2</mn></mfrac><munderover> <mi>&Sigma;</mi> <mrow><mi>i</mi><mo>=</mo><mn>1</mn> </mrow> <mi>m</mi></munderover><msub> <mi>u</mi> <mi>t</mi></msub><mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo></mrow><mo>|</mo><msub> <mi>&phi;</mi> <mi>t</mi></msub><mrow> <mo>(</mo> <mi>&delta;</mi> <mrow><mo>(</mo><msub> <mi>x</mi> <mi>i</mi></msub><mo>)</mo> </mrow> <mo>)</mo></mrow><mo>-</mo><msub> <mi>y</mi> <mi>i</mi></msub><mo>|</mo><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo></mrow> </mrow>其中εt代表分类误差,φt(δ(xi))表示对样本xi上的关键特征δ的分类结果,yi代表样本xi的真实类别;C、若关键类Haar特征δ属于采用原始训练样本集所得到的关键类Haar特征集;直接进入下一步骤;否则,则将所述关键类Haar特征δ添加进基于原始训练样本集所得到的关键类Haar特征集Γ,进入下一步骤;D、在所述样本并集Ω和C步骤得到的关键类Haar特征集Γ上,构造弱分类器集合,并采用(2)式寻找误差最小的弱分类器ft和关键类Haar特征η, <mrow><msub> <mi>E</mi> <mi>t</mi></msub><mo>=</mo><mfrac> <mn>1</mn> <mn>2</mn></mfrac><munderover> <mi>&Sigma;</mi> <mrow><mi>t</mi><mo>=</mo><mn>1</mn> </mrow> <mrow><mi>m</mi><mo>+</mo><mi>n</mi> </mrow></munderover><msub> <mi>v</mi> <mi>t</mi></msub><mrow> <mo>(</mo> <msup><mi>i</mi><mo>&prime;</mo> </msup> <mo>)</mo></mrow><mo>|</mo><msub> <mi>f</mi> <mi>t</mi></msub><mrow> <mo>(</mo> <mi>&eta;</mi> <mrow><mo>(</mo><msub> <mi>x</mi> <msup><mi>i</mi><mo>&prime;</mo> </msup></msub><mo>)</mo> </mrow> <mo>)</mo></mrow><mo>-</mo><msub> <mi>y</mi> <msup><mi>i</mi><mo>&prime;</mo> </msup></msub><mo>|</mo><mo>,</mo><mo>-</mo><mo>-</mo><mo>-</mo><mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo></mrow> </mrow>其中Et代表分类误差,ft(η(xi′))表示弱分类器ft对样本xi′上的关键特征η的分类结果;E、在所述样本并集Ω上计算分类权值αt代表分类权值;F、更新样本并集Ω的权值ft(xi′)表示弱分类器ft对样本xi′的分类结果,e为自然对数底且e为常数;G、更新样本集合Δ的权值ut(i)=exp( yiψt(xi)),其中ψt(xi)=pt(θt δ(xi)),pt∈{ 1,+1}表示分类方向,θt为弱分类器在类Haar特征δ上的分类阈值,δ(xi)表示样本xi上的关键类Haar特征;H、如果在样本并集Ω上由弱分类器组成的强分类器F(x)=sign(∑αtft(x))对样本并集Ω的识别效果达到期望值,则输出分类器以及所选取的关键类Haar特征集;否则,返回A步骤。FSA00000268539300012.tif,FSA00000268539300022.tif,FSA00000268539300023.tif
2.根据权利要求1所述的基于类Haar和AdaBoost分类器的快速增量学习方法,其特 征在于步骤B的第1)步中T值为600。
3.根据权利要求1所述的基于类Haar和AdaBoost分类器的快速增量学习方法,其特 征在于所述步骤H中所述的期望值定义为99%。
全文摘要
本发明提供一种基于类Haar和AdaBoost分类器的快速增量学习方法,属于图像检测技术领域。本发明对于新增加的未正确识别的训练样本集,在不损失已有学习效果的前提下,增加一些关键的类Haar特征信息,而不是重新寻找关键类Haar特征信息,以提高训练的速度。本发明利用所提出的增量学习方法较好地解决了快速提升基于类Haar特征和AdaBoost分类器方法的识别性能问题,将其应用于车辆图像检测实验,与传统增量学习方法相比,在两者提升识别性能相近的情形下,明显减少了学习机的学习时间。
文档编号G06K9/62GK101937510SQ201010280839
公开日2011年1月5日 申请日期2010年9月14日 优先权日2010年9月14日
发明者文学志, 方巍, 郑钰辉 申请人:南京信息工程大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1