一种级联分类器训练方法及装置与流程

文档序号:16311417发布日期:2018-12-19 05:17阅读:251来源:国知局
一种级联分类器训练方法及装置与流程

本发明涉及图像处理领域,尤其涉及一种级联分类器训练方法及装置。

背景技术

目前,主要采用级联分类器进行图像内容识别。级联分类器是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的分类器即强分类器;训练出多个强分类器组合起来,就构成了级联分类器。只有图像特征符合级联分类器的每一级弱分类器的要求,才被认为包含目标内容。

使用级联分类器的工作包含两个阶段:训练和检测。训练过程分为3个步骤:首先需要提取训练样本某一特征,例如局部二值模式(localbinarypattern,lbp)特征、方向梯度直方图(histogramoforientedgradient,hog)特征、哈尔(haar)特征;然后将该特征转化成对应的弱分类器;最后从大量的弱分类器中迭代选择出最优弱分类器,最后我们将训练的结果都写入到xml文件中得到我们的训练模型。

训练弱分类器的图片大小是固定的。现有技术在前期准备训练样本的时候,将正样本样本归一化到指定的大小,负样本则不需要归一化到指定大小,在实际训练代码中在负样本原图的基础上从左上角开始按照一定的步长截取指定大小的感兴趣区域(regionofinterest,roi)图像作为正式训练的负样本使用,之后再适当缩放继续截取,直到不能再缩放后换下一张,直至得到所需数量的图片,最终开始正式进入训练。

以上训练方法,采用不断缩放和挪动步长截取同一张负样本的图片,导致计算量很大,训练速度低;同时负样本多样性不够,训练出的分类器误检较多。尽管有一些改进的方法,例如:同一负样本仅截取一张图片,并且在训练过程中不断实时测试已训练好的部分弱分类器,将误检的图片用于下一弱分类器的训练,即降低负样本的数量,同时提升负样本的针对性,取得了一定的效果。然而这种改进方法训练出的分类器,还是有较大概率的误检。



技术实现要素:

本发明实施例提供了一种级联分类器训练方法及装置,用以解决目前方法训练出的级联分类器误检概率较高的问题。

本发明实施例提供的具体方案如下:

第一方面,一种级联分类器训练方法,包括:

依次为每一级强分类器选取样本进行训练,对于第一级强分类器之后的任一级强分类器,在进行负样本训练时,判断选取的负样本的尺寸是否小于预设尺寸,如果是,将所选负样本缩放为级联分类器的检测窗口大小的图片;否则,从所选负样本中截取检测窗口大小的图片;

将处理负样本得到的图片输入所述任一级强分类器之前已训练的强分类器进行检测,选取被误检的图片;

根据所述被误检的图片对所述任一级强分类器进行负样本训练。

结合第一方面,在第一种可能的实现方式中,该方法还包括:

确定尺寸大于所述预设尺寸并且误检次数达到预设第一阈值的特定负样本;

缩放所述特定负样本至所述预设尺寸。

结合第一方面,在第二种可能的实现方式中,该方法还包括:

统计被误检的图片的数量;其中,根据所述被误检的图片对所述任一级强分类器进行负样本训练的触发条件,是确定所述被误检的图片的数量达到预设第二阈值。

结合第一方面,在第三种可能的实现方式中,该方法还包括:

对于第一级强分类器之后的任一级强分类器,在进行正样本训练时,将选取的正样本输入所述任一级强分类器之前已训练的强分类器进行检测,选取被正确识别的正样本;

根据所述被正确识别的正样本对所述任一级强分类器进行正样本训练。

结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,该方法还包括:

统计被正确识别的正样本的数量;其中,根据所述被正确识别的正样本对所述任一级强分类器进行正样本训练的触发条件,是确定所述被正确识别的正样本的数量达到预设第三阈值。

第二方面,一种级联分类器训练装置用于依次为每一级强分类器选取样本进行训练,对于第一级强分类器之后的任一级强分类器,在进行负样本训练时,具体包括:

负样本处理单元,用于判断选取的负样本的尺寸是否小于预设尺寸,如果是,将所选负样本缩放为级联分类器的检测窗口大小的图片;否则,从所选负样本中截取检测窗口大小的图片;

负样本选取单元,用于将处理负样本得到的图片输入所述任一级强分类器之前已训练的强分类器进行检测,选取被误检的图片;

负样本训练单元,用于根据所述被误检的图片对所述任一级强分类器进行负样本训练。

结合第二方面,在第一种可能的实现方式中,该装置还包括:

特定负样本处理单元,用于确定尺寸大于所述预设尺寸并且误检次数达到预设第一阈值的特定负样本;缩放所述特定负样本至所述预设尺寸。

结合第二方面,在第二种可能的实现方式中,该装置还包括:

负样本统计单元,用于统计被误检的图片的数量,当所述被误检的图片的数量达到预设第二阈值时,触发所述负样本训练单元。

结合第二方面,在第三种可能的实现方式中,在用于对于第一级强分类器之后的任一级强分类器,进行正样本训练时,具体包括:

正样本选取单元,用于将选取的正样本输入所述任一级强分类器之前已训练的强分类器进行检测,选取被正确识别的正样本;

正样本训练单元,用于根据所述被正确识别的正样本对所述任一级强分类器进行正样本训练。

结合第二方面的第三种可能的实现方式,在第四种可能的实现方式中,还包括:

正样本统计单元,用于统计被正确识别的正样本的数量,当确定所述被正确识别的正样本的数量达到预设第三阈值时,触发所述正样本训练单元。

本发明实施例中,判断选取的负样本的尺寸是否小于预设尺寸,如果是,将所选负样本缩放为级联分类器的检测窗口大小的图片,否则,从所选负样本中截取检测窗口大小的图片,将处理负样本得到的图片输入所述任一级强分类器之前已训练的强分类器进行检测,选取被误检的图片,根据所述被误检的图片对所述任一级强分类器进行负样本训练;本发明实施例采用被已训练的强分类器误检的样本进行训练,并且,将小于预设尺寸的负样本进行缩放处理,提升了负样本训练的针对性,同时,对于大于预设尺寸的负样本不作缩放,避免针对性过强导致正样本检测效果降低,最终使得级联分类器的负样本训练达到了更好的效果,误检率更低。

附图说明

图1是本发明实施例提供的一种级联分类器训练方法的流程示意图;

图2是本发明实施例提供的一种级联分类器训练方法的又一流程示意图;

图3是本发明具体实施例提供的流程示意图;

图4是本发明实施例提供的一种级联分类器训练装置的结构示意图。

具体实施方式

本发明实施例提供了一种级联分类器训练方法及装置,用以降低级联分类器的误检率。

本发明实施例,依次为每一级强分类器选取样本进行训练,对于第一级强分类器之后的任一级强分类器,在进行负样本训练时,如图1所示,包括:

s101、判断选取的负样本的尺寸是否小于预设尺寸,如果是,将所选负样本缩放为级联分类器的检测窗口大小的图片;否则,从所选负样本中截取检测窗口大小的图片。

例如:检测窗口大小为10*10,预设尺寸设定为15*15,如果所选负样本尺寸为20*15,显然,所选负样本尺寸大于预设尺寸,从中随机截取10*10大小的图片;如果所选负样本尺寸为15*10,显然,所选负样本尺寸小于预设尺寸,则直接将所选负样本缩放至10*10。

本发明实施例,定义长、宽分别小于预设尺寸对应长、宽的负样本为尺寸小于预设尺寸的负样本,其它情况定义为大于预设尺寸的负样本;或者,定义长、宽分别大于预设尺寸对应长、宽的负样本为尺寸大于预设尺寸的负样本,其它情况定义为小于预设尺寸的负样本。

s102、将处理负样本得到的图片输入所述任一级强分类器之前已训练的强分类器进行检测,选取被误检的图片。

由于仅选取被误检的图片开展下一步的训练,能够提高步骤s103负样本训练的针对性。

对于部分尺寸较大的图片,由于并未缩放,针对性较低,训练结果并不一定达到预期。如果数次分类器检测均为误检,例如,在训练好的第二级、第三级、第四级分类器中始终被误检的话,则需进一步提高该负样本的针对性,即进行缩放处理,具体包括:确定尺寸大于所述预设尺寸并且误检次数达到预设第一阈值的特定负样本;缩放所述特定负样本至所述预设尺寸。缩放后的样本再用于步骤s103的负样本训练,可以解决此类难以去除的误检问题。

较佳地,步骤s102还统计被误检的图片的数量,所述被误检的图片的数量达到预设第二阈值时,触发步骤s103进行负样本训练。也就是说,被误检的图片应累积到一定个数,以保障负样本的多样性。

s103、根据所述被误检的图片对所述任一级强分类器进行负样本训练。

由于输入强分类器进行训练的图片具有很好的针对性和多样性,因此用较少的时间训练出了更为准确的分类器。

本发明实施例,还提供了对正样本进行训练的方法,对于第一级强分类器之后的任一级强分类器,在进行正样本训练时,如图2所示,具体包括:

s201、将选取的正样本输入所述任一级强分类器之前已训练的强分类器进行检测,选取被正确识别的正样本。

s202、根据所述被正确识别的正样本对所述任一级强分类器进行正样本训练。

较佳地,步骤s201还统计被正确识别的正样本的数量,所述被正确识别的正样本的数量达到预设第三阈值时,触发步骤s202进行正样本训练。

以上说明,仅针对第一级强分类器之后的任一级强分类器,对于第一级强分类器,可将样本进行处理得到图片后直接用于训练,不需要输入已训练的强分类器。

下面给出本发明的具体实施例。

参见图3,本发明具体实施例包括如下步骤:

s301、准备首次训练样本。

对于正样本,尽量采用一致性较强的、角度变化少的、多样性不宜过大的正样本,以免影响正样本的原有统一特性。因为正样本后面要固定到统一大小,所以前期准备样本时尽量保证宽高比和所需一致,且尺寸较所需的大,以降低变形和失真带来的影响。正样本采用随机从样本库中随机挑选的方式,直至挑选至足够地数目。

对于负样本,为了配合后期使用的实际场景需求,应选取一些尽量和正样本比较可能出现的场景类似的图片作为负样本,且这个图片的大小要大于训练窗口的大小,并且符合正样本在背景中的比例。在选取负样本时,对负样本的大小做判断,例如低于w0*h0的我们直接缩放至w*h用作训练的负样本,否则就采用随机截取w*h窗口大小的图片用作训练的负样本,当w*h窗口大小的图片积累到足够的数目之后开始正式进入训练。

s302、第一级强分类器训练。

每一级强分类器的样本集是固定的,变化的是每个样本的权重;权重的更新是在每个弱分类器训练完之后,训练下一个弱分类器之前。当达到终止条件:达到最小虚警率或最大弱分类器的数目时,一级强分类器训练完成;其中,适当降低最小虚警率也能有效地降低误检率。

s303、准备下一级强分类器训练样本。

每一级强分类器训练之前都有一个样本重新选择的过程,它会在前面已训练出来的分类器的基础上对样本库中的样本依次进行预测。

对于正样本:采用上一次训练出来的分类器对现有的正样本库进行检测,因为图片大小固定,将检测到的图片直接拿来作为下一级训练的正样本,直到积累足够数目的正样本。

对于负样本:对负样本的大小做判断,例如低于w0*h0的我们直接缩放至w*h用作训练的负样本,否则就采用随机截取w*h窗口大小的图片用作训练的负样本,另外,为了进一步保证精确性,我们尽量将后期测试存在的很难去除的一些误检缩小至w0*h0大小再放入负样本库中,以能有效地降低这类误检。之后,采用上一次训练出来的分类器对根据负样本生成的w*h窗口大小的图片进行检测,保留检测到的窗口图片,从这些窗口图片当中选取误检的作为负样本,选取的个数应尽量多,在保证针对性的同时保证多样性。

s304、下一级强分类器训练。

s305、判断是否已训练完所有分类器,如果是,结束;否则,反复执行s303和s304直至级联分类器训练结束。

参见图4,本发明实施例提供了一种级联分类器训练装置,用于依次为每一级强分类器选取样本进行训练,对于第一级强分类器之后的任一级强分类器,在进行负样本训练时,该装置具体包括:

负样本处理单元401,用于判断选取的负样本的尺寸是否小于预设尺寸,如果是,将所选负样本缩放为级联分类器的检测窗口大小的图片;否则,从所选负样本中截取检测窗口大小的图片;

负样本选取单元402,用于将处理负样本得到的图片输入所述任一级强分类器之前已训练的强分类器进行检测,选取被误检的图片;

负样本训练单元403,用于根据所述被误检的图片对所述任一级强分类器进行负样本训练。

较佳地,该装置还包括特定负样本处理单元,用于确定尺寸大于所述预设尺寸并且误检次数达到预设第一阈值的特定负样本;缩放所述特定负样本至所述预设尺寸。

较佳地,该装置还包括负样本统计单元,用于统计被误检的图片的数量,当所述被误检的图片的数量达到预设第二阈值时,触发所述负样本训练单元。

较佳地,该装置在用于对于第一级强分类器之后的任一级强分类器,进行正样本训练时,具体包括:

正样本选取单元,用于将选取的正样本输入所述任一级强分类器之前已训练的强分类器进行检测,选取被正确识别的正样本;

正样本训练单元,用于根据所述被正确识别的正样本对所述任一级强分类器进行正样本训练。

较佳地,该装置还包括正样本统计单元,用于统计被正确识别的正样本的数量,当确定所述被正确识别的正样本的数量达到预设第三阈值时,触发所述正样本训练单元。

综上所述,本发明实施例提供了一种级联分类器训练方法及装置,采用已训练的部分分类器检测正样本及负样本,筛选其中具有针对性的样本用于下一级分类器训练,提升了级联分类器的训练效率。尤其是针对负样本,通过根据负样本的尺寸对负样本进行处理,最大程度地提升了负样本的针对性,降低了级联分类器的误检率。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1