一种基于随机蕨分类器的全自主在线学习方法

文档序号：6623948阅读：610来源：国知局

一种基于随机蕨分类器的全自主在线学习方法
【专利摘要】本发明公开了一种基于随机蕨分类器的全自主在线学习方法，该方法只需在视频帧中框选一次目标即可进行针对该目标类的分类器在线学习。步骤为：首先对框选的目标采用仿射变换得到初始的正样本集，在视频的非目标区域提取少量的负样本集训练初始随机蕨分类器；其次，使用该分类器在视频帧中进行目标检测。检测的过程中，采用最近邻分类器收集在线学习新样本，并自动判断样本类别；最后，将新样本用于随机蕨分类器的在线训练，更新随机蕨后验概率，逐渐提高分类器目标检测的精度，实现目标检测系统全自主在线学习。
【专利说明】-种基于随机蕨分类器的全自主在线学习方法

【技术领域】
[0001] 本发明属于模式识别领域，具体涉及一种基于随机蕨分类器的全自主在线学习方法。

【背景技术】
[0002] 在线学习属于增量学习的研究范畴，在这一类方法中分类器对每个样本只学一次，而不是重复的学习，这样在线学习算法运行过程中不需要大量的存储空间来存储训练样本，分类器每获得一个样本，即对其进行在线学习，通过在线学习使分类器在使用过程中仍然能根据新样本自我更新和改进，进一步提高分类效果。
[0003] 早期的在线学习算法有Winnow算法，统一线性预测算法等，2001年学者Oza将这些算法与boosting算法进行结合，提出了在线boosting算法（该算法引自"Online bagging and boosting，'N. Oza and S. Russell, In Proc. Artificial Intelligence and Statistics, 105-112, 2001)，在Oza的方法中，每个特征对应一个弱分类器，而强分类器是一定数量的弱分类器的加权和，其中弱分类器都是从弱分类器集合中挑选出来的。在线学习时，每个训练样本逐一的更新弱分类器集合中的每个弱分类器，包括调整正负样本的分类阈值以及该分类器的权重，使好的弱分类器权重越来越高，而较差的弱分类器权重越来越低，从而每次在线学习一个样本就可以挑选出一个当前权重最高的弱分类器加入强分类器中使最终训练出来的分类器有较强的分类能力。
[0004] 但是，在线boosting算法的弱分类器集合中每个弱分类器都要对新样本进行在线学习，当弱分类器个数较多时，在线学习速度必然会变慢。Grabner对在线boosting算法进行了改进，使其也象Adaboost算法一样可以进行特征选择，并且这种特征选择以及对分类器的更新都是在线进行的，称为在线Adaboost (该算法引自"On-line boosting and vision" H. Grabner and H.Bischof，In Proc. CVPR, (1):260-267, 2006)。但是在线 Adaboost用特征选择算子代替一般的弱分类器合成强分类器，特征选择算子数以及特征选择算子对应的弱分类器数都是固定的，相应的在线学习分类器结构比较僵化。当发现其分类能力无法满足检测性能的要求时，即使持续的在线学习下去也无法提高检测精度。
[0005] Ozuysal不再使用弱分类器组成强分类器进行样本分类，而是从样本特征集合随机抽取多个特征构成一个随机蕨，通过随机蕨统计训练样本后验概率分布，再由多个随机蕨的后验概率分布进行样本分类，即为随机蕨分类器算法（该算法引自"Fast keypoint recognition using random ferns，'In Pattern Analysis Machine Intelligence, IEEE Transaction on 32 (3) ,448-461，2010)。

【发明内容】

[0006] 本发明要解决的技术问题是：提供一种基于随机蕨分类器的全自主在线学习方法，用于分类器的自主学习以提高分类性能。
[0007] 本发明为解决上述技术问题所采取的技术方案为：一种基于随机蕨分类器的全自主在线学习方法，其特征在于：它包括如下步骤：
[0008] 1)准备初始训练分类器的样本集：
[0009] 针对待检测的视频帧，在视频帧中框选出一个目标图片，对该目标图片进行仿射变换得到的图片作为正样本；以不含有目标的背景图像区域作为负样本；如此随机的获取一定数量的正样本和负样本作为初始训练分类器的样本集；正、负样本为大小相同的图像块；
[0010] 2)随机蕨分类器初始训练：
[0011] 使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练，统计正负样本在每个随机蕨上的后验概率分布；
[0012] 3)将初始训练好的随机蕨分类器作为当前目标检测器遍历待检测的视频帧进行目标检测，得到目标模块，并计算每个目标模块的置信度；
[0013] 4)构建正负样本模板集：
[0014] 将以下三种样本作为正样本模板添加到正样本模板集M+，其余添加到负样本模板集M_ :
[0015] A、步骤1)中得到的正样本；
[0016] B、对步骤3)中得到的置信度超过置信度预设值的目标模块，采用光流法对其所在视频帧进行跟踪得到跟踪模块，若跟踪模块与该目标模块有重合区域，且重合率超过预设重合率，则认为该跟踪模块是真实目标，作为正样本模板添加到M+中；
[0017] C、对步骤3)中得到的置信度超过置信度预设值的目标模块，采用光流法对其所在视频帧进行跟踪得到跟踪模块，若跟踪模块与该目标模块有重合区域，且重合率未超过预设重合率，则通过保守相似度T判断该跟踪模块能否加入正样本模板集：

【权利要求】
1. 一种基于随机蕨分类器的全自主在线学习方法，其特征在于：它包括如下步骤： 1) 准备初始训练分类器的样本集：针对待检测的视频帧，在视频帧中框选出一个目标图片，对该目标图片进行仿射变换得到的图片作为正样本；以不含有目标的背景图像区域作为负样本；如此随机的获取一定数量的正样本和负样本作为初始训练分类器的样本集；正、负样本为大小相同的图像块； 2) 随机蕨分类器初始训练：使用准备好的初始训练分类器的样本集对随机蕨分类器进行初始训练，统计正负样本在每个随机蕨上的后验概率分布； 3) 将初始训练好的随机蕨分类器作为当前目标检测器遍历待检测的视频帧进行目标检测，得到目标模块，并计算每个目标模块的置信度； 4) 构建正负样本模板集：将以下三种样本作为正样本模板添加到正样本模板集W，其余添加到负样本模板集 A、步骤1)中得到的正样本； B、对步骤3)中得到的置信度超过置信度预设值的目标模块，采用光流法对其所在视频帧进行跟踪得到跟踪模块，若跟踪模块与该目标模块有重合区域，且重合率超过预设重合率，则认为该跟踪模块是真实目标，作为正样本模板添加到矿中； C、对步骤3)中得到的置信度超过0. 6的目标模块，采用光流法对其所在视频帧进行跟踪得到跟踪模块，若跟踪模块与该目标模块有重合区域，且重合率未超过预设重合率，则通过保守相似度T判断该跟踪模块能否加入正样本模板集：
如果Se大于预设的保守相似度阈值，则该跟踪模块作为正样本模板加入M+，So%为待分类样本与当前正样本模板集的前半部分模板的相似度，S+、^分别为待分类样本与正、负样本模板集的相似度，5·(ρ?Α +)为两个图像帧的相似度，p+，f分别为正样本和负样本，p为待分类样本，本步骤中待分类样本为跟踪模块；每加入一个正样本模板，则取同一视频帧中其周围四个相同大小的图像块判断是否为负样本，若是作为负样本模板加入负样本模板集『； 5) 使用最近邻分类器，获得在线学习的正负样本：最近邻分类器的设置如下：对于每个待分类样本P，分别计算其与正负样本模板集的相似度 S+(p，M+)及 S^p，M〇 :
相应的可得相似度f:
若相似度f大于阈值Θ ffl，则判断该待分类样本为真实目标，作为在线学习的正样本；否则为虚警，作为在线学习的负样本；本步骤中待分类样本为步骤3)得到的目标模块和步骤4)得到的正负样本模板集； (6)随机蕨分类器的在线训练：使用步骤5)获得的在线学习的正负样本，对随机蕨分类器进行在线学习，逐渐提高其分类精度；将在线学习的随机蕨分类器作为可持续更新的检测系统进行目标检测。
2.根据权利要求1所述的基于随机蕨分类器的全自主在线学习方法，其特征在于：所述的步骤2)的具体方法如下： 2. 1)构造随机蕨：对初始训练分类器的样本集中的单个样本上随机取s对特征点作为一组随机蕨，每个样本取特征点的位置相同，每对特征点进行像素值的比较，每对特征点中前一个特征点像素值大则取特征值为1，反之则取特征值为〇, s对特征点比较后得到的s个特征值按照随机的顺序构成一个s位的二进制数，即为该组随机蕨的随机蕨数值，每个样本的随机蕨中特征值的顺序一致； 2. 2)计算随机蕨数值在正负样本类上的后验概率：随机蕨中，有一部分为正样本得到的，其它为负样本得到的；随机蕨数值的取值种类有 2s个；统计每种随机蕨数值的取值的正样本个数，从而获得随机蕨数值在正样本类q上的后验概率分布PFilCi);同理获得随机蕨数值在负样本类Q上的后验概率分布PFilQ);联合所有随机蕨对初始训练分类器的样本集进行分类，即为随机蕨分类器；所述的步骤3)采用上述随机蕨分类器在每帧视频图像中进行目标检测：遍历待检测的每帧视频图像，在每帧视频图像中提取相同大小的图像块作为待测样本，待测样本的大小与步骤1)中正样本的大小相等，计算每个待测样本的随机蕨数值，从而得到相应的后验概率，最后由随机蕨分类器计算其类别；对于类别为正样本的图像块，则作为目标被检测出来。
3. 根据权利要求1所述的基于随机蕨分类器的全自主在线学习方法，其特征在于：所述的步骤4)每加入一个正样本模板，则取同一视频帧中其周围四个相同大小的图像块判断是否为负样本时，引入高斯背景建模，若图像块内前景像素小于前景像素阈值，则判断它为负样本。
4. 根据权利要求1或3所述的基于随机蕨分类器的全自主在线学习方法，其特征在于：所述的步骤4)还包括模板集消减机制：待分类样本与正负模板集的相似度等于待分类样本与正负模板集中单个正负样本模板之间相似度的最大值；实时统计各个正负样本模板获得该最大值的次数，若某正负样本模板获得的该最大值的次数小于最大值次数预设值，则去除对应的正样本模板或负样本模板。
5. 根据权利要求2所述的基于随机蕨分类器的全自主在线学习方法，其特征在于：所述的步骤6)随机蕨分类器的在线学习通过更新后验概率分布实现。
6. 根据权利要求5所述的基于随机蕨分类器的全自主在线学习方法，其特征在于：所述的步骤6)具体方法如下： 6. 1)将步骤5)获得的正负样本作为在线学习样本；设一个在线学习样本为（fnew，ck)，其中f_为随机蕨s位的二进制数，ck为样本类别，计算该在线学习样本的随机蕨数值； 6. 2)对步骤2. 1)样本集中类别为ck的样本总数加1，类别为ck的与该在线学习样本的随机蕨数值相同的样本数加1 ;其它随机蕨数值的样本数不变； 6. 3)根据更新后的样本数，重新计算随机蕨数值在该样本类上的后验概率分布； 6. 4)每新增一个在线学习样本，便重复6. 1)至6. 3)对后验概率分布进行更新一次。
【文档编号】G06K9/62GK104156734SQ201410407669
【公开日】2014年11月19日申请日期:2014年8月19日优先权日:2014年8月19日
【发明者】罗大鹏, 韩家宝, 魏龙生, 王勇, 马丽申请人:中国地质大学（武汉）

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗大鹏;韩家宝;魏龙生;王勇;马丽
技术所有人：中国地质大学（武汉）
我是此专利的发明人

上一篇：一种地铁隧道岩土体等效计算参数反演方法
上一篇：基于泛化双向相似连接技术的匹配方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。