复杂场景下的多视角人脸检测方法及其装置的制作方法

文档序号:6355469阅读:593来源:国知局
专利名称:复杂场景下的多视角人脸检测方法及其装置的制作方法
技术领域
本发明涉及视频监控领域,特别涉及视频监控领域中的人脸检测技术。
背景技术
近年来,由于反恐、国土安全和社会安全的需要,世界上各个国家对安防领域加大 了投入,而身份识别正是安防的一个核心问题。随着计算机视觉和模式识别技术的快速发 展,基于生物特征识别的身份识别技术得到了迅猛的发展,在很多领域都有了应用,越来越 显示出其巨大的商业价值和社会价值。人脸识别作为用户接受度最高、最自然、最直观的可 视化生物识别技术,其技术和应用价值正在突显。随着生物特征电子护照等出入境政府项 目广泛采用人脸识别,人脸识别技术在公安、航空等行业出现了大规模的应用。人脸检测作为人脸识别的第一步,其重要意义就不言自明。此外,人脸检测在表情 识别、人口统计、人流量统计、视频触发抓拍及智能视频监控的事件报警分析也有着广泛的 应用前景。另外,人脸检测的算法理论和实现方法也可以应用到诸如车辆检测、行人检测、 人头检测等目标检测中。人脸检测的目的是为了确定图像或视频中人脸的位置、大小和数量。由于人脸模 式的复杂性(脸部肤色的不同、表情的改变、胡须、化妆及饰物遮挡等等)、人脸的各种姿态 (人脸与摄像机角度的变化导致)以及周围环境光照的变化(如强烈的侧光所产生的阴阳 脸)使得人脸检测技术是一项富有挑战性的研究工作,特别是复杂场景下的多视角人脸检 测。复杂场景是指对于人脸所处环境光线变化恶劣、且背景复杂、干扰很多等情况,而多视 角人脸是指检测图像中覆盖一个较大的视角范围的人脸表观模式,一般上是指左右偏转90 度所形成的180度范围,而且人脸存在上下俯仰和倾斜。目前最为常用的人脸检测算法就是基于Boosting学习的人脸检测方法, Boosting学习算法的核心思想就是通过迭代挑选出多个具有不同分类能力的弱分类器进 行组合形成强分类器,其中分类能力较强的弱分类器具有更大的决策权。最为典型的就是 Viola等人提出的基于Haar特征的离散AdaBoost算法,并用这一算法学习Cascade型级联 结构的正面人脸检测器,使得正面人脸检测达到了实用效果。但是复杂场景下的多视角人脸检测的研究相对薄弱,其难度也大得多,目前提出 的算法较少,离实际应用还存在一定距离。总的来说,多视角人脸检测算法主要经历了三个 阶段,典型代表有并行级联结构的检测方法、金字塔结构的检测方法和矢量树结构的检测 方法。这些多视角人脸检测方法的本质都是基于Boosting学习框架下的一大类方法,其主 要区别在于检测器的结构设计、Boosting学习算法的形式和采用的特征方面。其中,并行级联结构的检测方法是最为直观、简单初级的多视角人脸检测方法,通 过为每一个视角的人脸训练出一个对应的级联结构检测器,然后在检测过程中依次利用每 个检测器对图像中的人脸进行判断,从而实现多视角人脸检测的功能。其中每个级联结构 检测器的训练是独立的,分类器的训练算法采用连续AdaBoost学习算法,采用的特征为 Haar特征。由于算法仅仅是对多个单视角人脸检测器的简单联合,没有考虑到不同视角人脸间的相似性,所以在检测过程中每个检测器都要对所有的子窗口进行遍历,而一般情况 下绝大多数子窗口是非脸部区域,这样就会在非人脸区域上进行重复遍历,耗费大量时间, 从而降低检测速度。金字塔结构检测方法采用由粗到精的检测策略,利用了不同目标间的相似性,并 且将目标进行从上至下的划分,根据此相似性训练出一个类似金字塔结构的多视角检测 器,然后在检测过程中将子窗口依次送到金字塔结构的各层分类器进行检测,直到最后一 层检测出目标。其中分类器的训练算法采用Float Boost学习算法,采用的特征同样为 Haar特征。相比简单并行级联结构的检测方法,该方法考虑到了不同视角人脸间的相似性, 但是该方法却未考虑到同类视角人脸间的差异性,因此被父节点判定为人脸的子窗口都要 被送到下一层的各个孩子结点当中,直到该层所有节点分类器将其判定为非人脸子窗口时 才判为非人脸子窗口,从而在一定程度浪费了过多的计算代价在非人脸子窗口上,因此降 低了检测速度。矢量树结构的检测算法同样采用由粗到精的检测策略,并同时兼顾不同视角下人 脸间的相似性与同种视角下人脸的差异性,训练出一个树状结构的多视角检测器。如图1 所示,其中圆圈为节点分类器;然后在检测过程中根据矢量树中的分支节点分类器的输出 结果来判断子窗口将送到下一层的哪个子节点中,依次往下直到最后一层。其中矢量树中 的各个节点分类器采用VectorBoosting学习算法进行训练,采用的特征为Haar特征和边 缘方向直方图EOH特征。由于矢量树检测器能够很好兼顾不同视角下人脸间的相似性与同 种视角下人脸的差异性,因此该方法应该是目前最为常用、经典的多视角人脸检测方法之 一。但是,本发明的发明人发现,目前的矢量树结构的检测方法仍存在如下几点不足1、由于该矢量树中的各个节点分类器为一强分类器,其中包含多个孩子节点的节 点分类器为分支节点分类器,如图1中的实线圆圈,由于分支节点分类器承担着去除非人 脸子窗口和不同视角人脸子窗口细分类的目的,因此在这些分支节点分类器中往往会非常 复杂,包含过多的弱分类器,从而降低检测速度。2、矢量树中各个节点分类器之间没有联系,独立地进行决策,从而浪费了被测子 窗口在其父节点分类器上的分类信息。3、训练过程中采用的Haar特征和EOH特征的特征池过于庞大,往往包含几万,甚 至十几万个特征,而从如此庞大的特征池中挑选出仅有上千个具有强分类能力的特征是项 非常耗时的工作。因此该方法训练一个鲁棒的多视角人脸检测器时往往需要耗费几个星 期,甚至更长的时间。

发明内容
本发明的目的在于提供一种复杂场景下的多视角人脸检测方法及其装置,在保证 检测率的同时提高检测速度。为解决上述技术问题,本发明的实施方式提供了一种复杂场景下的多视角人脸检 测方法,包含以下步骤使用包含多个节点分类器的级联矢量树结构检测器对输入的待测子窗口进行检 测,该级联矢量树结构检测器中包括至少一个分支节点分类器,并且,在至少一个分支节点 分类器之前,有至少一个级联的无分支节点分类器;
其中,如果无分支节点分类器将待测子窗口判定为非人脸子窗口,则停止与该无 分支节点分类器级联的分支节点分类器对该待测子窗口的进一步检测;如果无分支节点分 类器将待测子窗口判定为人脸子窗口,则将该待测子窗口送到与该无分支节点分类器级联 的分支节点分类器继续检测。本发明的实施方式还提供了一种复杂场景下的多视角人脸检测装置,包含检测窗口获取模块,用于根据输入图像获取待测子窗口 ;级联矢量树结构检测器训练模块,用于根据训练样本训练得到包含多个节点分类 器的级联矢量树结构检测器,级联矢量树结构检测器中包括至少一个分支节点分类器,并 且,在至少一个分支节点分类器之前,有至少一个级联的无分支节点分类器;检测模块,用于使用级联矢量树结构检测器对检测窗口获取模块获取到的待测子 窗口进行检测,其中,当级联矢量树结构检测器中的无分支节点分类器将待测子窗口判定 为非人脸子窗口时,停止与该无分支节点分类器级联的分支节点分类器对该待测子窗口的 进一步检测;当无分支节点分类器将待测子窗口判定为人脸子窗口时,将该待测子窗口送 到与该无分支节点分类器级联的分支节点分类器继续检测。本发明实施方式与现有技术相比,主要区别及其效果在于在对待测子窗口进行人脸检测的级联矢量树结构检测器中,在至少一个分支节点 分类器之前,有至少一级联的无分支节点分类器。如果无分支节点分类器将待测子窗口判 定为非人脸子窗口,则停止与该无分支节点分类器级联的分支节点分类器对该待测子窗口 的进一步检测;如果无分支节点分类器将所述待测子窗口判定为人脸子窗口,则将该待测 子窗口送到与该无分支节点分类器级联的分支节点分类器继续检测。通过在分支节点分类 器之间引入级联分类器,利用级联分类器对各个分支上的非人脸子窗口进行逐级有效的去 除,降低了分支节点分类器的复杂度,减少了所含的弱分类器个数,从而在保证检测率的同 时提高检测速度。进一步地,以先根遍历的方式进行递归训练各个节点分类器,在训练每个节点分 类器时,计算父节点分类器对于训练样本的分类置信度,用计算的置信度作为特征值训练 得到嵌入式弱分类器,将训练得到的嵌入式弱分类器作为第一个弱分类器嵌入到当前的节 点分类器当中;当前的节点分类器中其他的普通弱分类器通过根据训练样本计算的特征值 训练得到。通过将嵌入式分类器结构引入到矢量树结构检测器中,使得当前的节点分类器 能够继承其父节点分类器的分类置信度,从而加快了检测器的收敛,使得训练出的检测器 中包含的特征数目更少,进一步提高了检测速度,提升检测性能。进一步地,根据训练样本计算的特征值为分块局部二值模式特征值,分块局部二 值模式特征值为将图像中的一个分块中像素值的和当做一个像素值来计算局部二值模式 的特征值。由于分块局部二值模式特征值(即分块LBP特征),具有很好的纹理描述性能以 及结构简单、计算快速等优点,更为重要的是分块LBP特征池的数目较少,因此在挑选分块 LBP特征时速度很快,大大提高了检测器的训练速度和检测速度。进一步地,采用至少2个级联矢量树结构检测器对输入的待测子窗口进行检测, 其中,至少有一个级联矢量树结构检测器的输入特征为其他级联矢量树结构检测器的输入 特征的旋转值。其中,其他级联矢量树结构检测器的输入特征为分块局部二值模式特征值。 在检测过程中通过旋转分块局部二值模式特征值,可以将检测器进行扩展,从而在不需要对输入图像进行旋转的情况下达到全视角的人脸检测,扩展了检测器的检测视角,而且,分 块局部二值模式特征值的旋转的计算量远小于图的旋转和积分图的计算,因此可有效减少
计算量。进一步地,每个节点分类器在训练之前都要对训练样本进行重采样,以保证训练 该节点时所用的正样本都是被其父节点分类器所正确分类的正样本,而所有的负样本是被 其父节点分类器错误分类为正样本的负样本,从而使得当前的节点分类器能够集中对被父 节点分类器所误分的样本进行分类。


图1是根据现有技术中的矢量树结构检测器示意图;图2是根据本发明第一实施方式的复杂场景下的多视角人脸检测方法流程图;图3是根据本发明第一实施方式中的级联矢量树结构检测器示意图;图4是根据本发明第一实施方式中单个待测子窗口的检测流程图;图5是根据本发明第一实施方式的复杂场景下的多视角人脸检测方法示意图;图6是根据本发明第二实施方式中级联矢量树结构检测器的训练流程图;图7是根据本发明第二实施方式中节点分类器的训练流程图;图8是根据本发明第二实施方式中分块LBP特征示意图;图9是根据本发明第三实施方式的复杂场景下的多视角人脸检测装置结构示意 图。
具体实施例方式在以下的叙述中,为了使读者更好地理解本申请而提出了许多技术细节。但是,本 领域的普通技术人员可以理解,即使没有这些技术细节和基于以下各实施方式的种种变化 和修改,也可以实现本申请各权利要求所要求保护的技术方案。为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的实施 方式作进一步地详细描述。本发明第一实施方式涉及一种复杂场景下的多视角人脸检测方法,具体流程如图 2所示。在步骤201中,预先根据训练样本,训练出级联矢量树结构检测器。具体地说,首 先,根据人脸的姿势按照视角进行从上至下,由粗到细进行划分,构造出一个级联矢量树, 级联矢量树中的每个节点即为一个节点分类器,节点分类器分为分支节点分类器(即有多 个子节点的节点分类器)和无分支节点分类器(即只有一个子节点的节点分类器),在至少 一个分支节点分类器之前,有至少一个级联的无分支节点分类器。然后利用训练样本采用先根遍历方式依次训练各个节点分类器,每个节点分类器 在训练之前都要对训练样本进行重采样,以保证训练该节点时所用的正样本都是被其父节 点分类器所正确分类的正样本,而所有的负样本是被其父节点分类器错误分类为正样本的 负样本,从而使得当前的节点分类器能够集中对被父节点分类器所误分的样本进行分类。在本实施方式中,训练出的级联矢量树结构检测器如图3所示,图中的圆圈为节 点分类器,其中实线圆圈为分支节点分类器,虚线圆圈为无分支节点分类器,省略点表示一系列无分支节点分类器的缩略。所有的节点分类器的输出为一向量,向量的维数与其孩子 节点数目一致。例如图3中,如果第一个分支节点分类器A的输出结果为{1,1,0},则表示 该子窗口可能为向左侧偏转的脸或正面脸,不可能是向右侧偏转的脸,然后在下一层中,该 子窗口被送到向左侧偏转的脸和正面脸对应的强分类器中;如果分类结果为{0,0,0},则 表示该子窗口是非人脸窗口。而对于无分支节点分类器,也就是一般节点分类器,由于其孩 子节点数目为1,则其输出向量的维数也为1,向量就退化成一个二分类值的标量,并与后 面挂接的一系列无分支节点分类器(图中省略点表示)形成级联分类器,从而降低后续分 支节点分类器的复杂度,提高人脸检测的效率,其中级联分类器的层数(即在分支节点分 类器之前级联的无分支节点分类器的层数)可以事先设定也可以通过设定检测指标来动 态设定。从图3中可以看出,训练出的级联矢量树结构检测器共包含15个视角,平面外旋 转分为5个姿态,依次为左全侧(-90,-54)、左半侧(-54,-18)、准正面(-18,+18)、右半侧 (+18,+54)和右全侧(+54,+90) 5个视角,每个平面外旋转视角下再细分为3个平面内旋转 视角,依次为旋转-30 (-45,-15),0度(-15,+15)和30度(+15,+45)。这样该级联矢量树 结构检测器的检测能力能够覆盖平面外旋转180度的范围和平面内旋转90度的范围。在步骤202中,判断是否需要进行多视角的人脸检测,如果需要进行多视角的人 脸检测,则进入步骤203。在步骤203中,遍历待检测的图像,获取到待测子窗口,并将获取到的待测子窗 口,输入到在步骤201中训练出的级联矢量树结构检测器中。接着,在步骤204中,使用在步骤201中训练出的级联矢量树结构检测器对输入的 待测子窗口进行检测。具体地说,对于一个待测子窗口,从根节点开始遍历各个节点分类器对其进行类 别属性的判断,如果级联矢量树结构检测器中的某一分支上的节点分类器将该待测子窗口 判为非人脸,则停止向下访问其孩子节点,转而向上递归访问其它分支上的节点分类器。如 果待测子窗口通过某一分支上所有节点分类器,直到叶子节点,则该子窗口被判为人脸,而 且该人脸的视角类别就是该叶子节点所对应的类别,如图4所示。也就是说,包括根节点 在内的每一个获得待测子窗口输入的节点分类器按如下方式处理如果判定为非人脸子窗 口,则结束本分支对该待测子窗口的检测(即不再送到孩子节点中检测);否则,如果本节 点不是叶子节点,则将该待测子窗口送到该节点的至少一个子节点中进一步检测,如果本 节点已经是叶子节点了,则判定该子窗口为人脸,且该人脸的视角类别就是该叶子节点所 对应的类别。接着,在步骤205中,判断是否已处理完待检测图像中的所有待测子窗口,如果没 有,则回到步骤203,获取新的待测子窗口进行检测;如果已处理完待检测的图像的所有待 测子窗口,则进入步骤206,输出人脸检测结果。在本实施方式中,复杂场景下的多视角人脸检测方法主要包括级联矢量树结构检 测器的训练和利用训练出的检测器进行多视角人脸的检测两部分,如图5所示,图中的虚 线上面部分为检测器的训练部分,下面为利用检测器进行检测部分。通过在分支节点分类 器之间引入级联分类器,利用级联分类器对各个分支上的非人脸子窗口进行逐级有效的去 除,降低了分支节点分类器的复杂度,减少了所含的弱分类器个数,从而在保证检测率的同时提高检测速度。本发明第二实施方式涉及一种复杂场景下的多视角人脸检测方法。第二实施方式 在第一实施方式的基础上进行了改进,主要改进之处在于在本实施方式中,在训练得到级 联矢量树结构检测器时,为了更好的继承父节点分类器已有的分类能力,引入了嵌入式弱 分类结构。具体流程如图6所示,在步骤601中,根据人脸姿态及角度的划分,创建一个矢量 树,矢量树中的每个节点为一个节点分类器。接着,在步骤602至步骤604中,从根节点开始,以先根遍历的方式进行递归训练 各个节点分类器。具体地说,在步骤602中,训练样本重采样,并初始化样本权重。接着,在步骤603中,训练遍历的当前节点分类器。具体训练流程如图7所示,在 训练每个节点分类器时,计算父节点分类器对于训练样本的分类置信度,用计算的置信度 作为特征值训练得到嵌入式弱分类器,将训练得到的嵌入式弱分类器作为第一个弱分类器 嵌入到当前的节点分类器当中。当前的节点分类器中其他的普通弱分类器通过根据训练样 本计算的特征值训练得到。通过将嵌入式分类器结构引入到矢量树结构检测器中,使得当 前的节点分类器能够继承其父节点分类器的分类置信度,从而加快了节点分类器的收敛, 使得训练出的检测器中包含的特征数目更少,进一步提高了检测速度,提升检测性能。值得一提的是,在训练普通弱分类器时,根据训练样本计算的特征值为分块局部 二值模式特征值,该分块局部二值模式特征值(即分块LBP特征值)为将图像中的一个分 块中像素值的和当做一个像素值来计算局部二值模式的特征值。在本实施方式中,通过以 下方式计算图像中一个区域的分块局部二值模式特征值如图8所示,首先,将一个区域分为9个同等大小的3女3的矩形块。然后,计算 各个矩形块内部的像素灰度值总和,然后将中心块的像素灰度值总和,与其8个邻域块的 像素灰度值总和进行大小比较。如果邻域块的像素灰度值总和大于中心块的像素灰度值总 和,则该邻域块的值设为1。如果邻域块的像素灰度值总和小于或等于中心块的像素灰度值 总和,则该邻域块的值设为0。最后,将得到的8个邻域块值连接起来,形成一个8位的二 进制串,将该二进制串的十进制值即作为区域的分块局部二值模式特征值。图8中的(a) 部分为矩形块灰度分布示意;(b)部分为设置的邻域块的值,根据设置的邻域块的值,得到 的分块LBP特征值为01111000 = 120 ; (c)部分为分块LBP特征值对于描述示意。由此可 见,选用分块LBP特征作为弱分类器的基本特征,能够很好的描述脸部特征纹理,其结构类 似于Haar-Iike特征结构。由于该矩形窗口的位置、大小是可以改变的,因此在一 24女24归一化后的人脸 区域内,共有8000多个这样的特征。相比传统的LBP特征,分块LBP特征具有更强的姿态 纹理变化适应性;而相比Haar特征,在同样区域的内,其特征数目要明显减少,从而训练速 度就会得到大大提升。在训练过程中,以样本的LBP特征值为基数对样本进行划分;然后 计算出每个划分上的分类能力,并根据其分类能力对这些划分进行排序;最后利用Gentle AdaBoost对这些排序好的划分进行分类,寻找出最小均方误差错误率下的最优分类及输出 置信度。由于现有技术中使用的LBP特征,对LBP特征计算直方图,得到一个向量。而本实施方式中的分块LBP得到的是一个标量,经实践检验效果优于不分块的。分块LBP特征与 传统LBP特征对于检测性能影响的实验结果如下对比实验是在CMU_PROFILE_IMG库上测试得到,该库是当前多视角人脸检测算法 的通用测试库,该库中共有208张测试图片,里面包含441个人脸,其中每个人脸的姿势都 有很大不同。表1就是具体的测试结果,其中的误检个数表示总共误检为人脸目标的个数, 表格中的百分比为人脸检测率,只有当误检个数越少,并且检测率越高的情况下,才表明选 用的特征性能越好,因此从表1中可以明显看出选用分块LBP特征作为弱分类器的基本特 征具有明显的性能优势。
权利要求
1.一种复杂场景下的多视角人脸检测方法,其特征在于,包含以下步骤使用包含多个节点分类器的级联矢量树结构检测器对输入的待测子窗口进行检测,该 级联矢量树结构检测器中包括至少一个分支节点分类器,并且,在至少一个分支节点分类 器之前,有至少一个级联的无分支节点分类器;其中,如果所述无分支节点分类器将所述待测子窗口判定为非人脸子窗口,则停止与 该无分支节点分类器级联的分支节点分类器对该待测子窗口的进一步检测;如果所述无分 支节点分类器将所述待测子窗口判定为人脸子窗口,则将该待测子窗口送到与该无分支节 点分类器级联的分支节点分类器继续检测。
2.根据权利要求1所述的复杂场景下的多视角人脸检测方法,其特征在于,通过以下 方式训练得到所述级联矢量树结构检测器根据人脸姿态及角度的划分,创建一个矢量树,所述矢量树中的每个节点为一个节点 分类器;以先根遍历的方式进行递归训练各个节点分类器;在训练每个节点分类器时,计算父节点分类器对于训练样本的分类置信度,用计算的 置信度作为特征值训练得到嵌入式弱分类器,将训练得到的嵌入式弱分类器作为第一个弱 分类器嵌入到当前的节点分类器当中;当前的节点分类器中其他的普通弱分类器通过根据 训练样本计算的特征值训练得到。
3.根据权利要求2所述的复杂场景下的多视角人脸检测方法,其特征在于,所述根据 训练样本计算的特征值为分块局部二值模式特征值;所述分块局部二值模式特征值为将图像中的一个分块中像素值的和当做一个像素值 来计算局部二值模式的特征值。
4.根据权利要求3所述的复杂场景下的多视角人脸检测方法,其特征在于,通过以下 方式计算图像中一个区域的所述分块局部二值模式特征值将一个所述区域分为9个同等大小的3女3的矩形块;计算各个矩形块内部的像素灰度值总和,然后将中心块的像素灰度值总和,与其8个 邻域块的像素灰度值总和进行大小比较;如果邻域块的像素灰度值总和大于所述中心块的像素灰度值总和,则该邻域块的值设 为1 ;如果邻域块的像素灰度值总和小于或等于所述中心块的像素灰度值总和,则该邻域 块的值设为0 ;将得到的8个邻域块值连接起来,形成一个8位的二进制串,将该二进制串的十进制值 即作为所述区域的分块局部二值模式特征值。
5.根据权利要求3所述的复杂场景下的多视角人脸检测方法,其特征在于,还包含以 下步骤采用至少2个所述级联矢量树结构检测器对输入的待测子窗口进行检测,其中,至少 有一个级联矢量树结构检测器的输入特征为其他级联矢量树结构检测器的输入特征的旋 转值;所述其他级联矢量树结构检测器的输入特征为分块局部二值模式特征值。
6.根据权利要求2所述的复杂场景下的多视角人脸检测方法,其特征在于,在训练每 个节点分类器之前,还执行以下步骤对训练样本进行重采样。
7.根据权利要求1至5中任一项所述的复杂场景下的多视角人脸检测方法,其特征在 于,在所述分支节点分类器之前级联的无分支节点分类器的层数预先设定,或根据多视角 人脸的检测指标动态设定。
8.一种复杂场景下的多视角人脸检测装置,其特征在于,包含 检测窗口获取模块,用于根据输入图像获取待测子窗口 ;级联矢量树结构检测器训练模块,用于根据训练样本训练得到包含多个节点分类器的 级联矢量树结构检测器,所述级联矢量树结构检测器中包括至少一个分支节点分类器,并 且,在至少一个分支节点分类器之前,有至少一个级联的无分支节点分类器;检测模块,用于使用所述级联矢量树结构检测器对所述检测窗口获取模块获取到的待 测子窗口进行检测,其中,当所述级联矢量树结构检测器中的所述无分支节点分类器将所 述待测子窗口判定为非人脸子窗口时,停止与该无分支节点分类器级联的分支节点分类器 对该待测子窗口的进一步检测;当所述无分支节点分类器将所述待测子窗口判定为人脸子 窗口时,将该待测子窗口送到与该无分支节点分类器级联的分支节点分类器继续检测。
9.根据权利要求8所述的复杂场景下的多视角人脸检测装置,其特征在于,所述级联 矢量树结构检测器训练模块包含以下子模块矢量树创建子模块,用于根据人脸姿态及角度的划分,创建一个矢量树,所述矢量树中 的每个节点为一个节点分类器;分类置信度计算子模块,用于在训练每个所述节点分类器时,计算父节点分类器对于 训练样本的分类置信度;嵌入式弱分类器训练子模块,用于将所述分类置信度计算子模块计算的置信度作为特 征值训练得到嵌入式弱分类器,并将训练得到的嵌入式弱分类器作为第一个弱分类器嵌入 到当前的节点分类器当中;普通弱分类器训练子模块,用于通过根据训练样本计算的特征值训练得到当前的节点 分类器中其他的普通弱分类器;所述级联矢量树结构检测器训练模块以先根遍历的方式进行递归训练各个节点分类
10.根据权利要求9所述的复杂场景下的多视角人脸检测装置,其特征在于,所述根据 训练样本计算的特征值为分块局部二值模式特征值;所述分块局部二值模式特征值为将图像中的一个分块中像素值的和当做一个像素值 来计算局部二值模式的特征值。
11.根据权利要求10所述的复杂场景下的多视角人脸检测装置,其特征在于,所述普 通弱分类器训练子模块通过包含以下子单元,计算图像中一个区域的所述分块局部二值模 式特征值划分子单元,用于将一个所述区域分为9个同等大小的3 * 3的矩形块; 像素灰度值总和计算子单元,用于计算各个所述矩形块内部的像素灰度值总和; 比较子单元,用于将中心块的像素灰度值总和,与其8个邻域块的像素灰度值总和进 行大小比较;设置子单元,用于对于像素灰度值总和大于所述中心块的像素灰度值总和的邻域块,将该邻域块的值设为1 ;对于像素灰度值总和小于或等于所述中心块的像素灰度值总和的 邻域块,将该邻域块的值设为0 ;连接子单元,用于将得到的8个邻域块值连接起来,形成一个8位的二进制串,将该二 进制串的十进制值即作为所述区域的分块局部二值模式特征。
12.根据权利要求10所述的复杂场景下的多视角人脸检测装置,其特征在于,所述检 测模块采用至少2个所述级联矢量树结构检测器对输入的待测子窗口进行检测,其中,至 少有一个级联矢量树结构检测器的输入特征为其他级联矢量树结构检测器的输入特征的 旋转值;所述其他级联矢量树结构检测器的输入特征为分块局部二值模式特征值。
13.根据权利要求9所述的复杂场景下的多视角人脸检测装置,其特征在于,所述级联 矢量树结构检测器训练模块还包含样本更新子模块,用于在训练每个节点分类器之前,对 训练样本进行重采样。
14.根据权利要求8至12中任一项所述的复杂场景下的多视角人脸检测装置,其特征 在于,在所述分支节点分类器之前级联的无分支节点分类器的层数预先设定,或根据多视 角人脸的检测指标动态设定。
全文摘要
本发明涉及视频监控领域,公开了一种复杂场景下的多视角人脸检测方法及其装置。本发明中,在对待测子窗口进行人脸检测的级联矢量树结构检测器中,在至少一个分支节点分类器之前,有至少一个级联的无分支节点分类器。通过在分支节点分类器之间引入级联分类器,利用级联分类器对各个分支上的非人脸子窗口进行逐级有效的去除,降低了分支节点分类器的复杂度,减少了所含的弱分类器个数,从而在保证检测率的同时提高检测速度。
文档编号G06K9/66GK102136075SQ20111005194
公开日2011年7月27日 申请日期2011年3月4日 优先权日2011年3月4日
发明者张文聪, 胡扬忠, 蔡巍伟, 谭文明, 贾永华, 邬伟琪 申请人:杭州海康威视软件有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1