人脸检测方法及装置与流程

文档序号:12906434阅读:233来源:国知局
人脸检测方法及装置与流程

本公开涉及图像识别技术领域,尤其涉及一种人脸检测方法及装置。



背景技术:

人脸检测技术是指从包括人脸的图像中识别出人脸区域的技术,是目前较为常见的一种图像处理技术。

相关技术中,人脸识别可以用于安全支付、身份认证等领域。由于这些领域对安全性的要求较高,所以对人脸识别的速度和准确度就提出了更高的要求。例如,当人脸识别应用在手机上进行解锁时,在确保人脸识别准确的基础上,如果人脸识别要花2秒,就会严重影响客户体验,如果能够缩短到0.2秒,客户的感觉会完全不同。



技术实现要素:

本公开实施例提供一种人脸检测方法及装置,用以提高人间人脸检测的速度与准确度。

根据本公开实施例的第一方面,提供一种人脸检测方法,包括:

根据已训练的人脸检测器携带的用于表示人脸特征的第一归一化像素差值npd组合,提取待检测图像的第二npd组合;

通过所述人脸检测器对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域;

提取所述人脸区域的n维特征向量,n为自然数;

通过已训练的逻辑回归分类器对所述n维特征向量进行回归计算,得到所述人脸区域存在人脸的概率;

当所述存在人脸的概率大于预设阈值时确定所述人脸区域中存在人脸。

在一实施例中,所述已训练的人脸检测器可携带所述第一npd组合中的npd顺序;

所述根据已训练的人脸检测器携带的用于表示人脸特征的第一npd组合,提取待检测图像的第二npd组合,可包括:

根据所述第一npd组合以及所述npd顺序,提取所述第二npd组合;

所述通过所述人脸检测器对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域,可包括:

通过所述人脸检测器基于所述npd顺序对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域。

在一实施例中,所述根据已训练的人脸检测器携带的用于表示人脸特征的第一npd组合,提取待检测图像的第二npd组合之前,所述方法还可包括:

确定包括人脸的第一正样本与不包括人脸的第一负样本组成的第一训练集;

确定所述第一正样本与所述第一负样本各自对应的npd;

基于所述第一正样本与所述第一负样本各自对应的npd学习得到多个深度二次元树;所述深度二次元树经学习得到每个枝节点的最优npd;

基于所述多个深度二次元树构建所述已训练的人脸检测器;所述多个深度二次元树中包括的最优npd构成所述第一npd组合。

在一实施例中,所述确定所述第一正样本与所述第一负样本各自对应的npd之前,所述方法还可包括:

将所述第一正样本与所述第一负样本各自对应的npd存储在查找表中;

所述确定所述第一正样本与所述第一负样本各自对应的npd,包括:

通过访问所述查找表确定所述第一正样本与所述第一负样本各自对应的npd。

在一实施例中,所述通过已训练的逻辑回归分类器对所述n维特征向量进行回归计算,得到所述人脸区域存在人脸的概率之前,所述方法还可包括:

将包括人脸的第二正样本与不包括人脸的第二负样本组成的第二训练集输入未训练的逻辑回归分类器;

对所述未训练的逻辑回归分类器的预测函数中n维特征向量各自对应的参数进行训练;所述第二负样本为基于npd检测人脸失败的负样本;

在确定所述预测函数中n维特征向量各自对应的参数符合预设条件时,停止训练所述逻辑回归分类器,得到所述已训练的逻辑回归分类器。

在一实施例中,所述确定所述预测函数中n维特征向量各自对应的参数符合预设条件,可包括:

确定所述预测函数的损伤函数值是否达到最小值;

当所述预测函数的损耗函数的值达到最小值时,确定所述预测函数中n维特征向量各自对应的参数符合所述预设条件。

根据本公开实施例的第二方面,提供一种人脸检测装置,包括:

第一特征提取模块,被配置为根据已训练的人脸检测器携带的用于表示人脸特征的第一归一化像素差值npd组合,提取待检测图像的第二npd组合;

回归处理模块,被配置为通过所述人脸检测器对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域;

第二特征提取模块,被配置为提取所述人脸区域的n维特征向量,n为自然数;

回归计算模块,被配置为通过已训练的逻辑回归分类器对所述n维特征向量进行回归计算,得到所述人脸区域存在人脸的概率;

第一确定模块,被配置为在所述存在人脸的概率大于预设阈值时确定所述人脸区域中存在人脸。

在一实施例中,所述已训练的人脸检测器可携带所述第一npd组合中的npd顺序;

所述第一特征提取模块,还可被配置为根据所述第一npd组合以及所述npd顺序,提取所述第二npd组合;

所述回归处理模块,还可被配置为通过所述人脸检测器基于所述npd顺序对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域。

在一实施例中,所述装置,还可包括:

第二确定模块,被配置为确定包括人脸的第一正样本与不包括人脸的第一负样本组成的第一训练集;

第三确定模块,被配置为确定所述第一正样本与所述第一负样本各自对应的npd;

学习模块,被配置为基于所述第一正样本与所述第一负样本各自对应的npd学习得到多个深度二次元树;所述深度二次元树经学习得到每个枝节点的最优npd;

构建模块,被配置为基于所述多个深度二次元树构建所述已训练的人脸检测器;所述多个深度二次元树中包括的最优npd构成所述第一npd组合。

在一实施例中,所述装置,还可包括:

存储模块,被配置为将所述第一正样本与所述第一负样本各自对应的npd存储在查找表中;

所述第三确定模块,还被配置为通过访问所述查找表确定所述第一正样本与所述第一负样本各自对应的npd。

在一实施例中,所述装置,还可包括:

输入模块,被配置为将包括人脸的第二正样本与不包括人脸的第二负样本组成的第二训练集输入未训练的逻辑回归分类器;

训练模块,被配置为对所述未训练的逻辑回归分类器的预测函数中n维特征向量各自对应的参数进行训练;所述第二负样本为基于npd检测人脸失败的负样本;

控制模块,被配置为在确定所述预测函数中n维特征向量各自对应的参数符合预设条件时,停止训练所述逻辑回归分类器,得到所述已训练的逻辑回归分类器。

在一实施例中,所述装置,还可包括:

所述第四确定模块,还被配置为确定所述预测函数的损伤函数值是否达到最小值;

所述第五确定模块,还被配置为在所述预测函数的损耗函数的值达到最小值时,确定所述预测函数中n维特征向量各自对应的参数符合所述预设条件。

根据本公开实施例的第三方面,提供一种人脸检测装置,所述装置包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

根据已训练的人脸检测器携带的用于表示人脸特征的第一归一化像素差值npd组合,提取待检测图像的第二npd组合;

通过所述人脸检测器对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域;

提取所述人脸区域的n维特征向量,n为自然数;

通过已训练的逻辑回归分类器对所述n维特征向量进行回归计算,得到所述人脸区域存在人脸的概率;

当所述存在人脸的概率大于预设阈值时确定所述人脸区域中存在人脸。

根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:

根据已训练的人脸检测器携带的用于表示人脸特征的第一归一化像素差值npd组合,提取待检测图像的第二npd组合;

通过所述人脸检测器对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域;

提取所述人脸区域的n维特征向量,n为自然数;

通过已训练的逻辑回归分类器对所述n维特征向量进行回归计算,得到所述人脸区域存在人脸的概率;

当所述存在人脸的概率大于预设阈值时确定所述人脸区域中存在人脸。

本公开的实施例提供的技术方案可以包括以下有益效果:先根据基于npd(normalizedpixeldifference,归一化像素差值)的已训练的人脸检测器中携带的用于表示人脸特征的第一npd组合,提取待检测图像的第二npd组合,通过人脸检测器对第二npd组合进行回归处理,可以快速地得到待检测图像中的人脸区域;接着,提取得到的人脸区域的n维特征向量,通过已训练的逻辑回归分类器对n维特征向量进行回归计算,可以快速地得到人脸区域存在人脸的概率,而基于得到的人脸区域存在人脸的概率,可以核实得到的人脸区域中是否存在人脸,其中,当存在人脸的概率大于预设阈值时确定得到的人脸区域中存在人脸,这样,可以快速地将得到的人脸区域中不存在人脸的人脸区域过滤掉,降低误检率。本公开的技术方案,不但可以提高人脸检测的速度,还可以提高人脸检测的准确度。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。

图1a是根据一示例性实施例示出的人脸检测方法的流程图。

图1b是根据一示例性实施例示出的已训练的人脸检测器携带的npd组合示意图。

图1c是根据一示例性实施例示出的人脸检测方法的场景图。

图2a是根据一示例性实施例一示出的人脸检测方法的流程图。

图2b是根据一示例性实施例一示出的用于人脸检测的深度二次元树的结构示意图。

图3是根据一示例性实施例二示出的对人脸检测器训练的流程图。

图4是根据一示例性实施例三示出的人脸检测方法的流程图。

图5是根据一示例性实施例四示出的人脸检测方法的流程图。

图6是根据一示例性实施例示出的一种人脸检测装置的框图。

图7a是根据一示例性实施例示出的另一种人脸检测装置的框图。

图7b是根据一示例性实施例示出的另一种人脸检测装置的框图。

图8a是根据一示例性实施例示出的另一种人脸检测装置的框图。

图8b是根据一示例性实施例示出的另一种人脸检测装置的框图。

图9是根据一示例性实施例示出的一种人脸检测装置的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1a是根据一示例性实施例示出的人脸检测方法的流程图,图1b是根据一示例性实施例示出的已训练的人脸检测器携带的npd组合示意图,图1c是根据一示例性实施例示出的人脸检测方法的场景图;该人脸检测方法可以应用在终端设备(例如:智能手机、平板电脑)、摄像装置或者与摄像装置相连接的人脸检测设备上。如图1a所示,该人脸检测方法包括以下步骤s101-s105:

在步骤s101中,根据已训练的人脸检测器携带的用于表示人脸特征的第一npd组合,提取待检测图像的第二npd组合。

在一个实施例中,第一npd组合包括若干个npd,该若干个npd组合起来可以表示人脸的本质结构。在一个示例性实施例中,如图1b所示,第一npd组合可以包括f1、f2、f3、f4表示人脸特征的4个npd,该4个npd可以表示人脸的本质结构。例如,f1可以表示眼睛的特征,f2可以表示眉毛的特征,f3可以表示鼻子的特征,f4可以表示嘴部的特征。

第一npd组合包括的npd根据人脸检测器的训练结果确定。其中,npd为两个像素的归一化像素差值,可以根据weber(韦伯)规则得到,具体可以根据如下公式计算得到:

其中,x、y分别为两个像素的亮度值。在上述的示例性实施例中,如图1b所示,f2为像素点p1、p2的归一化像素差值,x为像素点p2的像素点的亮度值,y为像素点p1的像素点的亮度值。

当需要对待检测图像进行人脸检测时,先对待检测图像进行缩放处理,使得缩放处理后的待检测图像的分辨率与人脸检测器的输入维度相同。例如,对于输入维度为20*20的人脸检测器,如果摄像装置的视频图像为800*600,则采集到的图像的分辨率也为800*600,此时需要将该800*600分辨率的图像归一化为20*20的图像。

在对待检测图像进行缩放处理后,根据已训练的人脸检测器携带的用于表示人脸特征的第一npd组合,提取缩放处理后的待检测图像的第二npd组合。在一个实施例中,根据第一npd组合中包括的npd对应的像素点的位置提取第二npd组合。在上述的示例性实施例中,如图1b所示,根据f1、f2、f3、f4对应的像素点的位置提取第二npd组合包括的npd(f1’、f2’、f3’、f4’),其中,f1’、f2’、f3’、f4’的对应的像素点的位置与f1、f2、f3、f4对应的像素点的位置一一对应。例如,f2’对应的像素点的位置分别与p1、p2的位置对应。

在步骤s102中,通过人脸检测器对第二npd组合进行回归处理,得到待检测图像中的人脸区域。

在一个实施例中,可以通过人脸检测器对第二npd组合进行回归处理,得到待检测图像中的人脸区域,并通过方框或者椭圆形框圈出人脸区域,以示检测得到的人脸区域。

在步骤s103中,提取人脸区域的n维特征向量。其中n为自然数。

在一个实施例中,n维特征向量可以是n维hog(histogramoforientedgradient,方向梯度直方图)特征向量。在另一个实施例中,n维特征向量可以是n维lbp(localbinarypattern,局部二值模式)特征向量。在再一个实施例中,n维特征向量可以是npd特征向量,这样会节约人脸检测时间,提高人脸检测效率。

在步骤s104中,通过已训练的逻辑回归分类器对n维特征向量进行回归计算,得到人脸区域存在人脸的概率。

在一个实施例中,逻辑回归分类器通过以下的公式(2)、(3)对n维特征向量进行回归计算,得到人脸区域存在人脸的概率。

其中,θ0、θ1、…、θn为特征向量x1、x2、…、xn对应的参数,i为自然数,θt为参数θ的矩阵形式,x为特征向量矩阵,hθ(x)为预测函数,hθ(x)的函数值为人脸区域存在人脸的概率。

通过(2)式可以得出,在基于提取的n维特征向量计算人脸区域存在人脸的概率时,一次判断需要n个乘法运算即可完成,计算速度快,提高了人脸检测的效率。

在步骤s105中,当存在人脸的概率大于预设阈值时确定人脸区域中存在人脸。基于上述得到的人脸区域存在人脸的概率,可以核实得到的人脸区域中是否存在人脸,其中,当存在人脸的概率大于预设阈值时确定得到的人脸区域中存在人脸,当存在人脸的概率小于预设阈值时确定得到的人脸区域中不存在人脸。

作为一个示例性场景,用户采用如图1c所示的手机11登录某应用时,该应用允许刷脸登录。当用户采用刷脸的登录方式登录应用时,该应用可以通过调用摄像头12对人脸进行拍照或者摄像,装置13通过执行本公开提供的人脸检测方法实现人脸识别。装置13可以是手机11的一部分,也可以是独立于手机的装置。具体地,图像采集模块14可以通过预设的采样周期采集摄像头12采集到的图像,预处理模块15根据人脸检测器的输入维度对图像采集模块采集到的图像进行缩放处理,以使缩放处理后的图像的分辨率与人脸检测器的输入维度相同,预处理模块15将缩放处理后的图像输入至已训练的人脸检测器16,通过已训练的人脸检测器16提取图像中存在人脸的区域,人脸检测器16将提取到的存在人脸的区域输出至已训练的逻辑回归分类器17,逻辑回归分类器17对核实上述的人脸区域中是否存在人脸。当确定人脸区域中存在人脸后才将人脸区域输出至后续的人脸识别模块18进行人脸识别,以判断是否允许用户登录,当采集的图像中不存在人脸时可以不将采集的图像输出至人脸识别模块18。本公开的技术方案,在人脸检测时采用双重人脸检测的方法不但可以提高人脸检测的准确度,同时保证了人脸检测的速度,有助于提高用户体验。

在另一个示例性场景中,本公开的技术方案可以采用预设维度(比如20*20)的检测窗口对包括多个人脸的待检测图像进行人脸检测,不限于对包括单个人脸的待检测图像进行人脸检测。

本实施例中,先根据基于npd(normalizedpixeldifference,归一化像素差值)的已训练的人脸检测器中携带的用于表示人脸特征的第一npd组合,提取待检测图像的第二npd组合,通过人脸检测器对第二npd组合进行回归处理,可以快速地得到待检测图像中的人脸区域;接着,提取得到的人脸区域的n维特征向量,通过已训练的逻辑回归分类器对n维特征向量进行回归计算,可以快速地得到人脸区域存在人脸的概率,而基于得到的人脸区域存在人脸的概率,可以核实得到的人脸区域中是否存在人脸,其中,当存在人脸的概率大于预设阈值时确定得到的人脸区域中存在人脸,这样,可以快速地将得到的人脸区域中不存在人脸的人脸区域过滤掉,降低误检率。本公开的技术方案,不但可以提高人脸检测的速度,还可以提高人脸检测的准确度。

在一个实施例中,所述已训练的人脸检测器可携带所述第一npd组合中的npd顺序;

所述根据已训练的人脸检测器携带的用于表示人脸特征的第一npd组合,提取待检测图像的第二npd组合,可包括:

根据所述第一npd组合以及所述npd顺序,提取所述第二npd组合;

所述通过所述人脸检测器对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域,可包括:

通过所述人脸检测器基于所述npd顺序对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域。

在一个实施例中,所述根据已训练的人脸检测器携带的用于表示人脸特征的第一npd组合,提取待检测图像的第二npd组合之前,所述方法还可包括:

确定包括人脸的第一正样本与不包括人脸的第一负样本组成的第一训练集;

确定所述第一正样本与所述第一负样本各自对应的npd;

基于所述第一正样本与所述第一负样本各自对应的npd学习得到多个深度二次元树;所述深度二次元树经学习得到每个枝节点的最优npd;

基于所述多个深度二次元树构建所述已训练的人脸检测器;所述多个深度二次元树中包括的最优npd构成所述第一npd组合。

在一个实施例中,所述确定所述第一正样本与所述第一负样本各自对应的npd之前,所述方法还可包括:

将所述第一正样本与所述第一负样本各自对应的npd存储在查找表中;

所述确定所述第一正样本与所述第一负样本各自对应的npd,可包括:

通过访问所述查找表确定所述第一正样本与所述第一负样本各自对应的npd。

在一个实施例中,所述通过已训练的逻辑回归分类器对所述n维特征向量进行回归计算,得到所述人脸区域存在人脸的概率之前,所述方法还可包括:

将包括人脸的第二正样本与不包括人脸的第二负样本组成的第二训练集输入未训练的逻辑回归分类器;

对所述未训练的逻辑回归分类器的预测函数中n维特征向量各自对应的参数进行训练;所述第二负样本为基于npd检测人脸失败的负样本;

在确定所述预测函数中n维特征向量各自对应的参数符合预设条件时,停止训练所述逻辑回归分类器,得到所述已训练的逻辑回归分类器。

在一个实施例中,所述确定所述预测函数中n维特征向量各自对应的参数符合预设条件,包括:

确定所述预测函数的损伤函数值是否达到最小值;

当所述预测函数的损耗函数的值达到最小值时,确定所述预测函数中n维特征向量各自对应的参数符合所述预设条件。

具体如何检测人脸的,请参考后续实施例。

至此,本公开实施例提供的上述方法,先根据基于npd的已训练的人脸检测器快速地得到待检测图像中的人脸区域;接着,通过已训练的逻辑回归分类器可以核实得到的人脸区域中是否存在人脸。这样,本公开的技术方案,不但可以提高人脸检测的速度,还可以提高人脸检测的准确度。

下面以具体实施例来说明本公开实施例提供的技术方案。

图2a是根据一示例性实施例一示出的人脸检测方法的流程图;图2b是根据一示例性实施例一示出的用于人脸检测的深度二次元树(dqt)的结构示意图;本实施例利用本公开实施例提供的上述方法,以根据第一npd组合中的npd顺序提取第二npd组合,并基于该npd顺序对第二npd组合进行回归处理为例进行示例性说明,如图2a所示,包括如下步骤:

在步骤s201中,根据第一npd组合以及npd顺序,提取第二npd组合。

在一个实施例中,已训练的人脸检测器可以携带第一npd组合中的npd顺序。其中,npd顺序为在进行人脸检测时对npd处理的顺序。在一个示例性实施例中,如图2b所示,已训练的人脸检测器可以包括多个深度二次元树(dqt),深度二次元树(dqt)用于进行人脸检测。深度二次元树(dqt)在进行人脸检测时,先在根节点21先对f1进行判断,具体是判断f1是否属于[θ11,θ12],当判断结果为是时,在枝节点22对f3进行判断,当判断结果为否时,在枝节点23对f2进行判断。在枝节点22对f3进行判断时,具体是判断f3是否属于[θ31,θ32],当判断结果为是时,输出对应的判断结果(比如不包括人脸),当判断结果为否时,在叶子节点24对f4进行判断。在枝节点23对f2进行判断时,具体是判断f2是否属于[θ21,θ22],当判断结果为是时,在叶子节点24对f4进行判断,当判断结果为否时,输出对应的判断结果(比如不包括人脸)。在叶子节点24对f4进行判断时,具体是判断f4是否属于[θ41,θ42],当判断结果为是时,输出对应的判断结果(比如包括人脸),当判断结果为否时,输出对应的判断结果(比如不包括人脸)。

在提取第二npd组合时,不但根据第一npd组合中npd对应的像素的位置确定第二npd组合中npd对应的像素的位置,而且,还可以根据第一npd组合中npd顺序确定第二npd组合中npd的提取顺序。在上述的示例性实施例中,第一npd组合中包括f1、f2、f3、f4等4个npd,第二npd组合中包括f1’、f2’、f3’、f4’等4个npd,如果第一npd组合的npd顺序依次为f1、f2、f3、f4,则第二npd组合中npd的提取顺序依次为f1’、f2’、f3’、f4’。提取的第二npd组合可以按照npd的提取顺序进行储存。

在步骤s202中,通过人脸检测器基于npd顺序对第二npd组合进行回归处理,得到待检测图像中的人脸区域。

在人脸检测器对第二npd组合进行回归处理时,可以基于第一npd组合的npd顺序对第二npd组合进行回归处理。由于第二npd组合按照第一npd组合的npd顺序提取npd,而在人脸检测时又按照第一npd组合的npd顺序对第二npd组合进行回归处理,这样,可以边提取npd边进行人脸检测,即特征提取与人脸检测同时进行,可以缩短人脸检测时间,提高人脸检测效率。

在步骤s203中,提取人脸区域的n维特征向量。其中n为自然数。

在步骤s204中,通过已训练的逻辑回归分类器对n维特征向量进行回归计算,得到人脸区域存在人脸的概率。

在步骤s205中,当存在人脸的概率大于预设阈值时确定人脸区域中存在人脸。

本实施例中的步骤s203~s205与上述的步骤s103~s105类似,在此不再赘述。

本实施例中,通过根据第一npd组合中的npd顺序提取第二npd组合,并基于该npd顺序对第二npd组合进行回归处理,可以进一步提高人脸检测的速度。

图3是根据一示例性实施例二示出的对人脸检测器训练的流程图;本实施例利用本公开实施例提供的上述方法,以如何对人脸检测器进行训练为例进行示例性说明,如图3所示,包括如下步骤:

在步骤s301中,确定包括人脸的第一正样本与不包括人脸的第一负样本组成的第一训练集。

在一个实施例中,第一正样本与第一负样本可以是不携带人工分类标签的样本,这样可以节约人工成本。

在步骤s302中,确定第一正样本与第一负样本各自对应的npd。

在一个实施例中,可以根据公式(1)通过计算得到第一正样本与第一负样本各自对应的npd。

在步骤s303中,基于第一正样本与第一负样本各自对应的npd学习得到多个深度二次元树。其中深度二次元树经学习得到每个节点的最优npd。

在上述的示例性实施例中,如图1b所示,f1、f2、f3、f4分别为深度二次元树的根节点21、枝节点23、枝节点22、叶子节点24学习得到的最优npd,[θ11,θ12]、[θ21,θ22]、[θ31,θ32]、[θ41,θ42]为学习得到的分裂阈值。深度二次元树可以经学习得到各个节点的最优npd以及分裂阈值。每个深度二次元树可以作为一个弱分类器,每次迭代可以得到一个弱分类器(深度二次元树),多个次迭代得到的多个弱分类器可以构成一个强分类器。

在一个示例性实施例中,可以采用adaboost算法训练分类器,学习最有区分力的特征,构建强分类器,并采用gentleadaboost算法来学习基于npd的深度二次元树。这样可以提高人脸检测的准确度。

在另一个示例性实施例中,一个级联分类器被进一步学习用于人脸检测。而且,还可以用软级联结构来快速学习和排除负样本。软级联可以看作一个adaboost分类器,每个弱分类器有一个终点。每个迭代过程中,一个深度二次元树作为弱分类器被学习,当前adaboost分类器的阈值也被学习。adaboost分类器的阈值用于拒绝不包括人脸的负样本。多个弱分类器可以构成一个强分类器。

在步骤s304中,基于多个深度二次元树构建已训练的人脸检测器。多个深度二次元树中包括的最优npd构成所述第一npd组合。

当训练结束,可以将训练得到的多个深度二次元树构建为人脸检测器,其中,上述的多个深度二次元树的每个节点学习到的最优npd构成上述的第一npd组合。

本实施例中,通过包括人脸的第一正样本与不包括人脸的第一负样本对人脸检测器进行训练,可以得到用于检测人脸的最优npd组合,可以提高人脸检测的准确度。

图4是根据一示例性实施例三示出的人脸检测方法的流程图;本实施例利用本公开实施例提供的上述方法,以通过查表确定第一正样本与所述第一负样本各自对应的npd为例进行示例性说明,如图4所示,包括如下步骤:

在步骤s401中,将第一正样本与第一负样本各自对应的npd存储在查找表中。

在一个实施例中,第一正样本与第一负样本各自对应的npd可以事先完成计算,并存储在查找表,以供训练人脸检测器时调用。

在步骤s402中,确定包括人脸的第一正样本与不包括人脸的第一负样本组成的第一训练集。步骤s402与上述的步骤s301相似,在此不再赘述。

在步骤s403中,通过访问查找表确定第一正样本与第一负样本各自对应的npd。

在需要确定第一正样本与第一负样本各自对应的npd时,可以通过访问查找表确定。这样,可以提高训练人脸检测器的速度。

在步骤s404中,基于第一正样本与第一负样本各自对应的npd学习得到多个深度二次元树。所述深度二次元树经学习得到每个枝节点的最优npd;

在步骤s405中,基于多个深度二次元树构建已训练的人脸检测器。所述多个深度二次元树中包括的最优npd构成所述第一npd组合。

本实施例中的步骤s404~s405与上述的步骤s303~s304类似,在此不再赘述。

本实施例中,通过查表确定第一正样本与第一负样本各自对应的npd,可以提高人脸检测器的训练速度。

图5是根据一示例性实施例四示出的人脸检测方法的流程图;本实施例利用本公开实施例提供的上述方法,以如何对逻辑回归分类器进行训练为例进行示例性说明,如图5所示,包括如下步骤:

在步骤s501中,将包括人脸的第二正样本与不包括人脸的第二负样本组成的第二训练集输入未训练的逻辑回归分类器。

在步骤s502中,对未训练的逻辑回归分类器的预测函数中n维特征向量各自对应的参数进行训练。第二负样本为基于npd检测人脸失败的负样本,例如,比如将人脸识别成非人脸、将非人脸错识别成人脸的样本。

在上述的实施例中,如公式(2)、(3)所示,hθ(x)为预测函数,其中,θ0、θ1、…、θn为特征向量x1、x2、…、xn对应的参数,参数θ0、θ1、…、θn的值需要通过训练确定。

在本实施例中,采用基于npd检测人脸失败的负样本,不但可以提高训练效率,而且还可以克服基于npd检测人脸的缺陷,提高人脸检测的准确度。

在步骤s503中,确定预测函数的损伤函数值是否达到最小值。若是,则执行步骤504,若不是,则执行步骤502。具体是,当确定预测函数的损伤函数值达到最小值时,执行步骤504,当确定预测函数的损伤函数值未达到最小值时,执行步骤502。

在步骤s504中,当预测函数的损耗函数的值达到最小值时,确定预测函数中n维特征向量各自对应的参数符合预设条件。

在一个实施例中,训练过程中,可以利用预测函数的损伤函数值来衡量θ0、θ1、…、θn是否符合预设条件。当损伤函数值达到最小值时,θ0、θ1、…、θn的值为最佳参数值,视为符合预设条件,否则,继续训练,直至损伤函数值达到最小值。

在步骤s505中,在确定预测函数中n维特征向量各自对应的参数符合预设条件时,停止训练逻辑回归分类器,得到已训练的逻辑回归分类器。

本实施例中,采用基于npd检测人脸失败的负样本对逻辑回归分类器进行训练,不但可以提高训练效率,而且还可以克服基于npd检测人脸的缺陷,提高人脸检测的准确度。

图6是根据一示例性实施例示出的一种人脸检测装置的框图,如图6所示,人脸检测装置包括:

第一特征提取模块61,被配置为根据已训练的人脸检测器携带的用于表示人脸特征的第一归一化像素差值npd组合,提取待检测图像的第二npd组合;

回归处理模块62,被配置为通过所述人脸检测器对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域;

第二特征提取模块63,被配置为提取所述人脸区域的n维特征向量,n为自然数;

回归计算模块64,被配置为通过已训练的逻辑回归分类器对所述n维特征向量进行回归计算,得到所述人脸区域存在人脸的概率;

第一确定模块65,被配置为在所述存在人脸的概率大于预设阈值时确定所述人脸区域中存在人脸。

在一个实施例中,所述已训练的人脸检测器可携带所述第一npd组合中的npd顺序;

所述第一特征提取模块,还可被配置为根据所述第一npd组合以及所述npd顺序,提取所述第二npd组合;

所述回归处理模块,还可被配置为通过所述人脸检测器基于所述npd顺序对所述第二npd组合进行回归处理,得到所述待检测图像中的人脸区域。

图7a是根据一示例性实施例示出的另一种人脸检测装置的框图,如图7a所示,在上述图6所示实施例的基础上,在一实施例中,装置还可包括:

第二确定模块71,被配置为确定包括人脸的第一正样本与不包括人脸的第一负样本组成的第一训练集;

第三确定模块72,被配置为确定所述第一正样本与所述第一负样本各自对应的npd;

学习模块73,被配置为基于所述第一正样本与所述第一负样本各自对应的npd学习得到多个深度二次元树;所述深度二次元树经学习得到每个枝节点的最优npd;

构建模块74,被配置为基于所述多个深度二次元树构建所述已训练的人脸检测器;所述多个深度二次元树中包括的最优npd构成所述第一npd组合。

图7b是根据一示例性实施例示出的另一种人脸检测装置的框图,如图7b所示,在上述图7a所示实施例的基础上,在一实施例中,装置还可包括:

存储模块75,被配置为将所述第一正样本与所述第一负样本各自对应的npd存储在查找表中。

在本实施例中,所述第三确定模块72,还被配置为通过访问所述查找表确定所述第一正样本与所述第一负样本各自对应的npd。

图8a是根据一示例性实施例示出的另一种人脸检测装置的框图,如图8a所示,在上述图6所示实施例的基础上,在一实施例中,装置还可包括:

输入模块81,被配置为将包括人脸的第二正样本与不包括人脸的第二负样本组成的第二训练集输入未训练的逻辑回归分类器;

训练模块82,被配置为对所述未训练的逻辑回归分类器的预测函数中n维特征向量各自对应的参数进行训练;所述第二负样本为基于npd检测人脸失败的负样本;

控制模块83,被配置为在确定所述预测函数中n维特征向量各自对应的参数符合预设条件时,停止训练所述逻辑回归分类器,得到所述已训练的逻辑回归分类器。

图8b是根据一示例性实施例示出的另一种人脸检测装置的框图,如图8b所示,在上述图8a所示实施例的基础上,在一实施例中,装置还可包括:

所述第四确定模块84,还被配置为确定所述预测函数的损伤函数值是否达到最小值;

所述第五确定模块85,还被配置为在所述预测函数的损耗函数的值达到最小值时,确定所述预测函数中n维特征向量各自对应的参数符合所述预设条件。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图9是根据一示例性实施例示出的一种人脸检测装置的框图。例如,装置900可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图9,装置900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(i/o)的接口912,传感器组件914,以及通信组件916。

处理组件902通常控制装置900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理部件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。

存储器904被配置为存储各种类型的数据以支持在设备900的操作。这些数据的示例包括用于在装置900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电力组件906为装置900的各种组件提供电力。电力组件906可以包括电源管理系统,一个或多个电源,及其他与为装置900生成、管理和分配电力相关联的组件。

多媒体组件908包括在所述装置900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当设备900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(mic),当装置900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。在一些实施例中,音频组件910还包括一个扬声器,用于输出音频信号。

i/o接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件914包括一个或多个传感器,用于为装置900提供各个方面的状态评估。例如,传感器组件914可以检测到设备900的打开/关闭状态,组件的相对定位,例如所述组件为装置900的显示器和小键盘,传感器组件914还可以检测装置900或装置900一个组件的位置改变,用户与装置900接触的存在或不存在,装置900方位或加速/减速和装置900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件916被配置为便于装置900和其他设备之间有线或无线方式的通信。装置900可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信部件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件916还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。

在示例性实施例中,装置900可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器904,上述指令可由装置900的处理器920执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1