基于人脸图像的性别识别方法及装置与流程

文档序号:12601281阅读:303来源:国知局
基于人脸图像的性别识别方法及装置与流程

本发明属于图像识别技术领域,尤其涉及一种基于人脸图像的性别识别方法及装置。



背景技术:

人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,通常也叫做人像识别、面部识别。人脸识别产品已广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗及众多企事业单位等领域。例如,人脸识别门禁考勤系统和人脸识别防盗门,关于信息安全的计算机登录、电子政务和电子商务。随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。其中,基于图像的性别识别能够有效地辅助人脸识别,性别识别的准确性可以直接影响最终的人脸识别的精确性。

现有技术中,人脸图像性别识别的流程为:先进行人脸检测,然后人脸图像的特征提取,最后根据提取的特征通过分类器识别人脸图像的性别。由于成像设备的关系,图像不一定会清晰的反应人的完整面部,大部分的图像会出现模糊、强光、黑暗等不清晰的情况,或者图像中人物出现低头、侧脸等不能完全显示整个人脸的姿态,在这种复杂的成像条件下,现有技术单纯的提取人脸图像的特征是无法准确判别人物的性别的,进而会增加识别结果的错误率。



技术实现要素:

本发明实施例提供一种基于人脸图像的性别识别方法及装置,旨在解决由于外部成像因素的变化而导致的无法准确的提取人脸图像的特征,这样会增加识别的错误率的问题。

本发明实施例提供的一种基于人脸图像的性别识别方法,包括:通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到所述目标人脸图像对应的性别判别结果,其中所述目标人脸图像是由人脸图像中各关键部位区域组成的图像;通过比对所述目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到所述目标人脸图像对应的余弦比对结果;将所述性别判别结果和所述余弦比对结果进行贝叶斯分类器运算,得到所述人脸图像中对象的性别。

本发明实施例提供的一种基于人脸图像的性别识别装置,包括:性别判别模块用于通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到所述目标人脸图像对应的性别判别结果,其中所述目标人脸图像是由人脸图像中各关键部位区域组成的图像;比对处理模块用于通过比对所述目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到所述目标人脸图像对应的余弦比对结果;识别模块用于将所述性别判别结果和所述余弦比对结果进行贝叶斯分类器运算,得到所述人脸图像中对象的性别。

本发明实施例提供的基于人脸图像的性别识别方法及装置,通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到所述目标人脸图像对应的性别判别结果,其中所述目标人脸图像是由人脸图像中各关键部位区域组成的图像,通过比对所述目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到所述目标人脸图像对应的余弦比对结果,将所述性别判别结果和所述余弦比对结果进行贝叶斯分类器运算,得到所述人脸图像中对象的性别,这样在复杂的成像情况下,通过对人脸图像中各关键部位重新进行拼接,并将深度卷积神经网络判别和图像的特征比对相结合,能够利用人脸各关键部位区域的特征、深度纹理、边缘与颜色特征进行辅助识别,增加了性别识别的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。

图1是本发明第一实施例提供的基于人脸图像的性别识别方法的实现流程示意图;

图2是本发明第二实施例提供的基于人脸图像的性别识别方法的实现流程示意图;

图3是本发明实施例中人脸检测的示意图;

图4是本发明实施例中人脸图像的示意图;

图5是本发明实施例中由各关键部位区域重构得到的目标人脸图像的示意图;

图6是本发明第三实施例提供的基于人脸图像的性别识别装置的结构示意图;

图7是本发明第四实施例提供的基于人脸图像的性别识别装置的结构示意图。

图8是本发明第五实施例提供的基于人脸图像的性别识别方法的电子设备的硬件结构示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,图1为本发明第一实施例提供的基于人脸图像的性别识别方法的实现流程示意图,可应用于人脸考勤设备、人脸防盗系统、计算机等识别人脸图像的终端中。图1所示的基于人脸图像的性别识别方法,主要包括以下步骤:

S101、通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到该目标人脸图像对应的性别判别结果。

该目标人脸图像是由人脸图像中各关键部位区域组成的图像。该各关键部位区域可以是人脸各个器官部位的区域以及面部轮廓区域,此处对目标人脸图像中各关键部位区域不做限定。需要说明的是,人脸图像和目标人图像的关系为:该目标人脸图像是由该人脸图像中该各关键部位区域组成的图像。该人脸图像用于表示整体人脸的图像。

深度卷积神经网络为卷积神经网络(CNN,Convolutional Neural Networks,),是一种带有卷积结构的深度神经网络,至少包括两个非线性可训练的卷积层、两个非线性的固定卷积层和全连接层,一共至少5个隐含层,主要应用于语音分析以及图像识别领域。

通过深度卷积神经网络训练图像样本就可以得到先验模型,其中训练图像样本以得到先验模型的过程是按照预置的类别对图像样本进行分类的过程,其中先验模型可用于对图像进行分类判别的模型。

S102、通过比对该目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到该目标人脸图像对应的余弦比对结果。

在图像识别领域中,图像的特征是图像识别领域的专有名词,图像的特征的提取是计算机视觉和图像处理中的一个概念。

图像样本的特征可以存储在终端内置的存储模块中,也可以存储在云端服务器上。余弦相似度是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。

S103、将该性别判别结果和该余弦比对结果进行贝叶斯分类器运算,得到该人脸图像中对象的性别。

需要说明的是,该人脸图像中对象为该人脸图像中所描绘的人。贝叶斯分类器是通过贝叶斯公式计算出对象属于哪个类别概率的算法,贝叶斯分类器运算的原理是通过某对象的先验概率,利用贝叶斯公式计算出该对象的后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类别作为该对象所属的类别。

本发明实施例中是将该性别判别结果和该余弦比对结果作为人脸图像中对象的先验概率,通过贝叶斯公式计算出该对象所属于的男性类别和女性类别的后验概率,并选取具有最大后验概率的性别类别作为该对象的性别类别。

本发明实施例中,通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到该目标人脸图像对应的性别判别结果,其中该目标人脸图像是由人脸图像中各关键部位区域组成的图像,然后通过比对该目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到该目标人脸图像对应的余弦比对结果,最后将该性别判别结果和该余弦比对结果进行贝叶斯分类器运算,得到该人脸图像中对象的性别,这样在复杂的成像情况下,通过对人脸图像中各关键部位重新进行拼接,并将深度卷积神经网络判别和图像的特征比对相结合,能够利用人脸各关键部位区域的特征、深度纹理、边缘与颜色特征进行辅助识别,增加了性别识别的准确性。

请参阅图2,图2为本发明第二实施例提供的基于人脸图像的性别识别方法的实现流程示意图,可应用于人脸考勤设备、人脸防盗系统、计算机等识别人脸图像的终端中,主要包括以下步骤:

S201、根据人脸图像的各关键点在该人脸图像中的位置,提取该人脸图像中关键部位区域。

S202、根据该人脸图像中关键部位区域重构人脸的图像,得到该目标人脸图像。

该目标人脸图像是由人脸图像中各关键部位区域组成的图像。

可选地,在步骤S201之前还包括:通过人脸检测以及人脸关键点定位确定待识别图像中的人脸图像;将该待识别图像中的人脸图像设定为检测区域。

通过小波(HAAR)分类器或者DLIB(C++library)算法对输入的图像进行人脸检测,然后对检测后的图像通过监督式下降算法(SDM,Supervised Descent Method)进行人脸关键点定位,其中通过SDM算法定位的人脸关键点包括:眉毛、眼睛、鼻子、嘴巴和面部轮廓。当然人脸检测和人脸关键点定位也可以通过其他算法来实现。

HAAR分类器,包含自适应增强(Adaboost)算法,在图像识别领域中,分类器是指对人脸和非人脸进行分类的算法。DLIB是一种C++的算法库,可应用于人脸检测和人脸关键点定位。

图3为人脸检测的示意图,如图3所示,深黑色方形框为人脸检测框,圆形表示人脸,三角形表示动物,多边形表示树木,经过人脸检测可以在图像中提取人脸图像,并将人脸图像设置于人脸检测框内。

可选地,根据预置倍数扩大该检测区域,以使该人脸图像中包括头发区域的图像。根据预置倍数扩大该检测区域是将头发区域扩充到人脸图像中,扩大检测区域的方式可以是将整个检测区域进行扩大,也可以是将检测区域的上部、下部、左右两部分均扩大预置倍数,还可以只扩大该检测区域的上部和下部。该预置倍数与头发长度以及脑顶头发高度有关,本实施中优选的预置倍数的数值为0.15,即将该检测区域的上部和下部各扩大0.15倍。图4为人脸图像的示意图,其中图4(a)和图4(b)中长方形框以内为检测区域,图4(a)中的检测区域内包括扩大检测区域之前的人脸图像,图4(b)中的检测区域内包括扩大检测区域之后的人脸图像。

由于头发的颜色、长短以及发型是识别性别很重要的依据,所以人脸图像中包括头发区域可以更准确识别性别。

可选地,对该检测区域中眼睛区域进行矫正,以使该人脸图像中该眼睛区域内的双眼处于同一水平线上。矫正眼睛的方式不做限定,可以通过几何变换来矫正眼睛,也可以改变两个眼睛之间夹角来矫正眼睛,最终的目的是将该眼睛区域内的双眼处于同一水平线上。

人脸关键点包括:眼睛、鼻子、嘴巴、眉毛、头发以及面部轮廓,通过各关键点在该人脸图像中的位置,提取该人脸图像中关键部位区域。其中该人脸图像中关键部位区域包括:头发区域、眉毛区域、眼睛区域、鼻子区域、嘴巴区域。通过重构各关键部位区域得到的目标人脸图像可以更加精确的描绘不同性别的人脸的发型、皮肤以及面部轮廓等人脸的局部区域。

如图5所示,图5为由各关键部位区域重构得到的目标人脸图像的示意图。为了便于说明及显示,图5所示的示意图中关键部位区域仅包括眼睛区域、眉毛区域、鼻子区域和嘴巴区域,其他关键部位区域并没有显示在图5中,图5所示的示意图仅仅是一个举例,并不能对本发明中关键部位区域构成限定。

S203、通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到该目标人脸图像对应的性别判别结果。

深度卷积神经网络是一种带有卷积结构的深度神经网络,至少包括两个非线性可训练的卷积层、两个非线性的固定卷积层和全连接层,一共至少5个隐含层,主要应用于语音分析以及图像识别领域。此处对卷积神经网络、先验模型的解释说明请参照本发明第一实施例中相关描述,此处不做赘述。

可选地,通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到该目标人脸图像对应的性别判别结果,具体为:

通过该深度卷积神经网络中先验模型,对该目标人脸图像进行分类判别,得到该目标人脸图像对应的最大概率值以及该最大概率值对应的第一目标性别类别;

将该最大概率值和该第一目标性别类别作为所述性别判别结果。

该性别类别包括女性类别和男性类别。在深度卷积神经网络中对多个关键部位图像样本进行训练,训练后得到先验模型。通过深度卷积神经网络训练图像样本就可以得到先验模型,其中训练图像样本以得到先验模型的过程是按照预置的性别类别对图像样本进行分类的过程,其中先验模型可用于对图像进行分类判别的模型。该第一目标性别类别为男性类别或女性类别。

S204、通过比对该目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到该目标人脸图像对应的余弦比对结果。

该图像样本为由整体人脸图像样本中各关键部位区域组成的图像样本,其中该整体人脸图像样本中关键部位区域包括:头发区域、眉毛区域、眼睛区域、鼻子区域、嘴巴区域。该整体人脸图像样本中关键部位区域与该人脸图像中关键部位区域中包括的区域是对应的,即,若该整体人脸图像样本中包括眉毛区域,则该人脸图像中包括眉毛区域,若该整体人脸图像样本中包括眼镜区域,则该人脸图像中包括眼镜区域。重构后得到的图像样本的构成与图5所示的图像相似。从整体人脸图像样本中提取关键部位区域的方式与从人脸图像提取关键部位区域的提取方式相同,此处不做赘述。同样的,重构得到图像样本的重构方式与重构得到目标人脸图像的重构方式相同,此处不做赘述。

该余弦相似度是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。

可选地,通过比对该目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到该目标人脸图像对应的余弦比对结果,具体为:

通过将该目标人脸图像的特征与图像样本的特征之间进行余弦相似度比对,得到该目标人脸图像对应的多个余弦相似度值;

按照该余弦相似度值由高到低的顺序,选取预置数目的目标人脸图像样本;

对该目标人脸图像样本的性别类别进行数量统计,并将数量最多的性别类别作为第二目标性别类别;

在该目标人脸图像样本中选取性别类别为该第二目标性别类别的相似人脸图像样本,并提取该相似人脸图像样本与该目标人脸图像之间的余弦相似度值作为目标余弦相似度值;

计算该目标余弦相似度值的平均值;

将该第二目标性别类别和所述平均值作为该余弦比对结果。

余弦相似度值的数值越大,表示相似度越高。首先根据算出的余弦相似度值,将图像样本,按照相似度由高到底的顺序进行排列,然后由相似度高开始,选取出预置数目的目标人脸图像样本。预置数目任意选取,当然选取的数目多,则最后判别的准确性就会提高。本实施例优选的预置数目为20个。

对该目标人脸图像样本的性别类别进行数量统计,并将样本数量最多的性别类别作为目标性别类别,如果该目标人脸图像样本中男性类别的样本的数量多,则目标性别类别为男性;如果该目标人脸图像样本中女性类别的样本的数量多,则目标性别类别为女性。若目标性别类别为男性,则选取目标人脸图像样本中男性的图像样本作为相似人脸图像样本,若目标性别类别为女性,则选取目标人脸图像样本中女性的图像样本作为相似人脸图像样本。

下面以一个具体例子来说明,如何根据目标人脸图像的特征与图像样本的特征之间余弦相似度比对来识别对象的性别,具体说明如下:

为了便于说明,设5个图像样本的特征分别为:样本1、样本2、样本3、样本4、样本5,该目标人脸图像为图像1,预置数目为3;设,样本1的性别类别为男性,样本2的性别类别为女性,样本3的性别类别为男性,样本4的性别类别为女性,样本5的性别类别为男性。

将图像1的特征分别与样本1-5的特征进行余弦相似度比对;

算出图像1与样本1之间的余弦相似度值为数值1,算出图像1与样本2之间的余弦相似度值为数值2,算出图像1与样本3之间的余弦相似度值为数值3,算出图像1与样本4之间的余弦相似度值为数值4,算出图像1与样本5之间的余弦相似度值为数值5,其中数值5>数值3>数值4>数值1>数值2;

按照上述算出的余弦相似度值由高到低的顺序,选取预置数目的目标人脸图像样本为样本5、样本3和样本4;

对该目标人脸图像样本的性别类别进行数量统计,男性类别的样本个数为2个,女性类别的样本个数为1个,则男性类别为第二目标性别类别;

确定男性类别的目标人脸图像样本为样本5和样本3,并算出数值5和数值3的平均值1;

将平均值1和第二目标性别类别作为该余弦比对结果。

S205、将该性别判别结果和该余弦比对结果进行贝叶斯分类器运算,得到该人脸图像中对象的性别。

贝叶斯分类器是通过贝叶斯公式计算出对象属于哪个类别概率的算法,贝叶斯分类器运算的原理是通过某对象的先验概率,利用贝叶斯公式计算出该对象的后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类别作为该对象所属的类别。

本发明实施例中是将该性别判别结果和该余弦比对结果作为人脸图像中对象的先验概率,通过贝叶斯公式计算出该对象的属于男性类别和女性类别的后验概率,并选取具有最大后验概率的性别类别作为该对象的性别类别。

本发明实施例中,根据人脸图像的各关键点在该人脸图像中的位置,提取该人脸图像中关键部位区域,根据该人脸图像中关键部位区域重构人脸的图像,得到该目标人脸图像,通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到该目标人脸图像对应的性别判别结果,通过比对该目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到该目标人脸图像对应的余弦比对结果,最后将该性别判别结果和该余弦比对结果进行贝叶斯分类器运算,得到该人脸图像中对象的性别,这样在复杂的成像情况下,通过对人脸图像中各关键部位重新进行拼接,并将深度卷积神经网络判别和图像的特征比对相结合,能够利用人脸各关键部位区域的特征、深度纹理、边缘与颜色特征进行辅助识别,增加了性别识别的准确性。

请参阅图6,图6是本发明第三实施例提供的基于人脸图像的性别识别装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。图6示例的基于人脸图像的性别识别装置可以是前述图1所示实施例提供的基于人脸图像的性别识别方法的执行主体,可以是终端或终端中的一个控制模块。图6示例的基于人脸图像的性别识别装置,主要包括:性别判别模块601、比对处理模块602和识别模块603。以上各功能模块详细说明如下:

性别判别模块601,用于通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到该目标人脸图像对应的性别判别结果;

比对处理模块602,用于通过比对该目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到该目标人脸图像对应的余弦比对结果;

识别模块603,用于将该性别判别结果和该余弦比对结果进行贝叶斯分类器运算,得到该人脸图像中对象的性别。

该目标人脸图像是由人脸图像中各关键部位区域组成的图像。该各关键部位区域可以是人脸各个器官部位的区域以及面部轮廓区域,此处对目标人脸图像中各关键部位区域不做限定。需要说明的是,人脸图像和目标人图像的关系为:该目标人脸图像是由该人脸图像中该各关键部位区域组成的图像。该人脸图像用于表示整体人脸的图像。

深度卷积神经网络是一种带有卷积结构的深度神经网络,至少包括两个非线性可训练的卷积层、两个非线性的固定卷积层和全连接层,一共至少5个隐含层,主要应用于语音分析以及图像识别领域。

通过深度卷积神经网络训练图像样本就可以得到先验模型,其中训练图像样本以得到先验模型的过程是按照预置的类别对图像样本进行分类的过程,其中先验模型可用于对图像进行分类判别的模型。

在图像识别领域中,图像的特征是图像识别领域的专有名词,图像的特征的提取是计算机视觉和图像处理中的一个概念。

图像样本的特征可以存储在终端内置的存储模块中,也可以存储在云端服务器上。余弦相似度是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。需要说明的是,该人脸图像中对象为该人脸图像中所描绘的人。

贝叶斯分类器是通过贝叶斯公式计算出对象属于哪个类别概率的算法,贝叶斯分类器运算的原理是通过某对象的先验概率,利用贝叶斯公式计算出该对象的后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类别作为该对象所属的类别。本发明实施例中是将该性别判别结果和该余弦比对结果作为人脸图像中对象的先验概率,通过贝叶斯公式计算出该对象所属于的男性类别和女性类别的后验概率,并选取具有最大后验概率的性别类别作为该对象的性别类别。

需要说明的是,以上图6示例的基于人脸图像的性别识别装置的实施方式中,各功能模块的划分仅是举例说明,实际应用中可以根据需要,例如相应硬件的配置要求或者软件的实现的便利考虑,而将上述功能分配由不同的功能模块完成。而且,实际应用中,本实施例中的相应的功能模块可以是由相应的硬件实现,也可以由相应的硬件执行相应的软件完成。本说明书提供的各个实施例都可应用上述描述原则,以下不再赘述。

本发明实施例中,性别判别模块602通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到该目标人脸图像对应的性别判别结果,其中所述目标人脸图像是由人脸图像中各关键部位区域组成的图像,比对处理模块603通过比对该目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到该目标人脸图像对应的余弦比对结果,识别模块604将该性别判别结果和该余弦比对结果进行贝叶斯分类器运算,得到该人脸图像中对象的性别,这样在复杂的成像情况下,通过对人脸图像中各关键部位重新进行拼接,并将深度卷积神经网络判别和图像的特征比对相结合,能够利用人脸各关键部位区域的特征、深度纹理、边缘与颜色特征进行辅助识别,增加了性别识别的准确性。

请参阅图7,本发明第四实施例提供的基于人脸图像的性别识别装置的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部分。图7示例的基于人脸图像的性别识别装置可以是前述图2所示实施例提供的基于人脸图像的性别识别方法的执行主体,可以是终端或终端中的一个控制模块。图7示例的基于人脸图像的性别识别装置,主要包括:提取模块701、重构模块702、性别判别模块703、比对处理模块704、识别模块705,其中性别判别模块703包括:判别模块7031和设定模块7032;比对处理模块704包括:比对模块7041、选取模块7042、统计模块7043和设置模块7044。以上各功能模块详细说明如下:

提取模块701,用于根据人脸图像的各关键点在该人脸图像中的位置,提取该人脸图像中关键部位区域。

重构模块702,用于根据该人脸图像中关键部位区域重构人脸的图像,得到该目标人脸图像。

该目标人脸图像是由人脸图像中各关键部位区域组成的图像。

可选地,该装置还包括:确定模块用于通过人脸检测以及人脸关键点定位确定待识别图像中的人脸图像;该确定模块还用于将该待识别图像中的人脸图像设定为检测区域。

通过HAAR分类器或者DLIB算法对输入的图像进行人脸检测,然后对检测后的图像通过SDM算法进行人脸关键点定位,其中通过SDM算法定位的人脸关键点包括:眉毛、眼睛、鼻子、嘴巴和面部轮廓。当然人脸检测和人脸关键点定位也可以通过其他算法来实现。

HAAR分类器,包含Adaboost算法,在图像识别领域中,分类器是指对人脸和非人脸进行分类的算法。DLIB是一种C++的算法库,可应用于人脸检测和人脸关键点定位。

图3为人脸检测的示意图,如图3所示,深黑色方形框为人脸检测框,圆形表示人脸,三角形表示动物,多边形表示树木,经过人脸检测可以在图像中提取人脸图像,并将人脸图像设置于人脸检测框内。

可选地,该装置还包括扩大模块用于根据预置倍数扩大该检测区域,以使该人脸图像中包括头发区域的图像。扩大模块根据预置倍数扩大该检测区域是将头发区域扩充到人脸图像中,扩大检测区域的方式可以是将整个检测区域进行扩大,也可以是将检测区域的上部、下部、左右两部分均扩大预置倍数,还可以只扩大该检测区域的上部和下部。该预置倍数与头发长度以及脑顶头发高度有关,本实施中优选的预置倍数的数值为0.15,即将该检测区域的上部和下部各扩大0.15倍。图4为人脸图像的示意图,其中图4(a)和图4(b)中长方形框以内为检测区域,图4(a)中的检测区域内包括扩大检测区域之前的人脸图像,图4(b)中的检测区域内包括扩大检测区域之后的人脸图像。

由于头发的颜色、长短以及发型是识别性别很重要的依据,所以人脸图像中包括头发区域可以更准确识别性别。

可选地,该装置还包括矫正模块用于对该检测区域中眼睛区域进行矫正,以使该人脸图像中该眼睛区域内的双眼处于同一水平线上。矫正眼睛的方式不做限定,可以通过几何变换来矫正眼睛,也可以改变两个眼睛之间夹角来矫正眼睛,最终的目的是将该眼睛区域内的双眼处于同一水平线上。

人脸关键点包括:眼睛、鼻子、嘴巴、眉毛、头发以及面部轮廓,提取模块701通过各关键点在该人脸图像中的位置,提取该人脸图像中关键部位区域。其中该人脸图像中关键部位区域包括:头发区域、眉毛区域、眼睛区域、鼻子区域、嘴巴区域。通过重构模块702重构各关键部位区域得到的目标人脸图像可以更加精确的描绘不同性别的人脸的发型、皮肤以及面部轮廓等人脸的局部区域。

如图5所示,图5为由各关键部位区域重构得到的目标人脸图像的示意图。为了便于说明及显示,图5所示的示意图中关键部位区域仅包括眼睛区域、眉毛区域、鼻子区域和嘴巴区域,其他关键部位区域并没有显示在图5中,图5所示的示意图仅仅是一个举例,并不能对本发明中关键部位区域构成限定。

性别判别模块703,用于通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到该目标人脸图像对应的性别判别结果。

可选地,性别判别模块703包括:判别模块7031和设定模块7032;

判别模块7031,用于通过该深度卷积神经网络中先验模型,对该目标人脸图像进行分类判别,得到该目标人脸图像对应的最大概率值以及该最大概率值对应的第一目标性别类别;

设定模块7032,用于将该最大概率值和该第一目标性别类别作为所述性别判别结果。

该第一目标性别类别为男性类别或女性类别。深度卷积神经网络是一种带有卷积结构的深度神经网络,至少包括两个非线性可训练的卷积层、两个非线性的固定卷积层和全连接层,一共至少5个隐含层,主要应用于语音分析以及图像识别领域。此处对卷积神经网络、先验模型的解释说明请参照本发明第一实施例中相关描述,此处不做赘述。

比对处理模块704,用于通过比对该目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到该目标人脸图像对应的余弦比对结果。

该图像样本为由整体人脸图像样本中各关键部位区域组成的图像样本,其中该整体人脸图像样本中关键部位区域包括:头发区域、眉毛区域、眼睛区域、鼻子区域、嘴巴区域。该整体人脸图像样本中关键部位区域与该人脸图像中关键部位区域中包括的区域是对应的,即,若该整体人脸图像样本中包括眉毛区域,则该人脸图像中包括眉毛区域,若该整体人脸图像样本中包括眼镜区域,则该人脸图像中包括眼镜区域。重构后得到的图像样本的构成与图5所示的图像相似。从整体人脸图像样本中提取关键部位区域的方式与从人脸图像提取关键部位区域的提取方式相同,此处不做赘述。同样的,重构得到图像样本的重构方式与重构得到目标人脸图像的重构方式相同,此处不做赘述。

该余弦相似度是用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小的度量。

可选地,比对处理模块704包括:比对模块7041、选取模块7042、统计模块7043、计算模块7044和设置模块7045。

比对模块7041,用于通过将该目标人脸图像的特征与图像样本的特征之间进行余弦相似度比对,得到该目标人脸图像对应的多个余弦相似度值;

选取模块7042,用于按照该余弦相似度值由高到低的顺序,选取预置数目的目标人脸图像样本;

统计模块7043,用于对该目标人脸图像样本的性别类别进行数量统计,并将数量最多的性别类别作为第二目标性别类别;

选取模块7042,还用于在该目标人脸图像样本中选取性别类别为该第二目标性别类别的相似人脸图像样本,并提取该相似人脸图像样本与该目标人脸图像之间的余弦相似度值作为目标余弦相似度值;

计算模块7044,用于计算该目标余弦相似度值的平均值;

设置模块7045,用于将该第二目标性别类别和所述平均值作为该余弦比对结果。

余弦相似度值的数值越大,表示相似度越高。预置数目任意选取,当然选取的数目多,则最后判别的准确性就会提高。本实施例优选的预置数目为20个。

统计模块7043对该目标人脸图像样本的性别类别进行数量统计,并将样本数量最多的性别类别作为目标性别类别,如果该目标人脸图像样本中男性类别的样本的数量多,则目标性别类别为男性;如果该目标人脸图像样本中女性类别的样本的数量多,则目标性别类别为女性。若目标性别类别为男性,则选取模块7042选取目标人脸图像样本中男性的图像样本作为相似人脸图像样本,若目标性别类别为女性,则选取模块7042选取目标人脸图像样本中女性的图像样本作为相似人脸图像样本。

识别模块705,用于将该性别判别结果和该余弦比对结果进行贝叶斯分类器运算,得到该人脸图像中对象的性别。

贝叶斯分类器是通过贝叶斯公式计算出对象属于哪个类别概率的算法,贝叶斯分类器运算的原理是通过某对象的先验概率,利用贝叶斯公式计算出该对象的后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类别作为该对象所属的类别。

本发明实施例中是将该性别判别结果和该余弦比对结果作为人脸图像中对象的先验概率,识别模块705通过贝叶斯公式计算出该对象的属于男性类别和女性类别的后验概率,并选取具有最大后验概率的性别类别作为该对象的性别类别。

本发明实施例中,提取模块701根据所述人脸图像的各关键点在所述人脸图像中的位置,提取所述人脸图像中关键部位区域,其中所述人脸图像中关键部位区域包括:头发区域、眉毛区域、眼睛区域、鼻子区域、嘴巴区域,重构模块702根据所述人脸图像中关键部位区域重构人脸的图像,得到所述目标人脸图像,,性别判别模块703通过预置的深度卷积神经网络中先验模型,对目标人脸图像进行性别分类判别,得到所述目标人脸图像对应的性别判别结果,其中所述目标人脸图像是由人脸图像中各关键部位区域组成的图像,然后比对处理模块704通过比对所述目标人脸图像的特征与图像样本的特征之间的余弦相似度,得到所述目标人脸图像对应的余弦比对结果,最后识别模块705将该性别判别结果和该余弦比对结果进行贝叶斯分类器运算,得到该人脸图像中对象的性别,这样在复杂的成像情况下,通过对人脸图像中各关键部位重新进行拼接,并将深度卷积神经网络判别和图像的特征比对相结合,能够利用人脸各关键部位区域的特征、深度纹理、边缘与颜色特征进行辅助识别,增加了性别识别的准确性。

图8是本发明第五实施例提供的基于人脸图像的性别识别方法的电子设备的硬件结构示意图,如图8所示,该电子设备包括:

一个或多个处理器810以及存储器820,图8中以一个处理器810为例。

该电子设备还可以包括:输入装置830和输出装置840。

处理器810、存储器820、输入装置830和输出装置840可以通过总线或者其他方式连接,图8中以通过总线850连接为例。

存储器820作为一种非易失性计算机可读存储介质,可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块,如本申请实施例中的数据存储方法对应的程序指令/模块(例如,附图6所示的性别判别模块601、比对处理模块602和识别模块603)。处理器810通过运行存储在存储器820中的非易失性软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例的基于人脸图像的性别识别方法。

存储器820可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于人脸图像的性别识别装置的使用所创建的数据等。此外,存储器820可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实施例中,存储器820可选包括相对于处理器810远程设置的存储器,这些远程存储器可以通过网络连接至基于人脸图像的性别识别装置。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入装置830可接收输入的数字或字符信息,以及产生与基于人脸图像的性别识别装置的用户设置以及功能控制有关的键信号输入。输出装置840可包括显示屏等显示设备。

所述一个或者多个模块存储在所述存储器820中,当被所述一个或者多个处理器810执行时,执行上述任意方法实施例中的基于人脸图像的性别识别方法。

上述产品可执行本申请实施例所提供的方法,具备执行方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本申请实施例所提供的方法。

本发明实施例的电子设备以多种形式存在,包括但不限于:

(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机、多媒体手机、功能性手机,以及低端手机等。

(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:掌上电脑(PDA Personal Digital Assistant)、移动互联网设备(MID,Mobile Internet Device)和超级移动个人计算机(UMPC,Ultra-mobile Personal Computer)设备等。

(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器,掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。

(4)服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

(5)其他具有数据交互功能的电子装置。

在本申请所提供的多个实施例中,应该理解到,所揭露的系统、终端和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信链接可以是通过一些接口,模块的间接耦合或通信链接,可以是电性,机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。

所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本发明所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上为对本发明所提供的基于人脸图像的性别识别方法及装置的描述,对于本领域的技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上,本说明书内容不应理解为对本发明的限制。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1