一种性别识别方法

文档序号:6575034阅读:555来源:国知局
专利名称:一种性别识别方法
技术领域
本发明涉及一种性别识别方法,属于图像处理技术领域。
背景技术
近年来,随着人脸识别技术研究的深入,基于人脸图像的性别识别已经成为计算机生物识别领域中热门的研究课题之一。性别识别是让计算机根据输入的人的图像信息判断性别的过程,在人工智能、系统监控、模式识别等方面有着重要的前景。应当理解,性别识别在身份识别与验证中可以充当“过滤器”,利用检测出来的性别信息显著降低身份识别的图片搜索数量,提高身份认证识别速度与精度。性别识别技术领域是人脸图像识别中被较早提出的识别领域,国内外对此也进行了大量的研究,常用的性别识别的方法有1.基于人工神经网络的性别识别。由B. A. Golomb率先提出,后续如S. C. Yen等人提出改进,正确识别率可达88. 7%。其根据提取出的人脸特征训练神经网络,再利用训练好的神经网络识别人的性别。2.基于支持向量机的性别识别。其将得到的人脸图像缩小为21*21的图像,训练支持向量机,或将利用AAM得提取的特征训练支持向量机,再利用训练好的支持向量机识别人的性别。3.基于Adaboost的性别识别,也称为Adaoost分类方法。其提取图像的Haar特征,训练Adaboost分类器,再利用训练好的Adaboost识别人的性别。以上所采取的方法都是仅仅利用了图像的部分信息,当其中的部分信息被干扰时,势必会影响其识别率,因此,上述的几种方法存在识别率不高、识别率易受干扰的缺点。而图像中的多路信息,当一部分信息被干扰时,综合所有信息可以相对有效的消除干扰,因此,这在单一的信息无法满足识别需要时,发明人认为可以考虑融合信息,以提高性别的识别率。

发明内容
因此,本发明从融合多路信息的角度入手,采用一种新的性别识别的路径,而提出一种识别率可以被接受的性别识别方法。本发明采用以下技术方案
一种性别识别方法,基于同样规格的样本按照选定的多个子特征训练,输出基于每个子特征识别的性别识别结果;
输入待识别的图片,归一到所述规格,识别归一后的所述图片每一子特征识别的性别识别结果,信息融合的方式为求和该图片的基于各子特征的性别识别结果,取优势的性别识别结果之和对应的性别输出。依据本发明的上述性别识别方法,把得到的多个一次识别信息进行二次融合,得到最终的识别结果,信息融合充分利用了各个一次识别结果,形成信息互补,有效地消除了干扰,具有很好的应用效果。其应用可以大大提高性别是别的鲁棒性,且对光照等干扰有很好的适应性,从而获得更好的识别率。上述性别识别方法,,所述规格为截取的人脸区域大小为MXN的尺寸规格,且含有两瞳孔间距的规格,据此行列均分该人脸,生成网格,得到匹配数目的网格点;
基于每个网格点提取人脸子特征,利用每个子特征信息和预先知道的男女信息,应用学习算法进行学习,输出训练结果。上述性别识别方法,提取人脸子特征的方法是,首先截取对应网格点的预定邻域,形成一个Ml XNI子区域,进而得到Ml XNI列的向量。上述性别识别方法,M1、N1的取值范围均为[10,15]。上述性别识别方法,所述性别识别结果为y={0,1},其中O代表女,I代表男,或者输出y={p,q},其中P为女的概率,q为男的概率,O
^ P ^ I, O ^ q ^ I ;
相应地,信息融合的方式对于输出结果为y={0,l}的分类方法采用对比输出分类为O与分类为I的个数;
信息融合的方式对于输出结果为y={p,q}分类方法采用概率加权的方法
P= {pl, p2, p3, p4,…,pK}和 Q= {ql, q2, q3, q4, ...,qK},其中 K 为网格点个数,P 为判定为女的概率集合,Q为判定为男的概率组合;
计算为女的概率为p=sum(P)/K,为男的概率为q=sum(Q)/K,其中sum代表求和;若p>q,则认定是女,否则 为男。上述性别识别方法,所述网格划分方法是宽m等分,高η等分,其中m、η均为自然数,且m e [4,10],n e [3,8] 上述性别识别方法,所述规格包含截取人脸区域的内容,所述的人脸区域为整张人脸或选择眼睛、眉毛、鼻子、嘴巴中的一个或者多个。结合具体实施例对本发明进行更详细的说明,本发明的上述及其他目的和优点将更加显而易见。
具体实施例方式在以下的内容中,所涉及到的性别识别方法,表现在对图片多种信息的信息融合,其原理是将得到的多个一次识别信息进行二次融合,以二次融合的结果,作为最终的识别结果。当某些识别信息因为受到干扰而受到影响时,其他的一次识别信息在正确时,类同于剔除掉了不可用的识别信息,从而信息融合充分利用了各个一次识别结果,形成信息互补,因而具有很好的应用效果。进而可大大提高性别识别的鲁棒性,且对光照等干扰有很好的适应性,有很高的识别率。依据上述内容,提供一种性别识别方法,其包括步骤1.图片几何尺寸归一化,截取人脸区域,得到人脸区域的大小MXN;
归一化样本以及待处理的图片,使得相关信息具有相对统一的基础。1.1、在一些实施例中,几何尺寸归一化的方法可以是利用支持向量机来获得,通过大量样本的学习,定位人的两瞳孔位置;在较佳的实施例中,设定两瞳孔距离为64像素,设定两睛孔的中点为图片的中心点,将图片放缩到240X320的尺寸,在较佳的实施例中可以在获得较好识别率的情况下,计算量相对比较小;
1.2、在一些实施例中,截取的人脸区域可以是整张人脸,也可以是人脸的眼睛、眉毛、鼻子、嘴巴等关键特征,在选择局部特征时,尽可能选择性别区分度较大的部位,在区分度相对较小时,可以匹配多种部位进行区分,以满足信息融合的需要;
1.2、1、在一些较佳的实施例中,截取人脸区域可为整张人脸,区域宽度为100-150,区域高度为150-200,此方法较为充分的利用了人脸的全部信息;
1.2.2、在一些实施例中,截取人脸区域可为眉毛眼睛区域,截取区域的大小可为100X40,此方法利用了人脸的局部区域,但由于眉毛眼睛具有很好的区分度,也可具有很好的识别效果; 2.对选择的MXN区域的高和宽分别等距离划分网格,得到若干个网格点;
2.1、在一些实施例中,MXN区域的宽可以划分为m等份,m为自然数,m—般取M的1/10-1/4 ;经过大量的实验,m过大则容易包含过多的无效信息,造成识别率下降,m过小则容易遗漏关键信息,同样造成识别率下降,在这个区间内,可以获得较佳区分度;
2.2、在另一些实施例中,MXN区域的高可以划分为η等份,η为自然数,η 一般取N的1/8 —1/3,经过验证,η过大或过小也都将使识别率有不同程度的下降;
3、选取2Κ(K为自然数,一般取100-300张即可,可获得具有较好代表性的数据)张尺寸归一化的人脸图像,男女图像各K张,基于每个网格点提取人脸子特征,利用每个子特征信息和预先知道的男女信息,用学习算法进行学习;其中输入为网格点信息,输出为y={0,1},其中O代表女,I代表男,或者输出y={p,q},其中P为女的概率,q为男的概率,Oi
P-1j O^q^l;
3.1、在一些实施例中,每个网格点的子特征提取可以采用直接截取网格点周围MlXNl区域的方法,形成以网格点为中心的邻域,逐行排列得到I行Ml XNI列的向量,其中M1、N1均为自然数,此种方法简单明了,易于操作;
3.2、再进一步应用的一些实施例中,每个网格点的子特征提取可首先截取网格点周围MlXNl区域,再将Ml X NI区域的灰度值做归一化处理,最后逐行排列得到I行Ml XNl列的向量,此种方法通过归一化处理,将人脸灰度信息映射到同一尺度空间,可在一定程度上提高识别率;
3.3、优选地,每个网格点的子特征提取可首先截取网格点周围MlXNl区域,计算A(i, j)的灰度平均值AveGray和灰度方差VariGray,其中O s i〈Ml,O S j〈Nl,A(i,j)为MlXNl区域内对应位置上的灰度值,计算标准化的灰度值As(i, j) = ( A(i, j)_ AveGray) /VariGray,最后将标准化后的区域逐行排列得到I行MlXNl列的向量,此种方法可确保处理后区域的像素值均值为0,区域内像素信息近似满足标准正态分布;
上述3.1 — 3. 3中的Ml、NI均可取10 —15之间,过大或过小都会造成学习效果变差,经过验证在期望的识别率中上述范围可用,并可在上述范围中去的峰值;
应当理解,包括Ml、NI取值范围在内的范围基本满足一定参数效果的曲线,由此所延伸出效果较差的数值,属于其的简单变换,应当落入其保护范围之内。3.4根据3,机器学习方法可以是贝叶斯学习的方法,此时的识别结果可为实数P和q,其中P为是女的概率,Q为是男的概率,0 ρ 1,O < q <1:识别结果还可以是y={0,l},其中O代表女,I代表男;3.5根据3,机器学习方法可以是支持向量机学习的方法,此时的识别结果可为O或1,其中O代表女,I代表男;
3.6根据3,机器学习方法可以是神经网络学习的方法,此时的识别结果可为O或1,其中O代表女,I代表男;
4.对于一幅待识别的图像,通过上述步骤对图像预处理,将得到的多个网格点信息作为训练好的分类器的输入,分别得到其一次识别结果,最后通过信息融合的方式得到最终判断结果;更具体的步骤表示如下
4.1、若分类器的输出结果为y= {O,1},信息融合的方式可以采用择多判决的方法,为判断方便,选取网格点个数NUM可为奇数,NUM —般可为15 — 35之间的奇数,分别统计分类器输出为O的个数NUMQl和分类器为I的个数NUMQ2,若NUMQDNUMQ2,则为女,否则为男;
4.2、在一些实施例中,若分类器的输出结果为y= {p,q},信息融合的方式可以采用概率加权的方法。设网格点的输出结果为P={pl,p2,p3,p4,…,pK}和Q={ql,q2,q3,q4,...,qK},其中K为网格点个数,P为判定为女的概率集合,Q为判定为男的概率组合;最后计算为女的概率为P=sum(P)/K,为男的概率为q=sum(Q)/K,其中sum代表求和;若p>q,则认定是女,否则为男。下面结合更具体的实施例对上述方案作更具体的描述。实施方式一1.图像几何尺寸归一化,截取人脸区域;1.1.设定样本数量S=100000,采用支持向量机学习的方法,定位人的两瞳孔位置;设定两瞳孔距离为64像素,设定两瞳孔的中点为图片的中心点,将图片放缩到240X320的尺寸;1. 2对于n=100幅人脸图像,依次粗略估计能截取人脸区域的矩形大小Aj,并得到此矩形的左上角坐标(Xlj,yij)和右下角坐标(x2j,y2j),其中ISJ S ,分别计算两坐标点的均值
(X1, Y1)和(x2, y2),其中
权利要求
1.一种性别识别方法,其特征在于,基于同样规格的样本按照选定的多个子特征训练,输出基于每个子特征识别的性别识别结果; 输入待识别的图片,归一到所述规格,识别归一后的所述图片每一子特征识别的性别识别结果,信息融合的方式为求和该图片的基于各子特征的性别识别结果,取优势的性别识别结果之和对应的性别输出。
2.根据权利要求1所述的性别识别方法,其特征在于,所述规格为截取的人脸区域大小为MXN的尺寸规格,且含有两瞳孔间距的规格,据此行列均分该人脸,生成网格,得到匹配数目的网格点; 基于每个网格点提取人脸子特征,利用每个子特征信息和预先知道的男女信息,应用学习算法进行学习,输出训练结果。
3.根据权利要求2所述的性别识别方法,其特征在于,提取人脸子特征的方法是,首先截取对应网格点的预定邻域,形成一个Ml XNl子区域,进而得到Ml XNI列的向量。
4.根据权利要求3所述的性别识别方法,其特征在于,M1、N1的取值范围均为[10,15]。
5.根据权利要求1至4任一所述的性别识别方法,其特征在于,所述性别识别结果为7={0,1},其中0代表女,1代表男,或者输出y={p,q},其中p为女的概率,q为男的概率,0^p<l, 0<q<l; 相应地,信息融合的方式对于输出结果为y={0,l}的分类方法采用对比输出分类为0与分类为I的个数; 信息融合的方式对于输出结果为y={p,q}分类方法采用概率加权的方法P= {pl, p2, p3, p4,…,pK}和 Q= {ql, q2, q3, q4, ...,qK},其中 K 为网格点个数,P 为判定为女的概率集合,Q为判定为男的概率组合; 计算为女的概率为p=sum(P)/K,为男的概率为q=sum(Q)/K,其中sum代表求和;若p>q,则认定是女,否则为男。
6.根据权利要求2至4任一所述的性别识别方法,其特征在于,所述网格划分方法是宽m等分,高n等分,其中m、n均为自然数,且m G [4,10], n G [3,8]。
7.根据权利要求1所述的性别识别方法,其特征在于,所述规格包含截取人脸区域的内容,所述的人脸区域为整张人脸或选择眼睛、眉毛、鼻子、嘴巴中的一个或者多个。
全文摘要
本发明公开了一种性别识别方法,基于同样规格的样本按照选定的多个子特征训练,输出基于每个子特征识别的性别识别结果;输入待识别的图片,归一到所述规格,识别归一后的所述图片每一子特征识别的性别识别结果,信息融合的方式为求和该图片的基于各子特征的性别识别结果,取优势的性别识别结果之和对应的性别输出。依据本发明为一种新的性别识别方法,其识别率较高。
文档编号G06K9/62GK103034840SQ20121051511
公开日2013年4月10日 申请日期2012年12月5日 优先权日2012年12月5日
发明者张传锋, 许野平, 方亮, 曹杰, 刘辰飞 申请人:山东神思电子技术股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1