一种基于深度学习的年龄估计方法与流程

文档序号:13472935阅读:3377来源:国知局
一种基于深度学习的年龄估计方法与流程

本发明涉及一种年龄估计方法,具体涉及一种基于深度学习的年龄估计模型设计方法,属于计算机视觉领域。



背景技术:

年龄估计技术作为计算机视觉的一个分支,近年来受到越来越多的关注。所谓年龄估计就是根据人脸图像,提取图像年龄特征,采用计算机视觉技术进行相关处理分析,判断人脸图像年龄的技术。通过对人脸图像准确的年龄预测,可以改变人们的生活习惯和方式,具有很重要的现实意义。日常生活方面可以通过年龄预测结果针对不同年龄人群提供精准服务,在人流拥挤区域快速标记幼儿和老人,方便特殊人群管理。越来越多的手机娱乐软件也加入年龄估计功能,准确的年龄估计结果能够提升用户的体验,利于软件推广。

人的年龄在不同时期呈现不一样的变化,并且是长期连续的过程。直观感受为轮廓变化、皮肤变化、五官变化等。通过面部图像对人的年龄进行估计面临诸多难题,年龄估计不是标准的多分类问题,不同的人在不同阶段给人的直观印象差别很大,更难通过图片就对人进行准确的估计;人脸数据库很难获取,人为主观标定也存在较大偏差;表情、环境、图像质量影响年龄估计的准确性。

年龄估计方法主要分为基于脸部形状和基于纹理特征的方法。基于脸部形状的方法关键在于关键点定位,如aam、acm算法,如果定位不准将影响年龄估计的效果,不同姿态、表情影响关键点定位。基于纹理特征的算法主要有lbp、gabor等算法,提取面部图像纹理特征,能够描述面部皱纹信息,图像质量、分辨率等影响该类算法的精度。近年来,深度学习算法经历快速发展期,随着大数据时代的到来以及gpu等各种更加强大的计算设备的发展,深度学习如虎添翼,不断颠覆语音识别、图像分类、文本理解等众多领域的算法设计思路。



技术实现要素:

本发明提出一种轻量级深度学习模型,其目的在于提升现有算法识别率低耗时的问题,尤其适用于低分辨率、有遮挡的人脸图像的年龄估计问题。

本发明是一种基于深度学习的年龄估计方法,包括如下步骤:

(1)构建年龄数据库,共超过50万张人脸图像,人工标定标签0-61岁,其中标签61代表60岁以上人群。该数据库全部为中国人脸数据,有效保证识别国内人脸图像的有效性。在保证图像数量的同时,该数据库扩大人脸图像广度,保证足够多的人在不同年龄段不同环境下的样本,而非同一人在同一场景下的大量样本。图像大部分为日常生活图片,包括不同姿态、分辨率、表情下的图像。相对于现有公开的年龄估计算法,本发明所构建的年龄库更能反应实际应用中所获取的人脸图像,保证最终所得到的年龄估计模型的泛化能力和鲁棒性。

(2)对已构建的年龄数据库图像进行预处理,包括人脸检测、关键点定位及对齐。

具体地,人脸检测技术为lbp+haar,mtcnn等;关键点定位及对齐采用aam,dlib等技术。

较佳地,对步骤(2)的预处理结果进行光照预处理。

(3)对齐后的图像统一大小归一化为64x64。

优选地,步骤(3)归一化后的图像转换为浮点型,像素值归一化到[01]。

(4)将步骤(3)得到的图像和对应的标签作为深度模型的输入,运用cnn卷积深度网络训练年龄估计模型。

具体地,该深度模型共包含4个卷积层,4个relu层,4个pooling层,两个全连接层。

(5)对测试图像按照步骤(2)、(3)依次进行预处理,然后输入到步骤(4)训练好的年龄估计模型,得出测试图像在各类标签上的相似度值。

(6)将步骤(5)得到的对应标签和相似度值相乘再相加,得到最终的年龄估计结果。

较优地,选择前n个最相似的标签,与标签对应的相似度求和相加。

该发明提供的年龄估计方法,得到的深度模型小,运行时间快,年龄估计识别率高。建立的超过50万张人脸年龄库,有效保证样本多样性,为深度模型训练提供数据支撑,该数据库包括大量小孩、老人样本,能够有效识别特殊人群的年龄。

附图说明

图1为人脸年龄数据库建立过程。

图2为本发明所建立的部分人库图像。

图3为本发明所采用深度学习模型结构。

具体实施方式

本发明为一种基于深度学习的年龄估计方法,包括前期数据库的建立,模型设计与训练,后期测试等步骤,具体实施方式如下:

(1)建立人脸年龄估计数据库。本发明所建立的人脸数据库包含60万张人脸图像,每张图像都有性别和年龄标签。年龄标签范围0-61,其中标签61表示60岁以上人群。图像来自网络和自采图像,部分来自视频。本发明整理样本模式如图1所示。互联网上收集各个年龄样本,主要来自婚恋网站和育儿网站,然后训练模型,对新下载的数据用模型分类,然后手工将年龄估计相差较大的图片重新标定,更新训练库,重新训练模型,如此反复更新训练样本集,提高模型准确率。

(2)训练样本的预处理。首先对下载的图像进行人脸检测,主要采用的检测算法有lbp+adaboost算法、于仕琪的人脸检测库和基于深度学习的mtcnn算法。然后对检测到的人脸进行关键点定位和人脸对齐,可以采用dlib算法库。人脸归一化时人脸宽度和高度选取为两眼距离的3倍。预处理后的人脸图像如图2所示。

(3)训练深度学习模型。将预处理好后的图像统一归一化大小为72x72的图像,训练的时候在72x72的图像上随机截取64x64大小的图像块,可以提高训练样本的数量,提高模型的稳定性和识别率。模型结构如图3。该模型共包含4个卷积层,4个relu层,4个pooling层,2个全连接层。该模型可采用caffe框架进行训练,输入64x64,第一层conv层卷积核大小5,个数为24,第二层卷积核大小3,个数为48,第三层卷积核大小为3,第四层卷积核大小为3,个数为96,第四层卷积核大小为3,个数为192。卷积核后跟relu层和pooling层,pooling层

采用maxpooling,核大小为2,在第4个pooling层后接全连接层,输出为192,后面再接全连接层,输出为62,即标签类别数。

(4)对训练好的年龄估计模型进行测试,本发明在自采集数据库上测试,自采集测试样本库共3万张图像,包括0-61岁各年龄段的人脸图像。首先对测试样本做如上预处理,然后将预处理好的图像作为训练好的深度模型的输入,模型输出为62个标签和相对应标签上的概率值。本发明不采用概率值最大的标签作为最后输出,而是采用将62个标签值和对应的概率值相乘再求和的方式,得到最终的年龄估计值。此方法得到的年龄估计结果更加稳定,波动范围更小。

本发明训练得到的年龄估计模型为1.5m,在pc上的运行的速度为4ms。在3万张自采集样本库上测试平均绝对误差为2.6。

尽管这里参照本发明的解释性实施例对本发明进行了描述,上述实施例仅为本发明较佳的实施方式,本发明的实施方式并不受上述实施例的限制,应该理解,本领域技术人员可以设计出很多其他的修改和实施方式,这些修改和实施方式将落在

本技术:
公开的原则范围和精神之内。



技术特征:

技术总结
本发明公开了一种基于深度学习的年龄估计方法,包括如下步骤:(1)构建年龄数据库。(2)对已构建的年龄数据库图像进行预处理。(3)对齐后的图像统一大小归一化为64x64。(4)将得到的图像和对应的标签作为深度模型的输入,运用CNN卷积深度网络训练年龄估计模型。(5)对测试图像输入年龄估计模型,得出测试图像在各类标签上的相似度值。(6)将得到的对应标签和相似度值相乘再相加,得到最终的年龄估计结果。该发明提供的年龄估计方法,得到的深度模型小,运行时间快,年龄估计识别率高。该数据库包括大量小孩、老人样本,能够有效识别特殊人群的年龄。

技术研发人员:曹艳艳;王昆
受保护的技术使用者:四川长虹电器股份有限公司
技术研发日:2017.09.26
技术公布日:2018.01.16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1