一种基于集成卷积神经网络的年龄识别方法与流程

文档序号:12365449阅读:468来源:国知局
一种基于集成卷积神经网络的年龄识别方法与流程

本发明涉及一种图像处理技术领域,特别涉及一种基于集成卷积神经网络的年龄识别方法。



背景技术:

人脸年龄识别是根据采集的人脸图像,提取人脸图像的年龄特征,采用计算机图像处理等相关技术进行处理和分析,判断人脸图像所属年龄类别的一种计算机视觉技术。年龄识别问题在学术研究和商业应用方面有着广泛的应用前景,比如对于酒吧,网吧或私人会所等成年人的娱乐场所,通过年龄识别系统可以禁止未满18周岁的未成年人进入;对于销售香烟和酒的自动售货机,可以通过安装实时摄像头,实时得到顾客年龄类别,拒绝向未满18周岁的未成年人提供销售烟酒服务;在公共电脑服务中,比如电子阅览室,通过自动年龄识别系统拦截未成年人浏览成人信息的网站和其它限制性电影。另外在一些电子顾客管理系统中,在顾客登录的时候采集顾客的人脸图像并自动进行年龄识别,从而实现在不干扰顾客的情况下对不同年龄段的顾客消费偏好和购物特点进行收集以及后续顾客数据的分析和挖掘,根据后续的数据分析结果为不同年龄段的顾客提供个性化的产品或服务。在人机交互方面,可以为不同年龄段的用户提供符合年龄特点的人机交互界面以及进行权限控制。

目前有很多年龄识别的方法,大体上将年龄识别系统分为两个部分:人脸图像的特征提取和年龄分类的算法选择。而分类就是依靠机器学习算法来实现,效果比较显著的有支持向量机(SVM)、神经网络、K最近邻算法、高斯混合模型(GMM)、随机森林、集成学习等等。国内外学者在解决语音情感识别问题时,大都采用这些分类算法,但是这些分类算法极大地依赖于对人脸图像的特征提取,而目前采用的特征抽取方法是人工设计的,如主动外观模型、人脸测量模型等,再通过特征选择算法剔除冗余或者不相关的特征,得出最优或者次优特征子集,这一步骤的目的一方面是提高识别准确率,另一方面是降低特征的维数,从而提升模型训练速度。但是这个过程极大地依赖人工专家的经验,并且需要反复进行实验才能完成的,不仅工作量大,而且很难找到一种最优的人脸年龄特征表达,从而影响了人脸年龄识别的效果。



技术实现要素:

本发明的目的在于克服现有技术的缺点与不足,提供一种识别准确率高的基于集成卷积神经网络的年龄识别方法。

本发明的目的通过下述技术方案实现:一种基于集成卷积神经网络的年龄识别方法,其特征在于,步骤如下:

S1、获取年龄识别训练数据库中的训练子集并且对其进行扩充,得到扩充后的训练子集;选取出M个经过上述扩充后的训练子集训练得到的卷积神经网络分类器作为基分类器;

S2、获取待测人脸图像;

S3、在测试时,将待测人脸图像分别输入步骤S1获取到的M个基分类器,然后融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。

优选的,所述步骤S1中基分类器获取过程具体如下:

S11、将年龄识别训练库分成训练集和验证集;其中年龄识别训练库包括人脸图像以及各人脸图像对应年龄类别;

S12、对训练集进行N次随机抽样,得到N个训练子集;

S13、采用图像变换方法自动扩充步骤S12中得到N个训练子集,得到N个扩充后的训练子集;

S14、随机生成N个卷积神经网络模型,然后利用步骤S13中得到的N个扩充后的训练子集分别对N个卷积神经网络模型进行训练,得到N个卷积神经网络分类器;

S15、计算N个卷积神经网络分类器在年龄识别训练库验证集上的识别准确率;

S16、选择识别准确率排名前M的M个卷积神经网络分类器作为基分类器。

更进一步的,所述步骤S12中对训练集进行的N次随机抽样为放回随机抽样。

更进一步的,其特征在于,所述步骤S13中图像变换方法包括对训练子集的人脸图像进行图像旋转、图像RGB通道扰动和图像中添加高斯噪声。

更进一步的,使用Python图形处理库的函数对训练子集中人脸图像进行图像旋转变换。

优选的,所述M为6,即步骤S1中选取出6个卷积神经网络分类器作为基分类器,即包括6个基分类器。

更进一步的,6个基分类器分别为四层卷积层的卷积神经网络模型训练得到的第一基分类器、第二基分类器和第三基分类器以及三层卷积层的卷积神经网络模型训练得到的基分类器第四基分类器、第五基分类器和第六基分类器。

更进一步的,训练得到第一基分类器的四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv11、第一下采样层pool11、第二卷积层conv12、第二下采样层pool12、第三卷积层conv13、第四卷积层conv14、第三下采样层pool15、第一全连接层fc16和第二全连接层fc17;其中第一卷积层conv11层的卷积核个数96,卷积核大小为9*9;第二卷积层conv12层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv13层的卷积核个数为256,卷积核大小为5*5;第四卷积层conv14层的卷积核个数为256,卷积核大小为3*3;

训练得到第二基分类器的四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv21、第一下采样层pool21、第二卷积层conv22、第二下采样层pool22、第三卷积层conv23、第四卷积层conv24、第三下采样层pool15、第一全连接层fc26和第二全连接层fc27;第一卷积层conv21层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv22层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv23层的卷积核个数为256,卷积核大小为3*3;第四卷积层conv24的卷积核个数为384,卷积核大小为3*3;

训练得到第三基分类器的四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv31、第一下采样层pool31、第二卷积层conv32、第二下采样层pool32、第三卷积层conv33、第四卷积层conv34、第三下采样层pool35、第一全连接层fc36和第二全连接层fc37;第一卷积层conv31层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv32层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv33层的卷积核个数为512,卷积核大小为5*5;第四卷积层conv34层的卷积核个数为384,卷积核大小为3*3;

训练得到第四基分类器的3层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv41、第一下采样层pool41、第二卷积层conv42、第二下采样层pool42、第三卷积层conv43、第三下采样层pool45、第一全连接层fc46和第二全连接层fc47;第一卷积层conv41层的卷积核个数为96,卷积核大小为9*9;第二卷积层conv42层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv43层的卷积核个数为256,卷积核大小为5*5;

训练得到第五基分类器的3层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv51、第一下采样层pool51、第二卷积层conv52、第二下采样层pool52、第三卷积层conv53、第三下采样层pool55、第一全连接层fc56和第二全连接层fc57;第一卷积层conv51层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv52层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv53层的卷积核个数为384,卷积核大小为5*5;

训练得到第六基分类器的3层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv61、第一下采样层pool61、第二卷积层conv62、第二下采样层pool62、第三卷积层conv63、第三下采样层pool65、第一全连接层fc16和第二全连接层fc17;第一卷积层conv61层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv62层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv63层的卷积核个数为384,卷积核大小为3*3。

优选的,所述卷积神经网络分类器中的分类器采用SoftMax分类器。

优选的,所述步骤S3中采用简单投票融合方法融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。

本发明相对于现有技术具有如下的优点及效果:

(1)本发明方法首先选取出M个经过年龄识别训练数据库中的扩充后的训练子集训练得到的卷积神经网络分类器作为基分类器;然后将待测人脸图像输入至M个基分类器,最后融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。具有年龄识别准确率高,减少了人脸图象的年龄特征提取对人的依赖性,能够估计多种人群的年龄,以及应用广泛的优点。另外本发明方法中对卷积神经网络分类器进行训练的训练子集为扩充后的训练子集,扩充后的训练子集有效增大了训练子集中的样本数,能够充分的对卷积神经网络模型进行训练,进一步提高了卷积神经网络分类器针对年龄识别准确率。

(2)本发明方法随机生成N个卷积神经网络模型,利用年龄识别训练数据库中经过扩充后的训练子集训练随机生成的N个卷积神经网络模型,以获取到对应的卷积神经网络分类器,然后利用年龄识别训练数据库中的验证集验证各卷积神经网络分类器年龄识别的准确率,最后选取出年龄识别准确率排名前M的卷积神经网络分类器作为基分类器,能够大大提高本发明方法年龄识别准确率。

(3)本发明方法中选取出的基分类器可为多个结构不同的卷积神经网络模型训练得到的,本发明方法利用多个结构差异化的卷积神经网络模型集成识别,能够获得更好的人脸年龄识别性能,进一步提高年龄识别的准确率。

附图说明

图1是本发明方法基分类器生成框图。

图2是本发明方法中四层卷积层的卷积神经网络模型结构框图。

图3是本发明方法中三层卷积层的卷积神经网络模型结构框图。

图4是本发明方法中年龄识别阶段示意图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。

实施例

本实施例公开了一种基于集成卷积神经网络的年龄识别方法,步骤如下:

S1、获取年龄识别训练数据库中的训练子集并且对其进行扩充,得到扩充后的训练子集;选取出M个经过上述扩充后的训练子集训练得到的卷积神经网络分类器作为基分类器;本步骤中基分类器获取过程具体如下:

S11、将年龄识别训练库分成训练集和验证集;其中年龄识别训练库包括人脸图像以及各人脸图像对应年龄类别;

S12、对训练集进行N次随机放回抽样,得到N个训练子集;其中N的范围可以为5~500。

S13、采用图像变换方法自动扩充步骤S12中得到N个训练子集,得到N个扩充后的训练子集,分别为扩充训练子集1、扩充训练子集2,…,扩充训练子集N;

S14、随机生成N个卷积神经网络模型B_CNN_1,、、、,B_CNN_N,然后利用步骤S13中得到的N个扩充后的训练子集分别对N个卷积神经网络模型进行训练,得到N个卷积神经网络分类器CNN1,、、、,CNNN,具体如图1所示;本实施例中卷积神经网络分类器中的分类器采用SoftMax分类器;

S15、计算N个卷积神经网络分类器在年龄识别训练库验证集上的识别准确率;

S16、选择识别准确率排名前M的M个卷积神经网络分类器作为基分类器。

S2、获取待测人脸图像。

S3、在测试时,将待测人脸图像分别输入步骤S1获取到的M个基分类器,然后融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。本步骤中采用简单投票融合方法融合M个基分类器输出的年龄类别,获得最终的一个年龄类别。

本实施例上述步骤S13中所使用的图像变换方法包括对训练子集的人脸图像进行图像旋转、图像RGB通道扰动和图像中添加高斯噪声。

图像旋转:图像旋转是指围绕某一个点以顺时针或者逆时针方向对给定的输入人脸图像进行旋转一定的角度。本实施例中使用Python Imaging Library(Python图形处理库,PIL)库的函数对训练集中人脸图像进行旋转变换。

RGB通道扰动:RGB模型表示的图像采用三种基色R、G、B表示。自然界的任意一种颜色都可以通过R、G、B三种基色按照不同的比例组合而成。通过改变RGB每一个通道的值,可以产生原图像的不同的衍生图像,对原图像进行RGB值进行随机扰动。

添加高斯噪声:图像中的噪声主要是指对图像产生干扰的杂质,通过在图像中添加高斯噪声产生新的图像样本。

本实施例方法中,针对人脸图像所做的图像变换包括对训练子集的人脸图像进行顺时针旋转5°、逆时针旋转5°、对RGB的3个通道值分别进行扰动,以及添加高斯噪声变换操作,这样1张图像将增加6张图像,训练子集扩大为原来的7倍。

本本实施例上述步骤S1中M为6,即步骤S1中选取出6个卷积神经网络分类器作为基分类器,包括6个基分类器。

本实施例中6个基分类器分别为四层卷积层的卷积神经网络模型训练得到的第一基分类器CNN1、第二基分类器CNN2和第三基分类器CNN3以及三层卷积层的卷积神经网络模型训练得到的基分类器第四基分类器CNN4、第五基分类器CNN5和第六基分类器CNN6。如图2所示,本实施例四层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv1、第一下采样层pool1、第二卷积层conv2、第二下采样层pool2、第三卷积层conv3、第四卷积层conv4、第三下采样层pool5、第一全连接层fc6和第二全连接层fc7;如图3所示,本实施例三层卷积层的卷积神经网络模型输入层至输出层之间依次为第一卷积层conv1、第一下采样层pool1、第二卷积层conv2、第二下采样层pool2、第三卷积层conv3、第三下采样层pool5、第一全连接层fc6和第二全连接层fc7。

本实施例训练得到第一基分类器的四层卷积层的卷积神经网络模型B_CNN_1输入层至输出层之间依次为第一卷积层conv11、第一下采样层pool11、第二卷积层conv12、第二下采样层pool12、第三卷积层conv13、第四卷积层conv14、第三下采样层pool15、第一全连接层fc16和第二全连接层fc17;其中第一卷积层conv11层的卷积核个数96,卷积核大小为9*9;第二卷积层conv12层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv13层的卷积核个数为256,卷积核大小为5*5;第四卷积层conv14层的卷积核个数为256,卷积核大小为3*3。

训练得到第二基分类器的四层卷积层的卷积神经网络模型B_CNN_2输入层至输出层之间依次为第一卷积层conv21、第一下采样层pool21、第二卷积层conv22、第二下采样层pool22、第三卷积层conv23、第四卷积层conv24、第三下采样层pool15、第一全连接层fc26和第二全连接层fc27;第一卷积层conv21层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv22层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv23层的卷积核个数为256,卷积核大小为3*3;第四卷积层conv24的卷积核个数为384,卷积核大小为3*3。

训练得到第三基分类器的四层卷积层的卷积神经网络模型B_CNN_3输入层至输出层之间依次为第一卷积层conv31、第一下采样层pool31、第二卷积层conv32、第二下采样层pool32、第三卷积层conv33、第四卷积层conv34、第三下采样层pool35、第一全连接层fc36和第二全连接层fc37;第一卷积层conv31层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv32层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv33层的卷积核个数为512,卷积核大小为5*5;第四卷积层conv34层的卷积核个数为384,卷积核大小为3*3。

训练得到第四基分类器的3层卷积层的卷积神经网络模型B_CNN_4输入层至输出层之间依次为第一卷积层conv41、第一下采样层pool41、第二卷积层conv42、第二下采样层pool42、第三卷积层conv43、第三下采样层pool45、第一全连接层fc46和第二全连接层fc47;第一卷积层conv41层的卷积核个数为96,卷积核大小为9*9;第二卷积层conv42层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv43层的卷积核个数为256,卷积核大小为5*5。

训练得到第五基分类器的3层卷积层的卷积神经网络模型B_CNN_5输入层至输出层之间依次为第一卷积层conv51、第一下采样层pool51、第二卷积层conv52、第二下采样层pool52、第三卷积层conv53、第三下采样层pool55、第一全连接层fc56和第二全连接层fc57;第一卷积层conv51层的卷积核个数为128,卷积核大小为9*9;第二卷积层conv52层的卷积核个数为256,卷积核大小为7*7;第三卷积层conv53层的卷积核个数为384,卷积核大小为5*5。

训练得到第六基分类器的3层卷积层的卷积神经网络模型B_CNN_6输入层至输出层之间依次为第一卷积层conv61、第一下采样层pool61、第二卷积层conv62、第二下采样层pool62、第三卷积层conv63、第三下采样层pool65、第一全连接层fc16和第二全连接层fc17;第一卷积层conv61层的卷积核个数为96,卷积核大小为7*7;第二卷积层conv62层的卷积核个数为256,卷积核大小为5*5;第三卷积层conv63层的卷积核个数为384,卷积核大小为3*3。

本实施例卷积神经网络模型的卷积层的权值使用均值为0,方差为0.01的高斯分布函数进行随机初始化,全连接层Dropout的随机丢弃率分别设置为0.5,训练的Batchsize设置为128,momentum设置为0.9,初始学习率为0.01,迭代次数50000次。

如图4所示,本实施例中步骤S3中,将待测人脸图像分别输入第一基分类器CNN1、第二基分类器CNN2、第三基分类器CNN3、第四基分类器CNN4、第五基分类器CNN5和第六基分类器CNN6。然后采用简单投票融合方法融合这6个基分类器输出的年龄类别,实现对这6个基分类器输出的识别结果进行投票表决,得票最多的年龄类别就是该输入人脸图像的年龄类别,作为最终的一个年龄类别。本实施例方法集成卷积神经网络,就是利用多个结构差异化的卷积神经网络构成的分类器进行集成测试,以获得更好的年龄识别性能。

其中下表1为将数据集Adience和Gallagher分别作为年龄识别训练数据库时,采用本实施例年龄识别方法(集成+图像变换+CNNs)和采用现有技术中一些年龄识别方法识别时的准确率,其中准确率采用常用的WA准确率:

WA=(识别准确样本总数)/(所有测试样本总数);

表1

其中Adience数据集是Eran Eidinger等人在研究非实验室条件下的人脸图像的年龄和性别分类问题中创建的数据集。该数据集的图像都是现实生活环境下的真实图像,具有不同光照,不同姿态,不同背景和不同表情等因素的影响,对生产环境下的人脸年龄识别问题更有研究意义。Adience数据集将年龄分成0-2岁,4-6岁,8-12岁,25-32岁,38-43岁,48-53岁,>60岁共8个类别。Gallagher数据集是Andrew C.Gallagher等人从Flickr.com采集的照片,都是现实生活环境下的照片。同样地,这些图片具有不同光照,不同姿态,不同背景和不同表情等因素的影响,目前在非实验室条件下图像年龄识别问题的研究中得到广泛使用。Gallagher数据集将年龄分成0-2岁,3-7岁,8-12岁,13-19岁,20-36岁,37-65岁,>66岁共7个类别。从表1中可以看出,相比现有技术其他年龄识别方法,本实施例年龄识别方法的准确率最高。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1