基于由全局到局部序数回归网络的人脸图像年龄估计方法

文档序号:34986397发布日期:2023-08-03 19:20阅读:25来源:国知局
基于由全局到局部序数回归网络的人脸图像年龄估计方法

本发明属于计算机视觉领域,提供一种基于由全局到局部序数回归网络的人脸图像年龄估计方法。主要涉及图像的分类问题;主要用于人机交互、机器视觉理解等方面。


背景技术:

1、年龄估计是一种基于人脸图像来预测真实年龄值或年龄群体的方法,它在视觉监控、人机交互、社交媒体、人脸检索等方面有着广泛的应用,是计算机视觉中的一个重要课题。虽然这一问题已被广泛研究多年,但从单一图像精确估计人类年龄仍然是非常具有挑战性的。

2、通过将年龄标签视为数值,可以将年龄估计转换为回归问题。但是,序数回归仍然具有挑战性,因为在许多情况下等级之间没有明确的区别。例如,在面部年龄估计中,由于基因,饮食和生活方式等众多因素,导致面部形状,大小和质地变化的衰老过程存在较大的个体差异,并且每个年龄段都没有明确的衰老特征。为了解决这个问题,本文提出了基于由全局到局部序数回归网络的人脸图像年龄估计方法,全局回归网络负责在整个年龄范围进行初步预测,局部回归网络学习特定年龄范围内的衰老特征,负责特定年龄范围的年龄预测。通过将全局回归网络和局部回归网络结合,在不增加网络设计复杂度的情况下,提高预测准确率,在afad数据集上取得了出色的结果。


技术实现思路

1、本发明的目的是针对现有技术的不足,提供一种基于由全局到局部序数回归网络的人脸图像年龄估计方法。本发明解决了现有序数回归网络在衰老特征差异不大情况下预测准确度较低的问题。

2、本发明首先对数据集中的人脸图像进行预处理,将原数据集中的年龄标签值转换为秩序标签;并对人脸图像进行多尺度人脸子块裁剪,能够更好地提取全局人脸信息和局部人脸信息,提取到更多与年龄密切相关的信息。对整个数据集进行k-means聚类分析,根据聚类结果,将整个数据集划分为多个局部数据域。然后将处理后的人脸图像输入到cnn网络中进行特征提取,本发明采用resnet-34作为特征提取骨干网络。通过构建秩一致性序数回归网络,对提取到的人脸特征进行年龄预测。将全局回归网络预测到的结果映射到局部年龄域中,利用对应的局部回归网络进行年龄预测,得到最终的预测结果。在构建序数回归网络时,通过共享除最后一层网络外的网络参数,解决了有序回归中秩不一致性的问题,提高了针对人脸年龄估计任务的准确率。

3、为了方便地描述本
技术实现要素:
,首先对一些术语进行定义。

4、定义1:卷积神经网络。卷积神经网络是一种前馈神经网络,包括卷积层和池化层,对于大型图像处理有出色表现。

5、定义2:序数回归:序数回归是用来估计一个物体的秩序。通过将回归问题转换为一系列二分类问题,由这一系列二分类结果来共同构成序数回归结果。

6、定义3:mae指标。mae指平均绝对误差,用来衡量预测值与真实值之间的平均绝对误差,定义如下:其中yi为真实标签,为模型预测标签。mae越小,说明模型越好。

7、本发明解决其技术问题所采用的技术方案如下:

8、步骤1:对数据集进行预处理;

9、获取afad数据集,afad数据集是一个由亚洲人面部图像组成的数据集,该数据集包含165501张面部图像,年龄范围为15-45岁。针对全部数据集,随机划选择70%的图像为训练集,10%的图像为验证集以及20%的图像为测试集。所有图像尺寸调整为256×256×3的像素。数据集的年龄标签调整为0-30的秩序标签;

10、步骤2:特征提取;

11、通过神经网络对人脸图像进行特征提取;选择resnet-34网络作为特征提取网络的骨干网络;每张人脸图像分别进行随机裁取256×256×3、224×224×3以及128×128×3三种尺寸后输入到特征提取网络,将提取到的特征进行融合并归一化至范围[-1,1],将特征数据保存为张量以便神经网络来使用;

12、步骤3:局部年龄域划分;

13、对整个数据集提取到的特征数据进行k-means聚类分析,根据聚类结果,将整个数据集划分为多个局部数据域;

14、步骤4:构建全局回归网络和局部回归网络;

15、构建的全局回归网络和五个局部回归网络均包括两个部分:特征提取网络和秩一致性序数回归网络;

16、特征提取网络采用resnet-34作为骨干网络,负责提取年龄特征;

17、秩一致性有序回归网络的输入为年龄特征,输出为年龄序数标签;

18、步骤5:年龄估计;

19、利用全局回归网络和局部回归网络,测试图像首先输入全局回归网络,得到全局预测年龄,将全局预测年龄映射到步骤2中划分的年龄域内,再将该图像输入到对应的局部回归网络中得到最终预测结果;如果同时映射到两个年龄区间内,则取两个局部回归网络预测结果的均值为最终预测年龄结果。

20、进一步的,所述特征提取,数据集中人脸图像经过预处理后已进行人脸对齐和面部图像裁剪,在此基础上随机裁剪出另外两个尺寸,将3个尺寸的图像统一调整为224×224×3的大小后传入resnet-34网络中进行人脸特征提取,所提取的特征主要包括纹理特征、表情特征、形状特征等。

21、进一步的,所述局部年龄域划分,将整个年龄范围划分为多个特征相似的年龄段,在每个年龄段内训练对应的局部回归网络;对整个人脸图像数据集进行k-means聚类,根据聚类结果划分为5个局部年龄域,分别为15-19、18-25、23-29、25-34、30-45。

22、进一步的,所述构建全局回归网络和局部回归网络,均包括特征提取网络和秩一致性序数回归网络。将特征提取网络提取到的特征输入到秩一致性序数回归网络中。秩一致性由共享除最后一层偏置项的神经网络的权重参数实现;秩一致性序数回归网络最后一层由k-1个二分类器组成,二分类器可由下式表示:

23、

24、其中是对第k个样本预测的经验概率,由下式得出:

25、

26、其中,σ为sigmoid函数,w为神经网络除最后一层外的权重参数,bk为第k个样本对应的偏置项。

27、秩一致性序数回归网络的输出为由[1,1,1,0,0,…0]组成的序数标签,其对应的年龄标签由下式获得:

28、

29、对于整个回归网络,在训练过程中损失函数由下式表示:

30、

31、其中,λk用来调节正样本对损失贡献的权重。

32、所述年龄估计,首先将测试图像输入全局回归网络,将其预测结果映射到步骤2划分的数据集上,利用对应的局部回归网络得到最终预测结果;如果同时映射到两个年龄区间内,则取两个局部回归网络预测结果的均值为最终预测年龄结果。

33、本发明创新之处在于:

34、1)针对现有序数回归网络在衰老特征差异不大情况下预测准确度较低的问题,提出由全局到局部序数回归网络,在不增加网络设计复杂度的情况下,提高预测准确率。

35、2)针对序数回归会出现秩不一致性的情况,通过共享网络参数,实现秩一致性。

36、3)针对afad数据集,利用k-means聚类分析,将15-45岁数据集划分为特征相近的多个年龄范围交叉的子数据集,并训练特定的局部回归网络,实验结果说明该方法取得出色的结果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1