一种年龄预测模型的训练方法、年龄预测方法及相关装置与流程

文档序号：25735050发布日期：2021-07-06 18:43阅读：来源：国知局

技术特征：

1.一种年龄预测模型的训练方法，其特征在于，所述年龄预测模型包括人脸检测模型和多输入回归模型；所述方法包括：

获取第一训练样本，其中，所述第一训练样本包括第一人脸样本图像对应的年龄标签以及所述第一人脸样本图像对应的年龄段标签；

通过所述人脸检测模型输出所述带有多个目标框的第一人脸样本图像以及所述第一人脸样本图像对应的第一概率预测值，其中，所述多个目标框的尺寸各不相同，分别用于指示所述第一人脸样本图像中的人脸区域所在的，可能性最大的多个位置；所述第一概率预测值包括各目标框对应的人脸区域分别属于各年龄段的概率；

从所述第一人脸样本图像中提取所述各目标框所在的人脸区域图；

基于所述各目标框所在的人脸区域图对所述多输入回归模型进行训练，通过所述多输入回归模型输出所述第一人脸样本图像对应的年龄预测值及第二概率预测值，所述第二概率预测值包括各所述人脸区域图中的人脸区域分别属于各年龄段的概率；

根据所述年龄标签与所述年龄预测值，以及，所述第一人脸样本图像对应的年龄段标签、所述第一概率预测值和所述第二概率预测值，更新所述多输入回归模型的参数，并返回执行所述获取第一训练样本的步骤，直至所述年龄预测模型收敛。

2.根据权利要求1所述的方法，其特征在于，所述通过所述人脸检测模型输出所述带有多个目标框的第一人脸样本图像以及所述第一人脸样本图像对应的第一概率值，具体包括：

将所述第一人脸样本图像输入至所述人脸检测模型，得到所述第一人脸样本图像对应的多个候选预测框、各候选预测框对应的置信度以及所述各候选预测框对应的年龄段概率值，所述多个候选预测框用于指示所述第一人脸样本图像中的人脸区域所在的多个可能位置，一个候选预测框对应的置信度用于指示所述一个候选预测框对应的人脸区域为真实人脸的可能性，一个候选预测框对应的年龄段概率值包括所述一个候选预测框中的人脸区域属于各年龄段的概率；

从所述多个候选预测框中选取最大置信度对应的候选预测框作为参考框，计算所述参考框与所述多个候选预测框中的其余候选预测框之间的交并比，得到交并比结果；

按照预设的交并比阈值区间端点划分成多个交并比区间，并根据所述交并比计算结果确定每个候选预测框所属的交并比区间；其中，所述交并比区间的个数与所述目标框的个数相同；

选取划分后的各交并比区间中置信度最大的候选预测框，作为所述目标框，并将所述置信度最大的候选预测框的年龄段概率值作为所述第一人脸样本图像对应的第一概率预测值。

3.根据权利要求1或2所述的方法，其特征在于，所述通过所述人脸检测模型输出所述带有多个目标框的人脸样本图像以及所述人脸样本图像对应的第一概率预测值之前，还包括：

获取第二训练样本，其中，所述第二训练样本包括带有真实框的第二人脸样本图像以及所述第二人脸样本图像对应的年龄段标签，所述真实框用于指示所述第二人脸样本图像中的人脸的真实位置；

基于所述第二训练样本，对所述人脸检测模型进行训练，通过所述人脸检测模型输出所述第二人脸样本图像对应的预测框以及所述第二人脸样本图像对应的第三概率预测值，所述预测框用于指示所述第二人脸样本图像中的人脸区域的预测位置，所述第三概率预测值包括所述预测框对应的人脸区域属于各年龄段的概率；

根据所述真实框与所述预测框，以及所述第二人脸样本图像对应的年龄段标签与所述第三概率预测值，更新所述人脸检测模型的参数，并返回执行获取第二训练样本的步骤，直至所述人脸检测模型收敛。

4.根据权利要求1所述的方法，其特征在于，所述多输入回归模型包括多个基础特征提取模块、多个softmax层模块、特征融合模块以及全连接模块，多个基础特征提取模块均与所述特征融合模块连接，所述特征融合模块与所述全连接模块连接，且所述多个基础特征提取模块与多个softmax层模块一一对应连接，其中，所述多个基础特征提取模块和所述多个softmax层模块的数量与所述目标框的数量相同；

所述基于所述各目标框所在的人脸区域图对所述多输入回归模型进行训练，通过所述多输入回归模型输出所述第一人脸样本图像对应的年龄预测值及第二概率预测值具体包括：

对所述各目标框所在的人脸区域图分别进行归一化操作，得到所述目标人脸区域图；

将所述目标人脸区域图输入至所述目标人脸区域图对应的基础特征提取模块，得到所述目标人脸区域图对应的第一人脸特征图，所述目标人脸区域图为任一归一化后的人脸区域图；

将目标人脸区域图对应的第二人脸特征图输入至所述目标人脸区域对应的softmax层模块，得到所述目标人脸区域图对应的年龄段概率预测值，所述目标人脸区域图对应的年龄段概率值包括所述目标人脸区域图中的人脸区域属于各年龄段的概率；

将各归一化后的人脸区域图对应的第一人脸特征图输入至所述特征融合模块进行融合，得到第二特征图；

将第二特征图输入至所述全连接模块，得到所述第一人脸样本图像对应的年龄预测值；

将各人脸区域图对应的年龄段概率值确定为所述第一人脸样本图像对应的第二概率预测值。

5.根据权利要求4所述的方法，其特征在于，所述对所述各目标框所在的人脸区域图进行归一化操作，得到各归一化后的人脸区域图，包括：

利用所述各目标框的置信度对所述目标框进行排序，得到目标框序列，一个目标框对应的置信度用于指示所述一个目标框对应的人脸区域为真实人脸的可能性；

获取预设的归一化尺寸序列，将所述目标框序列中的第m个目标框的人脸区域图按照所述归一化尺寸序列中的第m个尺寸进行归一化，得到归一化后的人脸区域图，所述目标框序列中的目标框的数量与所述归一化尺寸序列中的尺寸的数量相同，所述目标框序列中目标框的排序方式与所述归一化尺寸序列中的排序方式相反。

6.根据权利要求1所述的方法,其特征在于，所述根据所述年龄标签与所述年龄预测值，以及，所述第一人脸样本图像对应的年龄段标签、所述第一概率预测值和所述第二概率预测值，更新所述多输入回归模型的参数具体包括：

根据所述年龄标签以及年龄预测值，确定所述多输入回归模型的年龄损失值；

根据所述第一人脸样本图像对应的年龄段标签、所述第一概率预测值和所述第二概率预测值，确定所述多输入回归模型的年龄段损失值；

根据所述年龄损失值及所述年龄段损失值，得到所述多输入回归模型的总损失值，根据所述总损失值更新所述多输入回归模型的参数。

7.根据权利要求6所述的方法，其特征在于，所述根据所述第一人脸样本图像对应的年龄段标签、所述第一概率预测值和所述第二概率预测值，确定所述多输入回归模型的年龄段损失值，包括：

按照如下公式计算所述年龄段损失值：

其中，l2表示所述年龄段损失值，n表示所述第一训练样本中第一人脸样本图像的数量，i表示所述目标框的数量，表示所述第二概率预测值，hj表示所述第一人脸样本图像的年龄段标签，fjⁱ表示所述第一概率预测值。

8.一种年龄预测模型的训练装置，其特征在于，所述年龄预测模型包括人脸检测模型和多输入回归模型；所述训练装置包括：

获取单元，用于获取第一训练样本，其中，所述第一训练样本包括第一人脸样本图像对应的年龄标签以及所述第一人脸样本图像对应的年龄段标签；

第一训练单元，用于通过所述人脸检测模型输出所述带有多个目标框的第一人脸样本图像以及所述第一人脸样本图像对应的第一概率预测值，其中，所述多个目标框的尺寸各不相同，分别用于指示所述第一人脸样本图像中的人脸区域所在的，可能性最大的多个位置；所述第一概率预测值包括各目标框对应的人脸区域分别属于各年龄段的概率；

提取单元，用于从所述第一人脸样本图像中提取所述各目标框所在的人脸区域图；

第二训练单元，用于基于所述各目标框所在的人脸区域图对所述多输入回归模型进行训练，通过所述多输入回归模型输出所述第一人脸样本图像对应的年龄预测值及第二概率预测值，所述第二概率预测值包括各所述人脸区域图中的人脸区域分别属于各年龄段的概率；

更新单元，用于根据所述年龄标签与所述年龄预测值，以及，所述第一人脸样本图像对应的年龄段标签、所述第一概率预测值和所述第二概率预测值，更新所述多输入回归模型的参数，并返回执行所述获取第一训练样本的步骤，直至所述年龄预测模型收敛。

9.一种年龄预测方法，其特征在于，所述方法包括：

获取待预测人脸图像；

将所述待预测人脸图像输入至年龄预测模型，其中，所述年龄预测模型通过如权利要求1-7任一项所述的年龄预测模型的训练方法训练得到；

通过所述年龄预测模型确定所述待预测人脸图像的年龄值。

10.根据权利要求9所述的年龄预测方法，其特征在于，所述年龄预测模型包括人脸检测模型和多输入回归模型，所述多输入回归模型包括多个基础特征提取模块、特征融合模块以及全连接模块，多个基础特征提取模块均与所述特征融合模块连接，所述将所述待预测人脸图像输入至年龄预测模型，包括：

将所述待预测人脸图像输入至所述人脸检测模型，通过所述人脸检测模型输出所述待预测人脸图像的待预测人脸区域图；

将所述待预测人脸区域图输入至所述基础特征提取模块，得到所述待预测人脸图像对应的第一人脸特征图；

将所述待预测人脸图像对应的第一人脸特征图输入至所述特征融合模块进行融合，得到所述待预测人脸图像对应的第二特征图；

将第二特征图输入至所述全连接模块，通过所述全连接模块输出所述待预测人脸图像的年龄值。

11.一种年龄预测装置，应用于如权利要求9或10所述的年龄预测方法，其特征在于，所述装置包括：

第一获取模块，用于获取待预测人脸图像；

输入模块，用于将所述待预测人脸图像输入年龄预测模型，其中，所述年龄预测模型通过如权利要求1-7任一项所述的年龄预测模型的训练方法训练得到；

预测模块，用于通过所述年龄预测模型确定所述待预测人脸图像的年龄值。

12.一种计算机可读存储介质，存储有计算机程序，其特征在于，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至7中任一项或权利要求9或10所述的方法中的各个步骤。

13.一种计算机设备，包括存储器和处理器，其特征在于，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至7中任一项或权利要求9或10所述的方法中的各个步骤。

技术总结
本申请实施例公开了一种年龄预测模型的训练方法、年龄预测方法及相关装置，该模型包括人脸检测模型和多输入回归模型；其中方法包括：获取第一训练样本，包括第一人脸样本图像对应的年龄标签和年龄段标签；通过人脸检测模型输出带有多个目标框的第一人脸样本图像以及对应的第一概率预测值，包括各目标框对应的人脸区域分别属于各年龄段的概率；从第一人脸样本图像中提取各目标框所在的人脸区域图；基于人脸区域图对多输入回归模型进行训练，通过多输入回归模型输出第一人脸样本图像对应的年龄预测值及第二概率预测值，第二概率预测值包括各人脸区域图中的人脸区域分别属于各年龄段的概率；根据标签与各预测值，更新多输入回归模型的参数。

技术研发人员：陈仿雄
受保护的技术使用者：深圳数联天下智能科技有限公司
技术研发日：2021.03.18
技术公布日：2021.07.06

完整全部详细技术资料下载

当前第2页1 2