人脸位姿估计方法及装置与流程

文档序号:34181731发布日期:2023-05-17 09:21阅读:51来源:国知局
人脸位姿估计方法及装置与流程

本公开涉及人脸识别,尤其涉及一种人脸位姿估计方法及装置。


背景技术:

1、在人脸位姿估计任务中,由于图像中人脸位置和人脸大小大小的多样性,口罩等因素对人脸区域的遮挡,以及位姿标注本身具有的不确定性,对人脸位姿估计算法的设计带来困难。传统人脸位姿估计模型使用的是通用识别模型,缺乏针对估计人脸位姿的设计,不能充分获取位姿估计需要的局部信息和整体信息,同时,直接对位姿角度进行回归的做法过于直接,难以获得最优效果。上述问题导致传统人脸位姿估计模型精度较低,人脸位姿估计准确率低。

2、在实现本公开构思的过程中,发明人发现相关技术中至少存在如下技术问题:传统人脸位姿估计模型进行人脸位姿估计存在准确率低的问题。


技术实现思路

1、有鉴于此,本公开实施例提供了一种人脸位姿估计方法、装置、电子设备及计算机可读存储介质,以解决现有技术中,传统人脸位姿估计模型进行人脸位姿估计存在准确率低的问题。

2、本公开实施例的第一方面,提供了一种人脸位姿估计方法,包括:利用卷积层、批归一化层和第一激活层构建局部分组卷积模块,利用空间注意力模块和transformer模块构建全局注意力模块,利用残差网络、局部分组卷积模块和全局注意力模块构建主体网络;在主体网络后接三个并行的回归网络,得到人脸位姿估计模型,其中,每个回归网络均由全局平均池化层和全连接层组成,每个回归网络对应一种人脸位姿以及关于该人脸位姿的损失函数;为三个回归网络各自对应的损失函数分配一个自适应权值参数,以得到自适应加权损失函数;依据自适应加权损失函数完成对人脸位姿估计模型的训练,利用训练好的人脸位姿估计模型进行人脸位姿估计。

3、本公开实施例的第二方面,提供了一种人脸位姿估计装置,包括:构建模块,被配置为利用卷积层、批归一化层和第一激活层构建局部分组卷积模块,利用空间注意力模块和transformer模块构建全局注意力模块,利用残差网络、局部分组卷积模块和全局注意力模块构建主体网络;模型模块,被配置为在主体网络后接三个并行的回归网络,得到人脸位姿估计模型,其中,每个回归网络均由全局平均池化层和全连接层组成,每个回归网络对应一种人脸位姿以及关于该人脸位姿的损失函数;分配模块,被配置为为三个回归网络各自对应的损失函数分配一个自适应权值参数,以得到自适应加权损失函数;训练模块,被配置为依据自适应加权损失函数完成对人脸位姿估计模型的训练,利用训练好的人脸位姿估计模型进行人脸位姿估计。

4、本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。

5、本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。

6、本公开实施例与现有技术相比存在的有益效果是:因为本公开实施例通过利用卷积层、批归一化层和第一激活层构建局部分组卷积模块,利用空间注意力模块和transformer模块构建全局注意力模块,利用残差网络、局部分组卷积模块和全局注意力模块构建主体网络;在主体网络后接三个并行的回归网络,得到人脸位姿估计模型,其中,每个回归网络均由全局平均池化层和全连接层组成,每个回归网络对应一种人脸位姿以及关于该人脸位姿的损失函数;为三个回归网络各自对应的损失函数分配一个自适应权值参数,以得到自适应加权损失函数;依据自适应加权损失函数完成对人脸位姿估计模型的训练,利用训练好的人脸位姿估计模型进行人脸位姿估计,因此,采用上述技术手段,可以解决现有技术中,传统人脸位姿估计模型进行人脸位姿估计存在准确率低的问题,进而提高人脸位姿估计的准确率。



技术特征:

1.一种人脸位姿估计方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述局部分组卷积模块内部从前到后依次为:卷积核为第一数量的分组卷积层、所述卷积核为第二数量的普通卷积层、所述卷积核为所述第一数量的所述普通卷积层、所述批归一化层和所述第一激活层。

3.根据权利要求1所述的方法,其特征在于,所述空间注意力模块内部从前到后依次为:卷积核为第二数量的普通卷积层、所述批归一化层、所述第一激活层、所述卷积核为第三数量的所述普通卷积层、所述批归一化层、第二激活层。

4.根据权利要求1所述的方法,其特征在于,利用残差网络、所述局部分组卷积模块和所述全局注意力模块构建主体网络,包括:

5.根据权利要求1所述的方法,其特征在于,利用空间注意力模块和transformer模块构建全局注意力模块,包括:

6.根据权利要求1所述的方法,其特征在于,自适应加权损失函数loss:

7.根据权利要求1所述的方法,其特征在于,人脸位姿分为偏航角位姿、俯仰角位姿和翻滚角位姿三种。

8.一种人脸位姿估计装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。


技术总结
本公开涉及人脸识别技术领域,提供了一种人脸位姿估计方法及装置。该方法包括:利用卷积层、批归一化层和第一激活层构建局部分组卷积模块,利用空间注意力模块和Transformer模块构建全局注意力模块,利用残差网络、局部分组卷积模块和全局注意力模块构建主体网络;在主体网络后接三个并行的回归网络,得到人脸位姿估计模型,其中,每个回归网络均由全局平均池化层和全连接层组成,每个回归网络对应一种人脸位姿以及关于该人脸位姿的损失函数;为三个回归网络各自对应的损失函数分配一个自适应权值参数,以得到自适应加权损失函数;依据自适应加权损失函数完成对人脸位姿估计模型的训练,利用训练好的人脸位姿估计模型进行人脸位姿估计。

技术研发人员:杨战波,黄泽元,祁晓婷,蒋召
受保护的技术使用者:北京龙智数科科技服务有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1