1.一种视角无关的视频三维人体姿态识别方法,其特征在于,该识别方法包括:
步骤1:虚拟数据生成阶段:基于任意包含三维标注的人体姿态数据集,合成虚拟相机参数后生成二维/三维数据元组;
步骤2:模型训练阶段:利用生成的二维/三维数据元组分别训练用于获得具有相机视角泛化能力的模型的模块化神经网络第一模块和用于获得能够保护帧间动作连续性的模型的模块化神经网络第二模块;
步骤3:无约束视频推理阶段:对于任意无约束采集得到的视频,通过利用步骤2训练得到的多模块深度神经网络预测得到三维人体姿态识别结果。
2.根据权利要求1所述的一种视角无关的视频三维人体姿态识别方法,其特征在于,所述的步骤1具体包括:对于任意包含三维标注的人体姿态数据集,采用相机视角增强模块合成虚拟相机参数,并利用投影关系生成二维/三维数据元组。
3.根据权利要求2所述的一种视角无关的视频三维人体姿态识别方法,其特征在于,所述的相机参数包括决定相机位置和朝向的外参和决定相机投影焦距画幅的内参。
4.根据权利要求1所述的一种视角无关的视频三维人体姿态识别方法,其特征在于,所述的步骤2中的第一模块使用单帧数据元组进行视角增强的训练。
5.根据权利要求1所述的一种视角无关的视频三维人体姿态识别方法,其特征在于,所述的步骤2中的第二模块使用连续序列的数据元组进行时序模型训练。
6.根据权利要求1所述的一种视角无关的视频三维人体姿态识别方法,其特征在于,所述的步骤2与步骤3中,在输入神经网络前,还包括对二维检测结果进行相机无关的二维检测归一化预处理过程,其对应描述公式为:
式中,kx,y表示二维检测归一化预处理后的二维点坐标,
7.根据权利要求1所述的一种视角无关的视频三维人体姿态识别方法,其特征在于,所述的步骤3中的无约束采集得到的视频具体包括自然条件采集,或经过缩放、裁剪、变速、和其他颜色调整变换的视频序列。