人体姿态估计模型的训练方法、装置、电子设备及介质与流程

文档序号:37167389发布日期:2024-03-01 12:09阅读:12来源:国知局
人体姿态估计模型的训练方法、装置、电子设备及介质与流程

本技术涉及计算机视觉领域,尤其涉及一种人体姿态估计模型的训练方法、装置、电子设备及介质。


背景技术:

1、随着工业化和科技化进程的不断推进,以计算机视觉为主体的相关研究成为与人类社会息息相关的热点。计算机视觉技术即通过计算或学习等方式,实现计算机对外界信息和人类行为的理解。计算机视觉技术的快速发展,能在很大程度上解放人类双手,对工业社会发展和进步有至关重要的作用。

2、针对安防领域,通过计算机视觉技术可以自动从监控视频中识别视频中的人员的人体姿态,根据人体姿态识别对应的人员是否存在风险,从而减少安保人员的工作内容。

3、然而,对于银行等应用场景,由于办理业务的人员数量众多,出现在监控视频中的人员数量也较多,会出现不同人员的人体相互遮挡的情况,该情况下会导致识别人体姿态的准确性差的问题。


技术实现思路

1、本技术提供一种人体姿态估计模型的训练方法、装置、电子设备及介质,用以提升识别人体姿态的准确性。

2、第一方面,本技术提供一种人体姿态估计模型的训练方法,包括:获取人体姿态估计模型的训练请求,所述训练请求包括监控视频;从所述监控视频中提取得到多个输入特征图;确定初始人体姿态估计模型中的多个初始关联通道,通过所述多个输入特征图对所述多个初始关联通道进行训练,得到多个目标关联通道,其中关联通道用于将输入特征图中的人体关键点进行关联处理得到关联结果;通过所述多个训练关联通道替换所述多个初始关联通道,得到目标人体姿态估计模型。

3、在一种可能的实施方式中,通过所述多个输入特征图对所述多个初始关联通道进行训练,得到多个目标关联通道,包括:确定阶段数量,所述阶段数量大于1;针对第一阶段,将所述多个输入特征图输入所述多个初始关联通道,得到第一阶段的输出结果,通过所述第一阶段的输出结果对所述多个初始关联通道进行训练,得到第一阶段的多个训练关联通道;针对任意一个其他阶段,将前一个阶段的输出结果输入前一个阶段的多个训练关联通道,得到当前阶段的输出结果,通过所述当前阶段的输出结果对所述多个初始关联通道进行训练,得到当前阶段的多个训练关联通道;通过最后一个阶段的多个训练关联通道以及最后一个阶段的输出结果,确定所述多个目标关联通道。

4、在一种可能的实施方式中,所述多个初始关联通道为并联连接,所述多个初始关联通道包括第一关联通道、第二关联通道以及第三关联通道;将所述多个输入特征图输入所述多个初始关联通道,得到第一阶段的输出结果,包括:针对任意一个输入特征图,将所述输入特征图输入所述第一关联通道,得到第一输出特征图,所述第一关联通道用于对所述输入特征图中的所有关键点进行定位处理;将所述输入特征图输入所述第二关联通道,得到第二输出特征图,所述第二关联通道用于对所述输入特征图中的存在连接关系的关键点进行定位处理;将所述输入特征图输入所述第三关联通道,得到第三输出特征图,所述第三关联通道用于对所述输入特征图中的预设关键点进行定位处理;确定所述第一阶段的输出结果包括所述第一输出特征图、所述第二输出特征图以及所述第三输出特征图。

5、在一种可能的实施方式中,通过所述第一阶段的输出结果对所述多个初始关联通道进行训练,得到第一阶段的多个训练关联通道,包括:将所述第一输出特征图输入第一关联通道对应的第一损失函数中,得到第一损失值,并将所述第一关联通道以及所述第一损失值输入优化算法,得到第一训练关联通道;将所述第二输出特征图输入第二关联通道对应的第二损失函数中,得到第二损失值,并将所述第二关联通道以及所述第二损失值输入优化算法,得到第二训练关联通道;将所述第三输出特征图输入第三关联通道对应的第三损失函数中,得到第三损失值,并将所述第三关联通道以及所述第三损失值输入优化算法,得到第三训练关联通道;确定所述多个训练关联通道包括所述第一训练关联通道、所述第二训练关联通道以及所述第三训练关联通道。

6、在一种可能的实施方式中,将前一个阶段的输出结果输入前一个阶段的多个训练关联通道,得到当前阶段的输出结果,包括:将所述前一个阶段的输出结果进行合并处理,得到前一个阶段的输出结果之和;将所述前一个阶段的输出结果之和分别输入前一个阶段的每个训练关联通道,得到当前阶段的输出结果。

7、在一种可能的实施方式中,通过最后一个阶段的多个训练关联通道以及最后一个阶段的输出结果,确定所述多个目标关联通道,包括:从最后一个阶段的输出结果中确定多个目标关键点,所述目标关键点为每个训练关联通道对应的输出结果中的相同类型的关键点;将所述多个目标关键点进行加权融合处理,得到合并关键点,并将所述合并关键点输入目标损失函数中,得到目标损失值;将最后一个阶段的多个训练关联通道以及所述目标损失值输入优化算法,得到所述多个目标关联通道。

8、在一种可能的实施方式中,从所述监控视频中提取得到多个输入特征图,包括:从所述监控视频中确定多个监控视频帧,所述监控视频帧为包含人体图像的视频帧;通过目标检测算法对所述多个监控视频帧进行分割处理,得到多个图像帧,其中每个所述图像帧对应所述多个监控视频帧中的一个人体图像;将所述多个图像帧输入特征提取模型,得到多个输入特征图,所述多个输入特征图与所述多个图像帧一一对应。

9、第二方面,本技术提供一种人体姿态估计模型的训练装置,包括:请求模块,用于获取人体姿态估计模型的训练请求,所述训练请求包括监控视频;提取模块,用于从所述监控视频中提取得到多个输入特征图;训练模块,用于确定初始人体姿态估计模型中的多个初始关联通道,通过所述多个输入特征图对所述多个初始关联通道进行训练,得到多个目标关联通道,其中关联通道用于将输入特征图中的人体关键点进行关联处理得到关联结果;替换模块,用于通过所述多个训练关联通道替换所述多个初始关联通道,得到目标人体姿态估计模型。

10、在一种可能的实施方式中,所述训练模块,具体用于确定阶段数量,所述阶段数量大于1;所述训练模块,具体还用于针对第一阶段,将所述多个输入特征图输入所述多个初始关联通道,得到第一阶段的输出结果,通过所述第一阶段的输出结果对所述多个初始关联通道进行训练,得到第一阶段的多个训练关联通道;所述训练模块,具体还用于针对任意一个其他阶段,将前一个阶段的输出结果输入前一个阶段的多个训练关联通道,得到当前阶段的输出结果,通过所述当前阶段的输出结果对所述多个初始关联通道进行训练,得到当前阶段的多个训练关联通道;所述训练模块,具体还用于通过最后一个阶段的多个训练关联通道以及最后一个阶段的输出结果,确定所述多个目标关联通道。

11、在一种可能的实施方式中,所述多个初始关联通道为并联连接,所述多个初始关联通道包括第一关联通道、第二关联通道以及第三关联通道;所述训练模块,具体用于针对任意一个输入特征图,将所述输入特征图输入所述第一关联通道,得到第一输出特征图,所述第一关联通道用于对所述输入特征图中的所有关键点进行定位处理;所述训练模块,具体还用于将所述输入特征图输入所述第二关联通道,得到第二输出特征图,所述第二关联通道用于对所述输入特征图中的存在连接关系的关键点进行定位处理;所述训练模块,具体还用于将所述输入特征图输入所述第三关联通道,得到第三输出特征图,所述第三关联通道用于对所述输入特征图中的预设关键点进行定位处理;所述训练模块,具体还用于确定所述第一阶段的输出结果包括所述第一输出特征图、所述第二输出特征图以及所述第三输出特征图。

12、在一种可能的实施方式中,所述训练模块,具体用于将所述第一输出特征图输入第一关联通道对应的第一损失函数中,得到第一损失值,并将所述第一关联通道以及所述第一损失值输入优化算法,得到第一训练关联通道;所述训练模块,具体还用于将所述第二输出特征图输入第二关联通道对应的第二损失函数中,得到第二损失值,并将所述第二关联通道以及所述第二损失值输入优化算法,得到第二训练关联通道;所述训练模块,具体还用于将所述第三输出特征图输入第三关联通道对应的第三损失函数中,得到第三损失值,并将所述第三关联通道以及所述第三损失值输入优化算法,得到第三训练关联通道;所述训练模块,具体还用于确定所述多个训练关联通道包括所述第一训练关联通道、所述第二训练关联通道以及所述第三训练关联通道。

13、在一种可能的实施方式中,所述训练模块,具体用于将所述前一个阶段的输出结果进行合并处理,得到前一个阶段的输出结果之和;所述训练模块,具体还用于将所述前一个阶段的输出结果之和分别输入前一个阶段的每个训练关联通道,得到当前阶段的输出结果。

14、在一种可能的实施方式中,所述装置还包括:确定模块,用于从最后一个阶段的输出结果中确定多个目标关键点,所述目标关键点为每个训练关联通道对应的输出结果中的相同类型的关键点;所述确定模块,还用于将所述多个目标关键点进行加权融合处理,得到合并关键点,并将所述合并关键点输入目标损失函数中,得到目标损失值;所述确定模块,还用于将最后一个阶段的多个训练关联通道以及所述目标损失值输入优化算法,得到所述多个目标关联通道。

15、在一种可能的实施方式中,所述装置还包括:执行模块,用于从所述监控视频中确定多个监控视频帧,所述监控视频帧为包含人体图像的视频帧;所述执行模块,还用于通过目标检测算法对所述多个监控视频帧进行分割处理,得到多个图像帧,其中每个所述图像帧对应所述多个监控视频帧中的一个人体图像;所述执行模块,还用于将所述多个图像帧输入特征提取模型,得到多个输入特征图,所述多个输入特征图与所述多个图像帧一一对应。

16、第三方面,本技术提供一种电子设备,包括:处理器,以及与所述处理器通信连接的存储器;所述存储器存储计算机执行指令;所述处理器执行所述存储器存储的计算机执行指令,以实现第一方面中任一项所述的方法。

17、第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行如第一方面中任一项所述的方法。

18、第五方面,本技术提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行如第一方面中任一项所述的方法。

19、本技术提供的人体姿态估计模型的训练方法、装置、电子设备及介质,包括:获取人体姿态估计模型的训练请求,所述训练请求包括监控视频;从所述监控视频中提取得到多个输入特征图;确定初始人体姿态估计模型中的多个初始关联通道,通过所述多个输入特征图对所述多个初始关联通道进行训练,得到多个目标关联通道,其中关联通道用于将输入特征图中的人体关键点进行关联处理得到关联结果;通过所述多个训练关联通道替换所述多个初始关联通道,得到目标人体姿态估计模型。以上方案,设计包含关联通道的人体姿态估计模型,同一个人体的关键点存在关联关系,关联通道通过关联关系将关键点相关联而确定人体图像,可以避免不同人体图像的干扰,从而提升识别人体姿态的准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1