本申请涉及姿态识别,特别是涉及目标姿态识别方法、装置、电子设备及可读存储介质。
背景技术:
1、相关的目标姿态估计方法应用于视频场景,预测结果存在显著抖动,其原因主要有以下几点:
2、1)视频场景中的目标姿态变化会比静态场景中的变化快得多,这使得传统的目标姿态估计模型难以准确地捕捉视频中的快速变化;
3、2)视频场景中的背景噪声会影响模型的预测结果;
4、3)目标姿态估计本身缺乏对连续运动的建模能力,导致时序预测结果不连续。
技术实现思路
1、本申请提供了目标姿态识别方法、装置、电子设备及可读存储介质,能够提高最终目标姿态识别的准确性。
2、第一方面,本申请提供一种目标姿态识别方法,该方法包括:获取待识别视频;其中,待识别视频包括连续的视频帧;对待识别视频进行目标姿态预测,得到每一视频帧对应的初始姿态预测结果;将所有初始姿态预测结果分解得到至少两个不同频率分量;将每一频率分量输入至网络模型,得到每一频率分量对应的子姿态预测结果;根据所有子姿态预测结果得到最终姿态预测结果。
3、第二方面,本申请提供一种目标姿态识别装置,该目标姿态识别装置包括:获取模块,用于获取待识别视频;其中,待识别视频包括连续的视频帧;预测模块,用于对待识别视频进行目标姿态预测,得到每一视频帧对应的初始姿态预测结果;分解模块,用于将所有初始姿态预测结果分解得到至少两个不同频率分量;处理模块,用于将每一频率分量输入至网络模型,得到每一频率分量对应的子姿态预测结果;以及根据所有子姿态预测结果得到最终姿态预测结果。
4、第三方面,本申请提供一种电子设备,该电子设备包括处理器以及与处理器耦接的存储器和显示界面;其中,存储器用于存储计算机程序,处理器用于执行计算机程序,以实现如上述第一方面提供的方法。
5、第四方面,本申请提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,计算机程序在被处理器执行时,实现如上述第一方面提供的方法。
6、本申请的有益效果是:区别于现有技术的情况,本申请提供的目标姿态识别方法、装置、电子设备及可读存储介质,通过将所有初始姿态预测结果分解得到至少两个不同频率分量,有效抑制噪声,然后将每一频率分量输入至网络模型,得到每一频率分量对应的子姿态预测结果;根据所有子姿态预测结果得到最终姿态预测结果的方式,得到准确的姿态预测结果,能够有效去除初始姿态预测结果的抖动,提高最终目标姿态识别的准确性。
1.一种目标姿态识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述将所有所述初始姿态预测结果分解得到至少两个不同频率分量,包括:
3.根据权利要求2所述的方法,其特征在于,所述按照时间序列将所有所述初始姿态预测结果分解得到至少两个不同频率分量,包括:
4.根据权利要求3所述的方法,其特征在于,所述网络模型包括第一子网络和第二子网络,所述将每一频率分量输入至网络模型,得到每一频率分量对应的子姿态预测结果,包括:
5.根据权利要求4所述的方法,其特征在于,所述根据所有所述子姿态预测结果得到最终姿态预测结果,包括:
6.根据权利要求1所述的方法,其特征在于,所述网络模型包括至少两个子网络,其中,所述网络模型采用以下方式进行训练:
7.根据权利要求6所述的方法,其特征在于,所述网络模型包括第一子网络和第二子网络,所述将所述训练视频分解得到至少两个不同频率视频分量,包括:
8.一种目标姿态识别装置,其特征在于,所述目标姿态识别装置包括:
9.一种电子设备,其特征在于,所述电子设备包括处理器以及与所述处理器耦接的存储器;
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序在被处理器执行时,实现如权利要求1-7任一项所述的方法。