姿态估计模型的训练方法、装置、电子设备及存储介质与流程

文档序号:36233220发布日期:2023-12-01 08:17阅读:49来源:国知局
姿态估计模型的训练方法与流程

所属的技术人员能够理解,本技术的各个方面可以实现为系统、方法或程序产品。因此,本技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。与上述方法实施例基于同一发明构思,在本技术实施例中的电子设备对应的是处理设备的情况下,参阅图8所示,其为应用本技术实施例的一种电子设备的硬件组成结构示意图,电子设备800可以至少包括处理器801、以及存储器802。其中,存储器802存储有计算机程序,当计算机程序被处理器801执行时,使得处理器801执行上述任意一种姿态估计模型的训练的步骤。在一些可能的实施方式中,根据本技术的电子设备可以包括至少一个处理器、以及至少一个存储器。其中,存储器存储有计算机程序,当计算机程序被处理器执行时,使得处理器执行本说明书上述描述的根据本技术各种示例性实施方式的姿态估计模型的训练的步骤。例如,处理器可以执行如图2中所示的步骤。与上述方法实施例基于同一发明构思,本技术提供的姿态估计模型的训练的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当程序产品在电子设备上运行时,程序代码用于使电子设备执行本说明书上述描述的根据本技术各种示例性实施方式的姿态估计模型的训练中的步骤,例如,电子设备可以执行如图2中所示的步骤。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。


背景技术:

1、随着人工智能技术的发展,可以借助于姿态估计模型,针对待识别图片进行姿态估计,获得用于描述对象姿态的各个关键点的坐标信息,进而,借助于获得的各坐标信息能够分析相关对象的姿态。

2、相关技术下,由于训练姿态估计模型的过程中,模型经过回归处理后预测的二维坐标信息,与输入图像对应的图像空间,属于不同的空间维度;因此,在借助于约束坐标值这种隐式且非对齐的约束方式进行约束的情况下,模型难以在图像空间中捕捉到图像中的内在信息,无法保障姿态估计模型的训练效果;进而,无法借助于训练后的姿态估计模型,准确地获得关键点的坐标信息,降低了姿态估计效果。


技术实现思路

1、本技术实施例提供一种姿态估计模型的训练方法、装置、电子设备及存储介质,用以提高姿态估计模型的姿态估计准确性。

2、第一方面,提出一种姿态估计模型的训练方法,包括:

3、获取各训练样本;一条训练样本包括:一个样本图像,以及各预设关键点在所述一个样本图像中的样本坐标,所述各预设关键点用于姿态定位;

4、基于所述各训练样本,对初始姿态估计模型进行多轮迭代训练,获得目标姿态估计模型,其中,在一轮迭代训练过程中,执行以下操作:

5、对选取的训练样本中包含的样本图像进行姿态估计,获得经过回归处理得到的,所述各预设关键点各自对应的预测坐标和l个预测参数组,其中,所述l个预测参数组是分别针对预设的l个分布函数确定的;

6、针对所述各预设关键点,分别执行以下操作:基于对应的预测坐标和l个预测参数组,聚合所述l个分布函数,获得相应的预测关键点在样本图像中的预测概率分布,并根据所述预测概率分布与对应的目标概率分布之间的分布差异,确定分布损失,其中,所述目标概率分布是基于所述预测关键点的样本坐标确定的,在所述样本图像上的概率分布;

7、基于各分布损失,调整所述初始姿态估计模型的模型参数。

8、第二方面,提出一种姿态估计模型的训练装置,包括:

9、获取单元,用于获取各训练样本;一条训练样本包括:一个样本图像,以及各预设关键点在所述一个样本图像中的样本坐标,所述各预设关键点用于姿态定位;

10、训练单元,用于基于所述各训练样本,对初始姿态估计模型进行多轮迭代训练,获得目标姿态估计模型,其中,在一轮迭代训练过程中,执行以下操作:

11、对选取的训练样本中包含的样本图像进行姿态估计,获得经过回归处理得到的,所述各预设关键点各自对应的预测坐标和l个预测参数组,其中,所述l个预测参数组是分别针对预设的l个分布函数确定的;

12、针对所述各预设关键点,分别执行以下操作:基于对应的预测坐标和l个预测参数组,聚合所述l个分布函数,获得相应的预测关键点在样本图像中的预测概率分布,并根据所述预测概率分布与对应的目标概率分布之间的分布差异,确定分布损失,其中,所述目标概率分布是基于所述预测关键点的样本坐标确定的,在所述样本图像上的概率分布;

13、基于各分布损失,调整所述初始姿态估计模型的模型参数。

14、可选的,所述预设的l个分布函数为l个高斯分布;所述基于对应的预测坐标和l个预测参数组,聚合所述l个分布函数,获得相应的预测关键点在样本图像中的预测概率分布时,所述训练单元用于:

15、针对每个高斯分布,分别执行以下操作:基于对应的预测坐标,确定所述高斯分布的均值矩阵,并基于对应的一个预测参数组,确定所述高斯分布对应的协方差矩阵和分量权重,得到参数赋值后的高斯分布结果;

16、按照针对l个高斯分布分别确定的分量权重,对l个高斯分布结果进行高斯混合处理,获得相应的预测关键点在样本图像中的预测概率分布。

17、可选的,所述目标概率分布,是采用以下方式确定的:

18、基于对应的预测关键点的样本坐标,确定目标均值矩阵,并分别确定在对应的各坐标轴上的标准差,以及根据所述各坐标轴上的标准差,确定所述目标高斯分布对应的目标协方差矩阵;

19、基于所述目标均值矩阵和所述目标协方差矩阵,对标准高斯分布进行参数赋值,得到目标概率分布。

20、可选的,所述分别确定在对应的各坐标轴上的标准差时,所述训练单元用于:

21、基于所述样本坐标与所述预测关键点的预测坐标,确定表征所述样本坐标与所述预测坐标之间的坐标差异的范数值;

22、在确定所述范数值超过设定阈值时,将所述范数值确定为所述目标高斯分布在各坐标轴上的标准差;以及,在确定所述范数值未超过设定阈值时,将所述设定阈值确定为所述目标高斯分布在所述各坐标轴上的标准差;所述目标高斯分布在所述各坐标轴上的标准差取值相同。

23、可选的,所述基于各分布损失,调整所述初始姿态估计模型的模型参数之前,所述训练单元还用于:

24、针对所述各预设关键点,分别执行以下操作:基于对应的预测坐标和样本坐标之间的坐标差异,计算位置损失;

25、所述基于各分布损失,调整所述初始姿态估计模型的模型参数,包括:

26、基于各分布损失和各位置损失,调整所述初始姿态估计模型的模型参数。

27、可选的,所述获得目标姿态估计模型之后,所述装置还包括处理单元,所述处理单元用于:

28、获取待处理图像;

29、采用所述目标姿态估计模型,针对所述待处理图像中的待识别对象进行姿态估计处理,得到所述各预设关键点在所述待处理图像中的坐标信息。

30、可选的,所述获取待处理图像时,所述处理单元用于:

31、获取原始图像;

32、针对所述原始图像进行对象识别处理,确定所述原始图像中包含待识别对象的目标区域,其中,所述待识别对象是姿态估计所针对的对象;

33、从所述原始图像中裁剪出所述目标区域对应的图像内容,得到待处理图像。

34、可选的,所述得到所述各预设关键点在所述待处理图像中的坐标信息之后,所述处理单元还用于:

35、基于各坐标信息之间的位置关系,确定所述待处理图像中待识别对象的状态特征;

36、基于所述状态特征,与各候选状态各自对应的候选状态特征的匹配情况,确定所述待识别对象匹配的目标状态。

37、第三方面,提出一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。

38、第四方面,提出一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法。

39、第五方面,提出一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述方法。

40、本技术有益效果如下:

41、本技术提出了一种姿态估计模型的训练方法、装置、电子设备及存储介质,公开了先获取用于模型训练的各训练样本,其中,一条训练样本包括:一个样本图像,以及用于姿态定位的各预设关键点,在该样本图像中的样本坐标;之后,采用各训练样本对基于回归的初始姿态估计模型进行多轮迭代训练后,得到训练后的目标姿态估计模型。

42、而且,就一轮迭代训练过程中执行的处理操作而言,采用初始姿态估计模型,对选取的训练样本中包含的样本图像进行姿态估计,获得各预设关键点各自对应的预测坐标和l个预测参数组,其中,l个预测参数组是分别针对预设的l个分布函数确定的;再针对每个预设关键点,基于得到的预测坐标和l个预测参数组,聚合对应的l个分布函数,获得相应的预测关键点在样本图像中的预测概率分布,并根据该预测概率分布与对应的目标概率分布之间的分布差异,确定针对该预设关键点确定的分布损失;进而,基于针对各预设关键点确定的各分布损失,调整模型参数。

43、这样,在训练基于回归的初始姿态估计模型的过程中,通过调整初始姿态估计模型的输出结果,使得在经过回归处理,输出各预设关键点各自对应的预测坐标的基础上,额外输出各预测关键点各自对应的l个预测参数组,为针对各预设关键点分别进行的,l个分布函数的参数具体化和聚合过程提供了处理依据。

44、而且,在针对模型训练建立约束的过程中,通过针对各预设关键点分别构建对应的预测概率分布,使得借助于针对每个预设关键点分别进行的l个分布函数的聚合,能够将针对预设关键点的预测坐标转化为,在相应的样本图像上的概率分布;从而促使输入至初始姿态估计模型的输入图像,与针对初始姿态估计模型建立约束时所依据的预测概率分布处于同一个维度上,这不仅有利于初始姿态估计模型更好地捕捉到图像中的内在信息,提升初始姿态估计模型的表示能力,还有助于训练初始姿态估计模型具有更好的处理性能,提升训练效果;

45、与此同时,结合基于回归的网络结构本身具有轻量的网络特点,在训练初始姿态估计模型得到目标姿态估计模型的过程中,一方面能够保障模型的姿态估计性能,提高姿态估计的准确性,另一方面,能够降低对于内存资源和计算资源的占用情况,降低耗时负担,提升资源利用率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1