一种运动控制模型训练方法、装置、设备及存储介质与流程

文档序号:44264111发布日期:2026-01-04 16:20阅读:12来源:国知局
技术简介:
本发明针对传统机器人运动控制模型训练效率低、适应性差、泛化能力弱的问题,提出基于本体感知信息与模拟地形信息的混合知识驱动训练方法。通过迭代训练原始模型并结合收敛条件判断,实现对复杂地形的自适应控制,显著提升模型鲁棒性与场景泛化能力,保障机器人运动稳定性与安全性。
关键词:运动控制模型训练,复杂地形适应

本发明涉及机器人,尤其涉及一种运动控制模型训练方法、装置、设备及存储介质。


背景技术:

1、随着机器人技术的发展,机器人的运动控制作为一项基本技能,运动控制模型的训练可以使机器人能够以敏捷和适应性在环境中进行导航和执行任务。

2、目前,传统的机器人运动控制模型训练方式往往依赖于强化学习的方式实现对运动控制模型的训练。然而,传统的运动控制模型训练方式的训练效率较低,对复杂地形的适应性较差,模型的场景泛化能力和鲁棒性较低,从而无法保证对机器人运动控制的稳定性和安全性。


技术实现思路

1、本发明提供了一种运动控制模型训练方法、装置、设备及存储介质,以实现对机器人运动控制模型的高效训练,提高对复杂地形的适应性,提高模型的场景泛化能力和鲁棒性,从而保证对机器人运动控制的稳定性和安全性。

2、根据本发明的一方面,提供了一种运动控制模型训练方法,该方法包括:

3、获取针对机器人的原始运动控制模型,以及所述机器人的第一样本数据,其中,所述第一样本数据包括所述机器人的本体感知信息和模拟地形信息;

4、基于所述第一样本数据对所述原始运动控制模型进行迭代训练;

5、响应于所述原始运动控制模型满足预设收敛条件,将满足所述预设收敛条件的所述原始运动控制模型作为目标运动控制模型。

6、根据本发明的另一方面,提供了一种运动控制模型训练装置,该装置包括:

7、数据获取模块,用于获取针对机器人的原始运动控制模型,以及所述机器人的第一样本数据,其中,所述第一样本数据包括所述机器人的本体感知信息和模拟地形信息;

8、迭代训练模块,基于所述第一样本数据对所述原始运动控制模型进行迭代训练;

9、模型收敛模块,用于响应于所述原始运动控制模型满足预设收敛条件,将满足所述预设收敛条件的所述原始运动控制模型作为目标运动控制模型。

10、根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:

11、至少一个处理器;以及

12、与所述至少一个处理器通信连接的存储器;其中,

13、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的运动控制模型训练方法。

14、根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的运动控制模型训练方法。

15、本发明实施例的技术方案,通过获取针对机器人的原始运动控制模型,以及所述机器人的第一样本数据,其中,所述第一样本数据包括所述机器人的本体感知信息和模拟地形信息,从而降低对外部传感器的依赖,为模型训练提供基础数据。基于所述第一样本数据对所述原始运动控制模型进行迭代训练,并响应于所述原始运动控制模型满足预设收敛条件,将满足所述预设收敛条件的所述原始运动控制模型作为目标运动控制模型,可以使模型自适应复杂地形特征与本体状态关联,提高模型的泛化能力的鲁棒性。本发明通过本体感知信息和模拟地形信息,实现对原始运动控制模型在混合知识驱动下的模型迭代训练,可以提高对机器人运动控制模型的训练效率,提高对复杂地形的适应性,提高模型的场景泛化能力和鲁棒性,从而保证对机器人运动控制的稳定性和安全性。

16、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。


技术特征:

1.一种运动控制模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述第一样本数据对所述原始运动控制模型进行迭代训练,包括:

3.根据权利要求2所述的方法,其特征在于,所述原始运动控制模型包括:特征提取层和控制决策层;所述基于所述第一样本数据集,对所述原始运动控制模型进行训练,获得第一样本控制指令,包括:

4.根据权利要求3所述的方法,其特征在于,所述特征提取层包括:第一特征提取模块、第二特征提取模块和特征拼接模块;所述将所述第一样本数据集输入至所述特征提取层进行特征提取,获得所述第一样本特征,包括:

5.根据权利要求2所述的方法,其特征在于,所述基于所述第一样本控制指令,确定所述机器人在所述第一样本控制指令下的运动状态信息,包括:

6.根据权利要求2所述的方法,其特征在于,所述基于所述第一样本控制指令和所述运动状态信息,对所述原始运动控制模型进行迭代训练,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于所述第一样本控制指令和所述运动状态信息,对所述原始运动控制模型进行优化,获得优化后的原始运动控制模型,包括:

8.一种运动控制模型训练装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的运动控制模型训练方法。


技术总结
本发明公开了一种运动控制模型训练方法、装置、设备及存储介质。该方法包括:获取针对机器人的原始运动控制模型,以及机器人的第一样本数据,其中,第一样本数据包括所述机器人的本体感知信息和模拟地形信息;基于第一样本数据对原始运动控制模型进行迭代训练;响应于原始运动控制模型满足预设收敛条件,将满足预设收敛条件的原始运动控制模型作为目标运动控制模型。本发明能够实现对机器人运动控制模型的高效训练,提高对复杂地形的适应性,提高模型的场景泛化能力和鲁棒性,从而保证对机器人运动控制的稳定性和安全性。

技术研发人员:杨壮
受保护的技术使用者:杭州软通天擎机器人科技有限公司
技术研发日:
技术公布日:2026/1/3
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!