一种基于模仿学习的深海精细遥操纵任务的实现方法

文档序号:25875076发布日期:2021-07-16 17:33阅读:来源:国知局

技术特征:
1.一种基于模仿学习的深海精细遥操纵任务的实现方法,其特征在于,包括以下步骤,步骤s1:搭建目标任务的mujoco仿真环境,包括机械臂等执行机构和操纵对象;步骤s2:操作员在步骤s1搭建的仿真环境中操纵机械臂来完成目标任务,由软件记录机械臂各关节的运动序列,为步骤s4的仿真训练提供示教范例;步骤s3:采用actor

critic框架构建网络,策略网络的观测输入包括机械臂本体运动、力反馈、视觉等信息,策略网络的输出为机械臂各个关节的关节位置指令;步骤s4:以步骤s2中的示教范例为模仿对象,应用不基于模型的强化学习算法对网络进行训练,使仿真环境中的机械臂能以99%以上的成功率完成目标任务。步骤s5,将训练好的策略网络迁移到实际场景中,无需人工干预即可完成目标任务。2.根据权利要求1所述的一种基于模仿学习的深海精细遥操纵任务的实现方法,其特征在于所述步骤s1还包括在仿真环境中添加所述噪声参数,所述噪声参数添加到机械臂各关节位置。3.一种基于模仿学习的深海精细遥操纵任务的实现方法的应用,其特征在于,所述应用包括深海探测或水下作业。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1