一种基于模型的机器人操作技能参数学习方法

文档序号：35470666发布日期：2023-09-16 15:19阅读：来源：国知局

技术特征：

1.一种基于模型的机器人操作技能参数学习方法，其特征在于，包括单一技能的策略学习模块、任务技能的参数学习模块；

2.根据权利要求1所述的基于模型的机器人操作技能参数学习方法，其特征在于，所述的单一技能的策略学习模块，利用表征学习对环境中各物体进行空间关系的表征，训练得到面向物体的表征模型，并借助表征模型中的编码器来编码环境观测，使用强化学习方法训练智能体，使其能以用户给定的单一语义技能目标为条件生成对应任务的动作参数，得到多个策略模型；

3.根据权利要求2所述的基于模型的机器人操作技能参数学习方法，其特征在于，

4.根据权利要求3所述的基于模型的机器人操作技能参数学习方法，其特征在于，所述的面向物体的表征模型训练方法包括如下步骤：

5.根据权利要求4所述的基于模型的机器人操作技能参数学习方法，其特征在于，所述的以语义目标为条件的策略模型包括如下步骤：

6.根据权利要求3所述的基于模型的机器人操作技能参数学习方法，其特征在于，所述的隐式状态转移方程学习模块包括如下步骤：

7.根据权利要求4或5或6所述的基于模型的机器人操作技能参数学习方法，其特征在于，所述的技能参数在线规划模块包括如下步骤：

技术总结
本发明公开了一种基于模型的机器人操作技能参数学习方法，包括单一技能的策略学习模块、任务技能的参数学习模块，单一技能的策略学习模块包括面向物体的表征模型和以语义目标为条件的策略模型，任务技能的参数学习模块包括隐式状态转移模型学习模块和技能参数在线规划模块；本发明单一语义技能策略学习模块将表征学习和强化学习相结合，将视觉输入到当前系统状态的逻辑表征的推理转化和面向任务的机器人策略学习相结合，生成满足目标逻辑状态的动作参数。使用强化学习方法，避免了大量的模型设计与处理以及对专家示教数据的需求，并且基于操作知识库对技能的动作序列进行预定义，缩小动作的搜索空间，降低智能体的探索负担。

技术研发人员：熊蓉,赵英豪,周忠祥,王越
受保护的技术使用者：浙江大学
技术研发日：
技术公布日：2024/1/15

完整全部详细技术资料下载

当前第2页1 2