一种基于多粒度强化学习的六足机器人导航方法与流程

文档序号：16397819发布日期：2018-12-25 19:57阅读：来源：国知局

技术特征：

技术总结
本发明提供了一种基于多粒度强化学习的六足机器人导航方法，步骤包括：由机器人对环境进行初次学习，得到细粒度条件的环境信息，再利用Q学习算法得到状态动作表；使用多粒度强化学习算法将原来的细粒度的状态动作表转化为粗粒度的状态动作表；使用多粒度迁移学习算法以及粗化后的状态动作表，对细粒度下的新环境进行重新学习和建图，再进行Q学习获得新环境下的状态动作集合；利用新环境下的状态动作集合对六足机器人进行实时导航控制。该六足机器人导航方法通过强化学习算法学习出变化环境中六足机器人在相应状态的最佳动作，并以此为基础，提高对变化环境的适应性；利用多粒度迁移学习机制，提高在环境变化的情况下的导航效率。

技术研发人员：陈春林;王岚;王子辉;任其成;唐开强;朱长青;辛博
受保护的技术使用者：南京大学
技术研发日：2018.09.16
技术公布日：2018.12.25

完整全部详细技术资料下载

当前第2页1 2