用于仿真足球机器人控球的控制方法与流程

文档序号:15491396发布日期:2018-09-21 20:38阅读:来源:国知局

技术特征:

技术总结
本发明公开了一种用于仿真足球机器人控球的控制方法,利用tile coding线性函数近似方法降低状态空间维度,足球机器人智能体模块在强化学习中选择Sarsa算法,对策略进行在线打分,高分优先选择的原则训练选择一个最优策略,仿真结果表明Sarsa算法可大大提高控球率。本发明基于Sarsa算法来应用强化学习,在keepaway上实验,在一个小的任务中保持球员可长时间控球,达到高持球率,从而可加大多智能体之间传球协作或可找到合适的机会射门,加大得分胜率。

技术研发人员:粱志伟;胡丽娟
受保护的技术使用者:南京邮电大学
技术研发日:2018.03.30
技术公布日:2018.09.21
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1