技术特征:
技术总结
本发明公开了一种用于仿真足球机器人控球的控制方法,利用tile coding线性函数近似方法降低状态空间维度,足球机器人智能体模块在强化学习中选择Sarsa算法,对策略进行在线打分,高分优先选择的原则训练选择一个最优策略,仿真结果表明Sarsa算法可大大提高控球率。本发明基于Sarsa算法来应用强化学习,在keepaway上实验,在一个小的任务中保持球员可长时间控球,达到高持球率,从而可加大多智能体之间传球协作或可找到合适的机会射门,加大得分胜率。
技术研发人员:粱志伟;胡丽娟
受保护的技术使用者:南京邮电大学
技术研发日:2018.03.30
技术公布日:2018.09.21