技术编号:15491396
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明涉及仿真机器人控制方法,尤其涉及一种仿真足球机器人的控制方法,属于机器学习、智能体控制技术领域。背景技术强化学习可以看作是一个试探评价过程,智能体在与环境交互的过程中,选择一个动作作用于环境,环境执行动作之后状态发生变化,同时产生一个强化信号(奖励或惩罚)反馈给智能体。智能体则根据强化信号和环境当前的状态再选择下一个动作,选择的原则是使受到正强化的概率(程序中通常用Q值表示)增大,基本原理如图1所示。如图1所示,每一个强化学习中智能体在与环境交互时,每一时刻的事件序列表示如下。1)智能体感...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。