一种游戏动作的处理方法和装置与流程技术资料下载

技术编号:17431740

提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明涉及数据处理技术领域,特别是涉及一种游戏动作的处理方法和一种游戏动作的处理装置。背景技术强化学习(reinforcement learning),又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。通过强化学习训练的策略网络(Policy Network),所谓的策略网络,即建立一个神经网络模型,它可以通过观察环境状态,直接预测出目前最应该执行的策略(policy),执行这个策略可以获得现在的和未来最大的预期回报值(reward)。强化学习在游戏中...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。

详细技术文档下载地址↓↓

提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。
该分类下的技术专家--如需求助专家,请联系客服