一种游戏动作的处理方法和装置与流程

一种游戏动作的处理方法和装置与流程技术资料下载

技术编号：17431740

提示：您尚未登录，请点 登陆 后下载，如果您还没有账户请点 注册 ，登陆完成后，请刷新本页查看技术详细信息。

本发明涉及数据处理技术领域，特别是涉及一种游戏动作的处理方法和一种游戏动作的处理装置。背景技术强化学习(reinforcement learning)，又称再励学习、评价学习，是一种重要的机器学习方法，在智能控制机器人及分析预测等领域有许多应用。通过强化学习训练的策略网络(Policy Network)，所谓的策略网络，即建立一个神经网络模型，它可以通过观察环境状态，直接预测出目前最应该执行的策略(policy)，执行这个策略可以获得现在的和未来最大的预期回报值(reward)。强化学习在游戏中...
注意：该技术已申请专利，请尊重研发人员的辛勤研发付出，在未取得专利权人授权前，仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权，增加技术思路，做技术知识储备，不适合论文引用。

详细技术文档下载地址↓↓

提示：您尚未登录，请点 登陆 后下载，如果您还没有账户请点 注册 ，登陆完成后，请刷新本页查看技术详细信息。