技术编号:36878921
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明涉及强化学习,具体涉及一种基于随机transformer模型的有模型深度强化学习方法。背景技术、强化学习是一种机器学习方法,其旨在使智能体通过与环境进行交互来学习最优的行为策略。与传统的监督学习和无监督学习方法不同,强化学习关注的是通过试错和奖励信号的反馈来学习正确的行为,从而使智能体能够在不断变化的环境中做出自适应的决策。近年来,随着相关研究的进一步深入与计算能力的发展,深度强化学习在多个领域中取得了更加广泛的成功。深度强化学习结合了深度神经网络的强大表示学习能力和强化学习的决策优化能...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。