技术编号:37648331
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。本发明实施例涉及机器人控制领域,特别涉及一种强化学习控制机器人的动作平滑度优化方法、设备及介质。背景技术、传统控制机器人的方法中并不存在对机器人末端轨迹进行平滑优化的需求,因为传统控制方法本身就已经是按照平滑的方式进行了机器人运动轨迹的规划。但是最新的智能控制算法,如强化学习,其输出是根据当前时刻的机器人状态所进行的实时控制,是机器人的末端轨迹不确定的。、目前,基础的强化学习算法通常是通过设计奖励函数来实现对平滑度进行优化,但奖励函数需要获取机器人所处环境状态的相关信息,而这些信息并不容易获...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。