一种基于强化学习的车辆跟驰模型建立方法与流程

文档序号:11231352阅读:来源:国知局

技术特征:

技术总结
本发明涉及汽车无人驾驶技术领域,一种基于强化学习的车辆跟驰模型建立方法,包括以下步骤:(1)定义经验缓存D、创建Q值网络,(2)随机初始化环境中所有车辆位置、速度、加速度和环境状态,(3)选择并执行动作,记录转移样本,计算长期回报,(4)更新Q值网络权重,对误差函数loss进行一次梯度下降,(5)步数是否超过最大时间步数,重复步骤3至步骤4,直到步数超过最大时间步数timestepmax的值或碰撞,(6)步数是否超过最大回合数,重复步骤2至步骤5,直到步数超过最大回合数episodemax的值。本发明把强化学习和神经网络结合起来,不断地对环境进行探索和对已经学习到的经验进行利用,最终得到一个无须驾驶数据驱动的无人汽车跟驰模型建立方法。

技术研发人员:谭国真;罗志祥
受保护的技术使用者:大连理工大学
技术研发日:2017.04.22
技术公布日:2017.09.08
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1