一种基于强化学习的车辆跟驰模型建立方法与流程

文档序号：11231352阅读：来源：国知局

技术特征：

技术总结
本发明涉及汽车无人驾驶技术领域，一种基于强化学习的车辆跟驰模型建立方法，包括以下步骤：(1)定义经验缓存D、创建Q值网络，(2)随机初始化环境中所有车辆位置、速度、加速度和环境状态，(3)选择并执行动作，记录转移样本，计算长期回报，(4)更新Q值网络权重，对误差函数loss进行一次梯度下降，(5)步数是否超过最大时间步数，重复步骤3至步骤4，直到步数超过最大时间步数timestepmax的值或碰撞，(6)步数是否超过最大回合数，重复步骤2至步骤5，直到步数超过最大回合数episodemax的值。本发明把强化学习和神经网络结合起来，不断地对环境进行探索和对已经学习到的经验进行利用，最终得到一个无须驾驶数据驱动的无人汽车跟驰模型建立方法。

技术研发人员：谭国真;罗志祥
受保护的技术使用者：大连理工大学
技术研发日：2017.04.22
技术公布日：2017.09.08

完整全部详细技术资料下载

当前第2页1 2