一种面向高速公路场景的智能车端到端决策方法及系统与流程

文档序号：17336082发布日期：2019-04-05 22:30阅读：250来源：国知局

本发明涉及无人驾驶汽车决策领域，特别涉及一种面向高速公路场景的智能车端到端决策方法及系统。

背景技术：

随着技术的发展，越来越多的智能车研究人员将注意力集中于实际驾驶场景，希望在实际高速公路上实现自动驾驶，著名的darpa竞赛历届的比赛场景中都有高速公路场景，要求参赛智能车像人类驾驶员一样完成高速公路场景下的避障、超车和换道等决策任务，旨在促进智能车更快地进入实际驾驶场景中，并在实际驾驶场景中帮助人类完成各种驾驶任务。

高速公路场景相比城市公路场景，其道路结构比较规范，有清晰的车道线，背景简单，环境的不可预测性因素较少，周围车辆的运动行为基本可预测，环境相对稳定。面向高速公路场景的决策方法必须考虑避免许多由不可预测性因素造成的极端行驶环境，专注于提升智能车驾驶的安全性和舒适性。然而在公共数据库训练的决策模型都是基于公路场景，并不能直接应用到实际高速公路场景中。原因有两点：一是公共数据库中的场景与实际高速公路场景差异巨大，比如国外交通标志与国内的交通标志并不一致，同种车道周边的场景也并不一样，让公共数据库上训练的模型直接预测实际高速公路场景的决策值会产生较大偏差；二是不同车辆的内部属性并不相同，同样的场景不同的车辆所需要转动的方向盘转角值并不一样，直接将公路场景的公共数据库上训练的模型应用在高速公路实际车辆上容易输出极端决策值。为了应用公共数据库上训练的模型，那么就需要应用模型迁移的方法，利用模型迁移方法将公共数据库上训练的模型迁移到实际高速公路场景中，这样就可以让实际车辆根据当前场景输出适合本车的决策量，保持智能车辆安全稳定地决策。

高速公路场景下的决策过程主要涉及车道保持、变道、超车和跟车等操作，让智能车安全稳定地行驶。车道保持操作要求智能车尽量在车道中间行驶，当车辆靠近右侧车道线时输出左转方向盘转角值，当车辆靠近左侧车道线时输出右转方向盘转角值。这种情况下的决策网络必须具有让智能车自动回正的能力。变道操作要求智能车在不和其他车辆发生碰撞的基础上安全行驶，其基本条件是当前车道的前方车辆与本车距离低于安全距离，并且左边车道或者右边车道没有车辆。超车操作是在变道操作的基础上进行两次连续的变道操作，该过程需要考虑被超车车辆的车速，跟车操作的行驶条件是当前车道的前方车辆与本车的距离低于安全距离并且左右车道都有车辆，只能让智能车减速然后与前车保持一个安全距离行驶。针对实际高速公路场景下的智能车决策问题，设计出一种面向高速公路场景的智能车端到端决策系统应用在高速公路场景，使得无人驾驶模式的智能车能够实现主动避障、根据前方车辆的运动进行相应的加速和减速操作、当前方障碍物消失时自主启动等自动驾驶功能，那么就能完美地实现高速公路场景下的智能车驾驶。

技术实现要素：

本发明的目的在于克服现有技术的不足，提供一种面向高速公路场景的智能车端到端决策方法及系统，能让智能车根据高速公路实际场景输出适合本车的决策量，保持智能车辆在无人驾驶过程中安全稳定地决策，实现提升智能车行驶的安全性和舒适性的目的。

本发明的目的是通过以下技术方案来实现的：

一种面向高速公路场景的智能车端到端决策方法，包括以下步骤：

s1、采用迁移学习方法中的finetuning方法重新训练初始训练网络模型，得到决策模型，包含以下分步骤：

s11、采集高速公路场景下的熟练驾驶员行驶样本制作成样本标签作为所述初始训练网络模型的训练样本；

s12、对已经训练好的初始训练模型进行finetuning操作，利用所述的训练样本获得高速公路场景下的决策模型；

s2、搭建高速公路场景下的智能车端到端决策系统的框架，包含以下分步骤：

s21、摄像头采集到即刻拍摄的图像或视频首先传给端到端决策网络，决策网络利用输入的图像或视频计算出方向盘转角值；

s22、使用卡尔曼滤波器对所述方向盘转角值进行滤波处理；

s23、使用can协议将决策量传给车辆控制模块；

s3、测试面向高速公路场景的智能车端到端决策系统，包含以下分步骤：

s31、使用训练样本集训练初始训练网络模型，获得预训练初始化模型，首先将学习率设为0.0001，优化方法采用adam，然后使用摄像头采集到即刻的图像或视频finetuning预训练初始化模型，学习率设为0.00001，优化方法采用adam，在网络收敛后得到高速公路场景下的端到端决策模型；

s32、在端到端决策系统里面加载训练好的决策模型，输入所述高速公路场景即刻拍摄的图像或者视频，计算出方向盘转角值，将所述卡尔曼滤波器中的模型噪声参数设为1，观测噪声参数设为20；

s33、利用离线数据测试端到端决策模型的输出，计算其预测的方向盘转角值与基准值之间的均方误差根，评价预测曲线与基准曲线的相似性。

进一步地，所述卡尔曼滤波器的状态更新公式为：

其中，k为卡尔曼增益，是根据系统状态和噪音计算出来的最优权值，xk^λ为模型预测值。

进一步地，所述can协议包括控制器和收发器，所述收发器用于收发数据，所述控制器用于判断接收到的数据的有用性。

一种面向高速公路场景的智能车端到端决策系统，包括以下功能模块：

预训练决策模块，用于将采集到的高速公路场景下的熟练驾驶员行驶样本制作成样本标签新训练初始训练网络模型，进行finetuning操作得出决策模型；

智能车端到端决策系统框架模块，首先利用速公路场景下的摄像头采集到即刻拍摄的图像或视频传输到端到端决策网络算出方向盘转角值，再使用卡尔曼滤波器对所述方向盘转角值进行滤波处理，然后用can协议将决策量传给车辆控制模块；

智能车端到端决策系统测试模块，利用训练样本集训练初始训练网络模型，获得预训练初始化模型，在端到端决策系统里面加载训练好的决策模型计算出方向盘转角值，利用离线数据测试端到端决策模型的输出算其预测的方向盘转角值与基准值之间的均方误差根。

进一步地，所述的能车端到端决策系统框架模块包括以下子功能模块：

计算方向盘转角值模块，用于摄像头采集到即刻拍摄的图像或视频首先传给端到端决策网络计算出方向盘转角值得到决策量；

卡尔曼滤波模块，用于对方向盘转角值进行滤波处理，使决策量变平滑；

can协议模块，用于将决策量传给车辆控制模块，包括收发器和控制器，收发器用于收发数据，控制器用于判断接收到的数据的有用性。

本发明的有益效果是：

1)本发明设计的端到端决策系统有较强的稳定性，其预测的方向盘转角值比较平稳，不会出现激烈的变化，保证了智能车在实际高速公路上能够平稳行驶，不会出现强烈的震荡；端到端的决策系统在智能车拐弯时也能够很好地拟合基准曲线，不会像卷积网络那样出现较大偏差；预训练好的时空特征融合网络已经具备一定的预测方向盘转角的能力，通过finetuning方法将该决策网络直接迁移到高速公路场景下可以节省很多时间，不用我们再从头开始训练网络模型。

2)采用can总线,传输效率高，用时短，并且成本相对较低，具有非常强的抗干扰能力，数据有误时能够迅速检测出来，其独特的双线串行结构有利于其抵抗各种电磁干扰,因为拥有优先级控制功能和仲裁功能，can总线可以形成大的局域通信架构。

3)现了高速公路场景下无人驾驶模式的自主巡航决策控制,不再需要人为的干预,实现主动避障,根据前方车辆的运动进行相应的加速和减速操作、当前方障碍物消失时自主启动等自动驾驶功能。

附图说明

图1为本发明方法的流程图；

图2为本发明系统的框架图。

具体实施方式

下面将结合实施例，对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

参阅图1-2，本发明提供一种技术方案：

一种面向高速公路场景的智能车端到端决策方法，如图1所示，主要包括以下几个步骤：

第一步，采用迁移学习方法中的finetuning方法重新训练初始训练网络模型，得到决策模型，包含以下分步骤：

采集高速公路场景下的熟练驾驶员行驶样本制作成样本标签作为所述初始训练网络模型的训练样本；

对已经训练好的初始训练模型进行finetuning操作，利用所述的训练样本获得高速公路场景下的决策模型；

高速公路场景相比城市公路场景，其道路结构比较规范，有清晰的车道线，背景简单。环境的不可预测性因素较少，周围车辆的运动行为基本可预测，环境相对稳定。面向高速公路场景的决策方法可以避免考虑许多由不可预测性因素造成的极端行驶环境，专注于提升智能车驾驶的安全性和舒适性。然而在公共数据库训练的决策模型并不能直接应用到实际高速公路场景中，原因有两点：一是公共数据库中的场景与实际高速公路场景差异巨大，比如国外交通标志与国内的交通标志并不一致，同种车道周边的场景也并不一样。让公共数据库上训练的模型直接预测实际高速公路场景的决策值会产生较大偏差。二是不同车辆的内部属性并不相同，同样的场景不同的车辆所需要转动的方向盘转角值并不一样。直接将公共数据库上训练的模型应用在实际车辆上容易输出极端决策值。为了应用公共数据库上训练的模型，需要应用模型迁移的方法。利用模型迁移方法将公共数据库上训练的模型迁移到实际高速公路场景中，这样就可以让实际车辆根据当前场景输出适合本车的决策量，保持智能车辆安全稳定地决策。本发明的目的在于让实际车辆根据当前场景输出适合本车的决策量，保持智能车辆安全稳定地决策，让决策算法可以专注于提升智能车行驶的安全性和舒适性。在此基础上提出了一种面向高速公路场景的端到端决策系统，并在长春高速公路数据集上验证了该决策系统的有效性。

预训练好的时空特征融合网络已经具备一定的预测方向盘转角的能力，通过finetuning方法将该决策网络直接迁移到高速公路场景下可以节省很多时间，不用我们再从头开始训练网络模型，comma.ai公共数据集是由国外熟练驾驶员采集，而我国的高速公路场景的交通规则与国外的不同，高速公路上的各种标识和公路两旁的场景也并不一致，直接利用在comma.ai公共数据集上训练的模型预测决策量容易输出极端决策值，容易引发交通事故。

第二步，搭建高速公路场景下的智能车端到端决策系统的框架，包含以下分步骤：

摄像头采集到即刻拍摄的图像或视频首先传给端到端决策网络，决策网络利用输入的图像或视频计算出方向盘转角值；了提高车辆行驶的稳定性和安全性，需要对该方向盘转角值进行滤波操作，我们使用卡尔曼滤波器对所述方向盘转角值进行滤波处理；通过卡尔曼滤波器后，决策量会变得更加平滑，这有利于决策系统更加稳定地控制智能车；最后通过can协议将决策量传给车辆控制模块，can协议相比其它通信协议稳定可靠，信号丢失少，实现简单方便。

所述卡尔曼滤波器的状态更新公式为：

其中，k为卡尔曼增益，是根据系统状态和噪音计算出来的最优权值，xk^λ为模型预测值，我们越相信模型的预测xk^λ，则观测的增益k越小；反之，当我们越不相信模型的预测xk^λ，则观测的增益k越大。卡尔曼滤波的基本思想是以k-1时刻的最优估计x^k-1为准，预计k时刻的状态变量xk^λ，同时又对该状态进行观测，得到观测变量zk，再在预测与观测之间进行分析，根据观测量修正预测量，从而得到k时刻的最优状态估计xk,卡尔曼滤波就是观测和测量的结合,预测来自经验模型，由人对系统的建模推算得来,测量修正来自外部的测量，是对模型的修正,观测噪声和测量噪声分别是对模型和测量不确定性的定量描述。

所述can协议包括控制器和收发器，所述收发器用于收发数据，所述控制器用于判断接收到的数据的有用性，can总线的最大特征是以广播的形式让不同距离的数据完成通信任务。收发器的主要任务是收发数据，控制器的主要任务是判断接收到的数据是否有用，不是则忽略。当一个结点需要传送数据时，系统首先将要发送的数据传给can控制器，让其准备发送，然后总线分配相应的资源让数据顺利传送到接收端。can控制器根据传输协议组将发送数据组织成特定形式，这时接收结点准备接收数据。接收端在接收数据时会检查数据的特定帧位的状态，以判断数据是否为所需的。can总线有以下几个特征：传输效率高，用时短，并且成本相对较低，具有非常强的抗干扰能力；当数据有误时能够迅速检测出来，其独特的双线串行结构有利于其抵抗各种电磁干扰；因为拥有优先级控制功能和仲裁功能，can总线可以形成大的局域通信架构。

测试面向高速公路场景的智能车端到端决策系统，包含以下分步骤：

使用训练样本集训练初始训练网络模型，获得预训练初始化模型，首先将学习率设为0.0001，优化方法采用adam，然后使用摄像头采集到即刻的图像或视频finetuning预训练初始化模型，学习率设为0.00001，优化方法采用adam，在网络收敛后得到高速公路场景下的端到端决策模型；

在端到端决策系统里面加载训练好的决策模型，输入所述高速公路场景即刻拍摄的图像或者视频，计算出方向盘转角值，将所述卡尔曼滤波器中的模型噪声参数设为1，观测噪声参数设为20；

利用离线数据测试端到端决策模型的输出，计算其预测的方向盘转角值与基准值之间的均方误差根，评价预测曲线与基准曲线的相似性。

如图2所示，一种面向高速公路场景的智能车端到端决策系统，包括以下功能模块：

预训练决策模块，用于将采集到的高速公路场景下的熟练驾驶员行驶样本制作成样本标签新训练初始训练网络模型，进行finetuning操作得出决策模型；

所述的能车端到端决策系统框架模块包括以下子功能模块：

计算方向盘转角值模块，用于摄像头采集到即刻拍摄的图像或视频首先传给端到端决策网络计算出方向盘转角值得到决策量；

卡尔曼滤波模块，用于对方向盘转角值进行滤波处理，使决策量变平滑；

can协议模块，用于将决策量传给车辆控制模块，包括收发器和控制器，收发器用于收发数据，控制器用于判断接收到的数据的有用性。

发明所用的数据集由熟练驾驶员在长春市周边高速公路和快车道上采集得到，大部分场景在上午九点到下午三点之间采集。采集数据的车辆是一汽红旗牌h7高档轿车，我们选择在晴天阳光充足的时候采集数据，因为晴天的场景图像的整体亮度较高，场景中各物体的轮廓比较清晰，这些都有利于决策网络预测方向盘转角值。为了帮助端到端决策网络更好地预测方向盘转角值，采集数据时我们选择了车道线比较清晰的路段，花了将近一个月的时间采集了16万帧左右的数据，其中大部分场景是长春市周边高速公路和城市块车道，只有少部分城市公路场景。

本发明实验的硬件环境是：超微sys-7048gr-tr服务器，x10drg-q主板，4块titanx显卡和1块内置显卡本实验的软件环境是：ubuntu16.04操作系统，keras2.1.1深度学习平台和tensorflow-gpu1.4.0深度学习平台。本发明设计的端到端决策系统有较强的稳定性，其预测的方向盘转角值比较平稳，不会出现激烈的变化，保证智能车在实际高速公路上能够平稳行驶，不会出现强烈的震荡。另外，端到端决策系统在智能车拐弯时也能够很好地拟合基准曲线，不会像卷积网络那样出现较大偏差，证明该系统能够帮助智能车顺利完成高速公路上的拐弯任务。

以上所述仅是本发明的优选实施方式，应当理解本发明并非局限于本文所披露的形式，不应看作是对其他实施例的排除，而可用于各种其他组合、修改和环境，并能够在本文所述构想范围内，通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围，则都应在本发明所附权利要求的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：程洪;金凡;梁黄黄;赵洋
技术所有人：电子科技大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、王老师：电子信息处理、先进检测方法和智能化仪表
4、周老师：1.智能电网 2.新能源利用 3.泛在电力物联网
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。