一种自动驾驶行为决策与轨迹规划模型与方法

文档序号：31724650发布日期：2022-10-05 00:13阅读：433来源：国知局

1.本发明属于自动驾驶技术领域。

背景技术：

2.自动驾驶是当前交通领域最为热门的领域之一,自动驾驶一般由感知识别、决策规划、执行控制三个环节组成。
3.感知系统也被称为“中层控制系统”，负责感知周围的环境，并进行环境信息与车内信息的采集与处理，主要涉及道路边界检测、车辆检测、行人检测等技术；决策系统也被称为“上层控制系统”，负责路径规划和导航，代替人类作出驾驶行为的决策；执行系统也被称为“底层控制系统”，负责汽车的加速、刹车和转向，主要由电子制动、电子驱动以及电子转向三部分构成。
4.近年来，国内外学者对于计算机视觉、自动驾驶决策行为分析、车辆动力学控制各方面的研究都在逐步深入，也都有了不同程度的应用。但是，现有自动驾驶框架体系的完整性差,存在换道安全性差的问题。

技术实现要素：

5.本发明目的是为了解决现有自动驾驶框架体系的完整性差,存在换道安全性差的问题。本发明提出一种自动驾驶行为决策与轨迹规划模型与方法。
6.本发明所述一种自动驾驶行为决策与轨迹规划模型，包括：安全保障层、行为决策层、轨迹规划层和车辆控制层；
7.行为决策层用于根据周围车辆及环境信息，利用idm算法和mobil算法，获取车辆下一时刻的决策指令；
8.安全保障层用于根据交通法规及目标车辆的速度、周围车辆及环境信息判断目标车辆执行行为决策层获取的下一时刻的决策指令是否会与周围车辆发生碰撞，若是则向行为决策层发送碰撞危险报警信号；否则将车辆下一时刻的决策指令发送至轨迹规划层；
9.行为决策层接收到碰撞危险报警信号，再次根据周围车辆及环境信息，利用idm算法和mobil算法，重新获取目标车辆下一时刻的决策指令；
10.轨迹规划层用于利用目标车辆周围车辆及环境信建立frenet坐标系，根据车辆下一时刻的决策指令对目标车辆行驶轨迹进行建模，采用硬约束和软约束计算成本函数，对目标车辆行驶轨迹寻优，获取最优目标车辆行驶轨迹；
11.安全保障层还用于根据交通法规及目标车辆的速度、周围车辆及环境信息判断最优目标车辆行驶轨迹每个时刻是否会与周围车辆发生碰撞，若是，则向轨迹规划层发送碰撞报警危险报警信号，同时标记碰撞时刻；否则，将向车辆控制层发送最优目标车辆行驶轨迹发送至车辆控制层；
12.轨迹规划层接收到碰撞危险报警信号，根据标记的碰撞时刻，调整最优目标车辆行驶轨迹，重新获取最优目标车辆行驶轨迹；
13.车辆控制层用于对最优目标车辆行驶轨迹进行离散化处理，获取每一时刻目标车辆的位置，再根据每一时刻目标车辆的位置与相邻两时刻目标车辆位置之间偏角，利用pid控制器获取动作控制信号。
14.一种自动驾驶行为决策与轨迹规划方法，该方法具体包括：
15.步骤一、采集目标车辆周围车辆及环境信息，根据所述周围车辆及环境信息和交通法规，利用idm算法和mobil算法，获取车辆下一时刻的决策指令；
16.步骤二、利用目标车辆周围车辆及环境信息建立frenet坐标系，根据车辆下一时刻的决策指令对目标车辆行驶轨迹进行建模，采用硬约束和软约束计算成本函数，对目标车辆行驶轨迹寻优，获取最优目标车辆行驶轨迹；
17.步骤三、对最优目标车辆行驶轨迹进行坐标变换，并离散化处理，再利用pid控制器获取动作控制信号。
18.进一步地，本发明中，步骤一中，目标车辆周围车辆及环境信息包括周围车辆的与目标车辆的相对速度、相对位置及目标车辆的当前车道信息。
19.进一步地，本发明中，步骤一中，获取车辆下一时刻的决策指令的具体方法为：
20.采用idm算法，根据目标车辆与前车的间距、速度，计算使车辆保持跟车行驶的加速度；
21.采用mobil算法根据所述使车辆保持跟车行驶的加速度，通过最小化变道引起的总制动策略对目标车辆变道行为进行建模，获取下一时刻目标车辆的换道决策指令。
22.进一步地，本发明中，步骤一中，采用idm算法，根据目标车辆与前车的间距、速度，计算使目标车辆保持跟车行驶的加速度的具体方法为：
23.利用idm算法的加速度方程：
[0024][0025][0026]
获取计算使目标车辆保持跟车行驶的加速度an，使目标车辆保持跟车行驶的加速度an分为自由流加速度a
free
(vn)与拥挤流加速度a
brake
(sn,vn,δvn)：
[0027][0028][0029][0030]
其中，s
(n)min
为车辆静止时的安全距离，tn为驾驶员反应时间时距，bn为舒适加速度， vn为目标车辆的速度，n为目标车辆的编号，a
(n)max
为目标车辆的最大加速度；v
(n)max
为目标车辆在自由流状态下的期望速度；δ为加速度指数，当δ
→
∞时，加速度为恒定值， δvn＝v
n-v
n-1
，δvn为目标车辆n与当前车道前车n-1的速度差，sn＝x
n-1-x
n-l
n-1
，sn为目标车
辆n与当前车道前车n-1的净间距，xn为车辆n的位置；l
n-1
为车辆(n-1)的长度；标量s
*
是当前状态下驾驶员的期望间距。
[0031]
进一步地，本发明中，步骤二中，对目标车辆行驶轨迹寻优之前，还包括对最优目标车辆行驶轨迹安全性判断的步骤，具体过程为:
[0032]
对目标车辆周围车辆及环境内的障碍物位置进行预测，并定义目标车辆在行驶过程中至少会与一个障碍物发生碰撞的不安全的栅格集合：
[0033][0034]
其中，t表示当前时刻，t
′
表示下一时刻，o表示障碍物所占的栅格的合集，rc表示碰撞半径，τ(s(t),d(t))是备选轨迹点中的任意一个栅格，τo(so(t),do(t))是预测的障碍物栅格，当备选轨迹点的栅格与预测的障碍物栅格的欧氏距离小于碰撞半径rc，存在碰撞，当目标车辆行驶轨迹避开集合u时为安全，t表示车辆行驶的总时间，so(t)表示t时刻障碍物在 frenet坐标系下的纵坐标，do(t)表示t时刻障碍物在frenet坐标系下的横坐标，s(t
′
)表示t
′ꢀ
时刻车辆在frenet坐标系下的纵坐标，so(t
′
)表示t
′
时刻障碍物在frenet坐标系下的纵坐标，d(t
′
)表示t
′
时刻车辆在frenet坐标系下的横坐标，do(t
′
)表示t
′
时刻障碍物在frenet坐标系下的横坐标。
[0035]
进一步地，本发明中，步骤二中，对目标车辆行驶轨迹寻优，获取最优目标车辆行驶轨迹的具体过程为：
[0036]
利用成本函数：
[0037][0038]
对目标车辆行驶轨迹寻优，其中，j(τ)表示最优轨迹的成本函数，j0表示车辆到目标车道中心的距离，ω0表示车辆到目标车道中心的距离这一参数的权重，jv表示对速度误差的成本函数，ωv表示速度的权重，ja表示对加速度的成本函数，ωa表示加速度的权重，jj表示对车辆的颠簸程度的成本函数，ωj表示车辆颠簸程度这一参数的权重，表示车辆转向角的成本函数，表示车辆转向角参数的权重。
[0039]
本发明利用idm和mobil算法实现自动驾驶车辆的长期行为决策，通过硬约束、软约束两种行驶对车辆行驶轨迹进行规划以及最优化来实现自动驾驶车辆的短期轨迹规划，它包括一个行为决策层，一个轨迹规划层，一个安全保障层以及一个车辆控制层,有效的提高了自动驾驶的安全性。
附图说明
[0040]
图1是本发明所述框架的整体结构示意图；
[0041]
图2是行为决策层中的状态转换过程示意图；
[0042]
图3是frenet坐标系下的车辆行驶路径示意图；
[0043]
图4是移动障碍物和候选路径的轨迹示意图。
具体实施方式
[0044]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0045]
需要说明的是，在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。
[0046]
具体实施方式一：下面结合图1说明本实施方式，本实施方式所述一种自动驾驶行为决策与轨迹规划模型，其特征在于，包括：安全保障层、行为决策层、轨迹规划层和车辆控制层；
[0047]
行为决策层用于根据周围车辆及环境信息，利用idm算法和mobil算法，获取车辆下一时刻的决策指令；
[0048]
安全保障层用于根据交通法规及目标车辆的速度、周围车辆及环境信息判断目标车辆执行行为决策层获取的下一时刻的决策指令是否会与周围车辆发生碰撞，若是则向行为决策层发送碰撞危险报警信号；否则将车辆下一时刻的决策指令发送至轨迹规划层；
[0049]
行为决策层接收到碰撞危险报警信号，再次根据周围车辆及环境信息，利用idm算法和mobil算法，重新获取目标车辆下一时刻的决策指令；
[0050]
轨迹规划层用于利用目标车辆周围车辆及环境信建立frenet坐标系，根据车辆下一时刻的决策指令对目标车辆行驶轨迹进行建模，采用硬约束和软约束计算成本函数，对目标车辆行驶轨迹寻优，获取最优目标车辆行驶轨迹；
[0051]
安全保障层还用于根据交通法规及目标车辆的速度、周围车辆及环境信息判断最优目标车辆行驶轨迹每个时刻是否会与周围车辆发生碰撞，若是，则向轨迹规划层发送碰撞报警危险报警信号，同时标记碰撞时刻；否则，将向车辆控制层发送最优目标车辆行驶轨迹发送至车辆控制层；
[0052]
轨迹规划层接收到碰撞危险报警信号，根据标记的碰撞时刻，调整最优目标车辆行驶轨迹，重新获取最优目标车辆行驶轨迹；
[0053]
车辆控制层用于对最优目标车辆行驶轨迹进行离散化处理，获取每一时刻目标车辆的位置，再根据每一时刻目标车辆的位置与相邻两时刻目标车辆位置之间偏角，利用pid控制器获取动作控制信号。
[0054]
本发明提出了一个面向自动驾驶长期行为决策与短期轨迹规划的层次框架来实现车辆的自动驾驶决策与规划。在决策层，利用智能驾驶员模型(idm)和mobil模型，根据目标车辆周围的道路交通状况生成长期决策的决策行为，包括跟驰和换道决策。在规划层，采用frenet坐标系进行短期轨迹优化，消除了道路曲率对轨迹方程计算的影响，相对于笛卡尔坐标系，极大地降低了运算量。进一步，本文在frenet坐标系下通过探索空间中的可行区域来生成轨迹多项式，从而能在保证轨迹安全的前提下执行决策命令。最后，这一框架还引入了一个启发式的安全保障层，用于处理突发状况，在紧急情况下能够调用其他模块进行重新计算。
[0055]
本发明提出了一个面向自动驾驶长期行为决策与短期轨迹规划的层次框架来实现车辆的自动驾驶决策与规划。在决策层，利用智能驾驶员模型(idm)和mobil模型，根据
目标车辆周围的道路交通状况生成长期决策的决策行为，包括跟驰和换道决策。在规划层，采用frenet坐标系进行短期轨迹优化，消除了道路曲率对轨迹方程计算的影响，相对于笛卡尔坐标系，极大地降低了运算量。进一步，本文在frenet坐标系下通过探索空间中的可行区域来生成轨迹多项式，从而能在保证轨迹安全的前提下执行决策命令。最后，这一框架还引入了一个启发式的安全保障层，用于处理突发状况，在紧急情况下能够调用其他模块进行重新计算。
[0056]
具体实施方式二、本实施方式所述一种自动驾驶行为决策与轨迹规划方法，该方法具体包括：
[0057]
步骤一、采集目标车辆周围车辆及环境信息，根据所述周围车辆及环境信息和交通法规，利用idm算法和mobil算法，获取车辆下一时刻的决策指令；
[0058]
步骤二、利用目标车辆周围车辆及环境信息建立frenet坐标系，根据车辆下一时刻的决策指令对目标车辆行驶轨迹进行建模，采用硬约束和软约束计算成本函数，对目标车辆行驶轨迹寻优，获取最优目标车辆行驶轨迹；
[0059]
步骤三、对最优目标车辆行驶轨迹进行坐标变换，并离散化处理，再利用pid控制器获取动作控制信号。
[0060]
进一步地，本发明中，步骤一中，目标车辆周围车辆及环境信息包括周围车辆的与目标车辆的相对速度、相对位置及目标车辆的当前车道信息。
[0061]
进一步地，本发明中，获取车辆下一时刻的决策指令的具体方法为：
[0062]
采用idm算法，根据目标车辆与前车的间距、速度，计算使车辆保持跟车行驶的加速度；
[0063]
采用mobil算法根据所述使车辆保持跟车行驶的加速度，通过最小化变道引起的总制动策略对目标车辆变道行为进行建模，获取下一时刻目标车辆的换道决策指令。
[0064]
进一步地，本发明中，步骤一中，采用idm算法，根据目标车辆与前车的间距、速度，计算使目标车辆保持跟车行驶的加速度的具体方法为：
[0065]
利用idm算法的加速度方程：
[0066][0067][0068]
获取计算使目标车辆保持跟车行驶的加速度an，使目标车辆保持跟车行驶的加速度an分为自由流加速度a
free
(vn)与拥挤流加速度a
brake
(sn,vn,δvn)：
[0069][0070][0071]
计算转移到frenet坐标系能够让车辆的驾驶行为对于三维的道路曲率和坡度保持不变，比笛卡尔坐标系描述车辆轨迹曲线的方式更为简单，能够显著简化函数、优化计算。这一框架中还构建了一个可扩展的安全保障层，用于控制生成的决策和轨迹的安全行。如果在路径规划中出现碰撞风险或无法预测轨迹的情况，安全保障层会向各模块重新发送计算命令。这在一定程度上提高了算法的安全性和可靠性。
[0083]
为了实现这种形式下的避障，定义一个集合u，该集合表示目标车辆在行驶过程中至少会与一个障碍物发生碰撞的不安全的栅格集合：
[0084][0085]
其中，的t表示当前时刻，t
′
表示下一时刻，o表示障碍物所占的栅格的合集，rc表示碰撞半径，τ(s(t),d(t))是备选轨迹点中的任意一个栅格，τo(so(t),do(t))是预测的障碍物栅格。因此问题可以转化为找到所有的τo点，在该点处τ和τo的欧氏距离小于碰撞半径rc。由于车辆行驶是一个连续的过程，每一个障碍物所占据的位置可以用一个半径为rc的柱体来表示，可行的备选轨迹只需要避开这个集合u即可。
[0086]
利用上述方法在目标车辆最优行驶轨迹上等间隔生成备选轨迹点后，利用成本函数：
[0087][0088]
其中，j(τ)表示最优轨迹的成本函数，w
x
表示各个参数的权重值。j0表示车辆到目标车道中心的距离，jv表示对速度误差的成本函数，ja表示对加速度的成本函数，jj表示对车辆的颠簸程度的成本函数，表示车辆转向角的成本函数。
[0089]
对获取目标车辆最优行驶轨迹在可靠性、舒适性和安全性方面寻优的步骤。
[0090]
进一步地，本发明中，对最优目标车辆行驶轨迹进行离散化处理，再利用pid控制器对目标车辆进行控制的过程为：
[0091]
根据当前车辆的速度、加速度生成车辆确定等间隔时间点到达的位置坐标，根据相邻两时间点之间的距离和偏角生成横向、纵向的pid控制指令，通过横向pid控制器控制转向角，通过纵向pid控制器控制车辆油门控制车辆的速度和加速度。
[0092]
本发明所述自动驾驶行为决策与轨迹规划模型与方法，其核心是将决策与控制算法进行集成，并通过一个安全保障层确保最终行为的安全性。这一集成方式可以使控制层直接调用决策层的输出，可以在一定程度上减少数据处理的工作量。同时安全保障层的功能相较于传统研究中在决策、控制层各自进行安全保障的方法更为可靠。
[0093]
虽然在本文中参照了特定的实施方式来描述本发明，但是应该理解的是，这些实施例仅仅是本发明的原理和应用的示例。因此应该理解的是，可以对示例性的实施例进行许多修改，并且可以设计出其他的布置，只要不偏离所附权利要求所限定的本发明的精神和范围。应该理解的是，可以通过不同于原始权利要求所描述的方式来结合不同的从属权利要求和本文中所述的特征。还可以理解的是，结合单独实施例所描述的特征可以使用在其他所述实施例中。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高汇东曲明成崔建勋徐培刚李先通
技术所有人：哈尔滨工业大学重庆研究院
我是此专利的发明人

上一篇：一种继电保护装置走时精度测试工装的制作方法
上一篇：一种具有调节功能的种植工作台

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、林老师：1.智能驾驶技术研究 2.智能汽车人机交互研究 3.自动驾驶预期功能安全及可靠性 4.驾驶功能与车辆动力学数据融合 5.驾驶场景大数据分析技术 6.车辆性能研究
2、朱老师：1.新能源汽车电驱动技术 2.轮毂电机驱动与控制 3.开关磁阻电机驱动系统控制 4.智能电动汽车
3、徐老师：1.内燃机节能及排放控制技术 2.汽车节能与新能源汽车技术 3. 车辆现代设计理论与方法
4、王老师：1.机械设计原理与方法 2.生理系统耦合及生物力学 3.康复工程学
5、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
如您是高校老师，可以点此联系我们加入专家库。