一种无人驾驶汽车驾驶任务决策系统及方法与流程

文档序号:14832652发布日期:2018-06-30 11:06阅读:229来源:国知局
一种无人驾驶汽车驾驶任务决策系统及方法与流程

本发明涉及汽车自动控制领域技术领域,尤其是一种无人驾驶汽车驾驶任务决策系统及其决策方法。



背景技术:

无人驾驶汽车是汽车发展的一个重要方向,无人驾驶汽车不仅能保证人们出行的安全性,还能大大提高大家的出行效率减少拥堵。自2009 年,中国起每年举办一届“中国智能车未来挑战赛”,这些赛事大大推动了无人驾驶车辆的发展。

尽管如此,无人驾驶汽车真正的走进现实生活以及被人们广泛接受还有很长的路要走。其中无人驾驶汽车的决策与控制直接影响无人驾驶汽车行为的安全性以及合理性。

关于无人驾驶汽车的决策与控制,申请号为201110007154.X的中国发明专利提出了一种无人驾驶汽车局部路径规划的装置及方法,该系统采用人工势场的方法计算无人驾驶车辆可行驶路径,但是该系统在规划可行驶路径时仅考虑了与其他障碍物的避障问题,并没有将遵守交通法律法规纳入建模中,无法保证无人驾驶汽车行为的合法性。

申请号为201110372447.8的中国发明专利描述了一种无人驾驶汽车的导航方法,该方法集成视觉导航、雷达导航和GPS导航三种导航策略,在不同的环境及工况下采用不同的导航策略。该方法中三个导航策略都过于简单,同样没有将遵守交通法律法规纳入到控制策略中。

申请号为201410221906.6的中国发明专利中描述了一种具有社会行为交互的无人驾驶汽车控制系统,该系统将其他车辆的驾驶意图考虑到决策与控制算法中,采用隐形马尔科夫模型判断其他车辆的行驶意图,但是该系统对无人驾驶车辆的决策过程的描述过于简单,缺少系统性的描述。



技术实现要素:

本发明要解决的技术问题是提供一种无人驾驶汽车驾驶任务决策系统及其决策方法,能够解决现有技术的不足,保证车辆在道路上能够安全高效的行驶,完成相应的行驶任务,并能够主动的遵守交通法律法规。

为解决上述技术问题,本发明所采取的技术方案如下。

一种无人驾驶汽车驾驶任务决策系统,其特征在于:包括,

环境感知模块,用于探测车辆周围的环境;

宏观规划及导航模块,用于根据输入的行驶任务进行路径规划生成从起点到终点可通行的宏观路径,并且根据汽车当前所处的位置确定汽车跟随宏观路径所需要采取的行为,输出导航信息;

驾驶任务决策模块,用于根据汽车当前的驾驶任务、驾驶环境、汽车导航信息决策汽车接下来将要执行的驾驶任务;

驾驶任务执行及避障模块,用于根据汽车的运动状态实现对最优驾驶任务的执行。

作为优选,导航信息包括汽车前方设定距离需要采取的行为以及推荐行驶的车道。

作为优选,环境感知模块包括若干个视觉传感器、若干个毫米波雷达传感器、若干个激光雷达传感器并且通过多源信息融合方式对传感器信息进行处理融合输出环境模型;所述环境模型,包括车道对象、交通参与物对象、可行区域对象;所述车道对象指感知范围内的每一条车道及其属性信息,包括交通标志线、交通信号灯、车道左右车道线的线型、车道限速值;所述交通参与物对象指感知范围内的运动或者静止的障碍物,交通参与物对象包含的信息有参与物的类型、轮廓、运动状态;可行区域对象指车辆物理上可以行使的区域的范围,利用多段线描述出边界的几何轮廓。

作为优选,驾驶任务决策模块包括驾驶任务集合生成模块、规则性评判模块和最优任务决策模块。

作为优选,驾驶任务集合生成模块根据汽车当前所处的驾驶环境确定汽车可以执行的驾驶任务集合,生成可执行驾驶任务集合时根据当前环境模型中的车道对象间的相互连接关系从驾驶行为池中选择所有可采取的行为确定预期路径;所述驾驶行为池包含保持车道、准备车道变换、执行车道变换、准备交叉口转弯、执行交叉口转弯、准备调头、执行调头;确定驾驶行为后对汽车可到达的车速范围进行离散,汽车可到达的车速确定方法为当前汽车的速度增加和减少一定的数值,代表汽车执行加速和减速;每一个离散的车速和其相对应的驾驶行为及预期路径对应一个驾驶任务;

驾驶任务包含汽车将要走行的预期路径、驾驶行为、驾驶要求;所述驾驶行为,指驾驶任务对应的行为有保持车道行驶、变换车道、交叉口转弯等;所述驾驶要求指驾驶任务执行时对汽车运动状态的要求有最高车速、转向等信号要求,驾驶要求通过沿着预期路径方向的S-L坐标系表示。

作为优选,规则性评判模块对驾驶任务池中的驾驶任务进行规则性评判,去掉驾驶任务中不符合交通规则的、不安全的以及和导航引导的方向不符的驾驶任务;规则性评判采用等级划分的方法进行评判;评判时分别从安全性、合法性和导航引导三个方面进行评级,最后进行综合评判。

作为优选,安全性评级指汽车将要采取的驾驶任务的安全性进行评级,分为2个等级,0和1分别对应不安全和安全;安全性分为两部分,一方面是保证汽车在运行时不会因为侧向加速度过大而产生侧翻等,另一方面是汽车与其他交通参与物发生碰撞的概率;进行第一个方面评判时,根据驾驶任务的预期路径曲率确定汽车可以安全行驶的最大车速,当驾驶任务的预期车速超过安全行驶的最大车速时认为安全性为0;进行第二个方面评判时计算汽车与其他交通参与物发生碰撞的概率,根据3σ原理,当发生碰撞的概率大于0.3%认定为不安全,评级指标为0,否则认定为安全,评级指标为1;对于汽车与其他交通参与物发生碰撞的概率计算时认为本车和其他交通参与者均前方和左右两侧均有一个安全范围,安全范围与速度相关为正太分布函数;进行碰撞概率计算,计算时汽车到达驾驶任务预期位置时与其他交通参与者的安全范围发生碰撞的概率。

作为优选,合法性评级指对驾驶任务是否违反交通规则进行评级,分为3个等级,0代表驾驶任务不符合交通规则,0.5代表驾驶任务不违反交通规则但是为不良的驾驶行为例如在换道过程中改变目标车道,1代表驾驶任务符合交通规则;进行合法性评级时,先从速度方面进行合法性判断,判断驾驶任务中的速度要求是否超过车道的限速值,当前方红绿灯为红灯时认为前方车道停车线以后的车道限速值为0,超过则认为驾驶任务合法性为0,之后判断驾驶任务是否有跨越实线变换车道、汽车行驶方向与车道指向的通行方向不同等行为,如果有则驾驶任务的合法性为0,最后建立驾驶任务合法迁变网络,根据汽车当前的执行的驾驶任务与目标驾驶任务迁变是否符合驾驶任务迁变网络,如果不符合则认为驾驶任务的合法性为0.5,如果符合则为1;所述的驾驶任务迁变网络,指遵守交通规则且具有良好的驾驶习惯下的驾驶行为迁变过程,当汽车处于执行换道的行为中时认为驾驶行为目标车道与当前行为的目标车道相同,认定为是合法的,否则合法性为0.5,当汽车当前处于准备换道阶段时,认定为处于准备换道阶段超过3s时合法性为1,否则为0.5。

作为优选,导航引导评级指对驾驶任务是否符合导航模块输入的导航行为及信息进行评级,所述的导航行为及信息指汽车前方一定距离需要采取的行为及推荐车道;导航引导评级同样分为三个等级,0代表完全不符合导航引导信息,0.5表示驾驶任务所能到达的方向与导航引导信息相同但是不完全相同,1代表驾驶任务完全符合导航引导信息。

作为优选,综合评判指对所有的驾驶任务根据安全性、合法性和导航引导评级的三个指标进行综合性筛选,首先保留安全性、合法性和导航引导评级均为1的驾驶任务,如果没有满足条件的则对筛选条件进行松弛,先保证安全性,之后保留从合法性和导航引导评级为0.5的驾驶任务;当没有满足安全性为1的驾驶任务时则发出报警,提醒驾驶员介入。

作为优选,最优任务决策模块从安全、合法和符合导航引导的驾驶任务中选择最佳的驾驶任务作为最终驾驶任务;进行最优驾驶任务决策时分别对驾驶任务进行驾驶负担评价和工效性评价,最终综合驾驶任务的工效性指标和驾驶负担指标选择最终驾驶任务;

驾驶负担评价指对车辆由当前位置到达驾驶任务的预期位置的横向距离进行评价,其范围为0~1间的连续值;

功效性评价指对驾驶任务所对应的驾驶要求中的最高车速进行评价,其范围同样为0~1的连续值。

作为优选,驾驶任务执行及避障模块根据汽车的运动状态实现对最优驾驶任务的执行,包括沿着驾驶任务预期路径行驶,同时保证汽车车速不超过驾驶任务要求的最高车速,转向灯状态满足驾驶任务对转向灯的要求,以及躲避驾驶任务预期路径中的障碍物。

作为优选,

一种上述的无人驾驶汽车驾驶任务决策系统的决策方法,包括以下步骤:

A、输入车辆行驶的行驶任务包括起点和终点;

B、宏观规划及导航模块根据输入的起点和终点进行宏观路径规划并且根据宏观路径规划的结果以及汽车当前的位置输出汽车接下来需要执行的导航信息;

C、初始化环境感知模块;环境感知模块感知车辆周围的环境周期性输出相应的环境模型;

D、驾驶任务决策模块以1000ms的周期性运行,根据当前所处的环境车辆当前所处的状态以及导航引导信息输出最优的驾驶任务;

E、驾驶任务执行及避障模块,根据汽车的运动状态实现对最优驾驶任务的执行以及对障碍物的躲避,输出控制汽车的控制指令;

F、车辆执行机构执行步骤E输出的控制指令实现车辆的运动;

G、判断是否接近目的地,如果接近目的地则终止。

作为优选,步骤E中,驾驶任务执行及避障模块根据初始化环境感知模块给出的环境模型计算出障碍物规避范围,并给出规避范围的阈值函数;然后建立阈值函数与车辆行驶状态轨迹的映射关系,通过映射关系与车辆行驶状态的实时迭代,给出车辆行驶状态的调控指令。

本发明将规则性判断和机理性判断分开,在规则性判断中分别考虑安全性、合法性、导航引导三个方面,在进行安全性判断时分别考虑自身行驶的安全性以及与其他物体发生碰撞的可能性,引入与其他物体发生碰撞的碰撞概率的计算方法。在合法性判断时,不止能判断驾驶任务是否遵守交通规则,同时建立良好驾驶习惯的驾驶任务迁变网络,判断驾驶任务是否符合良好的驾驶习惯。在最后的综合决策中分别考虑驾驶负担和驾驶任务的工效性进行最优决策。采用上述技术方案所带来的有益效果在于:

1、本发明具有很好的安全性,车辆不仅在良好的环境下可以安全的行驶,在拥堵的情景车辆仍然可以安全通过。

2、车辆可以很好的遵循交通法律法规,例如车辆进行车道变换时需要提前3s开启转向灯,不允许车辆连续变换车道以及车辆转弯前必须提前并入相应车道等。

附图说明

图1为本发明整体运行框图。

图2为本发明环境模型示意图。

图3为换道过程示意图。

图4为转弯过程示意图。

图5为调头过程示意图。

图6为直行道驾驶任务集合生成示意图。

图7为十字路口驾驶任务集合生成示意图。

图8为汽车安全范围示意图。

图9为高速直行时碰撞概率计算示意图。

图10为低速直行时碰撞概率计算示意图。

图11为换道时碰撞概率计算示意图。

图12为转弯时碰撞概率计算示意图。

图13为良好驾驶习惯驾驶任务迁变网络。

图中:1、环境感知模块;2、宏观规划及导航模块;3、驾驶任务决策模块;4、驾驶任务执行及避障模块;31、驾驶任务集合生成模块;32、规则性评判模块;33、最优任务决策模块。

具体实施方式

本发明中使用到的标准零件均可以从市场上购买,异形件根据说明书的和附图的记载均可以进行订制,各个零件的具体连接方式均采用现有技术中成熟的螺栓、铆钉、焊接、粘贴等常规手段,在此不再详述。

如图1所示,本发明包括环境感知模块、宏观规划及导航模块、驾驶任务决策模块、驾驶任务执行及避障模块。运行时各个模块在自己的运行时间周期下周期性运行,运行时步骤如下:

步骤1,输入车辆行驶的行驶任务包括起点和终点。

步骤2,宏观规划及导航模块根据输入的起点和终点进行宏观路径规划并且根据宏观路径规划的结果以及汽车当前的位置输出汽车接下来需要执行的导航信息。

步骤3,初始化环境感知模块。环境感知模块感知车辆周围的环境周期性输出相应的环境模型如图2。

步骤4,驾驶任务决策模块以1000ms的周期性运行,根据当前所处的环境车辆当前所处的状态以及导航引导信息输出最优的驾驶任务。

步骤5,驾驶任务执行及避障模块,根据汽车的运动状态实现对最优驾驶任务的执行以及对障碍物的躲避,输出控制汽车的控制指令。

步骤6,车辆执行机构执行步骤6输出的控制指令实现车辆的运动。

步骤7,判断是否接近目的地,如果接近目的地则终止。

本发明的宏观规划及导航模块指根据输入的行驶任务(起点、终点) 进行路径规划生成从起点到终点可通行的宏观路径。并且根据汽车当前所处的位置确定汽车跟随宏观路径所需要采取的行为,输出导航信息。所述导航信息包括汽车前方一定距离需要采取的行为以及推荐行驶的车道。

本发明的环境感知模块负责探测车辆周围的环境。包括多个视觉传感器、多个毫米波雷达传感器、多个激光雷达传感器并且通过多源信息融合方式对传感器信息进行处理融合输出环境模型。如图2为本发明的环境感知模块输出的环境模型,环境模型包括车道对象、交通参与物对象、可行区域对象。所述车道对象指感知范围内的每一条车道及其属性信息,包括各种交通标志线、交通信号灯、车道左右车道线的线型、车道限速值。所述交通参与物对象指感知范围内的运动或者静止的障碍物,交通参与物对象包含的信息有参与物的类型、轮廓、运动状态。可行区域对象指车辆物理上可以行使的区域的范围,利用多段线描述出边界的几何轮廓。

本发明驾驶任务决策过程,包括驾驶任务池生成模块、规则性评判模块、最优任务决策模块。

所述驾驶任务集合生成模块,根据汽车当前所处的驾驶环境确定汽车可以执行的驾驶任务集合,生成可执行驾驶任务集合时根据当前环境模型中的车道对象间的相互连接关系从驾驶行为池中选择所有可采取的行为及确定预期路径。之后对每一个可采取的行为对汽车可到达的车速进行离散,每一个离散的车速及其驾驶行为对应一个驾驶任务。其中驾驶行为池如图3-5将车道变换和交叉口转弯及调头等行为分为准备阶段和执行阶段,所以驾驶行为池包含保持车道、准备车道变换、执行车道变换、准备交叉口转弯、执行交叉口转弯、准备调头、执行调头。确定所有可采取的动作及预期路径如图6-7,图6中根据车道间的连接关系可采取的行为分别是保持车道、准备右换道、执行右换道、准备左换道、执行左换道、准备调头、执行调头,图7中场景可采取的行为有执行交叉口直行、执行交叉口右转、执行交叉口左转、执行调头。确定驾驶行为后对汽车可到达的车速范围进行离散,汽车可到达的车速确定方法为当前汽车的速度增加和减少一定的数值,代表汽车执行加速和减速。每一个离散的车速和其相对应的驾驶行为及预期路径对应一个驾驶任务。

所述规则性评判,指对对驾驶任务池中的驾驶任务进行规则性评判去掉驾驶任务中不符合交通规则的、不安全的以及和导航引导的方向不符的驾驶任务。规则性评判采用等级划分的方法进行评判。评判时分别从安全性、合法性和导航引导三个方面进行评级,最后进行综合评判。

安全性评级,指汽车将要采取的驾驶任务的安全性进行评级,分为2 个等级,0和1分别对应不安全和安全。安全性分为两部分,一方面是保证汽车在运行时不会因为侧向加速度过大而产生侧翻等,另一方面是汽车与其他交通参与物不发生碰撞。进行第一个方面评判时,根据驾驶任务的预期路径曲率确定汽车可以安全行驶的最大车速,当驾驶任务的预期车速超过安全行驶的最大车速时认为安全性为0。进行第二个方面评判时计算汽车与其他交通参与物发生碰撞的概率,根据3σ原理认为发生碰撞的概率大于0.3%认为不安全评级指标为0否则认为安全评级指标为1。对于汽车与其他交通参与物发生碰撞的概率计算时认为本车和其他交通参与者均前方和左右在汽车轮廓的基础上两侧均有一个安全范围如图8,安全范围与速度相关为正太分布函数。其中汽车前方安全范围为正太分布其均值可以通过汽车车速和汽车所能采取的最大减速度求出,其方差可以通过统计得到,这样可以表示汽车车速越高其前方的安全范围越大。汽车左右安全范围认为其均值为0,方差为与汽车车速相关的函数,车速越高方差越大,与其他参与物发生横向碰撞的概率越大。进行碰撞概率计算,计算时汽车到达驾驶任务预期位置时与其他交通参与者的安全范围发生碰撞的概率。如图9-10进行汽车与静止障碍物或者交通参与物进行碰撞概率计算,当车速高时其安全范围大发生碰撞概率高,当车速低时安全范围小发生碰撞概率小。如图11所示当进行执行换道行为的碰撞概率计算,计算时认为汽车由当前的纵向位置立即到达目标车道相应的位置判断其与目标车道内的其他交通参与物发生碰撞的概率,如图11中进行换道安全性判断时其与后面车辆发生碰撞的概率大,与前方车辆不发生碰撞。如图12进行转弯行为的安全性判断,同样认为其进入目标车道,汽车与其他车辆不发生碰撞。

所述合法性评级,指对驾驶任务是否违反交通规则进行评级,分为3 个等级,0代表驾驶任务不符合交通规则,0.5代表驾驶任务不违反交通规则但是为不良的驾驶行为例如在换道过程中改变目标车道,1代表驾驶任务符合交通规则。进行合法性评级时,先从速度方面进行合法性判断,判断驾驶任务中的速度要求是否超过车道的限速值超过则认为驾驶任务合法性为0,之后判断驾驶任务是否有跨越实线变换车道等行为如果有则驾驶任务的合法性为0,最后建立驾驶任务合法迁变网络,根据汽车当前的执行的驾驶任务与目标驾驶任务迁变是否符合驾驶任务迁变网络,如果不符合则认为驾驶任务的合法性为0.5,如果符合则为1。所述的驾驶任务迁变网络,指遵守交通规则且具有良好的驾驶习惯下的驾驶行为迁变过程,如图13。如当汽车处于执行换道的行为中时只有继续执行换道直到完成换道才认为是合法的合法性为1否则合法性为0.5,当汽车当前处于准备换道阶段进入执行换道阶段时只有处于准备换道阶段超过3s时则合法性为1,否则为0.5。

所述导航引导评级对驾驶任务是否符合导航模块输入的导航行为及信息,所述的导航行为及信息指汽车前方一定距离需要采取的行为及推荐车道,例如前方100m交叉口左转、前方请走最右侧车道等。导航引导评级同样分为三个等级,0代表完全不符合导航引导信息,0.5表示驾驶任务所能到达的方向与导航引导信息相同但是不完全相同,1代表驾驶任务完全符合导航引导信息。

所述综合评判,指对所有的驾驶任务根据安全性、合法性和导航引导评级的三个指标进行综合性筛选,首先保留安全性、合法性和导航引导评级均为1的驾驶任务,如果没有满足条件的则对筛选条件进行松弛,先保证安全性,之后保留从合法性和导航引导评级为0.5的驾驶任务。当没有满足安全性为1的驾驶任务时则发出报警,提醒驾驶员介入。

所述最优任务决策,从安全、合法和符合导航引导的驾驶任务中选择最佳的驾驶任务作为最终驾驶任务。进行最优驾驶任务决策时分别对驾驶任务进行驾驶负担评价和工效性评价,最终综合驾驶任务的工效性指标和驾驶负担指标选择最终驾驶任务。

所述驾驶负担评价,对车辆由当前位置到达驾驶任务的预期位置的横向距离进行评价,其范围为0~1间的连续值。其评价指标通过下面公式计算:

式中:fb为驾驶任驾驶负担指标,Smax为候选驾驶任务目标位置横向距离的最大值,Smin为候选驾驶任务目标位置横向距离的最小值,S为当前评价的驾驶任务的横向距离。

所述工效性评价,对驾驶任务所对应的预期车速进行评价,其范围同样为0~1的连续值。其评价指标通过下面公式计算:

式中:fv为工效性指标,vmax为候选驾驶任务最大车速,vmin为候选驾驶任务最小车速,v为当前评价驾驶任务车速。

综合仲裁,对候选车道的车道流速指标和行驶负担指标通过下面公式计算综合指标,并且选择综合指标最小的候选车道作为目标车道。

f=wv*f2v+wb*f2b

式中:f为综合评价指标,wv为车道流速指标权系数值,fv为车道流速评价指标,wb为车道行驶负担指标权系数值,fb为车道行驶负担评价指标。

驾驶任务执行及避障模块4根据初始化环境感知模块1给出的环境模型计算出障碍物规避范围,并给出规避范围的阈值函数;然后建立阈值函数与车辆行驶状态轨迹的映射关系,通过映射关系与车辆行驶状态的实时迭代,给出车辆行驶状态的调控指令。

映射关系与车辆行驶状态的迭代方法为,

其中,F为映射关系,L为阈值函数。通过对映射关系进行实时迭代更新,可以提高车辆行驶状态调整的实时性和准确性。

本发明包括驾驶任务执行及避障装置,根据汽车的运动状态实现对最优驾驶任务的执行,包括沿着驾驶任务预期路径行驶,同时保证汽车车速不超过驾驶任务要求的最高车速,转向灯状态满足驾驶任务对转向灯的要求,以及躲避驾驶任务预期路径中的障碍物。

在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1