一种基于博弈论的周围车辆交互行为预测方法与流程

文档序号:21080986发布日期:2020-06-12 16:31阅读:509来源:国知局
一种基于博弈论的周围车辆交互行为预测方法与流程

本发明属于自动驾驶技术领域,尤其涉及一种基于博弈论的周围车辆交互行为预测方法。



背景技术:

自动驾驶技术具有显著提高交通安全性,减少交通拥堵等优点,使得其受到了越来越多的关注。自动驾驶技术通常主要包括环境感知、决策规划和控制执行三个部分,其中车辆的决策规划是衡量车辆智能水平的关键技术之一,智能决策技术的发展能够提高车辆应对复杂交通场景的能力。

车辆的决策规划主要包括两个部分:一方面自动驾驶车辆在做出决策前需要对周围环境的车辆的运动进行预测,另一方面自动驾驶车辆根据对周围环境的感知与对周围车辆未来运动的预测,决策与规划出自车的最优行驶路径。由此可见,对周围车辆的运动预测是否可靠直接决定自动驾驶车辆决策规划出的轨迹是否最优。

现有对周围车辆运动预测主要集中于基于物理和基于行为两种方法;基于物理的方法是最简单的运动预测模型。这种方法认为未来交通工具的运动只取决于物理定律,但是驾驶员的意图完全被忽略了。基于行为的模型很好的克服了这一局限,基于行为的运动预测方法通常可以分为直接通过原型轨迹来进行预测和先识别驾驶意图再进行预测两种方式。但是在这些方法中仍然假设车辆的行为是独立于其他车辆执行的,这也可能导致预测的结果不准确。



技术实现要素:

针对于上述现有技术的不足,本发明的目的在于提供一种基于博弈论的周围车辆交互行为预测方法,以解决现有技术中关于周围车辆驾驶行为预测方法中鲜有对周围车辆的交互反应进行预测的问题。

为达到上述目的,本发明采用的技术方案如下:

本发明的一种基于博弈论的周围车辆交互行为预测方法,包括步骤如下:

1)实时采集自动驾驶车辆和周围车辆的状态信息;

2)通过上述采集到的状态信息,对自动驾驶车辆和周围车辆的未来运动轨迹进行预测;

3)建立行驶收益评估函数,评估自动驾驶车辆和周围车辆的行驶收益;

4)对车辆的不同运动行为建立驾驶行为集m={lcl,lk,lcr},其中,lcl表示车辆向左换道行驶,lk表示车辆保持车道行驶,lcr表示车辆向右换道行驶;

5)根据期望效益理论,求解博弈矩阵中自动驾驶车辆不同运动行为下周围车辆下一时刻每种交互行为的期望收益,并将每种交互行为的期望收益归一化处理,得到周围车辆未来产生每种交互行为的概率。

优选地,所述步骤1)中所有车辆的状态信息包括:当前时刻的车辆位置信息、车辆速度信息和车辆的横摆角信息。

优选地,所述步骤2)中具体包括:

21)得到当前时刻t的自动驾驶车辆和周围车辆的状态信息其中,xe表示自动驾驶车辆的状态信息,(x1,x2,x3)表示周围车辆的状态信息;

22)根据所有车辆的状态信息以及预测的未来目标位置点,结合运动方程以及利用五次多项式拟合出车辆的未来运动轨迹,具体如下:

其中:(x,y)表示车辆的位置信息;vt和at表示在t时刻时车辆的速度和加速度;δt表示采样周期;ci表示多项式轨迹的待定参数,具体约束条件如下:

其中:(xi,yi)为t时刻时车辆的位置信息;(xf,yf)为经过若干周期后到达的目标位置信息;

23)将自动驾驶车辆和周围车辆的运动轨迹离散化得未来每个采样时刻的车辆状态信息,具体如下:

优选地,所述步骤3)中建立行驶收益评估函数,具体包括:

行驶收益评估函数包括安全性收益和可行空间收益两个收益指标;

31)安全性收益函数:

其中,τ表示反应时间,包括车辆驾驶系统反应时间τ1和驾驶员的反应时间τ2;分别表示自动驾驶车辆和周围车辆在t时刻的行驶速度;th表示车头时距;ttc表示距离碰撞时间;d*表示制动加速度;

32)可行空间收益函数:

其中,表示车辆与当前车道前车在t时刻的相对位置;表示车辆与目标车道前车在t+1时刻的相对位置;

33)行驶收益评估函数:

u=ω1rsafe+ω2rspace

其中,ω1和ω2分别表示安全性收益与可行空间收益的权重指标。

优选地,所述步骤4)中lcl具体分为加速向左换道lcl+、匀速向左换道lcl*和减速向左换道lcl-;lk具体分为保持车道加速行驶lk+、保持车道匀速行驶lk*和保持车道减速行驶lk-;lcr具体分为加速向右换道lcr+、匀速向右换道lcr*和减速向右换道lcr-

优选地,所述步骤5)中具体包括:

在正常的交通环境中,自动驾驶车辆与周围车辆的交互行为定义如下:

其中,ai和bj分别代表自动驾驶车辆和周围车辆的交互驾驶行为;

周围车辆的下一时刻每种交互行为的期望收益定义如下:

其中,qij表示考虑到自动驾驶车辆的行为下周围车辆对应行为的行驶收益;γ表示周围车辆每种交互行为下的驾驶风格权重因子。

本发明的有益效果:

1、本发明综合考虑到车辆行驶的安全性和可行空间,能够有效评估车辆的行驶收益。

2、本发明对自动驾驶车辆和周围车辆的运动轨迹进行了预测,充分考虑到了自动驾驶车辆与周围车辆之间的交互行为所带来的运动轨迹的不确定性。

3、本发明通过周围车辆未来的期望收益对其未来与自动驾驶车辆产生的交互行为进行预测,使得自动驾驶车辆在做决策规划时,更加安全可靠。

附图说明

图1为本发明方法的原理框图。

图2为自动驾驶车辆与周围车辆的运动轨迹预测及其离散化示意图。

图3为自动驾驶车辆与周围车辆的交互行为分析与预测示意图。

具体实施方式

为了便于本领域技术人员的理解,下面结合实施例与附图对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。

参照图1所示,本发明的一种基于博弈论的周围车辆交互行为预测方法,包括步骤如下:

1)实时采集自动驾驶车辆和周围车辆的状态信息;所有车辆的状态信息包括:当前时刻的车辆位置信息、车辆速度信息和车辆的横摆角信息。

2)通过上述采集到的状态信息,对自动驾驶车辆和周围车辆的未来运动轨迹进行预测;

21)得到当前时刻t的自动驾驶车辆和周围车辆的状态信息其中,xe表示自动驾驶车辆的状态信息,(x1,x2,x3)表示周围车辆的状态信息;

22)根据所有车辆的状态信息以及预测的未来目标位置点,结合运动方程以及利用五次多项式拟合出车辆的未来运动轨迹,具体如下:

其中:(x,y)表示车辆的位置信息;vt和at表示在t时刻时车辆的速度和加速度;δt表示采样周期;ci表示多项式轨迹的待定参数,具体约束条件如下:

其中:(xi,yi)为t时刻时车辆的位置信息;(xf,yf)为经过若干周期后到达的目标位置信息;

23)将自动驾驶车辆和周围车辆的运动轨迹离散化得未来每个采样时刻的车辆状态信息,参照图2所示,具体如下:

3)建立行驶收益评估函数,评估自动驾驶车辆和周围车辆的行驶收益;

行驶收益评估函数包括安全性收益和可行空间收益两个收益指标;

31)安全性收益函数:

其中,τ表示反应时间,包括车辆驾驶系统反应时间τ1和驾驶员的反应时间τ2;分别表示自动驾驶车辆和周围车辆在t时刻的行驶速度;th表示车头时距;ttc表示距离碰撞时间;d*表示制动加速度;

32)可行空间收益函数:

其中,表示车辆与当前车道前车在t时刻的相对位置;表示车辆与目标车道前车在t+1时刻的相对位置;

33)行驶收益评估函数:

u=ω1rsafe+ω2rspace

其中,ω1和ω2分别表示安全性收益与可行空间收益的权重指标。

4)对车辆的不同运动行为建立驾驶行为集m={lcl,lk,lcr},其中,lcl表示车辆向左换道行驶,lk表示车辆保持车道行驶,lcr表示车辆向右换道行驶;其中,lcl表示车辆向左换道行驶,lk表示车辆保持车道行驶,lcr表示车辆向右换道行驶;lcl可具体分为加速向左换道lcl+、匀速向左换道lcl*和减速向左换道lcl-;lk可具体分为保持车道加速行驶lk+、保持车道匀速行驶lk*和保持车道减速行驶lk-;lcr可具体分为加速向右换道lcr+、匀速向右换道lcr*和减速向右换道lcr-

5)根据期望效益理论,求解博弈矩阵中自动驾驶车辆不同运动行为下周围车辆下一时刻每种交互行为的期望收益,并将每种交互行为的期望收益归一化处理,得到周围车辆未来产生每种交互行为的概率。

车辆在道路行驶时,根据所采取的策略π不同,其未来的行为往往存在不确定性,其中策略π表示执行某行为的概率;在正常的交通环境中,自动驾驶车辆与周围车辆的交互行为集可定义如下:

其中,ai和bj分别代表自动驾驶车辆和周围车辆的交互驾驶行为。

参照如图3所示,当自动驾驶车辆准备向左换道时,此时周围车辆的交互行为可以看作为保持车道中的加速,匀速和减速、向左换道和向右换道。其中当周围车辆选择车道保持时加速行驶和向右换道都可能导致自动驾驶车辆换道不成功,此时自动驾驶车辆的交互行为主要有向左换道和保持车道行驶。

根据自动驾驶车辆和周围车辆的交互行为的建立期望收益博弈表1,如下:

表1

其中,rij和qij分别表示自动驾驶车辆与周围车辆对应行为下的行驶收益;

周围车辆的下一时刻每种交互行为的期望收益定义如下:

其中,γ表示周围车辆每种交互行为下的驾驶风格权重因子;例如当周围车辆选择保持车道加速行驶时,说明周围车辆对于自动驾驶车辆的换道行为不想避让,这使得周围车辆更期望自动驾驶车辆选择保持车道时自车的期望收益;

周围车辆每种交互行为下总的期望收益定义如下:

将每种交互行为的期望收益归一化处理,得到周围车辆未来产生每种交互行为的意图概率分布如下:

其中,分别表示周围车辆与自动驾驶车辆在t时刻的状态信息;bt和at分别表示周围车辆与自动驾驶车辆在t时刻采取的驾驶行为。

本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进,这些改进也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1