一种基于合作型博弈的自动驾驶汽车避撞控制方法与流程

文档序号:22585321发布日期:2020-10-20 17:47阅读:287来源:国知局
一种基于合作型博弈的自动驾驶汽车避撞控制方法与流程

本发明涉及一种自动驾驶汽车避撞控制方法,尤其涉及一种基于合作型博弈的自动驾驶汽车避撞控制方法。



背景技术:

随着21世纪汽车技术的飞速发展,自动驾驶水平不断提高,各等级的自动驾驶功能受到广泛研究。但随着自动驾驶等级的提高,自动驾驶汽车的安全性是需要研究者重点考虑的问题之一,尤其是确保自动驾驶汽车能实现避撞功能。

目前,许多研究方法已被用于开发自动驾驶汽车的避撞功能。强化学习方法通过训练汽车在遇到障碍的情况下能掌握状态和环境知识,从而实现自动驾驶汽车的轨迹规划或避障。五次多项式、贝塞尔曲线、s型曲线则被广泛用于生成可行的避撞轨迹。

现有研究通常利用轨迹规划来解决避撞问题,然而这类方法所生成的可行轨迹是否能被车辆执行依然是个问题。

部分研究直接利用动力学控制的方法,实现车辆的避撞,但相关研究仍缺少对避撞过程中车辆稳定性的考虑。此外,实际场景中的各类不确定性对车辆动力学性能有较大影响,现有研究也缺乏对不确定性的考虑。



技术实现要素:

本发明的目的是利用贝塞尔曲线生成避撞轨迹,随后利用前轮转向(afs)实现高效轨迹跟踪的同时,通过主动后轮转向(ars)来提升车辆的横向稳定性,并且基于合作型博弈论实现了前后轮转向的协同控制,从而在跟踪避撞的同时,提升横向稳定性,最终实现高效且安全的避撞控制。

本发明的技术方案是提供一种基于合作型博弈的自动驾驶汽车避撞控制方法,包括:

步骤1、通过车载传感设备检测周围环境,判断周围是否存在障碍物,若不存在则继续检测,若存在,则进入步骤2;

步骤2、结合步骤1中获取障碍物位置信息,自动驾驶汽车选择一系列安全的轨迹点,并利用贝塞尔曲线拟合这些轨迹点,从而生成避撞轨迹;

步骤3、车辆减速至安全避撞车速;

步骤4、实施非线性鲁棒轨迹跟踪控制,抑制曲率半径变化对跟踪性能的影响;

步骤5、完成避撞过程后,车辆切换至自适应巡航状态。

进一步地,该步骤1中,车载传感设备选择车载摄像头、雷达。

进一步地,该步骤4包括:

步骤4.1、基于二自由度车辆横向动力学方程,建立轨迹跟踪动力学模型,动力学模型简记为如下形式:

其中,

其中,u=[δfδr]t,σ1=2(cf+cr);σ2=-2(lfcf-lrcr);

式中:为航向角偏差;ey为横向位移偏差;为横向速度偏差;为横摆角速度偏差;vx为汽车纵向速度;vy为汽车横向速度;cr为路径的曲率半径;m为汽车质量;cf为前轮侧偏刚度;cr为后轮侧偏刚度;lf为汽车质心到前轴的距离;lr为汽车质心到后轴的距离;iz为横摆转动惯量;δf为前轮转角,δr为后轮转角,we为因速度波动产生的建模误差

步骤4.2、根据步骤4.1中的动力学模型,利用鲁棒最优控制,设计前轮转角输入和后轮转角输入:

u=-r-1btpx+γr-1btpx‖btpx‖∈-2(αx+β)

其中,p为代数黎卡提(riccati)方程

atp+pa-2pbr-1btp+q=0的解;

式中:r=q=i4×4为单位矩阵;α、β为选定的常数;γ、∈为控制器可调系数;矩阵a、b为步骤4.1中定义的矩阵;

步骤4.3、用模糊集合表征系统不确定性,并设计相应的隶属度函数;

步骤4.4、确定步骤4.2中可调参数γ、∈的取值范围

γmin≤γ≤γmax

∈min≤∈≤∈max

其中,γmin、γmax、∈min、∈max为已知常数,分别表示两个可调参数的最小和最大值;

步骤4.5、利用李雅普诺夫函数,找到系统性能v的边界,即

v=xtpx≤η1(γ,∈,t)+η2(γ,∈)

其中,p为步骤4.2中求得的矩阵p

η2(γ,∈)=κξ

其中,ξ为第二中间变量,其表达式为

式中:κ为预设常数,t0为观测器开始观测的时刻;为t0时刻的系统性能,可由t0时刻的系统状态计算得到;是在放缩得到v的边界过程中得到的第一中间变量;

将跟踪成本与稳定性成本分别与稳定性能和累计瞬态性能对应,得到相应的成本函数,进而可以求解相应的博弈优化问题;

步骤4.6、求解由步骤4.4、步骤4.5组成的两人合作型博弈问题,该两人博弈问题的最优解即帕累托最优,得到可调参数的最优值γ*,∈*;将这组最优值γ*,∈*代入步骤4.2中的控制律表达式,得到帕累托最优对应的前、后轮转角;

步骤4.7、将步骤4.5中前、后轮转角输入指令分别发送给前、后轴转向机构,并由相应转向机构执行对应指令。

进一步地,步骤4.5中,成本函数如下:

其中,jstability为稳定性成本;jtrack为跟踪成本;d为模糊数与实数的映射运算。

本发明的有益效果为:

1、本发明考虑到实际车辆参数不确定性的有界性这一特征,创新地运用模糊集合表征该不确定性,并据此设计相应的鲁棒轨迹跟踪控制律,能有效抑制实际车辆系统参数摄动对跟踪性能的影响;

2、本发明考虑了所生成的避撞轨迹曲率半径实时变化的特性,设计了相应的鲁棒轨迹跟踪控制律,能有效抑制曲率半径变化对跟踪性能的影响;

3、本发明考虑了所建立动力学模型默认车速恒定而实际车速会有一定波动的情况,把因速度波动产生的建模误差考虑为不确定性,能有效抑制速度波动对跟踪性能的影响;

4、本发明基于合作型博弈的框架,把稳定性、跟踪性能分别与控制器可调参数关联,从而实现兼顾稳定性的鲁棒轨迹跟踪控制。

附图说明

图1为自动驾驶汽车避撞过程示意图;

图2为方法总流程图;

图3是为生成避撞轨迹流程图;

图4是为非线性鲁棒路径跟踪控制流程图;

图5为一种具体实例效果图;

具体实施方式

以下将结合附图1-5对本发明的技术方案进行详细说明。

如图1-4,该实施例提供了一种基于合作型博弈的自动驾驶汽车避撞控制方法,包括:

步骤1、通过车载传感设备检测周围环境,判断周围是否存在障碍物,若不存在则继续检测,若存在,则进入步骤2;

该步骤中,车载传感设备可以是车载摄像头、雷达等。

步骤2、结合步骤1中获取障碍物位置信息,自动驾驶汽车选择一系列安全的轨迹点,并利用贝塞尔曲线拟合这些轨迹点,从而生成避撞轨迹;

步骤3、车辆减速至安全避撞车速;

该步骤中,通过车辆减速要保证与障碍物的避撞,同时也能在避撞转向的过程中提升车辆稳定性;

步骤4、实施非线性鲁棒轨迹跟踪控制,抑制曲率半径变化对跟踪性能的影响;

步骤4.1、基于二自由度车辆横向动力学方程,建立轨迹跟踪动力学模型。

其中,u=[δfδr]t,σ1=2(cf+cr);σ2=-2(lfcf-lrcr);

式中,各参数的含义分别为:为航向角偏差;ey为横向位移偏差;为横向速度偏差;为横摆角速度偏差;vx为汽车纵向速度;cy为汽车横向速度;cr为路径的曲率半径;m为汽车质量;cf为前轮侧偏刚度;cr为后轮侧偏刚度;lf为汽车质心到前轴的距离;lr为汽车质心到后轴的距离;iz为横摆转动惯量;δf为前轮转角,δr为后轮转角,we为因速度波动产生的建模误差。

把上述动力学模型简记为如下形式:

其中,

步骤4.2、根据步骤4.1中的动力学模型,利用鲁棒最优控制,设计前轮转角输入和后轮转角输入:

u=-r-1btpx+γr-1btpx‖btpx‖∈-2(αx+β)

其中,p为代数黎卡提(riccati)方程

atp+pa-2pbr-1btp+q=0

的解。

上式中各参数含义为:r=q=i4×4为单位矩阵;α、β为选定的常数;γ、∈为控制器可调系数;矩阵a、b为步骤4.1中定义的矩阵。

步骤4.3、用模糊集合表征系统不确定性,并设计相应的隶属度函数。

首先是来自轮胎侧偏刚度的不确定性可定义为:其中,δcf属于这个模糊集合;

后轮侧偏刚度不确定性可定义为:其中,δcr属于这个模糊集合;

道路曲率不确定性可定义为:其中,δcr属于这个模糊集合;

速度波动对模型产生的不确定性可定义为:we属于这个模糊集合。

上述各式中参数意义为:为前轴名义侧偏刚度;为后轴名义侧偏刚度;为名义道路曲率;δcf为前轴侧偏刚度不确定性;δcr为后轴侧偏刚度不确定性;δcr为道路曲率不确定性;we为等效速度波动干扰;各s**表示模糊集合;各μ**表示隶属度函数;各ω**表示取值集合,其取值由设计者确定,一般以名义值的-30%到+30%作为取值集合。

步骤4.4、确定步骤4.2中可调参数γ、∈的取值范围

γmin≤γ≤γmax

∈min≤∈≤∈max

其中,γmin、γmax、∈min、∈max为已知常数,分别表示两个可调参数的最小和最大值。

步骤4.5、利用李雅普诺夫函数,找到系统性能v的边界,即

v=xtpx≤η1(γ,∈,t)+η2(γ,∈)

其中,p为步骤4.2中求得的矩阵p

η2(γ,∈)=κξ

其中,ξ为第二中间变量,其表达式为

上两式中各参数含义如下:κ为预设常数,t0为观测器开始观测的时刻;为t0时刻的系统性能,可由t0时刻的系统状态计算得到;是在放缩得到v的边界过程中得到的第一中间变量。

将跟踪成本与稳定性成本分别与稳定性能和累计瞬态性能对应,得到相应的成本函数如下:

其中,jstability为稳定性成本;jtrack为跟踪成本;d为模糊数与实数的映射运算,具体如下:

其中φ为ζ的取值集合,μφ(ζ)为隶属度函数,d运算的作用是将η1(γ,∈,t)、η2(γ,∈)所包含的模糊集合映射到实数域,从而得到实数域上的成本函数,进而可以求解相应的博弈优化问题。

步骤4.6、求解由步骤4.4、步骤4.5组成的两人合作型博弈问题,该两人博弈问题的最优解即帕累托最优,得到可调参数的最优值(γ*,∈*)。将这组取值代入步骤4.2中的控制律表达式,得到帕累托最优对应的前、后轮转角。

步骤4.7、将步骤4.5中前、后轮转角输入指令分别发送给前、后轴转向机构,并由相应转向机构执行对应指令;

步骤5、完成避撞过程后,车辆切换至自适应巡航状态。

以下提供一个具体的算例:

步骤1:通过车载传感设备检测周围环境,采集障碍物定位信息(xobs,yobs)

步骤2:自动驾驶汽车选择一系列安全的轨迹点,并利用贝塞尔曲线拟合这些路径点,生成一系列避撞点(x1,y1),(x2,y2),…,(xn,yn),生成避撞轨迹y=f(x),f(x)为蛇形避撞轨迹。

步骤3:车辆减速至60km/h的车速

步骤4:实施非线性鲁棒轨迹跟踪控制,并通过一下方式实现:

步骤4.1:给出车辆动力学模型参数,并建立轨迹跟踪动力学模型。例:m=1385kg;iz=2065kg·m2;lf=1.114m;lr=1.436m;

步骤4.2:设计前、后轮转角表达式,其中的待定参数将在以下逐一确定;

步骤4.3:设计不确定性的隶属度函数与取值范围:

步骤4.4:确定可调参数范围γ∈(0,+∞);∈∈[2,+∞);

步骤4.5:获取当前系统状态x,权重矩阵取为

由此通过d映射运算,运算得到成本函数jstability和jtrack。

步骤4.6:结合步骤4.4与步骤4.5的结果,求解得到两人合作型博弈的最优解:(γ*,∈*)。

步骤4.7、获取当前系统状态x,取待定参数α=β=0.15;与(γ*,∈*)一起代入鲁棒控制律表达式,得到前、后轮转角值,得到的避撞效果如图5所示。

步骤5:完成避撞过程后,车辆切换至自适应巡航状态。

尽管参考附图详地公开了本申请,但应理解的是,这些描述仅仅是示例性的,并非用来限制本申请的应用。本申请的保护范围由附加权利要求限定,并可包括在不脱离本申请保护范围和精神的情况下针对发明所作的各种变型、改型及等效方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1