数据驱动的混合车辆队列鲁棒控制方法

文档序号:33640890发布日期:2023-03-29 02:02阅读:82来源:国知局
数据驱动的混合车辆队列鲁棒控制方法

1.本发明涉及车联网应用技术领域,具体涉及一种数据驱动的混合车辆队列的鲁棒控制方法,用于实现对混合车辆队列中智能网联自动驾驶车辆的鲁棒控制,以保障交通安全和提高通行效率。


背景技术:

2.汽车保有量的增加对道路容量、交通安全和通行效率提出了更高要求,随着科技的进步,智能网联车辆技术的出现为解决各种交通问题带来了新方法,它是实现道路安全、绿色节能的重要手段。智能网联车辆的出现及快速发展可以极大地改变全部由人驾驶车组成的交通流的固有属性,提高道路的使用率,并能有效避免碰撞事故的发生。在未来较长一段时间内,道路上很可能是由传统人工驾驶车辆(hdv)和智能网联自动驾驶车辆(cav)组成的混合车辆队列。考虑到人的随机驾驶特性以及hdv和cav之间相互作用的不确定性,交通环境将会更加复杂,这将给队列建模和控制带来巨大挑战。因此,如何在传统人工驾驶与网联自动驾驶共存情况下控制cav并提高混合车辆队列的安全性,将是亟需解决的重要研究课题。
3.cav作为混合车辆队列的可控部分,现有研究大多采用模型预测控制(mpc)在每个时间步(如0.1秒)重新规划cav轨迹。模型预测控制被广泛应用于cav运动控制,它可以对车辆状态实时预测并处理各种约束。然而很多对cav控制方面的研究中采用的是传统mpc方法,没有考虑各种现实情况导致的模型失配等不确定性的影响。虽然不确定性通常假设在一个时间步长有界,但它可以随着预测时间范围的增加而累积。如果对cav进行控制而不对累积的不确定性进行抑制,就会导致cav状态(例如车间距和速度)偏离其计划状态轨迹,从而导致控制性能缓慢、过于保守,还可能违反系统约束,如安全性、稳定性。在这种情况下为cav设计一个具有鲁棒性的控制器至关重要。
4.本发明提出了一种数据驱动的管道模型预测控制(tube mpc)方法,创新性地将扩展动态模式分解算法(edmd)与tube mpc结合起来解决混合车辆队列的建模与控制问题,其目标是通过对cav的控制使整个队列达到期望状态,使混合车辆队列稳定并且具有鲁棒性。本发明提出的控制方法的最大不同之处在于:数据驱动的车辆鲁棒控制策略能够充分应对车队行驶过程中的意外情况,抑制各种不确定性因素带来的负面影响,能够实现快速高效的闭环控制。


技术实现要素:

5.本发明提出了一种数据驱动的混合车辆队列的鲁棒控制方法。该方法通过设计包含前馈控制和反馈控制的控制框架,前馈控制为标称系统规划最优轨迹,通过反馈控制使实际系统与标称系统的状态跟踪误差保持在最小鲁棒正不变集内,最终驱使车辆的实际状态趋近于期望状态,使混合车辆队列达到最终的期望行驶效果。相比于传统mpc控制方法,本发明在抑制车队行驶过程中的不确定性因素的同时,保障了交通安全,提高了道路的占
用率。
6.本发明旨在基于扩展动态模式分解算法为混合车辆队列系统建模,进而设计tube mpc控制器对混合车辆队列中的cav进行控制,具体实现步骤如下:
7.步骤一、采集交通数据
8.由于数据驱动的建模算法基于混合车辆队列的车辆状态数据,所以在图1所示的混合交通场景中使用matlab工具仿真获得所需的混合车辆队列状态数据。混合车辆队列中的hdv采用idm驾驶策略,cav用反馈控制器进行简单控制使其满足安全性要求,在matlab平台进行仿真得到足够多的车辆状态数据。获得的一组顺序的随时间演变的交通队列数据快照集合可以表示为:
9.{x
1,1
,x
2,2
,

,x
n,m
}(1)
10.其中x
i,k
=[p
1,k

p
n,k
]
t
∈r
2n
,p
i,k
=[h
i,k v
i,k
]
t
,h
i,k
代表了在k时刻第i辆车与前车的车间距,v
i,k
代表了在k时刻第i辆车的车速,m则代表了时间序列。
[0011]
步骤二、对混合车辆队列系统建立数学模型
[0012]
本发明采用扩展动态模式分解算法对混合车辆队列系统进行建模。为了利用上个步骤获得的交通数据为系统进行建模,首先将混合车辆队列的数据写成如下矩阵的形式:
[0013]
x=[x1,x2,

,x
k-1
]
t
[0014]
x
+
=[x2,x3,

,xk]
t (2)
[0015]
u=[u1,u2,
…uk-1
]
t
[0016]
首先构造提升函数ψ(x)将系统原始状态提升到高维空间,提升函数的构造最好借鉴已知的混合车辆动力学的基础模型,根据混合车辆队列中传统驾驶员控制车辆的驾驶策略,提升函数构造为:
[0017][0018]
通过提升函数将系统原状态投影到高维空间,得到对应的数据快照:
[0019][0020]
然后可通过求解最优化问题求得系统矩阵a、b,
[0021][0022]
得到这个问题的解析解为:
[0023][0024]
矩阵c可以通过最小二乘法得到:
[0025][0026]
求解上述代数问题很容易求得系统矩阵a、b、c。但是研究的混合车辆队列中的车辆数有限,一般设置为几辆到几十辆,即使将维度提升,x
lift
仍是一个矮胖矩阵,即列数超
过行数,为了减少计算资源消耗,计算法向方程求解矩阵a和b是更有益的。法向方程为:
[0027]
m=[a b]v
ꢀꢀ
(8)
[0028]
其中
[0029][0030]
即可很容易求出近似系统矩阵a、b,进而得到不确定性为0对应的混合车辆队列的线性模型:
[0031][0032]
考虑到通过(3)得到(9)的推导可能会带来建模误差,将会导致:
[0033][0034]
其中εi是显式或隐式有界的,i=1,...,n+2n。将[ε
1 ε2ꢀ…ꢀ
ε
n+2n
]
t
定义为w,然后得到考虑模型失配带来的混合车辆队列的线性模型为:
[0035][0036]
由于本发明设计的控制器是基于增量模型的,所以将物理模型(12)转换成增量模型是必要的。车辆的平衡控制量是0为已知的,车辆平衡状态不能被预先确定,即u
*
=0,as
*-s
*
≠0,总建模误差为as
*-s
*
+w=[μ
1 μ2ꢀ…ꢀ
μ
n+2n
]
t
,记为其中μi显式或隐式有界,对于所有i∈{1,2,...,2n},w
n+2n
是紧凑并且包含原点。因此带有模型误差的混合车辆队列系统的线性增量模型为:
[0037][0038]
其中δsk=s
k-s
*
,δuk=uk。w紧凑并且包含原点。
[0039]
步骤三、设计反馈控制
[0040]
在本步骤中,我们为混合车辆队列系统设计tube mpc控制器的反馈控制部分,通过反馈控制动态地减小车辆的实际状态与标称状态之间的偏差。具体而言,先确定混合车辆队列的标称系统,进而得到混合车辆队列的误差系统,然后通过建立和求解一个离散线性二次型调节器问题得到反馈矩阵k。具体求解过程如下:
[0041]
设和为k时刻混合车辆队列标称模型的状态和控制输入,忽略有界不确定性扰动,可得混合车辆队列的标称系统为:
[0042]
[0043]
由于系统(13)存在持续且有界的未知扰动系统的实际状态不总是等于标称状态。定义系统的实际提升状态δs相对标称提升状态的偏差为es,相应地定义系统的实际状态δx相对标称提升状态δx的偏差为e
x
,得到混合车辆队列的误差系统为:
[0044][0045]
其中为误差系统的控制输入,为了防止误差的累积传播导致系统发散,为(15)的误差系统设计反馈辅助控制器k来抑制误差的传播,辅助反馈控制率为:
[0046][0047]
通过建立和求解一个离散线性二次型调节器问题来求解反馈矩阵k:
[0048][0049]
其中q、r分别为提升状态和控制输入的权重矩阵。
[0050]
步骤四、设计前馈控制
[0051]
前馈控制的目的是保证标称状态轨迹满足收紧的约束,并且最终使得标称状态在每个时间步严格地向目标终端轨迹移动。为了对约束进行收紧,必须首先找到包含所有es的鲁棒正不变集。混合车辆队列的鲁棒正不变集满足对于所有和都有为了减少保守性,我们希望越小越好,最小鲁棒正不变集为:
[0052][0053]
虽然通常不可能得到的显式表征,但可以得到的估计。本文采用内近似法估计鲁棒正不变集的凸集。的内部近似的扰动不变集
[0054][0055]
其中如果ak是α的幂零函数(a
α
=0),当α

∞时有
[0056]
然后标称提升状态和标称控制满足:
[0057][0058]
标称轨迹满足的收紧的约束就可以保证实际的车辆状态和控制约束的满足,也就保证了混合车辆队列系统的安全性。
[0059]
传统的模型预测控制的有限时域设计准则并不能保证渐近稳定性,闭环稳定性只能通过适当调整设计参数来实现。因此本发明所设计的tube mpc控制器增加了终端约束条件,系统状态在有限步内进入终端约束集后在状态反馈控制律的作用下达到系统的稳定点,保证了闭环系统的稳定性。
[0060]
定义sf是终端约束不变集,终端约束集sf满足如下要求:
[0061][0062]
为了便于计算系统的终端状态约束集,对系统的约束条件作如下处理,公式(20)
可以改为:
[0063][0064]
(14)定义的动力学和约束条件(22)的最大终端约束不变集可以表示为:
[0065][0066]
其中v是使的最小正整数,对于所有满足因为ak是严格稳定的并且(ak,f+gk)是可观的,那么v必然是有限值,所以v的计算可以转化为求解以下线性规划问题:
[0067][0068]
j为f+gk的第j行,j=0,...,n,m=1,...,v。显然,v的值不依赖于系统的状态变量。因此v可以通过离线计算得到。公式(23)定义了一个多面体集合,将该最大不变集作为终端状态约束集sf。
[0069]
因此,混合车辆队列的前馈控制设计可表述为以下优化问题:
[0070][0071]
上述优化二次成本函数中是决策变量,q和r分别为状态和控制量的权重矩阵。是相对于名义提升状态的终端成本,对称正定矩阵p是李雅普诺夫方程的解:
[0072][0073]
其中
[0074]
有益说明:
[0075]
本发明提出了一种数据驱动的混合车辆队列鲁棒控制方法。通过构造一组提升函数,利用edmd算法建立混合车辆队列的线性模型,解决了机理模型可能无法准确解释实际场景中车辆跟驰行为的问题。考虑系统中存在的不确定性,进而基于该线性模型设计包含前馈环节和反馈环节的tube mpc控制器。该控制器为标称系统规划最优轨迹,并且将标称系统和实际系统的偏差限制在鲁棒不变集内。该控制方法能够显式处理不确定性,且通信和计算负担较小,具有前馈控制和反馈控制的双重保障,为智能网联车辆的发展提供了新思路。
附图说明
[0076]
图1为环路交通场景示意图;左图为环形车道。右图为一个简化的网络系统示意图,其中cav作为输入节点,hdv为不受控节点。
[0077]
图2为在k=60时cav2的实际和标称状态及相关约束图;
[0078]
图3为在k=160时cav2的实际和标称状态及相关约束图;
[0079]
图4为cav2在前400步仿真过程中的状态分量响应曲线图;
[0080]
图5为当w=0.05时,鲁棒模型预测控制方法下5辆车的车间距和速度响应曲线图。
具体实施方式
[0081]
以下将结合图例对本发明提出的的数据驱动的混合车辆队列鲁棒控制方法做进一步的详细描述。
[0082]
本发明实例的交通场景是一条周长为50米,单车道单向的环形道路,路上不均匀地分布5辆车,用1~5标号,其中1,3,5为hdv,2,4为cav。在matlab平台上进行模拟仿真,一共采集100s的车辆状态数据,采集周期是0.1s,数据包含车辆速度、车间距、加速度等信息。本发明采用这样的数据信息来为混合车辆队列进行建模,进而验证所提出的tube mpc控制方法的有效性。
[0083]
步骤1:构造提升函数
[0084]
本发明采用数据驱动的edmd算法对系统进行建模,edmd算法的核心是构造合适的提升函数,提升函数的最佳选择取决于底层动力系统和用于获取数据的采样策略。由于本发明中的混合车辆队列中的hdv采用智能驾驶员模型(idm),故提升函数的构造借鉴hdv的控制策略。hdv的动力学模型为:
[0085][0086]
式中,a表示车辆的最大加速度,b表示车辆的舒适减速度,表示车辆可以达到的最大速度,s0表示最小停车距离,ti表示车辆i的最小跟车时距,δ表示加速度指数且δ的值通常取4,通过调节上述参数可以表征不同hdv的跟驰动态的差异性。
[0087]
参考混合车辆队列中的hdv的动力学模型来构造提升函数。将式(27)展开并且合并同类项可以得到下式:
[0088][0089]
其中b1,b2,b3,b4,b5是常系数,i=1,

,m,(28)式中具有5个非线性形式,由于混合车辆队列系统状态量x只包括每辆车的速度和间距,只依据这四个非线性形式来组成提升函数。由系统状态本身以及上述四个非线性项构造提升函数为:
[0090][0091]
提升函数的选择对于建模的精度至关重要,基于物理模型构建数据驱动模型,考虑先验知识是有利的。
[0092]
步骤2:参数初始化
[0093]
我们采用如下的方法进行初始化。首先收集足够的混合车辆队列的数据序列,计算混合车辆队列系统的系统矩阵a,b和c,得到混合车辆队列的系统模型。扰动的边界设置
为wh=wv=0.05。具体的车辆属性见表1。
[0094]
表1车辆参数
[0095][0096][0097]
tube mpc控制器的采样时间设为0.1s,多目标代价函数(25)中关于状态量和控制量的权重比被设为1:1。n
p
的值被设定为15以平衡tube mpc控制器中优化问题的可行性和求解的复杂性。根据(29)式构造提升函数,提升后维度n
φ
为20。根据公式(26)、(17)、(19)和(23)计算终端惩罚矩阵p、增益矩阵k、鲁棒不变量集和终端约束sf。我们利用开源matlab工具箱mpt3和yalmip,并使用qp求解器求解线性二次规划问题。
[0098]
步骤3:仿真实验
[0099]
如图1所示,本实例选用单向单车道环形路作为仿真实验交通场景。环形车道的长度为50m。每辆车的控制频率为10hz,所有车辆的初始速度为1m/s,间距不均匀地分布在环形道路上,此时混合车辆队列处于不平衡状态。为了验证本发明设计的tube mpc控制器,下面分别对管不变集的有效性、反馈控制和前馈控制的效果进行验证。
[0100]
首先以cav2为例来评估管不变集的有效性,进而验证系统的收敛性与闭环鲁棒性。图2和图3分别展示的是cav2在k=60和k=160时的实际状态与标称状态,其中绿色区域表示鲁棒不变集,深蓝色区域表示对实际状态的约束,浅蓝色区域表示对标称状态的约束,深灰色区域为实际状态δx的终端不变集csf,浅灰色区域为标称状态的终端不变集真实状态用粉色的方块标记,实际状态用绿色的方块标记。从两图中可以看出,系统的真实状态δx位于以为中心的管中,即并且在k=160时标称状态趋于0,实际系统跟踪标称系统也趋于0,验证了闭环控制系统的鲁棒性。
[0101]
图4为cav2的状态分量在前400个仿真步长内随时间变化的响应曲线,标称系统轨迹在最后收敛到0,并且在仿真周期内实际系统轨迹是以标称系统轨迹为中心并且在tube的范围内波动,这表明tube mpc控制器通过前馈控制确保cav2的标称误差状态趋于0,并且通过反馈控制确保cav2的实际轨迹可以追踪其对应标称系统的最优轨迹,达到渐近稳定。
[0102]
混合车辆队列的安全性是控制器的一个控制目标,车辆队列中车辆状态满足设定的约束对道路安全至关重要。从图5可以看出,tubempc控制器可以使混合车辆队列中的车辆状态保持在安全范围内,即满足车间距不小于2m的安全约束。并且tube mpc可以控制队列使其状态最终收敛到以期望值为中心的鲁棒不变集内。
[0103]
实验结果:本发明提出了一种数据驱动的混合车辆队列鲁棒控制方法,能抑制模型失配等不确定性带来的负面影响,驱动实际车辆状态趋近于期望车辆状态。该tube mpc方法与扩展动态模式分解算法创新性地结合,不仅可以建立一个符合实际交通场景的线性模型,便于后续控制器的设计,而且可以有效抑制模型失配等不确定性。在车辆轨迹数据的实验下,验证了本发明设计的控制器能够实现快速高效的闭环控制,提高了混合车辆队列
系统的安全性和鲁棒性。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1