快速路交通系统的迭代动态线性化及自学习控制方法与流程

文档序号:12826550阅读:274来源:国知局
快速路交通系统的迭代动态线性化及自学习控制方法与流程

本发明涉及快速路交通控制技术领域,具体涉及一种快速路交通系统的迭代动态线性化及自学习控制方法。



背景技术:

快速路交通控制是交通工程和智能交通系统中的一个重要领域。高峰期高速公路的频繁拥堵使交通状况恶化。造成快速路拥堵最常见的原因包括:交通需求大于设计能力、交通事故、道路工程和天气状况。为了更好地发挥快速路的性能,入口匝道是普遍采用的策略。入口匝道控制的目的是为了调节在其入口匝道处进入快速路主道的交通量,保证在下游干线快速路上保持期望(或最优)的车流量,使得快速路通行能力达到最大化。实际中,可在入口匝道处,通过交通监测装置和信号配时装置对进入的汽车数量进行统计检测和控制。

目前,基于局部和协调反馈的alinea入口匝道策略已成功应用到快速路交通系统控制中。它已被证明是一种非常简单,高效且方便实现的入口匝道控制方法。然而,该方法难以校准影响系统性能的关键模型参数,因为模型参数会随着道路条件的几何结构和环境因素,如雨水或者雾天而有所不同。此外,快速路交通流系统是强非线性、耦合且不确定的,因此其准确的模型在实际中很难得到。所以,将常见的基于模型的控制方法应用于快速路交通控制问题时,常会遇到很多意想不到的困难。

另一方面,宏观交通流模式一般都是每天重复的。例如,交通流将从午夜开始并逐渐增加至第一个高峰即早高峰,通常从上午7点到9点,第二个高峰从下午5点到7点。拥堵通常每天在同一位置开始。迭代学习控制(ilc)非常适合处理重复过程的控制问题。在前期的研究中,有学者提出了一些基于入口匝道策略的ilc方法,并已经应用于快速路一天或一周的密度控制中。在文献“freewaytrafficcontrolusingiterativelearningcontrol-basedrampmeteringandspeedsignaling”中,讨论了基于ilc的入口匝道和速度控制。在文献“aniterativelearningapproachfordensitycontroloffreewaytrafficflowviarampmetering”中,研究了以互补方式与纯误差反馈相结合的学习机制,仿真结果证明了基于ilc的优越性。文献“acomplementarymodularizedrampmeteringapproachbasedoniterativelearningcontrolandalinea”,通过使用基于ilc的入口匝道策略和基于ilc和alinea相结合的互补入口匝道策略来对输入饱和进行研究。在文献“iterativelearningcontroloffreewayflowviarampmeteringandsimulationonparamics”和文献“flowbasedlocalrampmeteringusingiterativelearningandparamicsplatform”中,进一步评估了基于ilc的入口匝道控制的有效性。

需要注意的是,上述用于入口匝道控制的ilc方法都是基于压缩映射和固定点理论设计的线性迭代学习算法,这在实际应用中会存在两个主要的限制。第一个限制是,由于跟踪误差的收敛性是基于λ范数获得的,有时沿迭代轴系统输出的瞬态响应性能变差。第二个限制是相同初始状态及相同参考轨迹必须匹配才能获得完全跟踪。

日复一日的严格重复性是一种理想的交通控制情况。实际中,由于快速路的道路条件和环境因素,例如雨水和雾天,使得交通流密度和车辆平均速度的初始值,以及跟踪目标每天都是变化的。因此,研究非严格重复模式的具有随机初始条件和迭代变化的期望密度轨迹的快速路交通系统的ilc方法是具有一定意义的。

目前,自适应迭代学习控制(ailc)方案得到了广泛研究,并且有许多成功的案例。在一般情况下,ailc最具有吸引力的优点是其处理迭代变化的参考轨迹的能力,并且这些参考轨迹是有界但可能具有大的随机初始重置误差以及干扰等问题。然而,大多数现有的ailc依赖于这样一个事实,即未知参数被已知非线性函数线性参数化,由于宏观交通流模型具有强非线性,因此不能直接用于快速路交通控制问题中。

最近,神经网络或模糊系统已被应用到了ailc中,以解决非线性系统无法线性参数化的问题。然而,通常难以确定模糊规则库和隶属度函数,并且用大量的操作数据训练神经网络也比较困难。最近,有学者通过将动态线性化方法引入到迭代域,提出了针对一般非线性离散时间系统的一种数据驱动的无模型自适应ilc。它实现了随机初始条件下的完全跟踪,并且不需要任何外部测试信号或训练过程。但是,目标跟踪轨迹必须是严格重复的。

受上述讨论的启发,通过引入伪偏导数(ppd)的新概念,针对快速路交通系统提出了一种新的等价的动态线性化方法。进一步,提出了一种基于快速路交通系统的迭代动态线性化的自学习控制方法(lineardata-modelbasedadaptiveilc,ldm-ailc),通过匝道调节对快速路交通流密度进行控制。



技术实现要素:

本发明的目的是提出了一种新的快速路交通系统的迭代动态线性化及自学习控制方法,通过匝道调节对快速路交通流密度进行控制。

为了实现上述目的,本发明采用如下技术方案,快速路交通系统的迭代动态线性化及自学习控制方法,包括以下步骤:

(1)建立快速路交通系统的空间离散交通模型;

(2)将所述空间离散交通流模型用一般非线性离散时间系统的形式表示;

(3)将一般非线性离散时间模型转化为动态线性化数据模型;

(4)建立动态线性化数据模型的学习控制律和参数更新律。

进一步地,所述步骤(1)中所述快速路交通系统假设包括一条单车道的快速路,每一区段均有一个入口匝道和一个出口匝道,则所述快速路的空间离散交通流模型为:

qi(t)=ρi(t)vi(t),(2)

其中h是采样时间间隔;t是指第t个时刻;i∈{1,λ,in}是指快速路的第i个区段;in是总的区段数;τ,υ,κ,l,m为常数参数;ρi(t)表示快速路第i个区段第t个时刻的交通流密度;vi(t)表示快速路第i个区段第t个时刻的平均速度;qi(t)表示快速路第i个区段第t个时刻的交通流量;ri(t)表示快速路第i个区段第t个时刻的入口匝道交通流率;si(t)表示快速路第i个区段第t个时刻的出口匝道交通流率;li表示快速路第i个区段的长度,vfree表示快速路第i个区段的自由速度,ρjam表示最大密度。

进一步地,将所述空间离散交通流模型转化为一般非线性形式为:

y(t+1)=f[y(t),r(t),d(t)],(5)

其中,状态向量y(t)∈rn包括所有交通密度、平均速度以及匝道序列;控制向量r(t)∈rn包括所有可控匝道流率;干扰向量d(t)∈rn包括所有入口匝道的需求和转弯速度;f(λ)∈rn是向量值函数。

进一步地,所述步骤(3)中将一般非线性离散时间模型转化为动态线性化数据模型,需要设定非线性数据模型满足以下2个假设:

假设1:f(λ)关于控制向量r(t)的偏导数连续;

假设2:非线性数据模型满足广义lipschitz条件,即对任意固定的t和||δr(t)||≠0,有

其中,δy(t+1)=y(t+1)-y(t),δr(t+1)=r(t)-r(t-1);是一个正常数;

则可得,对于任意的时刻t一定存在一个被称为ppd矩阵的参数使得非线性数据模型能够转化为以下等价的动态线性化数据模型,

δy(t+1)=φ(t)δr(t)(6)

其中,φ(t)∈rn×n且||φ(t)||≤bφ。

进一步地,所述步骤(5)中建立动态线性化数据模型的学习控制律和参数更新律的步骤为:

(51)设动态线性化数据模型满足假设3,同时设定快速路交通系统在有限的运行时间间隔t内重复,是严格重复的;

假设3:ppd参数矩阵是正定或者非负定;

(52)设期望交通输出为yd,k(t)∈rn,对于所有的t∈{0,1,∧,t},k=1,2,∧,yd,k(t)是迭代相关且有界的,即

其中,byd为正常数且存在;

(53)定义跟踪误差ek(t)=yd,k(t)-yk(t),则

ek(t+1)=yd,k(t+1)-yk(t)-φ(t)δrk(t)=φ(t)(φ(t)-1yd,k(t+1)-φ(t)-1yk(t)-δrk(t))(9)

ek(t+1)=φ(t)[θ(t)ζk(t)-δrk(t)](10)

其中,ζk(t)=yd,k(t+1)-yk(t)∈rn,θ(t)=φ(t)-1∈rn×n

(54)则可得第k次的学习控制律可表述为:

其中,是θ(t)的估计值。它的参数更新律为

其中,是给定有界的;c>0;0<abφ<2,p=in×n是单位阵。

本发明所提出的ldm-ailc方法能够处理非线性系统,并且无需已知线性参数的结构,它是一种数据驱动的控制方法,控制器的设计和分析只取决于i/o数据。此外,在具有随机初始状态和迭代变化跟踪目标的非严格可重复条件下,所提出的ldm-ailc方法仍然能够获得完全跟踪性能。因此,在实践中更适合于具有更高阶、强非线性和非严格可重复条件的这种典型的复杂快速路交通控制系统。理论分析和仿真结果均证实了所提方法的有效性。并且本发明的方法具有以下优点:

(1)本发明的快速路交通系统的迭代动态线性化方法,与以前的方法相比,不需要模型且完全等价;

(2)本发明的方法是基于数据驱动的,是利用以前重复的信息来更新当前的操作,与人的经验学习类似;

(3)本发明的方法不需要要求系统每天从同一个初始点开始运行;

(4)本发明的方法在每天的期望密度和期望速度有所改变时,也可以应用。

附图说明

图1是具有入口/出口匝道的快速路各区段描述;

图2是迭代变化的期望交通密度分布图;

图3是初始交通密度迭代100次的变化图;

图4是在时间间隔t∈{0,λ,500}内的最大跟踪误差变化图。

具体实施方式

下面结合附图和实施例对本发明作进一步的说明。

如图1所示,快速路交通系统包括一个单车道的快速路,每一区段都有一个入口匝道和一个出口匝道。它的空间离散交通流模型如下(1)-(4)式所示。

qi(t)=ρi(t)vi(t),(2)

其中,h是采样时间间隔;t是指第t个时刻,t∈{0,1,∧,t};i∈{1,∧,in}是指快速路的第i个区段;in是总的区段数;τ,v,k,l,m为常数参数;ρi(t)表示快速路第i个区段第t个时刻的交通流密度;vi(t)表示快速路第i个区段第t个时刻的平均速度;qi(t)表示快速路第i个区段第t个时刻的交通流量;ri(t)表示快速路第i个区段第t个时刻的入口匝道交通流率;si(t)表示快速路第i个区段第t个时刻的出口匝道交通流率;li表示快速路第i个区段的长度,vfree表示快速路第i个区段的自由速度,ρjam表示最大密度。

假设快速路交通系统在有限的时间间隔t={0,1,λ,t}内重复运行。控制目标是设计一种不需要已知确切的交通流模型和干扰情况的自适应ilc方法。自适应ilc将利用历史的快速路交通数据来产生控制输入序列,以使得交通密度在整个区间t={0,1,λ,t}上收敛到期望值。

根据(1)–(4)式,将所述空间离散交通流模型用一般非线性离散时间形式表示为:

y(t+1)=f[y(t),r(t),d(t)],(5)

其中,状态向量y(t)∈rn包含所有交通密度、平均速度以及匝道序列;控制向量r(t)∈rn包括所有可控匝道流率;干扰向量d(t)∈rp包含所有入口匝道的需求和转弯速度;f(λ)∈rn是向量值函数。

假设1:f(λ)关于控制输入r(t)的偏导数连续。

假设2:非线性数据模型满足广义lipschitz条件,即对任意固定的t和||δr(t)||≠0,有

||δy(t+1)||≤bφ||δr(t)||

其中,δy(t+1)=y(t+1)-y(t),δr(t)=r(t)-r(t-1);bφ是一个正常数。

假设1是一般非线性系统控制器设计的典型条件。假设2限制由控制输入的变化驱动的系统输出的变化率,它意味着入口匝道交通流量的有限变化不会导致交通密度的无限变化。此外,我们只需要已知bφ这样一个常数的存在,而不需要已知它的精确值。

对于满足假设1和假设2的一般非线性离散时间模型,当||δr(t)||≠0时,对于任意的时刻t一定存在一个被称为ppd矩阵的参数φ(t),使得非线性数据模型能够转化成如下等价的动态线性化数据模型,

δy(t+1)=φ(t)δr(t)(6)

其中,φ(t)∈rn×n且||φ(t)||≤bφ。

由非线性数据模型,

令ψ(t)=f[y(t),r(t-1),d(t)]-f[y(t-1),r(t-1),d(t-1)]。由假设1和微分中值定理,(a1)可重写为

其中,表示fi关于输入rj(t)在间隔[rj(t),rj(t-1)]中某点处的偏导数值。对于每个固定的t,我们考虑以下方程,h(t)为n行、n列的数值矩阵:

ψ(t)=h(t)δr(t)(a3)

因为条件||δr(t)||≠0满足,方程(a3)至少有一个解h*(t)。事实上,对于每个时刻t,它一定具有无穷多个解。

那么我们有δx(t+1)=φ(t)δr(t)。结果||φ(t)||≤bφ是假设2的直接结论。

动态线性化数据模型是对一般非线性离散时间模型的一种等价的描述,它与其他的线性形式不同,如泰勒线性化省略了高阶项。动态线性化是一种数据驱动的方法,它的实现只依赖于系统的输入输出数据。此外,线性数据模型非常简单,不需要任何模糊控制规则、外部测试信号以及像神经网络那样的训练过程。

另一个假设是关于ppd参数的。

ppd参数矩阵φ(t)是正定或者非负定的。不失一般性,本文中我们假设φ(t)≥δi>0。

假设3规定了控制方向的同向性,这在控制系统中是常见的。

如文献“datadrivenmodel-freeadaptivecontrolforaclassofmimononlineardiscrete-timesystems”所述,φ(t)表示马尔可夫参数或线性系统的传递函数,对于仅在有限时间间隔t∈{0,1,λ,t}上沿时间轴变化的快速路交通系统,可以合理地假设φ(t)是严格可重复的,然后通过考虑快速路交通控制系统的重复性,动态线性化数据模型的等效表达式可表述为,

yk(t+1)=yk(t)+φ(t)δrk(t)(10)

其中,δrk(t)=rk(t)-rk(t-1);t={0,1,λ,t};k=1,2,λ代表迭代次数。

期望的交通输出是yd,k(t)∈rn,对于所有的t∈{0,λ,t},k=1,2,λ,它是迭代相关且有界的,即

其中,我们只需要知道正常数byd的存在性。

定义跟踪误差ek(t)=yd,k(t)-yk(t),t∈{0,1,λ,t}。由(10)式,我们可以得到

ek(t+1)=yd,k(t+1)-yk(t)-φ(t)δrk(t)=φ(t)(φ(t)-1yd,k(t+1)-φ(t)-1yk(t)-δrk(t))(11)

令ζk(t)=yd,k(t+1)-yk(t)∈rn,θ(t)=φ(t)-1∈rn×n。等式(11)可重写成

ek(t+1)=φ(t)[θ(t)ζk(t)-δrk(t)](12)

那么,第k次的学习控制律可表述如下

其中,是θ(t)的估计值。它的参数更新律为

其中,是给定有界的;c>0;0<abφ<2,bφ如假设2中所定义,是正常数;p=in×n是单位阵。

其中,与其它的自适应ilc[14-20]不同,ζk(t)=yd,k(t+1)-yk(t)是线性函数,与系统输出和参考轨迹有关。因此,自动满足关于线性增长条件。

其中,所提的ldm-ailc是一种数据驱动的方法,因为控制器的设计和分析仅用到系统输入输出的可测数据。未知参数θ(t)是随迭代估计的,也是只用到控制系统可测的i/o数据。

针对mimo非线性离散时间系统所提出的ldm-ailc方案,在假设1–3满足的条件下,控制律(13)与学习更新律(14)能够保证:

(a)对于所有的t∈{0,λ,t},k=1,2,λ,ppd矩阵估计是有界的。

(b)当k趋于无穷时,跟踪误差ek(t),t∈{1,λ,t},沿迭代轴趋于零。

定义参数估计误差将控制律(13)式代入误差动态方程(12)式中,得

注意以下性质

性质1.

性质2.trace(qtvyt)=trace(qtvyt)t=vtqy

其中,a,b,c是方阵,q∈rm×n,v∈rm×1,y∈rn×1

定义那么根据以上性质1,可得

根据(14)式,等式(b2)变成

由于以上性质2,(b3)变为

在(14)式两边同时减去θ(t),并用关系式(b1),可得

考虑到(b5),(b4)式可重写为

再用关系式(b1),我们有

由于0<abφ<2,q>0,很明显

由(b7)和(b8),很容易得到

或者

根据定理1和假设3,0<δ≤||φ(t)||≤bφ,所以θ(t)是有界的。进一步,t∈{0,λ,t},是给定有界的,因此,很明显是有界的。又由不等式(b10)可推出是非负、非增且有界的,所以是有界的。

将(b7)的两边从0到k求和,得

由于v0(t)是有界的,vk(t)是非负有界的,考虑到(b8)和(b11),可得

根据ζk(t)的定义,有

其中,q2=1是两个正常数。

因此,根据收敛性质(b12)与(b13)即可得到对于所有的t∈{1,λ,t},ek(t)沿迭代轴渐近收敛。

为了验证本发明方法的正确性,对本发明的方法进行了以下仿真:

对于仿真,我们考虑一个区间的快速路被分为12个区段。每个区段的长度为0.5km。进入第1区段的初始交通量为每小时1600辆车辆。该模型中使用的参数如下:vi(0)=50km/h,vfree=80km/h,ρjam=80veh/lane/km,l=1.8,m=1.7,κ=13veh/km,τ=0.01h,h=0.00417h,γ=35km2/h,ri(0)=0veh/h,α=0.95。

在第2区段有一个入口匝道口,已知交通需求,有两个出口匝道口分别位于第5区段和第9区段,出口流量未知。以此来模拟高峰时段的交通情况。未知的出口流量实际上是作为模拟第2区段的外部干扰。

注意,序列需求实际上对入口匝道的控制输入施加了一些约束,例如:在k时刻入口匝道的交通流率不能超过当前需求与当前在入口匝道等待序列的和;因此

其中,li(t)是指在t时刻第i个入口匝道可能存在的等待序列的长度;ηi(t)是在t时刻第i个入口匝道交通需求量(veh/h);在本文仿真中ion=2,指存在入口匝道的区段数。另一方面,等待序列是入口匝道的需求与实际流量的差的累积,即

li(t+1)=li(t)+t[ηi(t)-ri(t)],i∈ion(16)

期望的快速路交通密度是ρd,k=30+0.1sin(πk/50),如图2所示,它是随迭代次数不断变化的。随机初始交通密度选的是ρi,k(0)=30+0.01rand,如图3所示。

在仿真中,我们选择a=0.1,c=0.01,θ0(t)=0.002,u0(t)=0。应用所提的ldm-ailc方法,学习收敛性如图4所示。其中横轴是迭代次数,纵轴是跟踪误差的最大绝对值

从图2-4可看出所提ldm-ailc方法的有效性。尽管初始值随机以及参考轨迹沿迭代轴随机变化,跟踪误差仍然渐进地逼近零。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1