一种基于迭代学习的地铁列车自动运行速度控制方法与流程

文档序号:12122501阅读:413来源:国知局
一种基于迭代学习的地铁列车自动运行速度控制方法与流程

本发明涉及一种基于迭代学习的地铁列车自动运行速度控制方法,属于城市轨道交通控制技术领域。



背景技术:

城市轨道交通具有速度快、运量大、污染少、能耗低、舒适性好等特点,是城市公共交通的重要组成部分,随着城市的快速发展,轨道交通系统的建设已成为世界大中型城市缓解交通拥堵的重要措施之一。轨道交通的运营特点决定了其对安全性、舒适性及节能特性的极高要求,相比于非自动化列车,列车的自动驾驶可以在保证安全运行的前提下,提高列车旅行平均速度、停车准确度和乘坐舒适度等指标,列车自动驾驶已成为轨道交通发展的重要目标之一。列车自动驾驶系统(ATO)的主要功能是实现列车速度的自动调整,通过对列车牵引系统和制动系统的控制实现列车在车站间的自动驾驶,使列车平稳地停靠在预定位置。ATO的调速系统性能的优劣直接影响轨道交通系统的发展,高效和安全的列车速度控制系统可保证列车的安全运行,最终实现列车多项性能指标的完善。

列车运行过程有高度复杂性、非线性及不确定性等特性,其控制方法主要有经典PID控制、最优化理论控制以及智能控制方法。由于列车在整个运行过程中存在外部噪声扰动、内部非线性扰动以及系统参数的不确定性,传统PID控制有难以克服的局限性,在控制速度时挡位切换次数过多,不利于列车的平稳运行,降低了乘坐的舒适性,同时增加了能耗。基于最优化理论的列车运行控制方法的研究大多是选择能耗或时间作为其单一性能指标,而列车运行过程属多目标优化问题,需同时满足安全、正点、舒适、节能等指标要求,仅仅以某种指标最优作为控制器设计约束条件很难获得满意的控制效果。智能控制的发展为实现高性能列车自动控制提供了可行的方法,但仍存在很多问题有待解决,如高性能车载模糊控制系统需要依赖大量已知的驾驶经验,且在不同车型不同线路上缺乏移植性,如神经网络控制方法收敛速度有待提高,且可能陷入局部最优,将其真正应用于实际系统还有待进一步发展。

对列车速度的优化控制能有效改善列车运行控制系统的多项性能指标,本发明充分利用列车运行的重复性及不完全重复性特征,提供一种基于迭代学习的地铁列车自动运行速度控制方法。



技术实现要素:

本发明的目的在于:提供一种针对城市轨道交通的列车自动运行速度控制方法,通过迭代过程中的输出误差和修正函数对学习增益进行自动调整,将其用来更新控制输入,同时,对迭代初态进行学习以保证算法对列车任意初态的收敛性,最终实现列车对目标速度曲线的精确跟踪。

实现本发明目的的技术解决方案具体为:一种基于迭代学习的地铁列车自动运行速度控制方法,包括以下步骤:

步骤1:针对城市轨道交通列车自动运行速度控制系统,建立列车运行动力学模型;

所述的列车运行动力学模型通过采用坡道线性模型来分析:

其中,s(t)∈[0,S]是列车运行位移,单位是m,S是线路全长;

t∈[0,T]是列车运行时间,T是全程运行时间;v(t)∈[0,V]是列车运行速度,单位是m/s,V(s)为s处允许的最高运行速度;F(t)是作用在列车单位质量上的控制力(牵引力或制动力),f(t)是作用在列车单位质量上的总阻力,f0(t)是列车单位质量受到的基本阻力,fi(t)是列车单位质量受到的坡道阻力,fr(t)是列车单位质量受到的弯道阻力,fs(t)是列车单位质量受到的隧道阻力,相关作用力的单位为N/kg;取系统状态量x(t)为列车运行位移和运行速度,即x(t)=[s(t) v(t)]T

将式(1)写成状态方程为:

其中,k表示列车第k次运行,f(xk(t),t)=[f1(xk(t),t)f2(xk(t),t)]T,f1(xk(t),t)=vk(t),f2(xk(t),t)=-f0(t)-fi(t)-fr(t)-fs(t),uk(t)=[0 Fk(t)]T,h(xk(t),t)=xk(t),yk(t)是系统输出。

步骤2:列车运行系统需要采取有效的控制措施以保证列车的安全、平稳、高效运行,通过迭代过程中的输出误差和修正函数对学习增益进行自动调整,将其用来更新速度控制器输入;

所述步骤2中,给出学习增益可变的迭代学习控制器表达形式,即列车自动运行速度控制系统第k+1次迭代的控制量表达式:

其中,λk(t)是可变学习增益,其值的大小与列车系统中参数时变特性相关,为保证系统快速收敛至期望轨迹,学习算法应随着列车系统参数动态特性的变化自动调整学习增益,即当系统参数快速变化时,控制量应具有适应这一变化的能力,否则系统输出误差将不断增大导致系统发散;ek(t)=yd(t)-yk(t)为系统在第k次运行时的输出误差,为系统在第k次运行时的输出误差ek(t)的导数,在当前完整的迭代周期内产生相应的跟踪误差ek+1(t)和误差导数将二者在迭代轴上按时间存储,下次迭代中,按顺序取出上一次迭代轴上的误差和误差导数值,并记为ek(t)和用于更新当前控制量;yd(t)为列车运行系统的期望输出;u0(t)是初始控制量,获得理想的初始控制量能有效减小初始跟踪误差,可保证在相同学习律下减少迭代次数,提高跟踪精度;

所述公式(3)中对控制量表达式的收敛性证明如下,首选给出如下的基本假设:

假设1:f()、h()关于系统状态向量x(t)满足Lipschitz条件,即对x2(t)∈Rn×1,存在M>0,N>0使得:

||f(x1(t),t)-f(x2(t),t)||≤M||x1(t)-x2(t)||

||h(x1(t),t)-h(x2(t),t)|≤N||x1(t)-x2(t)||;

假设2:存在惟一的理想控制量ud(t)使得系统的状态和输出为期望值,即满足:

该算法的收敛性证明如下:

(1)、根据列车运行动力学模型式有:

将控制量表达式(3)和初态学习算法式(5)带入(7)式可得:

(2)、根据微分中值定理可得:

ek+1(t)-ek(t)=yk(t)-yk+1(t)

=h(t,xk(t))-h(t,xk+1(t))=hx(t,ξ(t))(xk(t)-xk+1(t)) (9)

其中,xk+1(t)≤ξk(t)≤xk(t);

结合式(8)、式(9)可得:

令算子P:Cr[0,T]→Cr[0,T]为:

Pek(t)=[I-hx(t,ξk(t))λ(t)]ek(t) (11)

令算子Qk:Cr[0,T]→Cr[0,T]为:

由式(10)(11)(12)可得:

ek+1(t)=Pek(t)+Qk(ek)(t)=(P+Qk)(P+Qk-1)…(P+Q0)(e0)(t) (13)

由式ρ(I-hx(t,x(t))λ(t))<1可知P(t)谱半径小于1,又Qk满足对于t一致成立。因此,由式(13)可得即当k→∞时,系统输出yk(t)在[0,T]上一致收敛于期望轨迹yd(t)。

所述步骤2中,通过误差均值E[ek(t)]来调整λk(t)的大小,采用如下的修正函数对λk(t)进行修正:

其中,λmin是根据实际系统设定的学习增益最小值;当输出误差大于E[ek(t)]时,增大λk(t)使其接近于1以达到快速调整控制输入uk(t)的目的,当输出误差小于E[ek(t)]时,减小λk(t)使其接近于设定的最小值λmin,对λk(t)的适时调整使得系统的跟踪能力加强,同时又减小了系统收敛时的估计误差。

步骤3:为保证算法对初态误差的鲁棒性,在对控制量进行学习的同时对迭代初态进行学习,使得系统可在任意初始条件下均能收敛至期望轨迹,而不要求迭代初态精确位于期望初态上,最终实现列车对目标速度曲线和目标位移曲线的精确跟踪。

所述步骤3中,为保证学习算法对列车任意初态的鲁棒性,采用下式对系统的初态进行学习:

xk+1(0)=xk(0)+λk(0)ek(0) (5)

其中,xk(0)为第k次迭代时状态初始值,λk(0)为第k次迭代时学习增益初始值。

本发明的主要结果给出如下:

对于满足相应假设的列车速度控制系统即列车运行动力学模型采用式(3)的迭代学习控制算法和式(5)的初始状态学习算法,在t∈[0,T]上,若可变学习增益λ对所有t和k满足:

ρ(I-hx(t,x(t))λ(t))<1 (6)

则当k→∞时,列车输出量yk(t)一致收敛于期望轨迹yd(t)。

采用对系统初始状态进行学习的策略,即使系统存在初始状态误差,也能随迭代次数的增加,在有限时间区间上实现对期望轨迹的完全跟踪,该初态学习算法保证了对列车任意初态的收敛性。

本发明的有益效果是:

(1)本发明充分考虑了城市轨道交通列车运行的重复性特性;列车按照既定运行图往返于各站点之间的运行方式具有明显的重复性,将迭代学习控制方法用于列车控制领域充分利用了列车运行的重复性特征,有利于实现对既定速度目标曲线的完全跟踪。

(2)针对列车自动运行速度控制系统,本发明提供学习增益为自适应可变的ILC学习方法,不同于常规的增益固定的学习方法,该方法将具备自适应特性的学习增益λk(t)用于更新速度控制器输入,λk(t)的取值将根据迭代过程中的跟踪误差ek(t)和修正函数自适应调整。

(3)针对系统初态偏差对迭代输出误差的重要影响,本发明利用学习增益初始值和上一次迭代的系统状态和跟踪误差对本次迭代的系统初态进行修正,给出了迭代初态修正算法,保证了学习律对任意系统初态的收敛性。

附图说明

图1是列车坡道阻力示意图;

图2是列车目标速度曲线示意图;

图3是列车目标位移曲线示意图;

图4是本发明列车速度跟踪曲线示意图;

图5是本发明列车位移跟踪曲线示意图;

图6是速度跟踪误差L2范数曲线;

图7是位移跟踪误差L2范数曲线。

具体实施方式

为使本发明技术目的和方案优点表达更清晰明白,下面结合附图和具体实施例对本发明作进一步详细说明。下面具体描述内容是说明性的而非限制性的,不应以此限制本发明的保护范围。

本发明考虑城市轨道交通列车自动运行速度控制系统具有模型非线性和参数不确定性等因素,设计一种基于迭代学习的地铁列车自动运行速度控制方法,根据Bellman-Gronwall引理证明控制方法的稳定性和收敛性,根据列车速度控制系统模型,对控制器性能进行仿真。

具体实施例如下:

本实施例以列车速度控制系统为研究对象,模拟线路数据参照南京地铁1号线一期工程线路数据,南京地铁1号线一期工程线路全长21.7km,全线共设置16座车站,南京市内秦淮河水系发达,线路多次上跨越和下穿越河流,其中包括在相距440米的情况下先上跨外秦淮河再下穿内秦淮河的过度,纵断面在内外秦淮河间采用全线最大坡度33‰。本实施例中,模拟线路为两站点之间的线路,总长1976m,其中包括一段481.93米的上坡道,坡度为35‰,具体线路数据如下:

其中,线路曲线半径r沿行驶方向顺时针旋转时取正,逆时针旋转取负;坡度千分度值上坡取正,下坡取负。

步骤1、建立列车运行动力学模型;

所述的列车运行动力学模型通过采用坡道线性模型来分析:

本实施例中列车模型各参数设置如下:

(1)基本阻力f0(t)

基本阻力f0(t)采用Davis模型,即f0(t)=a0v2(t)+a1v(t)+a2,其中a0,a1,a2为与列车编组和车辆类型有关的经验常数,本实施例中具体设置为a0=2×10-5,a1=7.5×10-5,a2=1.2×10-2

(2)坡道阻力fi(t)

由图1可看出,坡道阻力fi(t)是由于列车在坡道上行驶时列车重力沿坡道方向的分力引起的。实际中地铁线路与水平面的夹角非常小,40‰的坡道钢轨面与水平面的夹角仅为2°17′26″,因此坡度角θ的正切值和正弦值可近似认为相等,根据图1可得:

由xk+1(0)=xk(0)+λk(0)ek(0)式可得其中h为线路坡道高度,Lp为坡道线路长度,M为列车和载荷的总重量,i=h×1000/Lp为坡度千分度,可见单位坡道阻力在数值上近似等于该坡度的千分度。

(3)弯道阻力fr(t)

弯道阻力一般采用如下的经验公式计算:

其中,A为经试验确定的常数,取值范围为[450 800],r为线路曲线半径。本实施例中列车编组是6节,车厢长度20m,列车运行线路最小曲率半径320米,参数A可取值为600。

(4)隧道阻力fs(t)

隧道阻力fs(t)与隧道和列车端面的当量直径、隧道长度、列车长度、列车运行速度等因素有关,一般采用以下经验公式进行计算:

fs(t)=0.00013×Ls×M

其中Ls为隧道长度。

列车目标速度曲线如图2所示,目标位移曲线如图3所示,其中包括一次牵引阶段、两次惰行阶段、两次制动阶段,运行总时间为145秒,惰行阶段运行速度分别为20m/s和8m/s。

步骤2:列车控制任务即为设计列车第k次运行时的控制律uk(t),使得在有限的运行次数下,列车输出yk(t)在t∈[0,T]的任意时刻都收敛于相应时刻的期望输出yd(t);列车自动运行速度控制系统第k+1次迭代的控制量表达式为即公式(3);其中,迭代过程中的学习增益通过输出误差和修正函数对进行自动调整,其表达式为即公式(4);取初始控制量取[u1(0) u2(0)]′=[0 0]′,学习增益初始值学习增益最小值设定为

通过公式(3)对控制量表达式的收敛性证明如下。首先给出如下的基本假设:

假设1:f()、h()关于系统状态向量x(t)满足Lipschitz条件,即对x2(t)∈Rn×1,存在M>0,N>0使得:

||f(x1(t),t)-f(x2(t),t)||≤M||x1(t)-x2(t)||

||h(x1(t),t)-h(x2(t),t)|≤N||x1(t)-x2(t)||;

假设2:存在惟一的理想控制量ud(t)使得系统的状态和输出为期望值,即满足:

该算法收敛性证明如下:

(1)、根据列车运行动力学模型式有:

将控制算法式(3)和初态学习算法式(5)带入(7)式可得:

(2)、根据微分中值定理可得:

ek+1(t)-ek(t)=yk(t)-yk+1(t)

=h(t,xk(t))-h(t,xk+1(t))=hx(t,ξ(t))(xk(t)-xk+1(t)) (9)

其中,xk+1(t)≤ξk(t)≤xk(t);

结合式(8)、式(9)可得:

令算子P:Cr[0,T]→Cr[0,T]为:

Pek(t)=[I-hx(t,ξk(t))λ(t)]ek(t) (11)

令算子Qk:Cr[0,T]→Cr[0,T]为:

由式(10)(11)(12)可得:

ek+1(t)=Pek(t)+Qk(ek)(t)=(P+Qk)(P+Qk-1)…(P+Q0)(e0)(t) (13)

由式ρ(I-hx(t,x(t))λ(t))<1可知P(t)谱半径小于1,又Qk满足对于t一致成立。因此,由式(13)可得即当k→∞时,系统输出yk(t)在[0,T]上一致收敛于期望轨迹yd(t)。

步骤3:为保证算法对初态误差的鲁棒性,对列车自动运行速度控制系统的迭代初态进行学习,初态学习表达式为xk+1(0)=xk(0)+λk(0)ek(0),即公式(5),取迭代初态为x(0)=[0 0]T

将步骤2和步骤3中所述控制方法及参数初始值运用于步骤1中建立的列车速度控制系统模型,检验本发明控制方法对列车期望轨迹的跟踪精度及收敛速度。图4是对目标速度曲线的跟踪结果,图中vd表示列车目标速度,v1、v3分别表示第1次和第3次迭代时的速度曲线,图5是第3次迭代时位置跟踪曲线,图中sd表示列车目标位移,s3表示第3次迭代时的位移曲线,采用本发明算法在第3次迭代时基本能跟踪上目标位移曲线。图6为速度跟踪误差在L2范数意义下关于迭代次数的变化曲线,图7为位移跟踪误差在L2范数意义下关于迭代次数的变化曲线。可以看出,第3次迭代后便能实现对目标速度曲线和目标位移曲线的跟踪,这是因为新算法中学习增益随跟踪误差的变化而改变,当误差较大时,学习增益随之增大,这在一定程度上加快了算法的收敛速度,反之,当跟踪误差较小时,学习增益随之减小保证了系统的稳定性;另一方面,尽管迭代初态与理想初态存在初始偏移,但因算法能同时对初始状态进行学习,经较少次数的迭代便可跟踪上期望轨迹,保证了系统对初始状态的鲁棒收敛性,不需要初始状态固定于某一确定值,突破了常规算法中要求初始状态与期望状态完全重合的限制。仿真实例说明本发明的提出的列车速度控制算法切实可行,对相关问题的方案设计有一定的借鉴意义。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1