一种基于迭代学习的地铁列车自动运行速度控制方法与流程

文档序号:12122501阅读:来源:国知局

技术特征:

1.一种基于迭代学习的地铁列车自动运行速度控制方法,其特征在于,包括以下步骤:

步骤1:针对城市轨道交通列车自动运行速度控制系统,建立列车运行动力学模型;

步骤2:通过迭代过程中的输出误差和修正函数对学习增益进行自动调整,将其用来更新速度控制器输入;

步骤3:为保证算法对初态误差的鲁棒性,在对控制量进行学习的同时对迭代初态进行学习,使得系统可在任意初始条件下均能收敛至期望轨迹,而不要求迭代初态精确位于期望初态上,最终实现列车对目标速度曲线和目标位移曲线的精确跟踪。

2.根据权利要求1所述的基于迭代学习的地铁列车自动运行速度控制方法,其特征在于,所述步骤1中所述的列车运行动力学模型通过采用坡道线性模型来分析,其模型为:

其中,s(t)∈[0,S]是列车运行位移,单位是m,S是线路全长;

t∈[0,T]是列车运行时间,T是全程运行时间;v(t)∈[0,V]是列车运行速度,单位是m/s,V(s)为s处允许的最高运行速度;F(t)是作用在列车单位质量上的控制力(牵引力或制动力),f(t)是作用在列车单位质量上的总阻力,f0(t)是列车单位质量受到的基本阻力,fi(t)是列车单位质量受到的坡道阻力,fr(t)是列车单位质量受到的弯道阻力,fs(t)是列车单位质量受到的隧道阻力,相关作用力的单位为N/kg;

取系统状态量x(t)为列车运行位移和运行速度,即x(t)=[s(t)v(t)]T,将式(1)写成状态方程为

其中,k表示列车第k次运行,系统状态量x(t)=[s(t)v(t)]T为列车运行位移和运行速度,f(xk(t),t)=[f1(xk(t),t)f2(xk(t),t)]T,f1(xk(t),t)=vk(t),f2(xk(t),t)=-f0(t)-fi(t)-fr(t)-fs(t),uk(t)=[0Fk(t)]T,h(xk(t),t)=xk(t),yk(t)是系统输出。

3.根据权利要求1所述的基于迭代学习的地铁列车自动运行速度控制方法,其特征在于,所述步骤2中,给出学习增益可变的迭代学习控制器表达形式即列车自动运行速度控制系统第k+1次迭代的控制量表达式为:

其中,λk(t)是与列车系统中参数时变特性相关可变学习增益,

ek(t)=yd(t)-yk(t)为系统在第k次运行时的输出误差,为系统在第k次运行时的输出误差ek(t)的导数,在当前完整的迭代周期内产生相应的跟踪误差ek+1(t)和误差导数将二者在迭代轴上按时间存储,下次迭代中,按顺序取出上一次迭代轴上的误差和误差导数值,并记为ek(t)和用于更新当前控制量;yd(t)为列车运行系统的期望输出;u0(t)是初始控制量,获得理想的初始控制量能有效减小初始跟踪误差,可保证在相同学习律下减少迭代次数,提高跟踪精度。

4.根据权利要求1所述的基于迭代学习的地铁列车自动运行速度控制方法,其特征在于,所述步骤2中,通过误差均值E[ek(t)]来调整λk(t)的大小,采用如下的修正函数对λk(t)进行修正:

其中,λmin是根据实际系统设定的学习增益最小值;当输出误差大于E[ek(t)]时,增大λk(t)使其接近于1以达到快速调整控制输入uk(t)的目的,当输出误差小于E[ek(t)]时,减小λk(t)使其接近于设定的最小值λmin,对λk(t)的适时调整使得系统的跟踪能力加强,同时又减小了系统收敛时的估计误差。

5.根据权利要求1所述的基于迭代学习的地铁列车自动运行速度控制方法,其特征在于,所述步骤3中,为保证学习算法对列车任意初态的鲁棒性,通过下式对系统的初态进行学习:

xk+1(0)=xk(0)+λk(0)ek(0) (5)

其中,xk(0)为第k次迭代时状态初始值,λk(0)为第k次迭代时学习增益初始值。

6.根据权利要求3所述的基于迭代学习的地铁列车自动运行速度控制方法,其特征在于,所述公式(3)中对控制量表达式的收敛性证明如下,首选给出如下的基本假设:

假设1:f()、h()关于系统状态向量x(t)满足Lipschitz条件,即对x2(t)∈Rn×1,存在M>0,N>0使得:

||f(x1(t),t)-f(x2(t),t)|||≤M||x1(t)-x2(t)||

||h(x1(t),t)-h(x2(t),t)|≤N||x1(t)-x2(t)||;

假设2:存在惟一的理想控制量ud(t)使得系统的状态和输出为期望值,即满足:

该算法的收敛性证明如下:

(1)、根据列车运行动力学模型式有:

将控制量表达式(3)和初态学习算法式(5)带入(7)式可得:

(2)、根据微分中值定理可得:

ek+1(t)-ek(t)=yk(t)-yk+1(t)

=h(t,xk(t))-h(t,xk+1(t))=hx(t,ξ(t))(xk(t)-xk+1(t)) (9)

其中,xk+1(t)≤ξk(t)≤xk(t);

结合式(8)、式(9)可得:

令算子P:Cr[0,T]→Cr[0,T]为:

Pek(t)=[I-hx(t,ξk(t))λ(t)]ek(t) (11)

令算子Qk:Cr[0,T]→Cr[0,T]为:

由式(10)(11)(12)可得:

ek+1(t)=Pek(t)+Qk(ek)(t)=(P+Qk)(P+Qk-1)…(P+Q0)(e0)(t) (13)

由式ρ(I-hx(t,x(t))λ(t))<1可知P(t)谱半径小于1,又Qk满足对于t一致成立。因此,由式(13)可得即当k→∞时,系统输出yk(t)在[0,T]上一致收敛于期望轨迹yd(t)。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1