控制系统设计方法

文档序号:6281768阅读:231来源:国知局
专利名称:控制系统设计方法
技术领域
本发明涉及一种控制系统设计方法。

背景技术
公知的控制系统设计方法,是上世纪八十年代中期出现的迭代学习控制(IterativeLearning Control)方法。它最初是由于高性能工业机器人运动轨迹控制的要求而产生的。对于非线性,强耦合且具有重复性运行的一大类被控对象,迭代学习控制能在不依赖于被控对象的数学模型下,在给定的区间内通过学习算法,能精确地跟踪给定的轨迹。它同时具有方法简单、控制器能在线学习,使得控制性能越来越好的特点。该方法在工业机器人控制应用中取得了很大的成功。
迭代学习控制在理论研究上虽然得到了很大的发展,且在具有重复运行条件被控对象中得到了某些应用,但不被控制界广泛关注的原因是它的苛刻的应用限制条件,即要求被控对象必须是在给定的时间区间内、要求期望轨迹在这时间区间内是给定不变的、要求控制器在这段时间区间内可以重复学习运行。由于这些限制,使得它的应用领域受到很大限制。
它不能解决控制领域中最为广泛的应用条件下高性能控制系统的问题,即 (1)控制是连续的,即时间区间是不定的,或无限的; (2)被控对象工作过程可能不是具有相同的重复过程; (3)控制输出的期望值是可变的; (4)系统存在非线性,但不受所谓的“相同的初始状态”约束,任何状态都可视为“初始状态”。
可以看出,工程中上述最为普遍的控制条件,恰恰是和迭代学习控制的基本应用条件相对立的。如何打破目前迭代学习控制的限制条件,并保留迭代学习控制独特的“学习”和非线性动态寻优能力、解决目前面临的很多急需解决的非重复、非线性、且具有高性能的要求的工程的控制问题具有很大的意义。


发明内容
现有的迭代学习控制的三个主要限制条件,即 (1)限定在给定的区间[t1,t2](相对于控制开始); (2)在该区间的期望输出为固定轨迹; (3)每次运行过程具有相同的初始状态,并允许控制重复上述过程进行学习。
为了克服现有技术的上述不足,本发明提供一种控制系统设计方法,根据对迭代学习控制收敛时记录的控制量u(t)、输出量y(t),期望输出量yd(t)和状态量x(t),采用最小二乘法对控制函数h进行拟合,可以避开迭代学习控制理论的三个主要应用限制条件,利用迭代学习控制独特的“学习”和非线性动态寻优能力,解决控制界急需解决的非重复、非线性、且具有高性能的要求的工程的控制问题。
本发明解决其技术问题所采用的技术方案一种控制系统设计方法,其点是包括以下步骤 (a)根据被控对象的特点找出控制律的结构函数h; (b)根据对迭代学习控制收敛时记录的控制量u(t)、输出量y(t),期望输出量yd(t)和状态量x(t),采用最小二乘法对控制函数h进行拟合,得到控制函数h的待定参数 u(x)=h(x,y,yd) 控制律u(x)是状态量x(t)、输出量y(t)及期望输出量yd(t)的函数。
本发明的有益效果是由于根据被控对象的特点找出控制律的结构函数h,根据对迭代学习控制收敛时记录的控制量u(t)、输出量y(t),期望输出量yd(t)和状态量x(t),采用最小二乘法对控制函数h进行拟合,打破了迭代学习控制理论的三个主要应用限制条件,在迭代学习控制独特的“学习”和非线性动态寻优能力的基础上,解决了控制界急需解决的非重复、非线性、且具有高性能的要求的工程的控制问题。采用本发明的方法先后对“混合动力电动汽车防滑刹车(ABS)控制”和“多电飞机机轮防滑刹车控制”进行了控制试验验证,其控制性能非常好。
下面结合附图和实施例对本发明作详细说明。



图1是本发明控制系统设计方法应用实施例中结合系数μ和滑移率σ的关系曲线图。
图2是本发明控制系统设计方法应用实施例中期望输出改变后控制效果曲线图。
图3是本发明控制系统设计方法应用实施例中跑道改变为湿路面时的控制效果曲线图。
图4是现有技术开环迭代学习控制方法基本结构框图。
图5是现有技术闭环迭代学习控制方法基本结构框图。
图中,下标k——第k次学习运行,uk(t)——第k次运行的控制量,yk(t)——第k次运行的输出量,yd(t)——期望输出量,ek(t)——第k次运行的输出误差量,uk+1(t)——第k+1次运行的控制量,T——运行的时间区间长度。

具体实施例方式 实施例1下面以飞机机轮防滑刹车控制为例详细说明。
对于被控的飞机机轮防滑刹车控制非线性系统,首先用传统的迭代学习控制方法进行学习,注意,因为这是控制器的“学习”阶段,不是运行阶段,可以人为地按迭代学习控制的三个限制条件进行设定。即学习运行限定在给定的区间[t1,t2]内;限定在该区间的期望输出为固定轨迹;限定学习运行时具有相同的初始状态;这里的期望输出尽量不要选择固定值,以利于学习过程可以充分揭示被控对象的动态过程。
用传统的迭代学习控制方法选择学习律,使之满足学习收敛条件。
在学习满足学习收敛,即误差满足系统要求时,记录下最后一次学习的控制量u(t)、输出量y(t)、期望输出yd(t)和状态量x(t)。这里保留了迭代学习控制优越的非线性动态学习和寻优能力。
传统的迭代学习控制到此已经结束了,控制的输出根据是自变量时间t的函数,因而它是一种“死记硬背”式的学习,当期望输出变更,运行时间变化或不具有重复条件的“相同初始值”时,则学习的结果失效。本发明接着要完成下面关键的归纳算法,将传统迭代学习控制“死记硬背”式的学习推广到高一层“学习的归纳”,这种归纳的目的是揭示控制律和状态之间的关系,使之能应用于一般的非重复的控制过程。
本发明方法如下 (1)首先根据被控对象的特点给出一种控制律的结构函数h,其参数待定,它可以是线性或者非线性的,但是其控制是状态或误差的函数,即具有 u(x)=h(x,y,yd)(1) 的形式,其中u为控制量,x为状态量,y为输出量,yd为期望输出,h为给出的控制律函数。一种控制律的结构函数h的选取考经验或对被控对象的了解,选择的结果对控制效果又影响。
(2)根据前面迭代学习控制收敛时记录的控制量u(t)、输出量y(t),期望输出yd(t)和状态量x(t),对控制函数h(式1)进行拟合,可以选择最小二乘法拟合。
(3)第(2)步的拟合后得到了控制函数h的待定参数,它实际上已经揭示了控制的内在规律,是对传统迭代学习控制的高一层“学习的归纳”,此时停止学习过程,因为此时的控制律u(x)是状态和输出及期望输出的函数,传统迭代学习控制的限制条件在这里不起作用,它已经可以用于一般的控制过程了。
本发明的基本原理叙述如下 参照图5、图6,本发明是基于传统迭代学习控制基础之上发展的。迭代学习控制问题可描述为,当被控对象如下 要求输出y(t)在时间区间[t1,t2]内精确地跟踪期望输出yd(t),其中x∈Rm,y∈Rn,u∈Rp。这里被控对象的数学模型f、g可能是未知非线性系统。如果理想的控制ud(t)存在,那么在迭代学习算法 uk(t)=uk-1(t)+L(t,xk-1(t),yk-1(t),yd(t))(3) uk(t)=uk-1(t)+L(t,xk(t),yk(t),yd(t))(4) 下uk(t)→ud(t),yk(t)→yd(t),其中下标k为学习次数,(3)和(4)式分别称为开环迭代学习控制的学习律和闭环迭代学习控制的学习律,即通过学习后找到最优的控制ud(t),随着学习次数的增加,使系统输出无限地逼近于期望输出yd(t)。已经有很多的理论证明了学习收敛的条件。当学习律满足收敛条件时,在不依赖于被控对象的数学模型的情况下,迭代学习控制具有很好的非线性动态寻优能力,可以解决很复杂的非线性控制问题,这是迭代学习控制的最大的优越之处。
在飞机机轮刹车中以“滑移率”为期望输出控制的效果是最好的,但它是最困难的,因为其数学模型为本质非线性的,它的数学模型具有如式(5)所示的非线性动态方程 其中 选择状态变量为X(t)=[x1(t),x2(t)]T(6) 输出为 状态方程中(5)中的f(X(t),t),B(X(t),t),C(t)分别为 C(t)=[1,0](11) 式(5)~(11)中的各个变量的物理意义为 u(t)-为控制输入 Tb(t)-刹车力矩 y(t)-为滑移率输出 σ(t)-滑移率 Jω-飞机车轮转动惯量 V-飞机的纵向速度 M-飞机质量 Rg-刹车滑跑过程中轮胎的滚动半径 g-重力加速度 Fv-主轮上飞机质量产生的垂直载荷 T0-发动机剩余推力 K0-慢车推力系数 Kf-阻力系数 μ-刹车时轮胎与跑道间的结合系数 n-刹车机轮数量 其中μ或μ(σ)是跑道和轮胎的结合系数,它与滑移率σ的关系如图1所示的非线性函数,随跑道情况和滑移率不同变化。图1表示了轮胎与跑道结合系数μ和滑移率σ的关系,在不同的跑道,如干跑道、湿跑道和冰跑道,其结合系数的值不同。
主轮上飞机质量产生的垂直载荷Fv是飞机速度V和轮胎与跑道间的结合系数μ的非线性函数。它可表示为 其中 a,b-飞机重心至前、后机轮的距离 H-为重心高度 HZS为重心至阻力伞的高度 Qx-飞机气动阻力 Qxs-阻力伞动阻力 μs-刹车时轮胎与跑道间的结合系数 μgd-轮胎与地面间的滚动摩擦系数 Fy=KyV2-飞机升力 Ky-升力系数 由以上的飞机刹车数学模型可知,它是高度非线性的系统,控制律的设计很困难。采用本发明的方法,现用传统的迭代学习控制进行学习,用迭代学习控制闭环PD型学习律 其中ek(t)=σd-σk(14) 为输出误差,σd为期望输出的滑移率,σk为实际输出的滑移率。
取学习过程的期望滑移率为 σd(t)=0.15(1-e-0.4tcos5πt)(15) 取闭环PD型学习律的参数为KP=2000,Kd=1,经过15次学习时,真实的滑移率与期望的滑移率输出已经重叠一致了,误差已趋于零。记录下第15次学习过程中的u15(t)(第15次运行的控制量)、x15(t)(第15次运行的状态量)、y15(t)(第15次运行的输出量)和期望输出yd(t) 然后根据本发明的方法进行控制律的归纳学习。首先构造控制律,经分析,飞机刹车系统采用下式所示的控制律 其中e(t)=σd(t)-σ(t)(17) 而控制律(16)式中的参数K1,K2,K3,K4,K5,K6为待定参数。
根据本发明的方法归纳学习的第二步,用经过15次学习后记录的数据对(16)式的控制律进行最小二乘解方程组,求出待定参数K1,K2,K3,K4,K5,K6。
图2表示在迭代学习控制完成后,且由给定的控制函数进行归纳后得到控制律参数后用于实际控制时,期望输出σ改变为σ=0.15后,控制效果的曲线。其中μ(σ)为结合系数,Tb为控制器输出的刹车力矩,V为飞机速度,ω为飞机机轮速度。
根据本发明的方法停止学习,控制器设计完成。改用(16)的控制律进行实际控制。在实际控制中,期望输出改变为σd(t)=0.15,从图2控制结果看,它有非常优异的控制效果,此时的结合系数μ值也一直保持在很高的值上。
图3表示在迭代学习控制完成后,且由给定的控制函数进行归纳后得到控制律参数后用于实际控制时,跑道由干跑道改变为湿跑道后,控制效果的曲线。其中μ(σ)为结合系数,Tb为控制器输出的刹车力矩,V为飞机速度,ω为飞机机轮速度。
当跑道由干跑道变为湿跑道时,不需要重新学习,从图3看控制律(16)仍然有很好的控制效果。
权利要求
1.一种控制系统设计方法,其特征包括以下步骤
(a)根据被控对象的特点找出控制律的结构函数h;
(b)根据对迭代学习控制收敛时记录的控制量u(t)、输出量y(t),期望输出量yd(t)和状态量x(t),采用最小二乘法对控制函数h进行拟合,得到控制函数h的待定参数
u(x)=h(x,y,yd),
即控制律u(x)是状态量x(t)、输出量y(t)及期望输出量yd(t)的函数。
全文摘要
本发明公开了一种控制系统设计方法,其点是包括以下步骤(a)根据被控对象的特点找出控制律的结构函数h;(b)根据对迭代学习控制收敛时记录的控制量u(t)、输出量y(t),期望输出量yd(t)和状态量x(t),采用最小二乘法对控制函数h进行拟合,得到控制函数h的待定参数u(x)=h(x,y,yd),即控制律u(x)是状态量x(t)、输出量y(t)及期望输出量yd(t)的函数。由于根据被控对象的特点找出控制律的结构函数h,根据对迭代学习控制收敛时记录的控制量u(t)、输出量y(t),期望输出量yd(t)和状态量x(t),采用最小二乘法对控制函数h进行拟合,打破了迭代学习控制理论的三个主要应用限制条件,在迭代学习控制独特的“学习”和非线性动态寻优能力的基础上,解决了控制界急需解决的非重复、非线性、且具有高性能的要求的工程的控制问题。
文档编号G05B13/02GK101105687SQ20071001840
公开日2008年1月16日 申请日期2007年8月3日 优先权日2007年8月3日
发明者辉 林, 蓉 齐 申请人:西北工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1