本发明涉及一种迭代学习控制的抗干扰对接控制方法,该发明属于迭代学习控制领域。
背景技术
精确对接控制在很多行业领域具有重要作用,例如,空中加油和船舶对接等等。对接控制的成功率往往会受到各种干扰的影响。以空中加油为例,在对接过程中会受到随机扰动(大气紊流)以及斥力干扰(受油机头波效应)。其中,斥力干扰是指当被控对象(受油机锥管)靠近对接目标(锥套)时,对接目标会受到被控对象的推动排斥(流场、磁场等)作用,向外侧以较快速度逃逸,从而导致对接失败。斥力干扰使得对接控制问题从原来的固定靶标射击问题,转变为活动靶标射击问题。通常情况下,被控对象的惯性大导致运动速度较慢,而对接目标的质量轻从而运动速度快,这就导致被控对象的机动性通常不足以追上逃逸的对接目标使得对接成功率大大降低。该现象在各种行业的对接控制任务中均有存在,在有人参与对接控制时,人能通过自身的经验对对接目标的运动轨迹进行预判,从而实现顺利对接。本发明采用迭代学习控制的方法来模仿人的对接过程,来实现对接目标的轨迹预测与跟踪控制,从而提高在各种气动干扰下的自主对接控制的成功率。该方法对未来的自主对接控制具有十分重要的作用和意义。
技术实现要素:
本发明给出了基于迭代学习控制的抗干扰自主对接控制方法。它提高了自主对接控制在斥力干扰下对接成功率。
本发明中面对的对接控制过程如下所示:
如图1所示是以空中对接为例子的一个典型对接控制问题,其中,被控对象是受油机上的锥套,对接目标是加油机软管末端的锥套,目的是通过迭代学习控制保证锥管(被控对象)在有干扰情况下顺利插入锥套中心(对接目标)。
一个对接控制问题可以表示如下:ppr=[xpryprzpr]t表示被控对象的位置向量,pdr=[xdrydrzdr]t对接目标的位置向量,这两个向量都统一定义在某一坐标系下。被控对象与对接目标在任意时刻t的位置误差可以定义为
其中,δxdr/pr(t),δydr/pr(t),δzdr/pr(t)分别表示向量δpdr/pr(t)的三个分量。斥力干扰通常是以δpdr/pr(t)为自变量的函数,而距离越近(δpdr/pr(t)越小)排斥作用越强,最后导致对接的失败。径向误差δr是判断对接成功与否的重要指标,通常定义为y轴和z轴方向的位置误差分量的范数
一次成功的对接要求被控对象到达对接目标平面的终端时刻t时,两者的位置的径向误差δr尽量小,其数学描述如下:终端时刻t表示为被控对象在x方向第一次穿过对接目标平面(δxdr/pr=0)的时刻
t=mint{δxdr/pr(t)=0}(3)
终端时刻的径向误差δr(t)在规定的允许误差阈值rc内,就可以认为这次对接是成功的,其数学定义如下
δr(t)<rc(4)
上述公式(4)称为对接成功率判断准则,而rc为根据实际需求制定的常数,也被称为误差阈值。
在没有外界干扰的理想情况下,对接目标的位置最终将会稳定在一个平衡点(记为
其中,
|wdr|≤0.5rc(6)
在迭代学习过程中,需要表示不同迭代次数下的位置与误差信息。这里用右上标(k)表示某变量在第k次对接时刻的数值。例如:
本发明通过迭代学习控制的方法,使得径向对接误差δr(k)(t(k))随着迭代次数k的增加不断减小,最后实现在斥力干扰存在情况下的高成功率的对接控制。如图2所示为整个系统的控制框图,图中a表示被控对象,b表示内环控制器,c表示迭代学习控制。迭代学习控制器是以被控对象的轨迹ppr与对接目标的轨迹pdr为输入,经过历史数据的迭代学习生成合适的跟踪位置信号
为了进一步说明本发明的技术方案,本发明提出的一种基于终端迭代学习控制的抗干扰自主对接控制方法,包括下述步骤:
步骤1:内环控制器设计保证位置跟踪
姿态与位置控制的方法目前非常成熟,例如根轨迹、极点配置以及lqr等设计方法均可以实现。在完成内环控制器设计后,没有干扰的理想情况下,任意给定坐标系ft下的目标位置的三维向量
其中,
|wpr|≤0.5rc(9)
跟踪误差向量wpr的大小取决于飞机本身的机动性能与外界干扰的强弱。在恶劣天气情况下位置波动较大,或者被控对象本身机动性能较差导致跟踪精度很差,要实现精确的对接控制是不现实的。因此,式(9)作为被控对象本身性能与外界干扰的一个约束,是保证对接控制能够成功进行的基本条件。
步骤2:确定迭代对接过程的实施方案
应用迭代学习控制需要对整个迭代学习过程进行方案制定,确定何时开始对接,何时结束对接并返回何处进行下一次迭代。
典型的一次迭代学习过程可以描述如下。
(1)被控对象先运动到对接目标后方一定距离(在此距离下斥力干扰足够弱,一般取被控对象长度的2倍以上)的某一初始位置,并观察对接目标和自身的位置波动情况。如果天气等外界状况良好,被控对象的随机位置偏差满足约束式(6)和式(9),则认为有成功对接的条件。
(2)停留一段时间(大于10s),利用这段时间对接目标的轨迹数据取均值,求得被控对象的平衡位置
(3)被控对象在内环控制器作用下慢慢靠近目标位置
(4)记录本次对接的终端时刻的被控对象位置
步骤3:迭代学习控制器算法实现
迭代学习算法与被控对象位置
其中
而
两式中涉及两个常数向量定义如下
其中,
本发明的优点及有益效果在于:仅需要终端时刻的位置信息,易于测量与获取;每次对接控制都瞄准固定点,安全性高;迭代学习控制器作为附加模块,位于控制系统外层,对原有控制系统更改少,便于实现。
附图说明
图1是以空中对接为例的对接系统示意图。
图2是对接控制系统结构图。
图3是迭代学习过程展示图。
图4是本发明实施步骤图。
图中符号说明如下:
图1:标号1表示被控对象锥管,2表示受油机,3表示对接目标锥套,4表示加油机,ppr表示被控对象的轨迹,pdr表示对接目标的轨迹,ft表示加油机坐标系otxtytzt,其中轴xt,yt,zt的方向分别是向前、向右和竖直向下。
图2:a表示被控对象,b表示内环控制器,c表示迭代学习控制,ppr表示被控对象的轨迹,pdr表示对接目标的轨迹,
图3:虚线表示锥套位置,实线表示锥管位置。图片从上向下分布表示锥管与锥套x,y,z方向的轨迹分量,从左向右分布表示第1次到第4次对接尝试的轨线数据。竖直方向坐标单位为m,横向坐标单位为s。
具体实施方式
请参见图1-4所示,本发明提供了一种基于终端迭代学习控制的抗干扰自主对接控制。这里以空中加油仿真系统为例进行实施展示。该方法具体包含以下步骤:
步骤1:被控对象的内环状态反馈控制器设计。
姿态与位置控制的方法目前非常成熟,例如根轨迹、极点配置以及lqr等设计方法均可以实现,这里我们用lqr的方法进行飞机自身的内环控制器设计。完成内环控制器设计后,飞机能够稳定的跟踪给定的目标位置的三维向量
步骤2:确定迭代对接过程的实施方案。
对接过程规定如下:
(1)以锥套正后方6米为初始位置,受油机锥管在锥套后方观察锥套与自身位置波动,随机扰动设置为|wdr|≤0.2rc,|wpr|≤0.2rc满足式(6)和式(9)的对接条件。
(2)等待20s,记录锥套的轨迹数据并得到锥套的平衡位置
(3)锥管以0.5m/s的匀速沿x方向靠近预测的锥套目标位置
(4)记录终端时刻锥管与锥套的位置,并计算下一次瞄准位置
以第一次对接尝试(k=1)为例,在仿真中第(2)步测量得到锥套的平衡位置为
步骤3:迭代学习控制器算法实现。
迭代学习控制算法形式见式(10)至式(12),其中迭代学习控制器的参数选取如下
仿真结果分析。
如图3所示为仿真实验中前四次对接尝试的曲线图,可以看到第一次对接,对接误差达到0.5m对接失败,通过学习第二次对接误差大大减小到0.23m仍然未能进入设定的阀值,然后第三次开始对接误差能够较好的保持在设定区域内,认为对接成功。可见该算法是稳定的,且经过两次对接尝试即可实现成功对接,具有较高的收敛速度,因此本发明是可行的。