本发明涉及一种网络化运动控制系统轮廓跟踪控制方法,尤其是一种基于eso的网络化运动控制系统迭代学习高精度轮廓跟踪控制方法,属于网络化运动控制领域。
背景技术:
在数控机床、工业机械手应用中,高精度轮廓控制是运动控制系统重要的性能指标,一直是运动控制中研究的热点问题。交叉耦合控制(cross-coupledcontrol,ccc)为轮廓跟踪控制中十分有效的方法之一,在单轴跟踪控制基础上考虑其运动的相互影响,将开环的轮廓控制系统变为闭环轮廓控制,从而直接对轮廓误差进行补偿,有效的提高了多轴系统的轮廓跟踪控制精度。高精度的单轴跟踪控制是保证轮廓精度的基础,在工业实际生产应用中,大量运动控制系统或设备是有限时间区间内的周期性重复任务,比如裁割、雕刻、打磨等。迭代学习控制(iterativelearningcontrol,ilc)是一种针对重复作业可实现完全跟踪的控制技术。且ilc不基于系统模型,方便在实际生产中应用推广,所以ilc非常适用于具有周期性任务的高精度单轴跟踪控制场合,能在有限时间内完美的跟踪期望轨迹。ilc是一种基于先前经验的前馈学习控制,能对系统中的周期性干扰实现有效的抑制,但是对非周期性干扰却无能为力,标准的ilc中,并没有合理利用干扰的信息,从而限制了ilc在非周期性干扰情形下的性能,对系统干扰进行估计,将其有效信息在ilc中合理利用成为解决问题的有效手段。
随着网络技术的发展和智能制造业的兴起,网络化运动控制(nmcs,networkedmotioncontrolsystem)已经广泛的应用于数控机床、工业机械手等领域,网络化运动控制取代传统控制方式成为新的发展趋势。将网络引入到运动控制系统中,关键问题在于网络诱导时延的影响,时变网络诱导时延使得控制输入不能实时的传输到控制器中,从而导致控制系统性能得不到有效保障。另一方面,网络时变时延是系统重复运行过程中引起非周期性干扰的主要因素,会导致ilc的跟踪性能变差,无法实现高精度的跟踪控制。如何消除网络时延的影响成为nmcs中亟需解决的首要问题,其中时变短时延的影响为主要问题。目前,常用的时延补偿方法有:切换系统方法、鲁棒控制方法、史密斯预估器方法、模型预测控制方法等,以上方法都要求获得系统部分或者全部精确模型信息,在实际工业应用中往往较为困难。近年,有学者提出了不基于时延模型的通信干扰观测器方法,将网络诱导时延建模为干扰进行有效观测和补偿,但该研究主要针对固定时延场景。
技术实现要素:
为了实现高精度轮廓跟踪控制,克服网络化运动控制系统时变时延带来的不确定性,消除非周期干扰对单轴迭代学习控制跟踪性能的影响,本发明提出了一种基于扩张状态观测器(extendedstateobserver,eso)的开闭环迭代学习控制方法,将时变时延引起的不确定处理为系统总和扰动的一部分,利用eso对系统总和扰动进行观测估计,在前馈通道中进行有效补偿,进而设计具有补偿功能的开闭环迭代学习控制器,在有效提高迭代收敛速度的同时,实现单轴高精度轨迹跟踪控制,并结合pd-ccc控制器进一步提高轮廓误差控制精度,实现网络化运动控制系统的高精度轮廓跟踪控制。
本发明解决其技术问题所采用的技术方案如下:
一种基于eso的网络化运动控制系统迭代学习高精度轮廓跟踪控制方法,所述方法包括以下步骤:
1)考虑网络化运动控制系统二阶模型,描述为如下形式
其中,x1(t)、x2(t)为系统的状态量,u(t)为系统控制量输入,y(t)为系统输出,d(t)为系统总和扰动,a1、a2为系统参数;考虑系统的传感器采用时间驱动模式,采样周期为h,控制器和执行器均采用事件驱动模式;控制系统时变网络时延τk均小于一个采样周期,即0≤τk≤h;则在任一采样周期,至多有两个控制输入作用在执行器上,控制量u(t)表示如下:
其中,tk表示第k个采样时刻,且tk+1=tk+h;则含有时变短时延τk的离散化运动控制系统模型描述为:
将网络时变时延引起的不确定性当作系统总和扰动的一部分,并将其扩张成新
的状态变量x3(t),即
2)针对单轴跟踪控制,采用反馈辅助型开闭环迭代学习控制策略,并结合eso消除非周期性干扰的影响,实现高精度网络化单轴跟踪控制;
3)在单轴跟踪控制的基础上,针对轮廓误差控制,设计pd型交叉耦合控制器,采用ilc+eso+ccc策略,实现高精度网络化轮廓跟踪控制。
进一步,所述步骤1)中,网络化运动控制系统在有限时间区间[0t]上重复运行,针对每个迭代周期设计的eso如下:
其中,下标j表示系统重复运行的次数,即系统迭代次数;z1j(k)、z2j(k)、z3j(k)为对状态量x1j(k)、x2j(k)、x3j(k)的估计;ezj(k)为观测误差;w0为状态观测器的增益。
所述步骤2)中,为了避免闭环导数信号无法准确获取的问题,提出一种新形式的反馈辅助型开闭环学习律,具体形式如下。
式中j为系统迭代运行次数,uj(k)为j次迭代周期采样时刻k的控制量,ej(k)、
所述步骤2)中,其中对干扰估计补偿控制输入在时域中需要不断更新,属于迭代学习控制中的反馈控制输入环节,对其不进行迭代域的存储,则开闭环迭代控制形式描述如下:
其中
所述步骤3)中,在采用ilc+eso实现高精度单轴跟踪控制的基础上,引入pd-ccc策略,将轮廓误差控制量补偿到单轴,最终发送给单轴执行器的控制量
其中,上标i表示运动轴x/y。
所述步骤3)中,交叉耦合误差计算如下:
ε=-cx·ex+cy·ey(11)
式中,ε为系统轮廓误差,cx、cy为交叉耦合控制器增益,ex、ey分别为x轴、y轴跟踪误差。
本发明的有益效果为:(1)将网络化时变时延处理为系统总和扰动的一部分,利用eso对其估计,并在前馈通道中进行补偿,有效消除迭代学习控制中非周期不确定干扰的影响,保证了单轴跟踪控制的稳定性和高精度性能;(2)采用反馈辅助型开闭环迭代学习控制策略,能有效提高收敛速度,且闭环反馈也能对不确定干扰起到有效抑制作用;(3)所采用方法均可不基于系统模型,可在系统模型完全未知的情况下进行参数调整,实现控制器有效运行,方便了此方法在实际应用中的推广。
附图说明
图1为网络化运动控制系统结构图;
图2为具有时变短时延网络化运动控制系统控制量时序图;
图3为基于ilc+eso的单轴跟踪器框架图;
图4为基于ilc+eso+ccc的轮廓跟踪控制器框架图;
图5为网络化运动控制系统时变时延时序图;
图6为单轴跟踪误差控制对比图;
图7为轮廓误差控制效果对比图;
图8为累计轮廓误差对比图。
具体实施方式
下面结合附图对本发明的实施方式作进一步描述。
参照图1~图8,一种基于eso的网络化运动控制系统迭代学习高精度轮廓跟踪控制方法,所述方法包括以下步骤:
1))考虑网络化运动控制系统二阶模型,描述为如下形式
其中x1(t)、x2(t)为系统的状态量,u(t)为系统控制量输入,y(t)为系统输出,d(t)为系统总和扰动,a1、a2为系统参数。考虑系统的传感器采用时间驱动模式,采样周期为h,控制器和执行器均采用事件驱动模式;控制系统时变网络时延τk均小于一个采样周期,即0≤τk≤h。将系统进行采样离散化,将系统总和扰动扩张新的状态变量,建立扩张的三阶离散系统模型,利用状态扩张观测器(eso)对系统干扰进行估计。
由图1可知,系统对象基于以太网通信,系统时延主要由控制中心算法计算及程序处理时延τcc、控制中心下发控制指令至执行器的网络时延τca、执行器反馈实时信息至控制中心的网络时延τsc三部分组成。则网络化运动控制系统控制回路总时延为:
τk=τcc+τca+τsc(2)
由于考虑的是短时延现象,则在任一采样周期,至多有两个控制输入作用在执行器上,故控制量u(t)如图2所示,可表示如下
其中tk表示第k个采样时刻,且tk+1=tk+h。则含有时变短时延τk的离散化运动控制系统模型为
进一步,对上式指数函数进行泰勒级数展开,并忽略高阶项,则上式可转化如下
将上式中由时变时延引起的随机实时作用量以及系统外部干扰扩张成新的状态变量x3(t),即
更进一步,采用扩张状态观测器(eso)对系统总和扰动进行估计,针对系统设计eso如下
其中下标j表示系统在有限时间区间[0t]上重复运行的次数,即系统迭代次数;z1j(k)、z2j(k)、z3j(k)为在对状态量x1j(k)、x2j(k)、x3j(k)的估计;ezj(k)为观测误差;w0为状态观测器的增益。
2)采用反馈辅助型开闭环ilc策略,结合eso实现高精度网络化单轴跟踪控制。
本方法为了避免闭环导数信号无法准确获取的问题,提出一种新形式的反馈辅助型开闭环学习律,具体形式如下。
式中j为系统迭代运行次数,uj(k)为j次迭代周期采样时刻k的控制量,ej(k)、
本方法利用扩张状态观测器对非周期性不确定干扰进行估计得到z3j(k),进而对系统总和扰动进行补偿。其中干扰补偿控制输入在时域中需要不断更新,属于反馈控制输入环节,但对其不进行迭代域的存储,则本发明开闭环迭代控制形式可描述如下。
其中
进一步,本方法设计基于eso的ilc单轴跟踪控制器结构图如图3所示。
3)采用ilc+eso+ccc策略,实现高精度网络化轮廓跟踪控制。
本方法在单轴ilc+eso策略的基础上,采用pd-ccc策略进一步提高轮廓跟踪精度,所设计轮廓跟踪控制器如图4所示,图4中
进一步,将交叉耦合控制器的轮廓误差控制量补偿到单轴之后,最终发送给单轴执行器的控制量
其中上标i表示运动轴x/y。
交叉耦合误差计算如下:
ε=-cx·ex+cy·ey(11)
式中,ε为系统轮廓误差,cx、cy为交叉耦合控制器增益,ex、ey分别为x轴、y轴跟踪误差
为验证所提出方法的有效性及优越性,对本发明进行如下实验。
设定系统期望轨迹及初始状态如下:
xd=10*cos2πt+150;
yd=10*sin2πt+150.0≤t≤t
则两轴轮廓轨迹是半径为r=10,圆心为(150,150)的圆,令系统运行周期t=8s,采样周期h=5ms。eso增益参数给定为w0=100,补偿因子为b0=20。给定开闭环迭代学习律参数