一种针对全状态受限严格反馈系统的保性能控制方法与流程

文档序号:15556340发布日期:2018-09-29 01:12阅读:419来源:国知局

本发明涉及非线性跟踪控制方法,尤其涉及一种针对全状态受限严格反馈系统的保性能控制方法。



背景技术:

大多数跟踪控制设计只能解决涉及强非线性和显著不确定性系统的跟踪稳定性。然而,在许多工程控制应用中,通常希望或要求相应的控制方案能够保持某些性能指标,而不仅仅是闭环稳定。此外,这些指标需要满足某些安全约束,使潜在的控制问题更有意义,也更具有挑战性。

过去的几十年见证了在处理系统输出或状态的约束方面作出的巨大努力。早期确保满足约束的方法包括模型预测控制、参考调节和非超调控。最近,由于障碍lyapunov函数(blf)能够建立避免或安全能力,因此用它来处理系统输出/状态约束。随后,利用对称障碍lyapunov函数(sblf)研究了具有常数和时变输出约束以及部分和全部状态约束的非线性系统自适应控制方法,然而所涉及到的约束都是对称的。为了处理不对称约束,我们进一步研究了构造非对称障碍lyapunov函数(ablf)的方法,它能够放宽初始条件的限制。然而,非对称障碍李雅普诺夫函数需要分段处理,这使得设计和分析变得相当复杂。

在系统响应的瞬态和稳态特性方面,明确地给定系统性能指标是非线性控制系统中另一个有趣而又具有挑战性的研究课题。传统控制器擅长迫使跟踪误差收敛到一个不确定的残差集中,其大小一般只由一些设计参数实现定性的调控,因此当需要明确给定系统的性能指标时,就无能为力了。现有方法中,漏斗控制能够将跟踪误差限制在一个可调的漏斗内,从而确保跟踪误差在预定的有限时间内收敛到规定的期望范围内。然而,由于漏斗边界总是对称的,它无法很好地实现对超调大小的限制。另一种保性能控制方法是规定性能控制(ppc)方法,它将保性能函数将原系统相结合,产生一个新的系统并设计相应的控制器确保其稳定,从而保证原系统性能能够达到规定的水平。值得注意的是,ppc收敛速度取决于一个单一指数衰减函数,且没有考虑在预定的有限时间内达到给定控制精度的问题。对于许多实际工程系统,例如导弹防御系统,从任务完成或者操作安全性以及产品质量等角度而言,要求系统能够在给定有限时间内达到预定的跟踪精度更具有实际意义。

现有的研究(包括上面提到的那些)暂时都还没有很好地实现将系统状态受约束与保性能跟踪有机结合。



技术实现要素:

针对现有技术之不足,本发明的目的是提供了一种针对全状态受限严格反馈系统的保性能控制方法,本方法在未违背全状态约束的前提下,确保跟踪误差在预设有限时间内收敛到预定的精度区域,并最终收敛到一个更小且可调整的残差集内,且超调量小于预先设定值。

为实现上述目的,本发明如下技术方案:一种针对全状态受限严格反馈系统的保性能控制方法,其特征在于,包括如下步骤:

s1:预处理,根据用户提供的性能要求选定相应的性能参数,并进一步确定塑形函数β(·)以及非对称尺度函数

s2:使用神经网络对系统未知的平滑非线性进行近似并采用自适应方法对神经网络位置权值进行估计;

s3:基于步骤s1和s2,采用反步法或反演法对系统进行控制器设计。

作为改进,所述步骤s1中给定性能参数如下:

其中,|e(t)|表示给定性能指标的跟踪误差

t表示规定时间,

ε表示在规定时间t内达到的误差精度,1>ε>0,

θ表稳态误差精度,θ>0,

分别表示超调上下限,是设计参数,δ>0。

作为改进,,所述步骤s1中确定塑形函数的步骤如下:

s1a:选取速率函数κ(t),通过matlab运行可行性条件可确定参数ζi以及η,并根据关系式(1-2)计算参数的值;

其中,η>1,η=ζ1,1>ε>0为设计参数;

s1b:确定塑形函数β(t)如关系式(1-3):

作为改进,所述步骤s1中确定的非对称尺度函数如关系式(1-4):

其中,对所有x≥0,ι>0,q≥max{3,n}和γ=γ1,对所有x<0,γ=γ2且γ1>1,γ2>1。

作为改进,所述步骤s1中参数的确定如下:

根据控制系统阶数n确定参数q,q为奇整数,且满足q≥max{n,3},再根据误差初值e(0)以及超调上限值δ和超调下限值确定参数γ0,ι,γ1和γ2的值,具体如下:

1)γ0=min{γ1,γ2}>η;

2)如果e(0)=0,则γ1=γ2;

3)如果e(0)>0,γ2>γ1,则

4)如果e(0)<0,γ1>γ2,则

作为改进,在所述步骤s1后,设置如下系统误差变换步骤:

所述系统误差变换关系式如(1-5):

z1(t)=β(t)s1(t)(1-5)。

作为改进,所述步骤s2中使用神经网络对系统未知的平滑非线性进行近似并采用自适应方法对神经网络位置权值进行估计的方法如下:

其中,为系统非线性的神经网络近似,为神经网络理想权值向量的估计向量:

为相应的神经元函数向量,神经元函数选为单层的高斯基函数如关系式(2-1),

其中πi为高斯函数的中心向量,可根据ζi的值选取;ψ>0为高斯函数的相应宽度。

作为改进,所述步骤s3的控制器设计如下:中间控制输入αi和实际控制u分别为:

u=αn(3-4);

其中,l1可通过计算得到;

其中是大于零的常数,由用户任意给定;

yd为用户提供的跟踪曲线,其本身及其n阶导数已知且有界;

其中x2为系统的已知状态;

其中ki是设计参数且ki>0,i=1,2,...n,z1(t)=β(t)s1(t)以及zi=xi-αi-1,i=2,...n;

其中ι和q都由公式(1-4)给定;

其中,

其中ζi通过matlab运行可行性条件确定;

其中和β(j)可分别根据已知的yd和β计算得到;

ωi和δαi-1是可计算变量,αi满足n-i阶延续可导,从而确保控制信号u和其他闭环信号都是连续的。

作为改进,所述分别采用如下关系式对应的更新;

其中是系统设计参数;

为神经元向量。

本发明具有以下有益效果:

1、本发明方法采用自适应神经网络方法能够针对一类单输入单输出的不确定严格反馈系统实现全状态受限下的保性能跟踪控制。与现有的要么只处理全状态约束而不可以预先控制性能指标,要么在无约束条件下研究对系统瞬态和稳态性能的约束,本发明方法针对单输入单输出严格反馈非线性系统明确地解决了全状态约束下的保性能跟踪问题。

2、该方法不仅能够实现对系统所有状态的约束,还可以使跟踪误差在给定时间内收敛到预定的区域,并最终收敛到一个更小的可预设的残差集以内,同时保证超调量的大小在规定的范围内。尽管相关技术已经能够确保该类系统的全状态/输出约束,但是跟踪性能一些设计参数以及近似误差的大小支配。而在现有技术中,尽管存在相关技术可以实现对系统的全状态或者输出约束,但是大多数方法只能够通过调整控制器参数对控制性能进行定性地支配,即不能够提供一套控制器参数与系统性能的量化关系。

附图说明

图1是不同步骤下的跟踪误差曲线。

图2是第一步(z1,z2)的相位图。

图3是跟踪过程:点划线-理想曲线;点线-所提出的方法下的状态x1的轨迹;实线-liu’s方法下的跟踪过程;虚线-x1的界限。

图4为状态x2的轨迹:实线-本文方法;点划线-liu’s方法;虚线-x2的界限。

图5神经网络理想权值估计的模,中的四条曲线分别为更新图。

图6为控制输入虚线,即输入信号u(t)的曲线:实线-本方法的控制输入;点划线-当λ1=5,λ2=6,liu’s方法下的控制输入;虚线-当λ1=12,λ2=20,liu’s方法下的控制输入

图7为跟踪误差比较曲线:实线-本方法的误差曲线;点划线-当λ1=5,λ2=6,liu’s方法下的误差曲线;虚线-当λ1=12,λ2=20,liu’s方法下的误差曲线

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。

一种针对全状态受限严格反馈系统的保性能控制方法,包括如下步骤:

s1:预处,根据用户提供的性能要求选定相应的性能参数,并进一步确定塑形函数β(·)以及非对称尺度函数

s2:使用神经网络对系统未知的平滑非线性进行近似并采用自适应方法对神经网络位置权值进行估计;

s3:基于步骤s1和s2,采用反步法或反演法对系统进行控制器设计。

具体地,所述步骤s1中给定性能参数如下:

其中,|e(t)|表示给定性能指标的跟踪误差

t表示规定时间,

ε表示在规定时间t内达到的误差精度,1>ε>0,

θ表稳态误差精度,θ>0,

分别表示超调上下限,是设计参数,δ>0。

t0≥0代表初始时间,并且,如果e(t0)≠0,否则其中sgn(·)表示符号函数。式子(1-1)-(a)和(1-1)-(b)意味着e(t)在预定有限时间t>t0内收敛到一个预设的精度范围(-ε,ε),并进一步缩小到一个更小的残差集(-θ,θ);式子(1-1)-(c)意味着,对于任意t≥t0,当e(t0)≥0时,e(t)保持在约束范围内;当e(t0)<0时,e(t)保持在约束范围内。即,系统响应所对应的超调应小于δδ≥ε>θ>0的ε,t,θ,δ由用户自由设定,因此可以预先定义包括给定时间内的超调、跟踪精度和残差方面的跟踪性能指标。

具体地,所述步骤s1中确定塑形函数的步骤如下:

s1a:选取速率函数κ(t),通过matlab运行可行性条件可确定参数ζi以及η,并根据关系式(1-2)计算参数的值;κ(t)参考现有文献;

其中,η>1,η=ζ1,1>ε>0为设计参数;

s1b:确定塑形函数β(t)如关系式(1-3):

虽然速率函数有很多,但是本发明在选择时,考虑到速率函数κ(t)∈r需具有以下性质:

①对于所有t>t0,κ(t)>1,并且κ(t0)=1;

②κ(t)是其中对所有t≥t0,

对于任何t≥t0和i∈z+,κ(i)(t)κ-1(t)有界。

β(t)之所以被称为塑形函数,是因为在稳定状态误差方面给定了行为指标,特别是通过设计参数ε来确定有限时间t内的跟踪精度;即跟踪误差在有限时间t内收敛到区域(-ε,ε),进一步收敛到更小的残差范围其中q≥3是奇整数。

具体地,所述步骤s1中确定的非对称尺度函数如关系式(1-4):

其中,对所有x≥0,ι>0,q≥max{3,n}和γ=γ1,对所有x<0,γ=γ2且γ1>1,γ2>1。

具体地,所述步骤s1中参数的确定如下:

根据控制系统阶数n确定参数q,q为奇整数,且满足q≥max{n,3},再根据误差初值e(0)以及超调上限值δ和超调下限值确定参数γ0,ι,γ1和γ2的值,具体如下:

1)γ0=min{γ1,γ2}>η;

2)如果e(0)=0,则γ1=γ2;

3)如果e(0)>0,γ2>γ1,则

4)如果e(0)<0,γ1>γ2,则

作为改进,在所述步骤s1后,设置如下系统误差变换步骤,所述系统误差变换关系式如(1-5):

z1(t)=β(t)s1(t)(1-5)。

系统误差变换关系的设计可以让最后设计出的控制器更简洁。在保证状态约束的同时,在有限时间内满足超调、稳态误差和跟踪精度等性能指标是非常重要的。这里,通过对塑形函数β(t)和尺度函数进行两个连续的误差变换,发明人研发了一种统一控制方法来实现预先给定的性能指标,来满足任何一定范围内存在的变换误差。

e(t)表示跟踪误差。可以证明对于所有的t≥t0,z1(t)满足|z1|<η,其中η是一个正常数,那么就确保了规定的性能指标,在此阶段,通过关系式(1-5)进行误差变换,对于所有t≥t0,条件|z1|<η足以保证性能指标。

s2:使用神经网络对系统未知的平滑非线性进行近似并采用自适应方法对神经网络位置权值进行估计。

具体方法如下:

其中,为系统非线性的神经网络近似,为神经网络理想权值向量的估计向量:

为相应的神经元函数向量,神经元函数选为单层的高斯基函数如关系式(2-1),

其中πi为高斯函数的中心向量,可根据ζi的值选取;ψ>0为高斯函数的相应宽度。

s3:控制器设计,具体如下:

中间控制输入αi和实际控制u分别为:

u=αn(3-4);

其中l1可通过计算得到;

其中是大于零的常数,由用户任意给定;

yd为用户提供的跟踪曲线,其本身及其n阶导数已知且有界;

其中x2为系统的已知状态;

其中ki是设计参数且ki>0,i=1,2,...n,z1(t)=β(t)s1(t)以及zi=xi-αi-1,i=2,...n;

其中ι和q都由公式(1-4)给定;

其中,

其中ζi可参考现有文献,通过matlab运行可行性条件确定;

其中和β(j)可分别根据已知的yd和β计算得到;

ωi和δαi-1是可计算变量,αi满足n-i阶延续可导,从而确保控制信号u和其他闭环信号都是连续的。

本发明提供了一种保性能控制方法,能够在全状态约束下,迫使跟踪误差在预设有限时间内收敛到指定区域,并进一步将误差减小到一个较小的可调整残差集,同时将超调限制在预定的小范围内。基于由行为整形函数和非对称尺度函数命名的两类辅助函数控制的连续变换误差,分别在变换误差一定有界的条件下,提出了一种实现给定性能指标的新方法,并且此条件连同全状态约束,可以通过嵌入障碍lyapunov函数来保证。此外,用一个对称障碍lyapunov函数来保持非对称输出约束,简化了稳定性分析过程。所有内部信号包括神经网络单元的刺激输入都被确保为有界的。同时,理论分析和数值仿真都验证了设计的有效性和优越性。

本方法至少具有以下独特的特征:

1)本发明不像现有技术一样直接将跟踪误差嵌入到blf中,而是引入了两个变换误差,第一个是由不对称尺度函数控制的,第二个是行为整形函数,这不仅保证了性能规格,而且还允许使用单个对称障碍lyapunov函数来处理不对称约束,避免利用多个分段障碍lyapunov函数,从而简化了现有工作中稳定性分析过程。

2)保证了跟踪行为指标,包括有限时间内的跟踪精度、稳态误差和超调量,使跟踪误差不仅收敛于预定的有限时间t内的集合(-ε,ε),而且进一步限制在一个较小的残差集(-θ,θ),它可以通过自由设计参数和ε来调节。此外,在全状态约束下,行为整形函数β(·)很好地实现了期望性能指标,使性能指标与设计常数ki、σi和nn的未知估计误差大小无关。

3)在反推设计的每一步中采用障碍李雅普诺夫函数,不违反全状态约束,同时,它确保nn输入保持在适当的紧集内,从而使nn估计器安全有效地并入控制回路中。

仿真实验:

为了验证所提出的控制方案的有效性并进行公平比较,考虑以下二阶严格反馈系统:

满足控制目标是使y跟踪期望轨迹yd=0.5sin(5t),使跟踪误差达到以下性能指标:1)在1秒内达到|e(t)|<0.02的跟踪精度;2)稳态误差:3)超调量:-0.01<e(t)<0.02,t≥t0,而状态x1和x2分别限制在x1∈(-0.6,0.9)和x2∈(-2.5,2.5)范围内。根据给定性能指标,可以很容易从关系式(1-2)中得到ε=0.02,t-t0=1,θ=0.018,δ=0.01和

利用本发明设计的控制器以及的更新法则进行了数值模拟,其中k1=5,k2=6,γ1=10,γ2∈{10,2000},t0=0,x1(0)=0.5,x2(0)=1,q=3≥max{3,2},由于我们选择用单层高斯基函数神经网络分别逼近非线性函数f1(x1)、g1(x1)、节点数量分别为5,5,3,3,神经元函数的中心均匀地分布在区域[-1,1]×[-3.5,3.5]中,宽度则等于1。仿真结果如图1-图7所示。

仿真过程可分为三个步骤:

第一步:不考虑保证性能指标,通过参考文献[48,49]运行matlab程序确定ζ1和ζ2的值。仿真结果如图1和图2所示,其中β=1,γ1=γ2=10,ζ1=2,ζ2=2.5。从图2可以看出,z1和z2确实分别留在区域(-2,2)和(-2.5,2.5),而跟踪响应违反了(如图1虚线所示)规定的性能指标。我们设置ζ1=2和ζ2=2.5并进入下一步。

第二步:为了保证有限时间内的精度和稳态误差的性能指标,通过选择η=ζ1=2和κt=39,选择κ(t)为κ(t)=exp(1.2212t),从而构造了行为整形函数β,其中κ(t)是从式子(1-2)中计算的。响应结果如图1点划线所示,跟踪误差在1秒内收敛到界限(-0.02,0.02),并进一步减少到(-0.018,0.018)。然而超调远大于要求值0.01。通过固定β,我们进入最后一步。

第三步:通过增加γ2,可以保证系统的超调量满足规定性能。我们将γ2重置为2000。仿真结果如图1、3-5所示。从图1中的实线可以看出,所有规定的性能指标都得到了满足。x1和x2的轨迹分别如图3中的点线和图4中的实线所示,可以观察到系统的状态约束未被违反。图5呈现了的有界性。图6中的实线)表示输入信号u是连续且有界的。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不同限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1