本发明涉及多智能体协同控制领域,其具体涉及网络攻击与复合故障下的多智能体稳定控制问题。
背景技术:
1、近年来,多智能体协同控制已取得显著的进步,多智能体编队模型可以扩展至多种领域,如多无人机、多小车模型等,其在一些高危工作或军事应用中发挥着巨大的作用,如巡航侦察、军事救援等。dos攻击又称拒绝服务攻击,其可能作用于多个智能体之间的通信网络以及单个智能体中的信息传播,可能会导致多智能体系统性能下降甚至丧失稳定性。因此,如何在不确定攻击强度、作用目标的情况下极大程度降低网络攻击的影响是具有实际意义的。专利cn110297497a发明了一种网络攻击下基于混合触发机制的多智能体系统一致性的控制方法,主要贡献为提出了一种网络攻击下的时间与事件混合触发机制的算法,但针对系统存在的执行器故障的问题尚未解决。专利cn116027809a发明了一种dos攻击下的多四旋翼无人机编队控制方法,研究了无人机编队在dos攻击下的协同控制,建立了无人机奇异摄动模型,但是只考虑了网络攻击作用在无人机之间的通信网络上的情形,没有考虑到单架无人机内部通信回路也受到网络攻击的场景。
2、目前,由于执行器故障等对系统的控制性能影响较大,目前国内外学者的研究也证实了故障观测器能够有效补偿此类影响,神经网络逼近器用于近似补偿执行器故障也具有较好的效果,同时设计鲁棒控制器可保证闭环系统全局范围内的稳定性、鲁棒性。此外,该方法在基于网络攻击下的多智能体控制中未见有详细报道。
技术实现思路
1、鉴于上述现有技术中的不足,本发明提出基于故障观测器和rbf神经网络的多智能体容错鲁棒控制控制方法,通过以下步骤组成:
2、步骤1、建立虚拟领导者状态方程模型,如下所示:
3、
4、y0(t)=c0x0(t)
5、其中,x0表示虚拟领导者的状态,y0表示虚拟领导者的输出,a0与c0为已知常数矩阵。
6、第i架跟随者智能体的状态方程如下:
7、
8、yi(t)=cixi(t)
9、其中,i=1,2,...,n表示第i架智能体,xi、ui和yi分别表示该架智能体的状态量、控制量和输出量,ai,bi,ci为已知常数矩阵。
10、步骤2、以传统的时滞模型来模拟dos网络攻击,设攻击强度为d∈p1∈{0,1,...,l},其中l表示最大攻击强度,受到dos攻击影响下的各状态如下所示:
11、
12、
13、
14、其中表示控制器的状态量,表示网络攻击下的智能体的输出量和控制器的状态量,∑ij表示协同控制下第i架与第j架智能体的协同误差,表示受到网络攻击影响下的协同误差值,aij是邻接矩阵中的元素,gi表示第i架智能体是否和虚拟领导者有信息交流,若有,则gi=1,反之,则gi=0。
15、系统的控制器设计如下所示:
16、
17、
18、其中,ki,l、hl是与最大攻击强度l有关的待设计矩阵增益,υi、λi是待设计矩阵,能够通过求解以下线性矩阵不等式得出:
19、
20、令:
21、ei(t)=yi(t)-y0(t)
22、
23、
24、
25、
26、
27、xc(t)=[εt(t),θt(t)]t
28、得到网络攻击下闭环系统如下:
29、
30、e(t)=ccxc(t)
31、其中:
32、
33、
34、
35、其中,l是系统的拉普拉斯矩阵,g=diag{g1,...,gn}。保证该闭环系统的稳定性即可以保证t→∞时θ,ε趋近于0,因此需要通过设计合适的矩阵增益ki,l、hl保证该闭环系统的稳定性。
36、将上述的闭环系统分解如下:
37、
38、
39、其中
40、将受到网络攻击影响下的所有可能的误差信号用一个新的变量表示为与若能保证变量与趋于零则能够证明对于最大的网络攻击强度l,都可以保证跟踪系统稳定;
41、设计矩阵增益ki,l,hl满足:
42、
43、
44、其中pi,l,ql为对称正定矩阵,0<αl<1。
45、满足以上条件即可保证控制器使跟踪系统趋于稳定。
46、特别地,假设第k架智能体受到复合故障的影响,其状态方程如下:
47、
48、其中p∈rm×1定义为系统的乘性故障因子,f(t)定义为系统的加性故障,ek∈rm×1表示加性故障系数。
49、步骤3、设计自适应故障观测器:
50、
51、其中是系统状态与输出的估计值,是故障估计值,l是待设计增益矩阵,存在正定矩阵p∈rn×n、f∈rr×p使:
52、
53、etp=fc
54、令故障估计算法为:
55、
56、其中γ是正定对称矩阵,表示自适应学习律。
57、通过rbf神经网络估计故障值,其算法为:
58、f=w*th(x)+ε
59、其中w*为理想权值,h(x)为径向基函数,ε为估计误差,其中ε有界,记为ε的估计值,则故障的估计值为:
60、
61、步骤4、验证系统的稳定性。令李雅普诺夫函数为:
62、v(t)=v1(t)+v2(t)+v3(t)
63、其中
64、将李雅普诺夫函数求导等效变换可以得出:
65、
66、
67、
68、由步骤2中矩阵增益ki,l,hl满足的条件,将变为:
69、
70、由etp=fc,变为:
71、
72、定义变为:
73、
74、最终证明在选取合适矩阵增益ki,l,hl,观测器增益l以及权重系数w的条件下系统闭环稳定。
1.一种基于h∞控制和故障观测器的dos网络攻击下多智能体的容错协同控制方法,由以下步骤组成:
2.根据权利要求1所述的一种基于h∞控制和故障观测器的dos网络攻击下多智能体的容错协同控制方法,其特征在于,步骤1中的领导者和跟随者的状态方程模型为:
3.根据权利要求1所述的一种基于h∞控制和故障观测器的dos网络攻击下多智能体的容错协同控制方法,其特征在于,步骤4中需要验证系统闭环稳定性,令: