网络攻击下基于混合触发机制的多智能体系统一致性的控制方法与流程

文档序号:18820165发布日期:2019-10-09 00:37阅读:625来源:国知局
网络攻击下基于混合触发机制的多智能体系统一致性的控制方法与流程

本发明属于多智能体协同一致控制技术领域,具体说的是网络攻击下基于混合触发机制的多智能体系统一致性的控制方法。



背景技术:

近十几年来,由于多智能体系统在无人机协同控制、编队控制等多方面的广泛应用而得到了广泛的研究。一致性问题是多智能体系统中的一个关键问题,一致性问题意味着多智能体系统中所有智能体的某些变量最终都必须收敛到同一状态。研究者对于一致性理论的各个方面进行了研究,包括有向/无向通信网络的多智能体一致性理论、固定/动态拓扑情况下的多智能体一致性理论、时滞系统的一致性理论、信息不确定以及异步通信情况下的多智能体一致性理论等问题,同时也在一阶、二阶和高阶一致性理论方面取得了一定的成果。为了实现一致性,通常设计一个控制器,根据本地交换的信息,控制器可以产生分布式控制动作,以保证所有智能体在某些物理量(例如位置或速度)上达成一致。值得注意的是,智能体之间的信息交换受时间延时的影响。网络通信信道有限,智能体不能对状态进行即时采样,智能体需要花费时间进行相关计算,这都会导致时延,因此所设计的控制器必须具有鲁棒性。此外,通信拓扑随时间变化的情况也经常发生,即由于临时通信丢失或智能体布局的改变而导致拓扑发生变化,即切换拓扑,从而导致协商一致协议的行为发生变化。

由于事件触发机制能够大大减少智能体之间的信息传输和智能体控制器调整的次数,因此其应用越来越广泛。然而,大多数事件触发机制总是以牺牲系统性能为代价,并且通常需要在通信数量和系统性能之间取得平衡。在多智能体系统中,优化数据传输方法仍然是一个挑战。在实际的控制系统中,通信带宽的利用率很低,在一定的时间内信息的传输量很少。针对这种系统,无论是事件触发机制还是时间触发机制都不能保证系统的最佳性能。如何解决这个问题,仍然是一个挑战。因此,本文提出了一种包括时间触发机制与事件触发机制的混合触发机制,目的就是缩短这一差距。

各国许多专家学者对多智能体的协同一致性控制进行了大量的研究,并且取得了丰硕的成果,但仍有不少影响控制系统的因素尚未考虑,主要表现在,近年来,网络的飞速发展使得控制领域网络与网络的连接更加紧密,虽然网络的引入增加了控制系统许多方面的工作效率,然而也带来了巨大的挑战,如数据包丢失、随机网络攻击、网络延时等,其中随机网络攻击是影响控制系统的一个最重要的因素。在实际的控制系统中,智能体之间的信息交互都是通过网络来实现的,因此就必须需要考虑网络安全问题,随机的网络攻击可以用非线性函数来表示。迄今为止,网络攻击下基于混合触发机制的多智能体系统一致性问题还没有文献报道。

针对网络攻击下基于混合触发机制的多智能体系统一致性问题,提出了网络攻击下多智能体系统实现一致性的控制方法。本文提出一种新的控制方法来研究网络攻击下基于混合触发机制的多智能体系统的一致性控制问题。采用随机伯努利变量描述混合触发机制以减轻网络负担。在混合触发机制下,考虑了时变延时、切换拓扑、随机网络攻击等因素的影响,建立了闭环控制系统的数学模型。基于lyapunov稳定性理论和lmi理论,给出了系统一致的主要结果定理。利用具有不确定转移率的马尔可夫跳变来描述拓扑的切换,三种拓扑之间切换的概率是不确定的。结果表明该方法具有很好的可靠性和鲁棒性。



技术实现要素:

本发明为了解决网络攻击下多智能体系统的一致性问题,提供了一种基于混合触发机制的多智能体系统一致性控制方法。该方法能够通过对系统中每个智能体的控制实现系统的一致性控制,还考虑了时变延时、切换拓扑、随机网络攻击等因素的影响,分析了系统在不确定因素下的一致性,因此该方法具有很好的通用性,灵活性、鲁棒性与可伸缩性。首先,为了减轻网络负担,引入了混合触发机制,为了更接近实际情况,还考虑了时变延迟、切换拓扑和随机网络攻击,其中随机网络攻击用伯努利变量来描述。其次,在通信拓扑中不存在生成树的情况下,定理1给出了系统一致的充分条件。结果表明该方法具有很好的可靠性和鲁棒性。

拉普拉斯矩阵l=[lij]为:

l=d-a(1)

其中

其中d为度矩阵,a为邻接矩阵,网络攻击下基于混合触发机制的多智能体系统的一致性控制,具体包括如下步骤:

步骤一:多智能体系统的运动模型建立

将多智能体系统中每个智能体看作为二维平面内运动的质点,其简化运动模型为:

其中xi∈rn表示第i个智能体的状态变量,智能体动态的阶数由n决定,ui∈rn是第i个智能体的控制输入。θt随时间的变化而变化,它表示多智能体系统在时间t的每个时刻所连接的智能体,τi(t)是影响第i个智能体的控制输入的时变延时。设τi(t)=τ+λi(t),其中τ是常数,λi(t)是随时间变化的扰动,满足因此在多智能体系统中对所有的智能体有成立。

步骤二:一致性控制器设计以及系统闭环方程建立

考虑如下一致性控制器:

其中k∈rn×n是常数矩阵增益,aij(θt)决定当前的拓扑状态,例如,如果节点i和j之间没有通信,则aij(θt)=0,ui(θt,t)表示智能体i的基于当前拓扑结构的控制输入。智能体状态的初始条件为:

在区间内,函数μi是任意的,对应于初始条件的集合。

连续时间马尔可夫链决定参数θt的动态特性,其中马尔可夫链具有由集合s给出的离散状态,其中s是多智能体系统中不同拓扑的数量。概率转换矩阵ψ=[ψpq]的表达式如下:

在此式中,ψpq表示在t时刻在区间δ>0内从拓扑p切换到拓扑q的概率,对所有的都有成立,(πpq+εpq)是不确定转移矩阵π的元素。

在式(7)中,πpq表示从状态p切换到状态q的概率的估计值,εpq表示估计值的误差,εpq未知,且有εpq∈[-δpq,δpq],其中0<δpq<πpq。很明显πpq和δpq均是正的,并且因此最后,将马尔可夫链的初始分布设为υ=(υ1,υ2,k,υs)。

将(3)和(4)写成紧凑形式如下:

当混合触发机制中使用时间触发时,数据采样将按以下方式传输:

其中tr是正整数,它满足是由网络引起的相应的网络延时,h是采样周期。令τ(t)=t-trh,因此式(10)可以重写为如下形式:

x1(t)=x(t-τ(t))(11)

式中,τ(t)∈[0,τm],τm,是延迟τ(t),的最大值。

当混合触发机制中选择事件触发机制时,给出如下事件触发条件:

其中ω>0,0≤σ<1,阈值误差er(t)的表达式为为了便于分析,我们把区间分成几个子区间,假设存在一个常数满足其中并且定义且有不等式成立。

经过事件触发机制的采样信号表达式如下:

x2(t)=x(t-d(t))+er(t)(13)

时间触发机制与事件触发机制之间切换的概率由随机伯努利变量α(t)来描述,则图1中的的表达式如下:

其中0≤α(t)≤1,并且α(t)具有如下性质:

是α(t)的期望,是α(t)的方差。

网络攻击由一个非线性函数f(x(t))来表示,则图1中的表达式如下:

在式(16)中,f(x(t-η(t)))表示网络攻击,其中η(t)∈[0,ηm]表示网络攻击的时间延时。0≤β(t)≤1也服从伯努利分布,它表示网络攻击发生的可能性。且有:

因此一致性控制器(4)可以写成如下形式:

因此可以得到混合触发闭环多智能体系统,即

在式(19)中,因此,一下给出一致性的定义:

定义1:当使用协商一致控制器(4)并引入混合触发机制,在随机网络攻击,不确定切换拓扑以及时变延时作用下,多智能体系统(3)可以实现均方一致性。即对任意的i≠j,在所有的初始条件和初始分布下,在均方意义下均成立。

步骤三:转换多智能体系统建立

通过引入不一致的新变量,采用树型转换法可将一致性问题转化为一个稳定性问题。

zi(t)=x1(t)-xi+1(t)(20)

fi(z(t))=f1(x(t))-fi+1(x(t))(22)

其中i=1,2,...,m-1,将式(20)、(21)、(22)写成紧凑形式如下:

并且还有

其中u=[1m-1-im-1],

并且wt=[0m-1-im-1]。

对(23)式进行求导并与(19),(26),(27),(28)式联立,最后应用性质u1m=0m-1,lk1m=0m和uw=im-1,最后可得如下的分歧系统:

式中因此,通过分析系统(29)的稳定性就能够完成对系统(19)的一致性分析,则定义1可重新写成如下形式:

定义2:当使用协商一致控制器(4)并引入混合触发机制时,如果系统(29)在均方意义下渐进稳定,即在任意初始条件与初始分布下,在均方意义下成立,则多智能体系统(3)就可以在随机网络攻击,不确定切换拓扑以及时变延时的作用下达到均方一致性。注意:为了便于计算,θt用来表示。

步骤四:闭环多智能体系统的一致性实现

以下定理给出了混合触发机制下多智能体系统在时变延迟控制输入、不确定切换拓扑以及随机网络攻击下实现一致性的充分条件:

定理1:给定正常数τm,dm,ηm和事件触发参数σ,其中τm,dm,ηm是时延的上限。讨论闭环多智能体系统(19),其中τ>0,并且π的定义如式(7)所示,在式(7)中,εpq∈[-δpq,δpq],且对任意的均有δpq>0,当k=1,2,...,m时,时变时延则如果对任意的都存在n(m-1)×n(m-1)维的矩阵和s=st>0使得下列不等式成立,闭环多智能体系统(19)就在均方意义下实现一致性。

在式(31)中,

证明:选取下列lyapunov-krasovskii随机泛函

其中zt和状态向量z(ρ)的值相对应,并且有

其中,假设式(34)中每一个矩阵变量均是正定的,因此就是正定的,对(34)式至(40)式进行求导、取期望,并进行放缩、应用事件触发条件,最后得到:

其中ξ的定义在定理1中,并且有:

对任意的γ≠0,为了保证利用schur补引理我们可以得到:

其中因此便得到不等式(31),因此有假设

因此有:

在该式中,是零时刻的随机初始拓扑,因此:

因此有即分歧系统(29)在均方意义下渐进稳定,也就是说闭环多智能体系统(19)在定义2的基础上实现了一致性,完成了证明。

本发明的特点及效果:本发明通过分析时变延时、切换拓扑、随机网络攻击等因素对系统的影响,研究了基于混合触发机制的多智能体系统一致性问题。首先,为了减轻网络负担,引入了混合触发机制.为了更接近实际情况,还考虑了时变延迟、切换拓扑以及随机网络攻击,其中网络攻击用伯努利变量描述。其次,在通信拓扑中不存在生成树的情况下,以定理的形式给出了系统实现一致性的条件,该定理由李雅普诺夫稳定性理论与线性矩阵不等式理论得到。因此,该发明能灵活地实现系统的一致性控制。

附图说明

为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。

图1是本发明中具有时变时滞、不确定切换拓扑和随机网络攻击的多智能体系统的混合触发一致性控制框图;

图2是本发明中多智能体系统中的三个通信拓扑结构图;

图3是本发明中时状态x(t)的响应曲线;

图4是本发明中时速度v(t)的响应曲线;

图5是本发明中时状态x(t)的响应曲线;

图6是本发明中时速度v(t)的响应曲线;

图7是本发明中随机网络攻击f(x(t))的变化曲线;

图8是本发明中时所有智能体的事件触发时刻和释放间隔;

图9是本发明中时混合触发机制中两种触发机制之间的切换概率;

图10是本发明中随机网络攻击f(x(t))发生的概率曲线;

图11是本发明中多智能体系统中的三个通信拓扑之间相互切换的图像。

具体实施方式

结合附图通过如下实施例对本发明进行详细说明:

步骤一:多智能体系统的运动模型建立

考虑以下多智能体系统的运动模型:

式中,xi为第i个智能体的位置,b为阻尼常数,c为弹簧常数。

步骤二:一致性控制器设计以及系统闭环方程建立

控制器设计如下:

在该式中,k是常数增益,用于计算期望的距离将(2)式代入(1)式可得:

根据图2可得拉普拉斯矩阵如下:

设πpq=1,εpq=±0.1,则可得:

步骤三:闭环多智能体系统的一致性实现

设采样周期h=0.002s,三个智能体的初始条件为x0=[20.12,13.05,7.89],时滞上界τm=0.4,dm=0.15,ηm=0.12,事件触发参数σ=0.08,由定理1可得τi(t)=0.15是一个可行解,本文考虑如下两种情况:

第一种:即此时系统中无网络攻击且混合触发机制被使用,第一种情况的下x(t)的响应曲线如图3,v(t)的响应曲线如图4。

第二种:即此时系统中网络攻击发生的概率为百分之二十,混合触发机制被使用,此时的x(t)的响应曲线如图5,v(t)的响应曲线如图6,网络攻击的图像如图7所示,在第二种情况下,所有智能体的事件触发时刻和释放区间如图8所示,图9显示出第二种情况下混合触发机制中两种触发机制之间相互切换的概率,图10描述了网络攻击发生的概率,图11表示多智能体系统中三个拓扑之间的切换情况。

结果表明,本发明提出的方法可以应用于一般线性时滞动态系统的一致性检验。此外,还可以证明,即使在三种拓扑中都没有生成树的情况下,系统仍然可以收敛。最后,三种拓扑之间切换的概率是不确定的,本发明考虑了时变延时、切换拓扑、随机网络攻击等因素对系统的影响,实现了基于混合触发机制的多智能体系统一致性。因此,该方法能更灵活地保证系统的一致性。在以上分析的基础上,可以看出多智能体系统最终实现了渐近稳定性和一致性,即本发明设计的控制器是有效的。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1