1.本发明属于计算机科学与控制领域,涉及一种有限时间和固定时间分布式事件触发一致性方法。
背景技术:
2.在过去的几十年中,关于多智能体协作控制的研究已取得显著的进展。越来越多的大型工程任务如果只依赖于单个设备或机器是无法实现复杂任务的。在许多行业中,协作控制已逐渐反映了其独特的优势。
3.多智能体系统是指由多个同时具有感知、通信、计算和执行能力的智能体组成的系统。每个智能体通过网络通信拓扑与其他智能体进行交互,从而协作完成复杂的任务。目前,多智能体系统已广泛用于交通控制、智能电网、制造、无人机编队控制、传感器网络、数据融合、多机械手协作设备和许多其他领域。
4.协同一致性是多智能体系统研究中的关键问题之一,指的是能使一组智能体通过与各自邻居的信息交互以及协同控制来达到状态一致的算法。另外,在实际工程应用中,例如姿态同步、环境监测等,往往要求多智能体系统在实现协同控制目标的同时满足多种性能(如快速性、鲁棒性、抗干扰性等)要求,其中,收敛时间是表征系统控制性能的重要指标。
5.值得注意的是,大多数多智能体一致性的研究都需要控制器连续更新。然而在实际应用中,每个智能体的计算资源是有限的,控制器有时无法实时更新。为了解决这个问题并提高在线资源的利用,现有的事件触发一致性方法有效减少了控制器更新频率。但目前的事件触发一致性策略大多是渐进稳定的,并没有考虑收敛性能。有限时间和固定时间的一致性由于其更快的收敛速度和对干扰以及参数不确定性的更好鲁棒性而被越来越多的学者研究。近年来,有限时间及固定时间事件触发一致性的成果颇为丰硕,但这些研究中的控制协议形式结构单一,控制器设计缺乏扩展性,无法根据具体的性能要求灵活设计。对此,如何设计可满足不同收敛性能要求的可扩展事件触发协同一致性协议是迫切需要解决的问题。
技术实现要素:
6.为了解决现有技术的不足,本发明提出了一种有限时间和固定时间分布式事件触发一致性方法。
7.本发明所采用的技术方案,包括以下步骤:
8.步骤a、确定多智能体系统的通信拓扑图g,用拉普拉斯矩阵l来表征智能体之间的信息交互。
9.步骤b、基于梯度神经网络思想,设计多智能体系统事件触发一致性协议。
10.步骤c、定义多智能体系统的事件触发误差,并基于事件触发误差设计事件触发条件。
11.步骤d、选取一致性协议中适合的方向函数。
12.步骤e、选取使多智能体系统不仅实现有限时间收敛性能而且可实现固定时间收敛性能的激活函数。
13.步骤f、将设计的多智能体系统控制协议与事件触发机制通过编程写入每一个智能体,并通过建立的通信拓扑图实现智能体之间的分布式信息交互,实现所有智能体的有限时间和固定时间一致性稳定。
14.本发明的有益效果:本发明基于梯度神经网络思想,提出了一种可扩展分布式事件触发控制框架,主要包含方向函数和属性函数,可以通过灵活设计控制器协议中的两个函数,实现不同的控制性能要求,同时有效减少控制器的更新频率,降低资源使用率。
附图说明
15.图1为本发明流程图。
具体实施方式
16.当前大多基于事件触发的多智能体一致性协议虽然也能同时满足相应的性能要求,但这些研究中的控制器都是针对具体问题设计的,很难根据具体的收敛目标进行更改,即控制器设计缺乏兼容性和扩展性。
17.针对上述问题,本发明给出了以下思路,见图1:
18.步骤a、假设有n个结构相同的智能体,这里可选取代表所有智能体中感兴趣的状态所组合而成的向量。再建立多智能体系统的通信网络拓扑图g,智能体之间的联系可用拉普拉斯矩阵l表示。
19.本发明采用的是无向拓扑图,n个智能体组成一个可由g=(θ,ε,a)表示的通信网络,其中θ={1,2,
…
,n}代表这n个智能体的序列,ε={(i,j)|i,j∈θ}代表存在通信交互的边的集合,a=[a
ij
]n×n代表具有权重的邻接矩阵,如果(i,j)∈ε,则a
ij
》0,否则,a
ij
=0。再构建g的入度矩阵d=diag{d1,d2,
…
,dn},di为每个智能体i的邻居数,由此可以得到g的拉普拉斯矩阵l=d-a。
[0020]
步骤b、根据梯度神经网络思想,设计基于事件触发的多智能体系统控制协议。
[0021]
步骤b-1、本发明中所采用的系统模型为:
[0022][0023]
其中,xi(t)代表第i个智能体在t时刻的状态,ui(t)代表第i个智能体在t时刻的控制输入。
[0024]
步骤b-2、为了实现系统的一致性,定义每个智能体与其邻居智能体的协同误差:
[0025][0026]
其中,ni代表与第i个智能体有通信的邻居个数。需要指出的是,有限时间、固定时间一致性是指存在一个时间t使得lim
t
→
t
(xi(t)-xj(t))=0。一般地,有限时间的收敛时间估计值与所有智能体的初始状态相关。
[0027]
步骤b-3、梯度神经网络是神经网络的典型框架,已广泛用于各种微分方程的在线求解方案。梯度神经网络的在线求解方案框架设计如下:
[0028]
(1)考虑微分方程令y
*
(t)代表此微分方程的理论解;
[0029]
(2)构建关于状态y(t)的优化函数j(y(t)),使得j(y
*
(t))=min
y(t)
j(y(t)),并获得j(y(t))的梯度表示式为此时,基于梯度神经网络的线性控制模型可表示为它可用于高效地求出最优解;
[0030]
(3)对于线性控制模型通常引入非线性单调递增激活函数以提高控制性能。本发明中使用σ(
·
)来表示非线性激活函数,于是基于梯度神经网络的控制模型可进一步表示为
[0031]
步骤b-4、针对b-1中的多智能体系统,根据步骤b-3中的梯度神经网络思想,并结合拉普拉斯矩阵的性质,分别构建优化函数j和其梯度因子:
[0032][0033]
其中,
[0034]
步骤b-5、根据非线性梯度神经网络设计方法,提出以下基于梯度神经网络和事件触发的分布式一致性控制协议:
[0035][0036]
其中,γi代表需要设计的参数;gi代表可调整的参数;s(
·
)代表方向函数,决定了控制方向和稳定性;φ(
·
)是属性函数,可以根据具体的控制要求和目的灵活设计。代表第i个智能体的第k个触发时刻。
[0037]
步骤c、定义多智能体系统的事件触发误差,并基于事件触发误差设计事件触发条件。
[0038]
步骤c-1、多智能体系统的事件触发误差定义为:
[0039][0040]
步骤c-2、基于步骤c-1定义的事件触发误差设计事件触发条件:
[0041][0042]
其中,δi>0代表一个常数;0<βi<1;
[0043]
步骤d、步骤b-5中的方向函数可选取为:
[0044][0045]
其中,ηi是一个可设计的正值,z代表此函数的自变量。此方向函数的另一种表达形式如下:
[0046][0047]
其中,z可替换成相关变量,如
[0048]
步骤e、选取使多智能体系统不仅实现有限时间收敛性能而且可实现固定时间收敛性能的激活函数。
[0049]
步骤e-1、激活函数φ(
·
)按如下方式选取:
[0050]
(1)φ(|z|)≥0。
[0051]
(2)φ(|z|)是关于|z|的单调递增函数。
[0052]
(3)ψ(|z|)=|z|φ(|z|)为关于|z|的单调增函数且为凹函数。
[0053]
步骤e-2、选取李雅普诺夫函数为:
[0054][0055]
其中,令λ2(l)代表拉普拉斯矩阵l除0特征根之外最小的特征根。
[0056]
步骤e-3、根据触发条件对选取的李雅普诺夫函数进行求导并利用步骤d-1中激活函数的性质可得:
[0057][0058]
其中,m代表有m个智能体的qi(t)≠0,i∈{1,...,m},则有n-m个智能体的qi(t)=0,i∈{m+1,...,n},η
max
=max
i=1,...,m
{ηi},∈
min
=min
i=1,...,m
{∈i},
[0059]
步骤e-4、进一步对李雅普诺夫函数的导数进行放缩可得:
[0060][0061][0062]
[0063]
其中
[0064]
步骤e-5、为了实现对有限时间和固定时间收敛的灵活设计,现取激活函数p∈(0,1),α>0,可验证此函数满足步骤d-1中的激活函数特性。
[0065]
此激活函数关于|z|的泰勒展开形式为:
[0066][0067]
在此形式中,可知总存在一个正整数l
*
≥2,使得l
*
p>1。由此可得到该激活函数满足:
[0068]
φ(|z|)≥α|z|
p
以及
[0069]
其中,α1=α,p1=p,p2=l
*
p>1。
[0070]
对于φ(|2|)≥α|z|
p
,步骤d-4可进一步放缩为:
[0071][0072]
由此,可推导出有限稳定时间为:
[0073][0074]
其中,x(0)代表智能体的初始状态。
[0075]
对于步骤d-4可进一步放缩为:
[0076][0077]
由此可推导出固定收敛时间为:
[0078][0079]
步骤f、将设计的多智能体系统控制协议与事件触发机制通过编程写入每一个智能体,并通过建立的通信拓扑图实现智能体之间的分布式信息交互,实现所有智能体的有限时间和固定时间一致性稳定。
[0080]
综上,本发明给出了基于梯度神经网络的可扩展分布式控制框架,具有以下优点:1)有效节省计算资源和通信资源;2)控制协议具有普适性,基于本发明所提出的框架通过选取不同的控制器函数可涵盖大部分已有的有限时间和固定时间设计方案;3)控制协议具有可扩展性,区别于已有的大部分有限时间和固定时间控制策略,本发明设计了新的控制器函数,具有更好的收敛性能。