一种针对传输时滞的多智能体协同控制方法和装置与流程

文档序号:31415707发布日期:2022-09-03 14:14阅读:122来源:国知局
一种针对传输时滞的多智能体协同控制方法和装置与流程

1.本技术涉及多智能体控制技术领域,尤其涉及一种针对传输时滞的多智能体协同控 制方法和装置。


背景技术:

2.随着自动控制系统技术的发展,多智能体系统的研究和应用呈现出迅猛发展的势头。 多智能体系统可以包含有多个智能体,每个智能体可以单独控制,独立运行,不同智能体间 也可以存在信息交互,相互影响,多智能体系统可以是无人机集群、多智能体系统等。
3.在多智能体系统中,多智能体的协同控制是当下系统控制中的一个重要研究方向, 其主要可以通过在不同环境下智能体间的信息交互来实现。然而,受交互网络的影响,智能 体间的信息交互过程中可能存在传输时滞、系统时延等网络问题,尤其是多智能体系统需要 进行动态调整时,信息交互存在延迟,多智能体系统难以在有限时间内实现一致稳定,无法 短时间达到平衡状态。
4.因此,日趋复杂的应用场景和商业需求对多智能体系统的协同控制提出了更高的要 求,故而目前亟需一种多智能体系统的系统控制方案,使得多智能体系统可以在存在传输时 滞、系统时延的网络状态下,在有限时间内实现一致稳定。


技术实现要素:

5.为了保证多智能体系统内部在有限时间内达到一致性稳定,本技术实施例提供了一 种针对传输时滞的多智能体协同控制方法和装置。所述技术方案如下:第一方面,本技术实施例提供了一种针对传输时滞的多智能体协同控制方法,所述方法包括: 将多智能体系统中所有智能体分为一个领导者和多个跟随者,并利用有向拓扑网络生成所述 领导者和所述跟随者的信息交互关系;建立每个所述智能体的二阶动力学系统模型,并基于所述二阶动力学系统模型建立所述跟随 者和所述领导者间的跟踪误差方程;基于所述跟踪误差方程和所述信息交互关系,构建每个所述跟随者含传输时滞的控制输入方 程ui,所述控制输入方程ui包含待求解的控制增益系数;将所述控制输入方程ui代入所述跟踪误差方程,通过增广处理生成所述多智能体系统的系统 跟踪误差方程;通过李雅普诺夫稳定性理论和有限时间稳定理论对所述系统跟踪误差方程进行分析,生成所 述多智能体系统的稳定性控制条件;利用所述多智能体系统的稳定性控制条件对每个所述跟随者的控制输入方程ui进行求解,得 到所述跟随者对应的控制增益系数;将所述控制增益系数加载至每个所述跟随者的控制器中,以使所述控制器根据所述控制增益 系数控制所述跟随者。
6.基于上述技术方案,将多智能体系统的智能体状态模型化,通过数理分析得到智
能 体间的协同控制增益系数,可以利用个体控制器对智能体进行实时精确控制,从而可以有效 实现多智能体系统在有限时间内达到一致性稳定。
7.可选的,所述利用有向拓扑网络生成所述领导者和所述跟随者的信息交互关系,包 括:利用图论知识将所有所述智能体设置为有向拓扑网络中的节点;生成所述有向拓扑网络的邻接矩阵a=[α
ij
],其中,i与j为相邻的智能体,i,j=1,2,...,n+1, 元素α
ij
=1表示第i个智能体与第j个智能体之间存在信息交互,元素α
ij
=0表示第i个智能 体与第j个智能体之间不存在信息交互。
[0008]
基于上述技术方案,利用图论知识,将有向网络拓扑思想引入至多智能体系统中的 智能体的信息交互中,保证了多智能体系统中智能体增删时,其它智能体之间的信息交互不 受影响,更加符合多智能体系统建设的实际需求。
[0009]
可选的,所述建立每个所述智能体的二阶动力学系统模型,并基于所述二阶动力学 系统模型建立所述跟随者和所述领导者间的跟踪误差方程,包括:基于所述领导者的内部状态x0(t)、状态变化量以及控制输入r0(t),建立所述领导者的 二阶动力学系统模型:基于每个所述跟随者的内部状态xi(t)、状态变化量系统干扰wi(t)以及所述控制输入 方程ui(t),建立每个跟随者的二阶动力学系统模型:基于所述领导者的内部状态和第i个跟随者的内部状态,设定所述第i个跟随者和所述领导 者的跟踪误差方程ξi(t)=x0(t)-xi(t)-fi(t),其中,fi(t)为所述第i个跟随者的系统向量,
ꢀꢀ
为系统编队控制信号,c=[10],
[0010]
基于上述技术方案,通过建立二阶动力学系统模型,可以将智能体内部的复杂状态 模型化,并将多智能体系统的一致性稳定数据化为跟随者和领导者间的跟踪误差方程,从而 便于后续对智能体的状态变化和系统稳定进行快速有效地分析。
[0011]
可选的,所述基于所述跟踪误差方程和所述信息交互关系,构建每个所述跟随者含传 输时滞的控制输入方程ui,包括:设定所述跟踪误差方程趋近于零,分析所述跟踪误差方程生成第i个跟随者的控制辅助项 利用所述控制辅助项和所述领导者的控制输入r0(t),以及所述系统编队控制信号构 建所述第i个跟随者的控制输入方程建所述第i个跟随者的控制输入方程其中,k1、k2、k3为待
求解的控制增益系数。
[0012]
基于上述技术方案,对跟踪误差方程进行分析,并结合领导者的控制输入和系统编 队控制信号来建立跟随者的控制输入方程,可以使得控制输入方程能够匹配跟随者的真实需 求。
[0013]
可选的,所述将所述控制输入方程ui代入所述跟踪误差方程,通过增广处理生成所 述多智能体系统的系统跟踪误差方程,包括:将所述控制输入方程ui代入所述跟踪误差方程,并设定k2、k3为单位矩阵,得到跟踪误差 动态方程对所述跟踪误差动态方程进行增广处理,构建所述多智能体系统中的系统跟踪误差方程 其中,ξ=col{ξ1,ξ2,...,ξn}, w=col{w1,w2,...,wn},in为n维单位矩阵,表示克罗内克积,l为所述邻接矩阵对应的拉 普拉斯矩阵。
[0014]
可选的,所述稳定性控制条件为:如果存在常数γ>0,d>0,适维矩阵k和正定矩阵 p,q,z,满足ω
11
=a
t
p+pa+2p+q+3a
t
za-d-1
e-γd
z-γp+iω
22
=-(1-d)q-d-1
e-γd
z成立,且所述则当传输时滞d(t)满足 0<d(t)<d时,所述多智能体系统能够在有限时间内实现一致稳定,其中,中的元 素*表示与元素r对称的元素r
t
,分别为p,z的逆矩阵,α=λ
max
(l
t
l),t0为任意 时刻,t为大于t0的任意时刻,c2>c1>0且λ2,λ3,λ4分别为 p,q,z的最大特征值,所述适维矩阵k为矩阵形式的控制增益系数。
[0015]
可选的,所述方法还包括:针对所述跟踪误差方程ξi(t)和系统干扰wi(t),引入h

的性能指标函数 其中,s为积分变量;通过李雅普诺夫稳定性理论对所述性能指标函数进行分析,生成扰动抑制条件,所述扰动抑 制条件为:如果存在干扰抑制参数0<γ<1和正定矩阵p,q,z,满足ω<0成立,则所述多智 能体系统中的所有智能体具有扰动抑制性能;所述利用所述多智能体系统的稳定性条件对每个所述跟随者的控制输入方程进行求解,得到 所述跟随者对应的控制增益系数,包括:
利用所述多智能体系统的稳定性条件和所述干扰抑制条件对每个所述跟随者的控制输入方程 进行求解,得到所述跟随者对应的控制增益系数。
[0016]
基于上述技术方案,在稳定性控制条件之外,引入h

方法来设定智能体的扰动抑制 条件,并综合稳定性控制条件和扰动抑制条件来求解跟随者对应的控制增益系数,从而使得 求解出的控制增益系数既可满足多智能体系统的稳定性需求,又可实现对噪声干扰的有效抑 制。
[0017]
第二方面,本技术实施例还提供了一种针对传输时滞的多智能体协同控制装置,所 述装置包括:拓扑结构分析模块,用于将多智能体系统中所有智能体分为一个领导者和多个跟随者,并利 用有向拓扑网络生成所述领导者和所述跟随者的信息交互关系;系统方程搭建模块,用于建立每个所述智能体的二阶动力学系统模型,并基于所述二阶动力 学系统模型建立所述跟随者和所述领导者间的跟踪误差方程;控制输入分析模块,用于基于所述跟踪误差方程和所述信息交互关系,构建每个所述跟随者 含传输时滞的控制输入方程ui,所述控制输入方程ui包含待求解的控制增益系数;所述系统方程搭建模块,还用于将所述控制输入方程ui代入所述跟踪误差方程,通过增广处 理生成所述多智能体系统的系统跟踪误差方程;稳定性分析模块,用于通过李雅普诺夫稳定性理论和有限时间稳定理论对所述系统跟踪误差 方程进行分析,生成所述多智能体系统的稳定性控制条件;控制增益求解模块,用于利用所述多智能体系统的稳定性控制条件对每个所述跟随者的控制 输入方程ui进行求解,得到所述跟随者对应的控制增益系数;控制增益加载模块,用于将所述控制增益系数加载至每个所述跟随者的控制器中,以使所述 控制器根据所述控制增益系数控制所述跟随者。
[0018]
第三方面,提供了一种中心控制器,所述中心控制器包括处理器和存储器,所述存 储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至 少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的针对传 输时滞的多智能体协同控制方法。
[0019]
第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、 至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指 令集由处理器加载并执行以实现如第一方面所述的针对传输时滞的多智能体协同控制方法。
[0020]
综上所述,本技术具有以下有益效果:采用本技术公开的针对传输时滞的多智能体协同控制方法,将有向网络拓扑思想引入至多智 能体系统中的智能体信息交互中,并构建智能体的二阶动力学系统模型将智能体在传输时滞 下的状态模型化,进而建立多智能体系统的系统跟踪误差方程,再利用李雅普诺夫稳定性理 论和有限时间稳定理论对跟踪误差方程进行分析,得出稳定性条件,从而可以通过稳定性条 件求解得到能够实现多智能体系统一致性稳定的控制增益系数。这样,将多智能体系统的智 能体状态模型化,通过数理分析得到智能体间的协同控制增益系数,可以利用控制器对智能 体进行实时精确控制,当传输时滞量是未知的,而且不同时刻
状态的传输时滞是会变化的情 况下,依然能够实现多智能体系统的跟踪控制,从而可以有效实现多智能体系统在传输时滞 下的一致性稳定。
附图说明
[0021]
图1为本技术实施例中一种多智能体系统的场景架构示意图;图2为本技术实施例中一种智能体协同控制方法的流程图;图3为本技术实施例中一种智能体协同控制装置结构示意图。
具体实施方式
[0022]
为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图1-3及实施例, 对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并 不用于限定本技术。
[0023]
本技术实施例提供了一种针对传输时滞的多智能体协同控制方法,该方法可以应用 在如图1所示的多智能体系统中,并具体可以由多智能体系统的中心控制器来执行,多智能 体系统可以包含中心控制器和多个智能体,每个智能体对应一个控制器。该中心控制器可以 与多智能体系统中各个智能体的控制器(后续简称为个体控制器)进行数据交互,如从个体 控制器处获取智能体的内部状态数据,向个体控制器发送控制增益系数等。中心控制器还可 以具备数据处理和分析功能,即可以用于对智能体的内部状态数据和状态变化进行处理并分 析,以得到加载在个体控制器中的控制增益系数。
[0024]
下面将结合具体实施方式,对图2所示的处理流程进行详细的说明,内容可以如下: 步骤201,将多智能体系统中所有智能体分为一个领导者和多个跟随者,并利用有向拓扑网 络生成领导者和跟随者的信息交互关系。
[0025]
在实施中,中心控制器可以记录多智能体系统中所有在线的智能体,并在所有智能 体中选取一个智能体作为领导者,且将其余智能体确定为跟随者。换言之,令多智能体系统 中有n+1个智能体,设定其中1个智能体为领导者,其余n个智能体为跟随者。之后,中心 控制器可以引入有向拓扑网络,取无向图g来描述多智能体系统中的领导者与跟随者之间的 通信网络拓扑关系,从而生成任意两个智能体间的信息交互关系。
[0026]
可选的,可以利用邻接矩阵来表达信息交互关系,相应的,步骤201的处理可以如 下:利用图论知识将所有智能体设置为有向拓扑网络中的节点;生成有向拓扑网络的邻接矩 阵a=[α
ij
]。其中,i与j为相邻的智能体,i,j=1,2,...,n,元素α
ij
=1表示第i个智能体与第j个智能体之 间存在信息交互,元素α
ij
=0表示第i个智能体与第j个智能体之间不存在信息交互。
[0027]
在实施中,中心控制器可以引入图论知识,利用有向拓扑网络来标识多智能体系统 中的智能体间的信息交互关系。具体来说,可以先将智能体设置为有向拓扑网络中的节点, 再生成有向拓扑网络的邻接矩阵a=[α
ij
],其中,i与j为相邻的智能体,i,j=1,2,...,n,元 素α
ij
即为第i个智能体和第j个智能体间的信息交互权值,当元素α
ij
=1表示第i个智能体 与第j个智能体之间存在信息交互,元素α
ij
=0表示第i个智能体与第j个智能体之间不存在 信息交互,例如α
12
=0,则代表第1个智能体和第2个智能体间不存在信息交互。此
外, 可以定义α
ii
=0,即代表每个智能体与自身的信息交互权值为0。值得一提的是,本实施例 中默认将领导者设为第0个智能体,α
ij
可以为跟随者间的信息交互权值。
[0028]
步骤202,建立每个智能体的二阶动力学系统模型,并基于二阶动力学系统模型建立 跟随者和领导者间的跟踪误差方程。
[0029]
在实施中,多智能体系统中的智能体在运行时,其内部状态取值及变化可以由二阶 动力学系统模型来拟合,并进一步的,多个智能体间的一致性稳定可以由跟随者和领导者的 误差来反映。故而,针对每个智能体,中心控制器可以建立智能体的二阶动力学系统模型, 并通过二阶动力学系统模型来构建领导者和跟随者间的跟踪误差方程,以数据化领导者和跟 随者之间存在的影响一致性稳定的状态偏差。
[0030]
可选的,步骤202中智能体的二阶动力学系统模型可以分为领导者的二阶动力学系 统模型和跟随者的二阶动力学模型,相应的构建过程可以分别如下:基于领导者的内部状态 x0(t)、状态变化量以及控制输入r0(t),建立领导者的二阶动力学系统模型:基于每个跟随者的内部状态xi(t)、状态变化量系统干扰wi(t) 以及控制输入方程ui(t),建立每个跟随者的二阶动力学系统模型: [0031]
在实施中,在构建领导者的二阶动力学系统模型时,可以考虑领导者的内部状态和 状态变化量,以及个体控制器对领导者的控制输入,因此可以基于领导者的内部状态x0(t)、 状态变化量以及控制输入r0(t),建立领导者的二阶动力学系统模型而对于跟随者,同样需要考虑跟随者的内部状态和状态变化量,以及 电源控制器对跟随者的控制输入,除此之外,还可以考虑外界干扰对跟随者的影响,因此可 以基于每个跟随者的内部状态xi(t)、状态变化量系统干扰wi(t)以及控制输入方程 ui(t),建立跟随者的二阶动力学系统模型内部状态即为各个 跟随者的多维状态向量,每一维对应跟随者的一项状态参数,xi(t)代表t时刻第i个跟随者 的内部状态,状态变化量可以理解为下一时刻的内部状态。可以理解,领导者在向跟随者共 享自身状态时,为了实现输出一致性目标,领导者自身可以看作是一个本身就具备抗干扰性 能的智能体,因此在构建领导者的二阶动力学系统模型时可以不考虑噪声干扰。
[0032]
进一步的,基于上述构建的领导者和跟随者的二阶动力学系统模型,跟踪误差方程 的建立过程具体可以如下:基于领导者的内部状态和第i个跟随者的内部状态,设定第i个 跟随者和领导者的跟踪误差方程ξi(t)=x0(t)-xi(t)-fi(t)。
[0033]
其中,fi(t)为第i个跟随者的系统向量,(t)为第i个跟随者的系统向量,为系统编队 控制信号,
c=[1 0],
[0034]
在实施中,在稳定的多智能体系统中,智能体间需要保证特定的编队形式,如当智 能体为无人机,多智能体系统为无人机编队时,无人机编队在飞行过程中,每个无人机间需 要保持固定的距离,且与其它无人机的相对位置保持不变。因此,对于这种编队形式,可以 利用系统向量fi(t)来体现,且存在(t)来体现,且存在为系统编队控制信号。不 难理解,编队形式是动态变化的,其变化量当前编队形式和系统编队控制输入两者的影响。 综上,在构建跟随者和领导者的跟踪误差方程时,不仅需要考虑跟随者的内部状态xi(t)和 领导者的内部状态x0(t),同时还需要引入上述系统向量fi(t),以保证多智能体系统的编队 稳定,从而可以得到跟踪误差方程ξi(t)=x0(t)-xi(t)-fi(t)。步骤203,基于跟踪误差方程和信息交互关系,构建每个跟随者含传输时滞的控制输入方程 ui。
[0035]
其中,控制输入方程ui包含待求解的控制增益系数。
[0036]
在实施中,中心控制器构建了跟随者和领导者间的跟踪误差方程,可以从保证二者 状态满足一致性稳定的角度出发,对跟踪误差方程进行分析,以确定出适合每个跟随者的控 制信号。同时,考虑多智能体系统内智能体间的相互干扰,可以进一步结合信息交互关系来 构建每个跟随者含传输时滞的控制输入方程ui。
[0037]
可选的,以上述跟踪误差方程的具体形式为基础,控制输入方程ui的构建过程可以 如下:设定跟踪误差方程趋近于零,分析跟踪误差方程生成第i个跟随者的控制辅助项 利用控制辅助项和领导者的控制输入r0(t),以及系统 编队控制信号构建第i个跟随者的控制输入方程构建第i个跟随者的控制输入方程
[0038]
其中,k1、k2、k3为待求解的控制增益系数。
[0039]
在实施中,当多智能体系统趋于一致性稳定时,任意跟随者和领导者间的跟踪误差 方程的取值都将趋于零,故而可以设定跟踪误差方程趋近于零,再对跟踪误差方程进行分析。 即取ξi(t)=x0(t)-xi(t)-fi(t)

0,同时,考虑到智能体间信息交互时存在传输时滞,在 设定跟随者控制器的控制输入时,需要引入每个跟随者含传输时滞的内部状态量xi(t-d(t))。 进而可以反向求出存在传输时滞的情况下第i个跟随者的控制辅助项进而可以反向求出存在传输时滞的情况下第i个跟随者的控制辅助项这样可以在构建第i个跟随者的控制输入方程ui时,同时引入控制辅助项和 领导者的控制输入r0(t),以及智能体系统的系统编队控制信号可以得到可以得到不难理解,多智能体系统的 一致性稳定主要受两方面影响,其一是不同智能体内部状态的同步保持,其二是不同智能体 的外界输入的一致,因此控制输入方程ui(t)可以由控制辅助项和外界控制输入项(包含领导 者的控制输入和系统编队的控制输入)共同组成。
[0040]
步骤204,将控制输入方程ui代入跟踪误差方程,通过增广处理生成多智能体系统的 系统跟踪误差方程。
[0041]
在实施中,中心控制器构建了个跟随者含传输时滞的控制输入方程ui后,可以将ui代入跟随者和领导者间的跟踪误差方程,之后可以通过增广处理的方式,由跟踪误差方程生 成多智能体系统的系统跟踪误差方程。
[0042]
可选的,在确定控制输入方程ui的形式后,系统跟踪误差方程的生成过程可以如下: 将控制输入方程ui代入跟踪误差方程,并设定k2、k3为单位矩阵,得到跟踪误差动态方程 对跟踪误差动态方程进行增广处理,构建多智能体系统中的系统跟踪误差方程进行增广处理,构建多智能体系统中的系统跟踪误差方程
[0043]
其中,ξ=col{ξ1,ξ2,...,ξn},w=col{w1,w2,...,wn},in为n维单位矩阵,表示克罗 内克积,l为邻接矩阵对应的拉普拉斯矩阵。
[0044]
在实施中,中心控制器可以将构建出的第i个跟随者的控制输入方程代入相应的跟踪 误差方程,同时为了简化运算过程,设定k2、k3为单位矩阵,从而可以得到第i个跟随者对 应的跟踪误差动态方程接 下来,利用个体分析变换为系统分析的思想,对所有跟随者对应的跟踪误差动态方程进 行增广处理,从而可以得到多智能体系统中的系统跟踪误差方程可以得到多智能体系统中的系统跟踪误差方程步骤205,通过李雅普诺夫稳定性理论和有限时间稳定理论对系统跟踪误差方程进行分析, 生成多智能体系统的稳定性控制条件。
[0045]
在实施中,李雅普诺夫稳定性理论是一种研究系统稳定性的理论,即探求系统的一 种平衡状态,当系统处于该平衡状态时,无论存在何种外界扰动,系统最终都会趋于回归该 平衡状态。有限时间稳定理论是一种研究在给定范围的初始条件下,在特定的时间区间内, 一个系统的状态始终是否能够保持在一个确定的界限内的理论。因此,可以基于李雅普诺夫 稳定性理论和有限时间稳定理论对系统跟踪误差方程进行分析,以计算多智能体系统在有限 时间内达到平衡状态时需要满足的控制条件,即生成多智能体系统的稳定性控制条件。
[0046]
基于上述系统跟踪误差方程基于上述系统跟踪误差方程若要多智能体系统在有限时间内达到群体一致性,则需要趋于0。故而,利用 李雅普诺夫稳定性理论和有限时间稳定理论对系统跟踪误差方程进行分析,可以得到如下稳 定性控制条件:如果存在常数γ>0,d>0,适维矩阵k和正定矩阵p,q,z,满足
ω
11
=a
t
p+pa+2p+q+3a
t
za-d-1
e-γd
z-γp+iω
22
=-(1-d)q-d-1
e-γd
z成立,且则当传输时滞d(t)满足 0<d(t)<d时,多智能体系统能够在有限时间内实现一致稳定。
[0047]
其中,中的元素*表示与元素r对称的元素r
t
,分别为p,z的逆矩阵, α=λ
max
(l
t
l),t0为任意时刻,t为大于t0的任意时刻,c2>c1>0且 λ2,λ3,λ4分别为p,q,z的最大特征值,适维矩阵k为矩阵形 式的控制增益系数。
[0048]
值得一提的是,表示由不等式 可以推导出不等式即当t0满足不等式 时,将不等式右侧替换为并选取任 意t代入不等式,均能满足不等式
[0049]
步骤206,利用多智能体系统的稳定性控制条件对每个跟随者的控制输入方程ui进行 求解,得到跟随者对应的控制增益系数。
[0050]
在实施中,在分析得出多智能体系统的稳定性控制条件后,中心控制器可以利用该 稳定性控制条件反向求解多智能体系统中各个智能体的控制增益系数。具体的,中心控制器 可以基于上述稳定性控制条件对每个跟随者的控制输入方程统一进行求解,从而可以得到跟 随者对应的控制增益系数。
[0051]
步骤207,将控制增益系数加载至每个跟随者的控制器中,以使控制器根据控制增益 系数控制跟随者。
[0052]
在实施中,中心控制器在确定了跟随者的控制增益系数后,可以将控制增益系数发 送至每个跟随者的个体控制器。个体控制器接收并加载该控制增益系数,将控制增益系数代 入跟随者的控制输入方程,以得到每个跟随者的具体控制输入,从而个体控制器可以通过该 具体控制输入对跟随者进行控制。
[0053]
可选的,可以引入h

性能指标对系统干扰进行抑制,相应的,可以存在如下处理: 针对跟踪误差方程ξi(t)和系统干扰wi(t),引入h

的性能指标函数通过李雅普诺夫稳定性理论对性能指标函数进行分析, 生成扰动抑制条件,扰动抑制条件为:如果存在干扰抑制参数0<γ<1和正定矩阵p,q,z, 满足ω<0成立,则多智能体系统中的所有智能体具有扰动抑制性能;
在实施中,中心控制器可以针对跟踪误差方程ξi(t)和系统干扰wi(t),引入h

性能指标函数 以使多智能体系统中各智能体的内部状态间偏差始 终保持在一个界内,从而可以保证智能体的内部状态不会超出瞬时范围,以满足多智能体系 统的安全性能需求。其中,s为积分变量,ξi(s)即为积分运算中的ξi(t),wi(s)为积分运算中 的wi(t)。之后,同样可以利用李雅普诺夫稳定性理论,对该性能指标函数进行分析,得到 扰动抑制条件,该扰动抑制条件具体可以为:如果存在干扰抑制参数0<γ<1和正定矩阵 p,q,z,满足ω<0成立,则多智能体系统中的所有智能体具有扰动抑制性能。
[0054]
进一步的,可以利用上述扰动抑制条件对控制增益系数进行求解,相应的,步骤206 的处理可以如下:利用多智能体系统的稳定性条件和干扰抑制条件对每个跟随者的控制输入 方程进行求解,得到跟随者对应的控制增益系数。
[0055]
在实施中,在分析得出多智能体系统的稳定性控制条件和上述干扰抑制条件后,中 心控制器可以同时利用该稳定性控制条件和干扰抑制条件,对多智能体系统中各个智能体的 控制增益系数进行求解。具体的,中心控制器可以基于上述稳定性控制条件和干扰抑制条件, 对每个跟随者的控制输入方程ui统一进行求解,从而可以得到跟随者对应的控制增益系数, 从而使得求解出的控制增益系数既可满足多智能体系统的稳定性需求,又可实现对噪声干扰 的有效抑制。
[0056]
采用本技术公开的针对传输时滞的多智能体协同控制方法,将有向网络拓扑思想引 入至多智能体系统中的智能体信息交互中,并构建智能体的二阶动力学系统模型将智能体在 传输时滞下的状态模型化,进而建立多智能体系统的系统跟踪误差方程,再利用李雅普诺夫 稳定性理论和有限时间稳定理论对跟踪误差方程进行分析,得出稳定性条件,从而可以通过 稳定性条件求解得到能够实现多智能体系统一致性稳定的控制增益系数。这样,将多智能体 系统的智能体状态模型化,通过数理分析得到智能体间的协同控制增益系数,可以利用控制 器对智能体进行实时精确控制,当传输时滞量是未知的,而且不同时刻状态的传输时滞是会 变化的情况下,依然能够实现多智能体系统的跟踪控制,从而可以有效实现多智能体系统在 传输时滞下的一致性稳定。
[0057]
本技术实施例还提供了一种针对传输时滞的多智能体协同控制装置,如图3所示, 所述装置包括:拓扑结构分析模块301,用于将多智能体系统中所有智能体分为一个领导者和多个跟随者, 并利用有向拓扑网络生成所述领导者和所述跟随者的信息交互关系;系统方程搭建模块302,用于建立每个所述智能体的二阶动力学系统模型,并基于所述二阶 动力学系统模型建立所述跟随者和所述领导者间的跟踪误差方程;控制输入分析模块303,用于基于所述跟踪误差方程和所述信息交互关系,构建每个所述跟 随者含传输时滞的控制输入方程ui,所述控制输入方程ui包含待求解的控制增益系数;所述系统方程搭建模块302,还用于将所述控制输入方程ui代入所述跟踪误差方程,通过增 广处理生成所述多智能体系统的系统跟踪误差方程;稳定性分析模块304,用于通过李雅普诺夫稳定性理论和有限时间稳定理论对所
述系统跟踪 误差方程进行分析,生成所述多智能体系统的稳定性控制条件;控制增益求解模块305,用于利用所述多智能体系统的稳定性控制条件对每个所述跟随者的 控制输入方程ui进行求解,得到所述跟随者对应的控制增益系数;控制增益加载模块306,用于将所述控制增益系数加载至每个所述跟随者的控制器中,以使 所述控制器根据所述控制增益系数控制所述跟随者。
[0058]
可选的,所述拓扑结构分析模块301,具体用于:利用图论知识将所有所述智能体设置为有向拓扑网络中的节点;生成所述有向拓扑网络的邻接矩阵a=[α
ij
],其中,i与j为相邻的智能体,i,j=1,2,...,n+1, 元素α
ij
=1表示第i个智能体与第j个智能体之间存在信息交互,元素α
ij
=0表示第i个智能 体与第j个智能体之间不存在信息交互。
[0059]
可选的,所述系统方程搭建模块302,具体用于:基于所述领导者的内部状态x0(t)、状态变化量以及控制输入r0(t),建立所述领导者的 二阶动力学系统模型:基于每个所述跟随者的内部状态xi(t)、状态变化量系统干扰wi(t)以及所述控制输入 方程ui(t),建立每个跟随者的二阶动力学系统模型:基于所述领导者的内部状态和第i个跟随者的内部状态,设定所述第i个跟随者和所述领导 者的跟踪误差方程ξi(t)=x0(t)-xi(t)-fi(t),其中,fi(t)为所述第i个跟随者的系统向量,
ꢀꢀ
为系统编队控制信号,c=[10],
[0060]
可选的,所述控制输入分析模块303,具体用于:设定所述跟踪误差方程趋近于零,分析所述跟踪误差方程生成第i个跟随者的控制辅助项 利用所述控制辅助项和所述领导者的控制输入r0(t),以及所述系统编队控制信号构 建所述第i个跟随者的控制输入方程建所述第i个跟随者的控制输入方程其中,k1、k2、k3为待求解的控制增益系数。
[0061]
可选的,所述系统方程搭建模块302,具体用于:将所述控制输入方程ui代入所述跟踪误差方程,并设定k2、k3为单位矩阵,得到跟踪误差 动态方程对所述跟踪误差动态方程进行增广处理,构建所述多智能体系统中的系统跟
特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1