一种针对传输数据丢失的多智能体协同控制方法和装置与流程

文档序号:31415709发布日期:2022-09-03 14:15阅读:156来源:国知局
一种针对传输数据丢失的多智能体协同控制方法和装置与流程

1.本技术涉及多智能体控制技术领域,尤其涉及一种针对传输数据丢失的多智能体协 同控制方法和装置。


背景技术:

2.随着自动控制系统技术的发展,多智能体系统的研究和应用呈现出迅猛发展的势头。 多智能体系统可以包含有多个智能体,每个智能体可以单独控制,独立运行,不同智能体间 也可以存在信息交互,相互影响,多智能体系统可以是无人机集群、多智能体系统等。
3.在多智能体系统中,多智能体的协同控制是当下系统控制中的一个重要研究方向, 其主要可以通过在不同环境下智能体间的信息交互来实现。然而,受交互网络的影响,智能 体间的信息交互过程中可能存在数据丢失的问题,尤其是当需要传输的数据量较大时,每个 智能体在发送和接收数据时均可能出现数据丢失的现象。并且,多个智能体丢失的数据分布 情况各不相同,发送和接收时的数据丢失情况也存在区别。
4.因此,日趋复杂的应用场景和商业需求对多智能体系统的协同控制提出了更高的要 求,故而目前亟需一种针对智能体数量较多,传输数据量较大的多智能体系统的系统控制方 案,使得多智能体系统内可以在期望目标下实现一致稳定。


技术实现要素:

5.为了保证多智能体系统内部实现一致性稳定,本技术实施例提供了一种针对传输数 据丢失的多智能体协同控制方法和装置。所述技术方案如下:第一方面,本技术实施例提供了一种针对传输数据丢失的多智能体协同控制方法,所述方法 包括:将多智能体系统中所有智能体分为一个领导者和多个跟随者,并利用有向拓扑网络生成所述 领导者和所述跟随者的信息交互关系;对所述信息交互关系评估,获取所述智能体两两间的数据丢失频率,并结合伯努利分布将所 述数据丢失频率转化为丢包概率分布;建立每个所述智能体的二阶动力学系统模型,并基于所述二阶动力学系统模型建立所述跟随 者和所述领导者间的跟踪误差方程;基于所述跟踪误差方程、所述信息交互关系和所述丢包概率分布,构建每个所述跟随者的控 制输入方程ui(k),所述控制输入方程ui(k)包含待求解的控制增益系数;将所述控制输入方程ui(k)代入所述跟踪误差方程,通过增广处理生成所述多智能体系统的 系统跟踪误差方程;通过李雅普诺夫稳定性理论和鲁棒控制理论对所述系统跟踪误差方程进行分析,生成所述多 智能体系统的稳定性控制条件;利用所述多智能体系统的稳定性控制条件对每个所述跟随者的控制输入方程ui(k)进行求解, 得到所述跟随者对应的控制增益系数;
将所述控制增益系数加载至每个所述跟随者的控制器中,以使所述控制器根据所述控制增益 系数控制所述跟随者。
6.基于上述技术方案,将多智能体系统的智能体状态模型化,通过数理分析得到智能 体间的协同控制增益系数,可以利用个体控制器对智能体进行实时精确控制,从而可以有效 实现存在传输数据丢失的情况下多智能体系统内部的一致性稳定。
7.可选的,所述利用有向拓扑网络生成所述领导者和所述跟随者的信息交互关系,包 括:利用图论知识将所有所述智能体设置为有向拓扑网络中的节点;生成所述有向拓扑网络的邻接矩阵a=[α
ij
],其中,i与j为相邻的智能体,i,j=1,2,...,n, 元素α
ij
=1表示第i个智能体与第j个智能体之间存在信息交互,元素α
ij
=0表示第i个智能 体与第j个智能体之间不存在信息交互。
[0008]
基于上述技术方案,利用图论知识,将有向网络拓扑思想引入至多智能体系统中的 智能体的信息交互中,保证了多智能体系统中智能体增删时,其它智能体之间的信息交互不 受影响,更加符合多智能体系统建设的实际需求。
[0009]
可选的,所述结合伯努利分布将所述数据丢失频率转化为丢包概率分布,包括:设定k时刻智能体i与智能体j进行信息交互时,包含γ
ij
(k)=0的数据丢失状态和γ
ij
(k)= 1的数据未丢失状态;根据所述数据丢失频率给出所述数据丢失状态和所述数据未丢失状态的丢包概率分布:率分布:
[0010]
基于上述技术方案,利用二项分布较为精确地量化数据传输丢包这一现象,从而便 于后续对于多智能体系统的状态分析。
[0011]
可选的,所建立每个所述智能体的二阶动力学系统模型,并基于所述二阶动力学系统 模型建立所述跟随者和所述领导者间的跟踪误差方程,包括:基于所述领导者的内部状态x0(k)和领导者控制输入r0(k),建立所述领导者的二阶动力学系 统模型:基于每个所述跟随者的内部状态xi(k)、系统干扰wi(k)以及跟随者控制输入ui(k),建立每个 跟随者的二阶动力学系统模型:基于所述领导者的内部状态和第i个跟随者的内部状态,设定所述第i个跟随者和所述领导 者的跟踪误差方程ξi(k)=x0(k)-xi(k)-fi(k);其中,k+1为相对k的下一时刻的状态,y0(k)与yi(k)为领导者与跟随者的输出,fi(k)为 所述第i个跟随者的系统向量,所述第i个跟随者的系统向量,为系统编队控制信号, [0012]
基于上述技术方案,通过建立二阶动力学系统模型,可以将智能体内部的复杂状
态 模型化,并将多智能体系统的一致性稳定数据化为跟随者和领导者间的跟踪误差方程,从而 便于后续对智能体的状态变化和系统稳定进行快速有效地分析。
[0013]
可选的,所述基于所述跟踪误差方程、所述信息交互关系和所述丢包概率分布,构 建每个所述跟随者的控制输入方程ui(k),包括:设定所述跟踪误差方程趋近于零,分析所述跟踪误差方程生成第i个跟随者的控制辅助变量:制辅助变量:利用所述控制辅助变量和所述领导者的控制输入r0(k),以及所述智能体系统的系统编队控 制信号构建所述第i个跟随者的控制输入方程 其中,k为待求解的控制增益系数。
[0014]
基于上述技术方案,对跟踪误差方程进行分析,并结合领导者的控制输入和系统编 队控制信号来建立跟随者的控制输入方程,可以使得控制输入方程能够匹配跟随者的真实需 求。
[0015]
可选的,所述将所述控制输入方程ui(k)代入所述跟踪误差方程,通过增广处理生成 所述多智能体系统的系统跟踪误差方程,包括:将所述控制输入方程ui代入所述跟踪误差方程ξi(k),对所述跟踪误差方程ξi(k)进行增广处 理,构建所述多智能体系统的系统跟踪误差方程:其中, ξ=col{ξ1,ξ2,...,ξn},w=col{w1,w2,...,wn},in为n维单位矩阵,为克罗内克积, l
γ
(k),l
γ
(k)分别为:
[0016]
可选的,所述稳定性控制条件为:如果存在常数 适维矩阵k和正定矩阵p1,p2,q1,q2,满 足成立,则所述多智能体系统能够达到均方意义下一致稳定,其中,中的元素*表示与 元素r对称的元素r
t
,q1、q2分别为p1,p2的逆矩阵,所述适维矩阵k为矩阵形式的控制 增益系数。
[0017]
可选的,所述通过李雅普诺夫稳定性理论和鲁棒控制理论对所述系统跟踪误差方程 进行分析,生成所述多智能体系统的稳定性控制条件,包括:获取l
γ
(k),的期望值将所述e{l
γ
(k)},代入所
述系统跟踪 误差方程,以替换矩阵l
γ
(k),通过李雅普诺夫稳定性理论和鲁棒控制理论对替换处理后的系统跟踪误差方程进行分析,生 成所述多智能体系统的稳定性控制条件。
[0018]
基于上述技术方案,采用期望值替换含有概率性质的不确定矩阵,可以有助于对系 统跟踪误差进行李雅普诺夫稳定性分析。
[0019]
可选的,所述方法还包括:针对每个所述跟随者与领导者的跟踪误差方程ξi(k)和系统干扰wi(k),引入h

的性能指标 函数其中,n为任意大于1的整数;通过鲁棒控制理论对所述性能指标函数进行分析,生成扰动抑制条件,所述扰动抑制条件为: 如果存在干扰抑制参数0<β<1和正定矩阵p1,p2,q1,q2,满足ω<0成立,则所述多智能体系统 中的所有智能体具有扰动抑制性能;所述利用所述多智能体系统的稳定性控制条件对每个所述跟随者的控制输入方程ui(k)进行 求解,得到所述跟随者对应的控制增益系数,包括:利用所述多智能体系统的稳定性控制条件和所述扰动抑制条件对每个所述跟随者的控制输入 方程ui(k)进行求解,得到所述跟随者对应的控制增益系数。
[0020]
基于上述技术方案,在稳定性控制条件之外,引入h

的性能指标函数来设定智能体 的扰动抑制条件,并综合稳定性控制条件和扰动抑制条件来求解跟随者对应的控制增益系数, 从而使得求解出的控制增益系数既可满足多智能体系统的稳定性需求,又可实现对噪声干扰 的有效抑制。
[0021]
第二方面,本技术实施例还提供了一种针对传输数据丢失的多智能体协同控制装置, 所述装置包括:拓扑结构分析模块,用于将多智能体系统中所有智能体分为一个领导者和多个跟随者,并利 用有向拓扑网络生成所述领导者和所述跟随者的信息交互关系;丢包概率评估模块,用于对所述信息交互关系评估,获取所述智能体两两间的数据丢失频率, 并结合伯努利分布将所述数据丢失频率转化为丢包概率分布;系统方程搭建模块,用于建立每个所述智能体的二阶动力学系统模型,并基于所述二阶动力 学系统模型建立所述跟随者和所述领导者间的跟踪误差方程;控制输入分析模块,用于基于所述跟踪误差方程、所述信息交互关系和所述丢包概率分布, 构建每个所述跟随者的控制输入方程ui(k),所述控制输入方程ui(k)包含待求解的控制增益 系数;所述系统方程搭建模块,还用于将所述控制输入方程ui(k)代入所述跟踪误差方
程,通过增 广处理生成所述多智能体系统的系统跟踪误差方程;稳定性分析模块,用于通过李雅普诺夫稳定性理论和鲁棒控制理论对所述系统跟踪误差方程 进行分析,生成所述多智能体系统的稳定性控制条件;控制增益求解模块,用于利用所述多智能体系统的稳定性控制条件对每个所述跟随者的控制 输入方程ui(k)进行求解,得到所述跟随者对应的控制增益系数;控制增益加载模块,用于将所述控制增益系数加载至每个所述跟随者的控制器中,以使所述 控制器根据所述控制增益系数控制所述跟随者。
[0022]
第三方面,提供了一种中心控制器,所述中心控制器包括处理器和存储器,所述存 储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至 少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一方面所述的针对传 输数据丢失的多智能体协同控制方法。
[0023]
第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、 至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指 令集由处理器加载并执行以实现如第一方面所述的针对传输数据丢失的多智能体协同控制方 法。
[0024]
综上所述,本技术具有以下有益效果:采用本技术公开的针对传输数据丢失的多智能体协同控制方法,将有向网络拓扑思想引入至 多智能体系统中的智能体信息交互中,并构建智能体的二阶动力学系统模型将状态模型化, 进而建立多智能体系统的跟踪误差方程,再利用李雅普诺夫稳定性理论和鲁棒控制理论对跟 踪误差方程进行分析,得出稳定性条件,从而可以通过稳定性条件求解得到能够实现多智能 体系统一致性稳定的控制增益系数。这样,将多智能体系统的智能体状态模型化,通过数理 分析得到智能体间的协同控制增益系数,可以利用控制器对智能体进行实时精确控制,从而 可以有效实现多智能体系统在存在数据丢包情况下的一致性稳定。
附图说明
[0025]
图1为本技术实施例中一种多智能体系统的场景架构示意图;图2为本技术实施例中一种多智能体协同控制方法的流程图;图3为本技术实施例中一种多智能体协同控制装置结构示意图。
具体实施方式
[0026]
为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图1-3及实施例, 对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并 不用于限定本技术。
[0027]
本技术实施例提供了一种针对传输数据丢失的多智能体协同控制方法,该方法可以 应用在如图1所示的多智能体系统中,并具体可以由多智能体系统的中心控制器来执行,多 智能体系统可以包含中心控制器和多个智能体,每个智能体对应一个控制器。该中心控制器 可以与多智能体系统中各个智能体的控制器(后续简称为个体控制器)进行数据交互,如从 个体控制器处获取智能体的内部状态数据、向个体控制器发送控制增益系数
统计出的智能体间的数据丢失频率,以伯努利分布的形式给出该数据丢失状态和数据未丢失 状态的概率:即丢包概率分布。
[0036]
步骤203,建立每个所述智能体的二阶动力学系统模型,并基于所述二阶动力学系统 模型建立所述跟随者和所述领导者间的跟踪误差方程。
[0037]
在实施中,多智能体系统中的智能体在运行时,其内部状态取值及变化可以由二阶 动力学系统模型来拟合,并进一步的,多个智能体间的一致性稳定可以由跟随者和领导者的 误差来反映。故而,针对每个智能体,中心控制器可以建立智能体的二阶动力学系统模型, 并通过二阶动力学系统模型来构建领导者和跟随者间的跟踪误差方程,以数据化领导者和跟 随者之间存在的影响一致性稳定的状态偏差。
[0038]
可选的,步骤203中智能体的二阶动力学系统模型可以分为领导者的二阶动力学系 统模型和跟随者的二阶动力学模型,相应的构建过程可以分别如下:基于所述领导者的内部 状态x0(k)和领导者控制输入r0(k),建立所述领导者的二阶动力学系统模型: 基于每个所述跟随者的内部状态xi(k)、系统干扰wi(k)以及跟随 者控制输入ui(k),建立每个跟随者的二阶动力学系统模型: [0039]
其中,k+1为相对k的下一时刻的状态,y0(k)与yi(k)为领导者与跟随者的输出, [0040]
在实施中,在构建领导者的二阶动力学系统模型时,可以考虑领导者的内部状态和 状态变化量,以及个体控制器对领导者的控制输入,因此可以基于领导者的内部状态x0(k)、 状态变化量x0(k+1)以及控制输入r0(k),建立领导者的二阶动力学系统模型而对于跟随者,同样需要考虑跟随者的内部状态和状态变化量, 以及电源控制器对跟随者的控制输入,除此之外,还可以考虑外界干扰对跟随者的影响,因 此可以基于每个跟随者的内部状态xi(k)、状态变化量xi(k+1)、系统干扰wi(k)以及控制输 入方程ui(k),建立跟随者的二阶动力学系统模型内部状 态即为各个跟随者的多维状态向量,每一维对应跟随者的一项状态参数,xi(k)代表k时刻 第i个跟随者的内部状态,xi(k+1)可以理解为下一时刻的内部状态。可以理解,领导者在 向跟随者共享自身状态时,为了实现输出一致性目标,领导者自身可以看作是一个本身就具 备抗干扰性能的智能体,因此在构建领导者的二阶动力学系统模型时可以不考虑噪声干扰。
[0041]
进一步的,基于上述构建的领导者和跟随者的二阶动力学系统模型,跟踪误差方程 的建立过程具体可以如下:基于所述领导者的内部状态和第i个跟随者的内部状态,设
定所 述第i个跟随者和所述领导者的跟踪误差方程ξi(k)=x0(k)-xi(k)-fi(k)。
[0042]
其中,fi(k)为所述第i个跟随者的系统向量,(k)为所述第i个跟随者的系统向量,为系统 编队控制信号,
[0043]
在实施中,在稳定的多智能体系统中,智能体间需要保证特定的编队形式,如当智 能体为无人机,多智能体系统为无人机编队时,无人机编队在飞行过程中,每个无人机间需 要保持固定的距离,且与其它无人机的相对位置保持不变。因此,对于这种编队形式,可以 利用系统向量fi(k)来体现,且存在(k)来体现,且存在为系统编队控制输入。不 难理解,编队形式是动态变化的,其变化量当前编队形式和系统编队控制输入两者的影响。 综上,在构建跟随者和领导者的跟踪误差方程时,不仅需要考虑跟随者的内部状态xi(k)和 领导者的内部状态x0(k),同时还需要引入上述系统向量fi(k),以保证多智能体系统的编队 稳定,从而可以得到跟踪误差方程ξi(k)=x0(k)-xi(k)-fi(k)。
[0044]
步骤204,基于所述跟踪误差方程、所述信息交互关系和所述丢包概率分布,构建每 个所述跟随者的控制输入方程ui(k)。
[0045]
其中,所述控制输入方程ui(k)包含待求解的控制增益系数。
[0046]
在实施中,中心控制器构建了跟随者和领导者间的跟踪误差方程,可以从保证二者 状态满足一致性稳定的角度出发,对跟踪误差方程进行分析,以确定出适合每个跟随者的控 制信号。同时,考虑多智能体系统内智能体间的相互干扰以及数据丢包对多智能体系统内部 的影响,可以进一步结合信息交互关系和丢包概率分布来构建每个跟随者的控制输入方程 ui(k)。
[0047]
可选的,以上述跟踪误差方程的具体形式为基础,控制输入方程ui的构建过程可以 如下:设定所述跟踪误差方程趋近于零,分析所述跟踪误差方程生成第i个跟随者的控制辅 助变量:利用所 述控制辅助变量和所述领导者的控制输入r0(k),以及所述智能体系统的系统编队控制信号 构建所述第i个跟随者的控制输入方程
[0048]
其中,k为待求解的控制增益系数。
[0049]
在实施中,当多智能体系统趋于一致性稳定时,任意跟随者和领导者间的跟踪误差 方程的取值都将趋于零,故而可以设定跟踪误差方程趋近于零,再对跟踪误差方程进行分析。 即取ξi(k)=x0(k)-xi(k)-fi(k)

0,进而可以反向求出数据传输存在丢包情况下第i个 跟随者的控制辅助变量,具体可以分为针对数据丢失状态和数据未丢失状态设计辅助变量。 以第i个跟随者智能体为例,对于数据未丢失状态,分别考虑跟随者与领导者的信息
交互, 以及跟随者与其它跟随者的信息交互,设计辅助变量以及跟随者与其它跟随者的信息交互,设计辅助变量同样,对于数据丢失状态, 也分别考虑跟随者与领导者的信息交互,以及跟随者与其它跟随者的信息交互,设计辅助变 量量这样可以在构建所述第i个跟随者的 控制输入方程ui(k)时,同时引入所述控制辅助变量和所述领导者的控制输入r0(k),以及所 述智能体系统的系统编队控制信号可以得到 不难理解,多智能体系统的一致性稳定主要 受两方面影响,其一是不同智能体内部状态的同步保持,其二是不同智能体的外界输入的一 致,因此控制输入方程ui(t)可以由控制辅助变量和外界控制输入项(包含领导者的控制输入 和系统编队的控制输入)共同组成。
[0050]
步骤205,将所述控制输入方程ui(k)代入所述跟踪误差方程,通过增广处理生成所 述多智能体系统的系统跟踪误差方程。
[0051]
在实施中,中心控制器构建了个跟随者的控制输入方程ui(k)后,可以将ui(k)代入跟 随者和领导者间的跟踪误差方程,之后可以通过增广处理的方式,由跟踪误差方程生成多智 能体系统的系统跟踪误差方程。
[0052]
具体的,中心控制器可以将代入ξi(k)= x0(k)-xi(k)-fi(k)中,并利用个体分析变换为系统分析的思想执行增广处理,从而可以构 建得到多智能体系统的系统跟踪误差方程: 其中, ξ=col{ξ1,ξ2,...,ξn},w=col{w1,w2,...,wn},in为n维单位矩阵,为克罗内克积, l
γ
(k),分别为:
[0053]
步骤206,通过李雅普诺夫稳定性理论和鲁棒控制理论对系统跟踪误差方程进行分析, 生成多智能体系统的稳定性控制条件。
[0054]
在实施中,李雅普诺夫稳定性理论是一种研究系统稳定性的理论,即探求系统的一 种平衡状态,当系统处于该平衡状态时,无论存在何种外界扰动,系统最终都会趋于回归该 平衡状态。鲁棒控制理论是用于研究一个系统中参数发生扰动时如何控制使得系统能否保持 正常工作的理论。因此,中心服务器可以对跟踪误差方程进行分析,构建适当的李雅普诺夫 函数,再利用鲁棒控制理论对多智能体系统编队一致性进行分析,以计算多智能体系统能够 在数据丢失的情况下实现均方意义下的一致性稳定的条件,即生成多智能体系统的稳定性控 制条件。
[0055]
基于上述系统跟踪误差方程基于上述系统跟踪误差方程若要多智能体系统达到群体一致性,则需要ξ(k+ 1)趋于0。故而,利用李雅普诺夫稳定性理论和鲁棒控制理论对系统跟踪误差方程进行分析, 可以得到如下稳定性控制条件:如果存在常数 适维矩阵k和正定矩阵p1,p2,q1,q2,满 足成立,则所述多智能体系统能够达到均方意义下一致稳定,其中,中的元素*表示与 元素r对称的元素r
t
,q1、q2分别为p1,p2的逆矩阵,所述适维矩阵k为矩阵形式的控制 增益系数。
[0056]
可选的,由于数据丢失为概率性事件,矩阵l
γ
(k),为不确定的,为了便于分析, 可以将矩阵l
γ
(k),转换为常值矩阵,因此步骤206的处理可以如下:获取l
γ
(k),的期望值
将所述e{l
γ
(k)},代入所述系统跟踪误差方程,以替换矩阵l
γ
(k),通过李雅普诺夫稳定性理论和鲁棒控制理论对替换处 理后的系统跟踪误差方程进行分析,生成所述多智能体系统的稳定性控制条件。
[0057]
在实施中,在对系统跟踪误差方程进行分析时,由于其包含的矩阵l
γ
(k),中存 在概率性元素,具体取值无法确定,因此可以取矩阵l
γ
(k),的期望值 利用e{l
γ
(k)},替换系统跟踪误差中 的l
γ
(k),以将二项分布的不确定值转变为确定值。继而,可以通过李雅普诺夫稳定 性理论和鲁棒控制理论对替换处理后的系统跟踪误差方程进行分析,生成所述多智能体系统 的稳定性控制条件。
[0058]
步骤207,利用多智能体系统的稳定性控制条件对每个跟随者的控制输入方程ui(k) 进行求解,得到跟随者对应的控制增益系数。
[0059]
在实施中,在分析得出多智能体系统的稳定性控制条件后,中心控制器可以利用该 稳定性控制条件反向求解多智能体系统中各个智能体的控制增益系数。具体的,中心控制器 可以基于上述稳定性控制条件对每个跟随者的控制输入方程ui(k)统一进行求解,从而可以 得到跟随者对应的控制增益系数。
[0060]
步骤208,将控制增益系数加载至每个跟随者的控制器中,以使控制器根据控制增益 系数控制跟随者。
[0061]
在实施中,中心控制器在确定了跟随者的控制增益系数后,可以将控制增益系数发 送至每个跟随者的个体控制器。个体控制器接收并加载该控制增益系数,将控制增益系数代 入跟随者的控制输入方程ui(k),以得到每个跟随者的具体控制输入,从而个体控制器可以 通过该具体控制输入对跟随者进行控制。
[0062]
可选的,可以引入h

性能指标对系统干扰进行抑制,相应的,可以存在如下处理: 针对每个所述跟随者与领导者的跟踪误差方程ξi(k)和系统干扰wi(k),引入h

的性能指标 函数通过鲁棒控制理论对所述性能指标函数进行分 析,生成扰动抑制条件,所述扰动抑制条件为:如果存在干扰抑制参数0<β<1和正定矩阵 p1,p2,q1,q2,满足ω<0成立,则所述多智能体系统中的所有智能体具有扰动抑制性能。
[0063]
其中,n为任意大于1的整数。
[0064]
在实施中,中心控制器可以针对跟踪误差方程ξi(k)和系统干扰wi(k),引入h

性能 指标函数以使多智能体系统中各智能体的内部状态 间偏差始终保持在一个界内,从而可以保证智能体的内部状态不会超出瞬时范围,以满足多 智能体系统的安全性能需求。之后,同样可以利用鲁棒控制理论,对该性能指标函数进行分 析,得到扰动抑制条件,该扰动抑制条件具体可以为:如果存在干扰抑制参数0<β<1和正定 矩阵p1,p2,q1,q2,满足ω<0成立,则所述多智能体系统中的所有智能体具有扰动抑制性能。
[0065]
进一步的,可以利用上述扰动抑制条件对控制增益系数进行求解,相应的,步骤207 的处理可以如下:利用多智能体系统的稳定性控制条件和扰动抑制条件对每个跟随者的控制 输入方程ui(k)进行求解,得到跟随者对应的控制增益系数。
[0066]
在实施中,在分析得出多智能体系统的稳定性控制条件和上述干扰抑制条件后,中 心控制器可以同时利用该稳定性控制条件和干扰抑制条件,对多智能体系统中各个智能体的 控制增益系数进行求解。具体的,中心控制器可以基于上述稳定性控制条件和干扰抑制条件, 对每个跟随者的控制输入方程ui(k)统一进行求解,从而可以得到跟随者对应的控制增益系 数,从而使得求解出的控制增益系数既可满足多智能体系统的稳定性需求,又可实现对噪声 干扰的有效抑制。
[0067]
采用本技术公开的针对传输数据丢失的多智能体协同控制方法,将有向网络拓扑思 想引入至多智能体系统中的智能体信息交互中,并构建智能体的二阶动力学系统模型将状态 模型化,进而建立多智能体系统的跟踪误差方程,再利用李雅普诺夫稳定性理论和鲁棒控制 理论对跟踪误差方程进行分析,得出稳定性条件,从而可以通过稳定性条件求解
得到能够实 现多智能体系统一致性稳定的控制增益系数。这样,将多智能体系统的智能体状态模型化, 通过数理分析得到智能体间的协同控制增益系数,可以利用控制器对智能体进行实时精确控 制,从而可以有效实现多智能体系统在存在数据丢包情况下的一致性稳定。
[0068]
本技术实施例还提供了一种针对传输数据丢失的多智能体协同控制装置,如图3所 示,所述装置包括:拓扑结构分析模块301,用于将多智能体系统中所有智能体分为一个领导者和多个跟随者, 并利用有向拓扑网络生成所述领导者和所述跟随者的信息交互关系;丢包概率评估模块302,用于对所述信息交互关系评估,获取所述智能体两两间的数据丢失 频率,并结合伯努利分布将所述数据丢失频率转化为丢包概率分布;系统方程搭建模块303,用于建立每个所述智能体的二阶动力学系统模型,并基于所述二阶 动力学系统模型建立所述跟随者和所述领导者间的跟踪误差方程;控制输入分析模块304,用于基于所述跟踪误差方程、所述信息交互关系和所述丢包概率分 布,构建每个所述跟随者的控制输入方程ui(k),所述控制输入方程ui(k)包含待求解的控制 增益系数;所述系统方程搭建模块303,还用于将所述控制输入方程ui(k)代入所述跟踪误差方程,通过 增广处理生成所述多智能体系统的系统跟踪误差方程;稳定性分析模块305,用于通过李雅普诺夫稳定性理论和鲁棒控制理论对所述系统跟踪误差 方程进行分析,生成所述多智能体系统的稳定性控制条件;控制增益求解模块306,用于利用所述多智能体系统的稳定性控制条件对每个所述跟随者的 控制输入方程ui(k)进行求解,得到所述跟随者对应的控制增益系数;控制增益加载模块307,用于将所述控制增益系数加载至每个所述跟随者的控制器中,以使 所述控制器根据所述控制增益系数控制所述跟随者。
[0069]
可选的,所述拓扑结构分析模块301,具体用于:利用图论知识将所有所述智能体设置为有向拓扑网络中的节点;生成所述有向拓扑网络的邻接矩阵a=[α
ij
],其中,i与j为相邻的智能体,i,j=1,2,...,n, 元素α
ij
=1表示第i个智能体与第j个智能体之间存在信息交互,元素α
ij
=0表示第i个智能 体与第j个智能体之间不存在信息交互。
[0070]
可选的,所述丢包概率评估模块302,具体用于:设定k时刻智能体i与智能体j进行信息交互时,包含γ
ij
(k)=0的数据丢失状态和γ
ij
(k)= 1的数据未丢失状态;根据所述数据丢失频率给出所述数据丢失状态和所述数据未丢失状态的丢包概率分布:率分布:
[0071]
可选的,所述系统方程搭建模块303,具体用于:基于所述领导者的内部状态x0(k)和领导者控制输入r0(k),建立所述领导者的二
阶动力学系 统模型:基于每个所述跟随者的内部状态xi(k)、系统干扰wi(k)以及跟随者控制输入ui(k),建立每个 跟随者的二阶动力学系统模型:基于所述领导者的内部状态和第i个跟随者的内部状态,设定所述第i个跟随者和所述领导 者的跟踪误差方程ξi(k)=x0(k)-xi(k)-fi(k);其中,k+1为相对k的下一时刻的状态,y0(k)与yi(k)为领导者与跟随者的输出,fi(k)为 所述第i个跟随者的系统向量,所述第i个跟随者的系统向量,为系统编队控制信号, [0072]
可选的,所述控制输入分析模块304,具体用于:设定所述跟踪误差方程趋近于零,分析所述跟踪误差方程生成第i个跟随者的控制辅助变量:制辅助变量:利用所述控制辅助变量和所述领导者的控制输入r0(k),以及所述智能体系统的系统编队控 制信号构建所述第i个跟随者的控制输入方程 其中,k为待求解的控制增益系数。
[0073]
可选的,所述系统方程搭建模块303,具体用于:将所述控制输入方程ui代入所述跟踪误差方程ξi(k),对所述跟踪误差方程ξi(k)进行增广处 理,构建所述多智能体系统的系统跟踪误差方程:其中, ξ=col{ξ1,ξ2,...,ξn},w=col{w1,w2,...,wn},in为n维单位矩阵,为克罗内克积,l
γ
(k),分别为:
[0074]
可选的,所述稳定性控制条件为:如果存在常数 适维矩阵k和正定矩阵p1,p2,q1,q2,满 足成立,则所述多智能体系统能够达到均方意义下一致稳定,其中,中的元素*表示与 元素r对称的元素r
t
,q1、q2分别为p1,p2的逆矩阵,所述适维矩阵k为矩阵形式的控制 增益系数。
[0075]
可选的,所述稳定性分析模块305,具体用于:获取l
γ
(k),的期望值将所述e{l
γ
(k)},代入所述系统跟踪
误差方程,以替换矩阵l
γ
(k),通过李雅普诺夫稳定性理论和鲁棒控制理论对替换处理后的系统跟踪误差方程进行分析,生 成所述多智能体系统的稳定性控制条件。
[0076]
可选的,所述稳定性分析模块305,还用于:针对每个所述跟随者与领导者的跟踪误差方程ξi(k)和系统干扰wi(k),引入h

的性能指标 函数其中,n为任意大于1的整数;通过鲁棒控制理论对所述性能指标函数进行分析,生成扰动抑制条件,所述扰动抑制条件为: 如果存在干扰抑制参数0<β<1和正定矩阵p1,p2,q1,q2,满足ω<0成立,则所述多智能体系统 中的所有智能体具有扰动抑制性能;所述控制增益求解模块306,具体用于:利用所述多智能体系统的稳定性控制条件和所述扰动抑制条件对每个所述跟随者的控制输入 方程ui(k)进行求解,得到所述跟随者对应的控制增益系数。
[0077]
本技术实施例还提供了一种中心控制器,所述中心控制器包括处理器和存储器,所 述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所 述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如步骤201-208所述 的针对传输数据丢失的多智能体协同控制方法。
[0078]
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完 成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介 质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0079]
以上均为本技术的较佳实施例,并非依此限制本技术的保护范围,本说明书(包括 摘要和附图)中公开的任一特征,除非特别叙述,均可被其它等效或者具有类似目的的替代 特征加以替换。即,除非特别叙述,每个特征只是一系列等效或类似特征中的一个例子而已。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1