本发明涉及多智能体系统技术领域,具体涉及一种基于图上信号粗化的多智能体系统一致性方法。
背景技术:
多智能体系统的分布式协同控制技术倍受关注,已被广泛应用在无人机编队控制、工业生产、交通控制、传感器网络等诸多领域。多智能体系统是由一组具备一定存储、通信、计算能力的智能体通过某种通信方式构成的网络化系统。整个系统需要利用智能体之间的相互合作来完成复杂任务和智能行为,但系统中各个智能体的设计相对简单且只能与其相邻的智能体进行信息交互而不能获得全局的信息,因此需要设计合适的算法对智能体进行协同控制。
在分布式协同控制中,一致性问题是最基础、最经典的问题。一致性是指在一致性算法的控制下,智能体之间通过局部的通信,仅依赖于邻居的信息更新自己的状态,最终使得所有智能体的状态达到一致。一致性算法指每个智能体在与它相邻智能体之间进行信息交换的过程中所遵循的交互规则。在所有一致性算法中,以节点初始值的均值为收敛目标的平均一致性算法是一类最重要的算法,其应用最为广泛。
收敛速度是评价一致性算法好坏的一个重要指标,更快的收敛速度意味着更强的鲁棒性,更高的工程应用价值。在数学、计算机科学、通信及控制理论领域,有大量研究者致力于如何提高多智能体系统一致性的收敛速度。
近年来,图信号处理理论蓬勃发展,该理论将传统信号处理中的概念拓展至图结构上,是研究非规则域信号的有利工具。很多学者对多智能体系统的一致性问题和图信号处理之间的关系进行研究。izumis,chail和mourajmf等人提出把多智能体系统建模成无向图,将智能体的初始状态视为初始的图信号值,多智能体系统的每一次协同的过程对应于图信号经过一次低通滤波。每个智能体的局部控制器可以视为图滤波器,根据节点的状态方程来设计图滤波器的核函数系数,从而得出一致性协议。izumis,azumasi和sugiet等人提出的算法中,图滤波器的系数是选取图拉普拉斯矩阵的最大特征值的倒数,这种算法实现了渐近时间平均一致性;yijw,chail等人提出的算法中,图滤波器的系数是选取图拉普拉斯矩阵的所有不同非0特征值的倒数,这种算法实现了有限时间平均一致性。但在系统规模较大(图的节点数较多)时,上述方法的收敛速度较慢。
技术实现要素:
本发明所要解决的是现有多智能系统实现一致性的收敛速度较慢的问题,提供一种基于图上信号粗化的多智能体系统一致性方法。
为解决上述问题,本发明是通过以下技术方案实现的:
基于图上信号粗化的多智能体系统一致性方法,具体包括步骤如下:
步骤1、将多智能体系统中智能体的数据作为图信号模型中的节点信号,并根据智能体之间的通信情况作为图信号模型的拓扑结构,由此建立多智能体系统的图信号模型即初始图;
步骤2、先对初始图使用单跳采样算法,选取出超节点并划分出每个超节点对应的局部集;再对超节点进行边的连接,得到粗化图;
步骤3、对于每个超节点,利用其所对应局部集内的其他节点的信号值进行加权平均,作为该超节点的当前信号值;
步骤4、利用粗化图的拉普拉斯矩阵的特征值设计图滤波器的核函数系数,并将超节点的当前信号值通过所设计的图滤波器进行迭代,使得所有超节点的当前信号值均达到设定的信号平均值;
步骤5、当所有超节点的当前信号值均达到设定的信号平均值后,各个超节点将其当前信号值传输给所对应局部集内的其他节点,以使所有节点的信号值达到平均一致,整个多智能体系统实现平均一致。
上述步骤2中,超节点的连边规则是:若分属不同局部集内的节点在初始图中有边连接,则对应局部集内的超节点有边连接。
上述步骤4中,图滤波器的核函数系数εt始终等于粗化图的拉普拉斯矩阵的最大特征值λp,其中p表示粗化图的拉普拉斯矩阵的特征值的个数,t表示迭代次数。
上述步骤4中,图滤波器的核函数系数εt为:
其中,λ1<λ2<…<λp-1<λp表示粗化图的拉普拉斯矩阵的各个特征值,p表示粗化图的拉普拉斯矩阵的特征值的个数,t表示迭代次数。
与现有技术相比,本发明基于对图上信号降维处理的思想,对多智能体系统构建的初始图信号模型进行超节点的选取和局部集的划分,通过对局部集内的协同获取超节点的信号值,再利用粗化图的拉普拉斯矩阵特征值设计图滤波器的核函数,超节点的信号经过图滤波器迭代达到平均值后,传输给其邻居节点,使所有节点信号值达到平均一致。本发明可以显著提高一致性收敛速度并降低计算量。
附图说明
图1为一种基于图上信号粗化的多智能体系统一致性方法的流程图。
图2为初始图信号模型示意图。
图3为单跳采样生成的粗化图。
图4为文发明在不同方法下的仿真结果,其中(a)为图滤波器系数取最大特征值倒数方法下;(b)为图滤波器系数取所有不同非0特征值倒数方法下。
图5为在各种规模大小的多智能体系统情况下,izumis等人提出方法与本发明发明的对比结果。
图6为在各种规模大小的多智能体系统情况下,yijw等人提出方法与本发明发明的对比结果。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实例,并参照附图,对本发明进一步详细说明。
参见图1,一种基于图上信号粗化的多智能体系统一致性方法,其具体包括步骤如下:
步骤1:多智能体系统图信号模型的建立。
建立多智能体系统的图信号模型g=(v,e,w),将系统中的多智能体包含的数据作为图信号模型中的节点信号,之后根据系统中各个智能体之间的通信情况,构造网络的图信号模型中的拓扑结构,即图结构模型。建立好图信号模型的权矩阵w,度矩阵d和拉普拉斯矩阵l,以及全局图信号矩阵x。
建立多智能体系统的图信号模型g=(v,e,w),v={1,2,…,n}是图中的节点的集合,即表示网络中各个智能体。边的集合用e={eij}表示,eij表示节点i和节点j之间有边相连接。当两个智能体之间可以之间交互信息时,我们把对应的节点相连接。w表示的是权矩阵,它是一个对称矩阵(wij=wji)。当节点i和节点j之间有边连接,则wij=wji=1,反之则为0。我们使用非归一化的拉普拉斯矩阵,
l=d-w(1)
其中l表示拉普拉斯矩阵,d为度矩阵,它的第i个主对角线元素
l=uλut(2)
系统中智能体的数据在该模型中为图信号集合x=[x1,x2,…,xn]t,其中n为网络中传感器节点的个数。
在图信号处理中,图傅立叶变换是指图信号x=[x1,x2,…,xn]t在所对应的图拉普拉斯矩阵的特征向量上的投影,即
绝对值较大的特征值对应于图信号的相对高频部分,绝对值较小的特征值对应于相对低频部分。
步骤2:生成粗化图。
首先,对多智能体系统建模成的初始图信号模型g使用单跳采样算法来进行超节点的选取和局部集的划分。单跳采样算法是一种贪婪算法,即每个节点都能划分到某个局部集,局部集之间不会有交叉部分。算法的过程如下:
1)在图模型g中找到度最大的节点,作为一个超节点,将该节点及其一阶邻居节点以及它们之间的边划分在一个局部集内;
2)在图中去掉此局部集以及局部集内的节点与局部集外的节点相连的边,得到剩余部分的图;
3)对剩余部分的图重复操作1)和2),直到所有节点都划分在某个局部集内。
对选取出的超节点个数记为m,每个超节点都对应有一个局部集。
接着,对超节点进行边的连接,得到粗化图gs。连边规则:若分属不同局部集内的节点在初始图中有边连接,则对应的局部集内的超节点有边连接。
步骤3:局部集内协同。
对局部集内的节点作一次协同,来获取超节点的信号值。对每个超节点而言,可以直接交互得到所在的局部集内其它节点的信息。超节点获取其他节点的信号值后做一次加权平均作为自己协同后的信号值,
其中fj表示第j个超节点协同后的信号值,fj表示第j个局部集所包含的所有节点的信号值之和,j=1,2…,m,n是初始图g的节点个数,m是采样后得到的超节点个数。超节点信号值集合f=[f1,f2,…fm]t。
步骤4:超节点协同。
将超节点信号值f通过图滤波器h,迭代直到所有超节点信号值达到设定的信号平均值。
图滤波器h的核函数h(λ)=1-εtλ,一致性协议的关键在于对εt的设计。这里使用粗化图gs的拉普拉斯矩阵ls的特征值进行设计。求解ls的不同特征值为0=λ1<λ2<…<λp=λmax。对εt的设计方法有两种:
1)取固定特征值方法:εt=λp。这种方法只用到粗化图的拉普拉斯矩阵的最大特征值,属于渐近时间一致性。
2)取不同非0特征值方法:
步骤5:超节点的信号值经过滤波达到平均值后传输给其局部集内的邻居节点,使所有节点达到平均一致。整个系统实现平均一致。
下面通过具体仿真实例,对本发明的性能进行进一步说明:
仿真实例1:
建立一个节点编号为1-9,信号初始值x(0)=[-98-36-57-24-6]t的图模型如图2所示。图中节点3的度最大,选取作为第一个超节点,编号为a,将它的邻居节点1,2,4,5及它们之间的边整体划为一个局部集;然后去掉节点4与节点6、节点5与节点6、节点5与节点7之间的边,在剩下图的部分中选取节点7为第二个超节点(当有节点的度大小相同时,依据编号顺序选取),编号为b,与节点6、8及它们之间的边构成第二个局部集;最后节点9单独构成第三个局部集,第三个超节点的编号为c。初始图节点数量为9,粗化图节点数量为3,
仿真实例2:
给出izumis等人提出方法和本发明发明的对比。izumis等人提出方法的迭代公式为,x(t+1)=(i-εtl)x(t),其中
表1izumis等人提出方法、本发明算法时间的对比(单位:秒)
仿真实例3:
给出yijw等人提出方法和本发明发明的对比。yijw等人提出方法的迭代公式为x(t+1)=(i-εtl)x(t),其中
表2yijw等人提出方法、本发明算法时间的对比(单位:秒)
需要说明的是,尽管以上本发明所述的实施例是说明性的,但这并非是对本发明的限制,因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下,凡是本领域技术人员在本发明的启示下获得的其它实施方式,均视为在本发明的保护之内。