一种恶意环境下的多智能体系统安全趋同控制方法

文档序号:9707627阅读:883来源:国知局
一种恶意环境下的多智能体系统安全趋同控制方法
【技术领域】
[0001] 本发明涉及多智能体系统协调控制技术领域,特别是涉及一种具有抵御恶意攻击 能力的多智能体系统安全趋同控制方法。
【背景技术】
[0002] 多智能体系统(multi-agent systems)是一群具备一定的感知、通信、计算和执行 能力的智能体通过通讯等方式关联成的一个网络系统。所谓趋同(consensus)控制问题,是 指通过设计合适的控制协议,使得多智能体系统中所有个体的状态值渐进地或者有限时间 内趋于一致。趋同控制在军事、航天、工业等各个领域具有十分广阔的应用背景,如多机器 人编队、多卫星系统、自动化公路调度、无线传感器网络的协调控制等都是其典型的应用实 例。而安全趋同控制,则在趋同控制的基础上,提出了更高的控制要求。安全趋同控制的基 本思想是通过对网络中的正常智能体施加控制,使得其在执行趋同协议中,能够抵御恶意 智能体的攻击行为,确保自身状态始终处于一个容许范围(安全域)内变化,并最终趋于一 致。近些年来,随着计算机技术的发展和网络系统的日益普及,多智能体系统趋同控制的安 全性问题越来越受到国内外专家的关注。
[0003] 传统的安全趋同控制方法主要存在以下两方面的不足:一方面,这些控制方法均 假定系统个体之间的通信是理想的状况,即各智能体能实时地交互信息。然而对于实际的 通信网络,时延是普遍存在且不可避免的。更有甚至,存在一类恶意智能体,能通过特殊的 攻击手段使得通信链路产生特定的时延;另一方面,目前大部分协议是针对静态的网络拓 扑,即按照固定的通信线路来设计协议,而这往往无法应对一些灵活可移动的恶意攻击节 点,具有一定的应用局限性。

【发明内容】

[0004] 本发明要克服上述控制方法的不足,提出一种在恶意环境下,具有适应时变网络 和通信时延能力的多智能体系统安全趋同控制方法。本发明所设计控制方法较以往控制方 法,对节点灵活的攻击方式具有强的鲁棒性,而且适用于具有通信时延的网络环境,这就是 本发明的形成动机。
[0005] 本发明的目的在于对具有恶意攻击和通信时延双重影响下的多智能体系统网络, 提出一种具有抗恶意攻击和时延能力的安全趋同控制方法,从而拓宽多智能体系统趋同控 制的研究应用范畴。
[0006] 本发明解决其技术问题所采用的技术方案是:
[0007] 恶意环境下的多智能体系统安全趋同控制方法,包括以下步骤:
[0008] 步骤1.建立数学模型。考虑由η个节点组成的多智能体系统网络,网络中一个节点 代表一个智能体。假定网络中包含有ns个正常节点和n a个恶意节点,满足ns+na = n。第i个正 常节点的动态模型为:
[0009] xi(k+l) =Xi(k)+Ui(k), i ^Vs (1)
[0010] 其中xi(k)和m(k)分别为节点i在k时刻的状态值和控制输入,Vs表示所有正常节 点的集合。另外假定系统中所有恶意节点的动态方程是未知的,它们不按照所设计的控制 协议更新自身状态值,具有任意改变自身状态值的能力,并能制造虚假信息发送给周围正 常节点,致使正常节点在更新状态时因采用这些虚假信息而发生错误,从而达到破坏整个 网络趋同进程的目的。
[0011] 步骤2.控制方法设计。根据上述建立的数学模型,以及恶意节点的攻击特点,接下 去我们给出详细的控制器设计方法。本发明考虑网络中所有正常节点未知其他节点的识别 序号,在仅知道周围邻居中至多拥有不超过f个邻居为恶意节点的前提下,即Iκ n va| < f, Vi e Fs,fez+,其中va表示所有恶意节点的集合,z+表示正整数,根据自身状态和邻居的时 延状态信息设计控制器。具体步骤如下:
[0012] 步骤21:初始化系统
[0013] 令k = 0,初始化系统,所有正常节点赋予初始状态值;
[0014] 步骤22:计算删减自适应参数
[0015]在第k轮时刻,正常节点i将该时刻收获的所有的信息值dk-cUjkDjeNi进行 整理后,按数值的大小作降序排列,其中j表示此时给节点i传送信息的节点,du(k)为i和j 之间的通信时延,K为节点i的邻居集,即所有能够发送信息给节点i的的节点集。记m(k)为 k时刻节点i的邻居总个数,ri(k)为控制器删减自适应参数,n(k)的值按照如下规则给定:
[0016]
(2)
[0017] 步骤23:创建删减规则
[0018] 基于步骤22求得的删减自适应参数^(1〇,我们接下来创建节点删减规则:如果节 点i整理的序列中有不少于^(1〇个值严格大于自身状态值 Xl(k),那么将序列中前^(1〇个 值移除,如不足^(1〇个,则将这些大于^(1〇的值全部移除;同样地,如果序列中有不少 Γι (k)个值严格小于自身状态值Xl(k),那么将序列中后^(1〇个值移除,如不足^(1〇个,则将 这些小于^仏)的值全部移除;
[0019] 步骤24:设计控制协议
[0020] 根据步骤23中删减完后保留的信息值,给节点i设计如下趋同控制协议:
[0021] 尸?
[0022] 结合之前个体的动态方程,控制系统闭环方程为:
[0023] Μ
[0024] 式子中各数学符号含义如下:
[0025] du(k)为节点j到节点i的通信时延,满足e {0Λ…,:?,常数3为通信时 延上界,满i
3考虑各节点获取自身状态时不 存在时延,即di,i(k)=o,W e %加,2〇为节点i和j之间的通信权重,且令= 1; 函数^(/<〇兰1,当节点i在步骤2中保留节点j的信息时,5i,j(k) = l,否贝Ι?δ?,」(1〇=0;
[0026] 步骤5:循环设置
[0027] 令k = k+l,转到步骤22。
[0028] 步骤3.趋同条件分析。首先依据代数图论知识,在这里提出r-健壮网络的概念:对 于一个有向通信网络,如果节点集V中任意一对子集,记作Si, S2,至少存在一个节点ieSk,k =1,2,满足|NASk| 2r,rez+,则称该网络是r-健壮网络。通过对r-健壮网络概念的引入, 进而我们可以得到如下趋同条件:
[0029]对于一个恶意攻击环境下的多智能体系统网络,如果正常节点周围邻居中至多拥 有不超过f个邻居为恶意节点,且满足2f+l-健壮网络属性,那么每个正常节点在本发明控 制方法作用下,它们的状态值能够保持在一个安全区域内发生变化且能够最终实现一致, 而且与网络的通信时延无关。
[0030]本发明与现有技术相比其显著优点在于:
[0031 ] 1、本发明方法针对动态的网络拓扑提出,相较于传统固定拓扑的趋同控制方法, 可应对一类灵活可移动的攻击节点,适用性更加广泛;
[0032] 2、适用于存在通信时延的网络。实际环境中通信时延是普遍存在且不可避免的, 因此是设计控制器的时候考虑时延问题是十分有必要的;
[0033] 3、本发明的控制器仅用周围邻居节点的时延信息作为控制输入,无需其他额外的 信息量,最大程度地节省了网络通信和计算成本。
【附图说明】
[0034] 图1为本发明中针对恶意节点和通信时延环境下的多智能体系统控制器设计结构 图;
[0035] 图2为本发明实施例建立的具有4个正常节点和3个恶意节点组成的多智能体系统 有向拓扑结构图;
[0036] 图3为在满足2-健壮网络结构下的各小车各时刻速度的表现图;
[0037] 图4为在不满足2-健壮网络结构下的各小车各时刻速度的表现图。
【具体实施方式】
[0038]参见图1,并结合实施例对本发明做进一步的详细说明。
[0039] 1)建立数学模型。考虑由η个节点组成的多智能体系统网络,网络中一个节点代表 一个智能体。假定网络中包含有n s个正常节点和na个恶意节点,满足ns+na = n。第i个正常节 点的动态模型为:
[0040] xi(k+l) =Xi(k)+Ui(k), i ^Vs (1)
[0041] 其中Xi(k)和m(k)分别为节点i在k时刻的状态值和控制输入,¥3表示所有正常节 点的集合。另外假定系统中所有恶意节点的动态方程是未知的,它们不按照所设计的控制 协议更新自身状态值,具有任意改变自身状态值的能力,并能制造虚假信息发送给周围正 常节点,致使正常节点在更新状态时因采用这些虚假信息而发生错误,从而达到破坏整个 网络趋同进程的目的。
[0042] 2)控制方法设计。根据上述建立的数学模型,以及恶意节点的攻击特点,接下去我 们给出详细的控制器设计方法。本发明考虑网络中所有正常节点未知其他节点的识别序 号,在仅知道周围邻居中至多拥有不超过f个邻居为恶意节点的前提下,即iNiflVal Vi £ Fs,feZ+,其中Va表示所有恶意节点的集合,Z+表示正整数,根据自身状态和邻居的时 延状态信息设计控制器。具体步骤如下:
[0043]步骤1:初始化系统
[0044] 令k = 0,初始化系统,所有正常节点赋予初始状态值;
[0045] 步骤2:计算删减自适应参数
[0046] 在第k轮时刻,正常节点i将该时刻收获的所有的信息值dk-cUjkDjeK进行 整理后,按数值的大小作降序排列,其中j表示此时给节点i传送信息的节点,du(k)为i和j 之间的通信时延,K为节点i的邻居集,即所有能够发送信息给节点i的的
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1