一种基于有向跟随的自适应多智能体编队控制方法与流程

文档序号:18523264发布日期:2019-08-24 10:00阅读:261来源:国知局
一种基于有向跟随的自适应多智能体编队控制方法与流程

本发明涉及多智能体编队控制领域,特别是涉及一种基于有向跟随的自适应多智能体编队控制方法。



背景技术:

随着技术的发展,智能体在近几十年来引起了研究人员的极大关注,他们在通信、计算机技术、生物学、社会行为学等各个方面,都有潜在的研究价值。而随着智能时代的逐渐到来,智能体也广泛的应用在生活的各个方面,但随着应用功能的日趋复杂,通过多个简单的智能体组成的多智能体系统比单一智能体具有更大的优势。多智能体系统在军事、航天、工业等各个领域都有广泛的应用,例如无人机的编队飞行,多个卫星进行协同运行、智能体车的编队运输等等。所以,多智能体系统的协调控制在获得广泛的研究。在多智能体的协同控制研究中,又分为多智能体蜂拥控制研究、多智能体编队控制研究、多智能体一致性研究等几大类,其中多智能体编队控制研究对实际应用具有很大的价值。

智能体编队控制是一种多个智能体在达到目标队形的过程中,既能组成目标队形,又可以适应具体的环境约束的一种控制方法。多智能体编队控制已有许多种成熟的控制方法,现有的常用方法主要有基于领航-跟随者方法、虚拟结构法、基于行为的方法、基于图论、势能法的方法。虽然现有多种方法能够对智能体的编队进行精确控制,且具有良好的鲁棒性,但这些算法大部分要求能够实时获取周围智能体的状态信息,尤其是对一些有明确位置目标的智能体,需要实时获取全局智能体数据,然后根据位置信息进行控制,最后形成多智能体编队。但在实际的应用中,我们往往会发现这些前提都是不能实现的。首先,传感器都是有一定采样频率的,智能体获取自身的位置信息存在一定时间间隔,并以一定的频率发送数据。其次,智能体的通信范围是有限的,所以全局范围内的通信基本是不可能的;而且每个智能体的通信都是存在一定带宽的,在进行多个一对一的通信时会浪费大量的通信资源。另外,智能体系统可能会进入复杂环境,无法进行全局通信。最后,当智能体编队中有单一智能体出现故障时,则将无法维持原来的编队,需要进行全局重新规划。因此在基于行为法和领航-跟随法的基础上引入智能体自适应控制策略,使之能够在之感知局部智能体的情况下完成编队控制,使智能体的编队控制更好的应用于实际系统。



技术实现要素:

本发明的目的是提供一种基于有向跟随的自适应多智能体编队控制方法,以解决传统智能体系统仅具有局部通信下的编队无法控制,通信量大,部分智能体故障引发编队失败等问题。

为实现上述目的,本发明提供如下方案:

一种基于有向跟随的自适应多智能体编队控制方法,包括:

步骤1:对多智能体系统进行初始操作,包括:

获取一个由多个智能体组成的多智能体系统,保证初始状态能够连接,确定领导者,并进行编号,领导者编号为1,其他编号为2,…,n。

定义通信范围c,利用图论g(v,a)进行抽象描述。

设定最优编队之间的距离r1和斥力场作用距离r2。

确定状态信息通信和通信等级交互网的等级确定通信两种通信模式,降低通信损耗量。

步骤2:一种基于领导者的通信等级交互网方法,包括:

把领导者智能体的通信的等级定义为1,并通过领导者智能体向周围智能体发送带有等级信息的交流信息。

跟随者智能体选择周围通信等级最大的智能体作为第一跟随目标,在第一跟随目标的等级上减1即为智能体本身等级,然后向周围智能体发送带有自己通信等级的等级交流信息,直到全部确认结束。

领导者智能体需要每隔一段时间对全局进行一次通信等级更新。

步骤3:一种基于通信等级交互网,多智能体编队控制的跟随策略方法,包括:

根据智能体的稳定状态标准确认自身状态。

对于通信等级为2的跟随者智能体,只接受领导者的状态信息。

对于通信等级小于2的跟随者智能体,根据控制要求选择第二跟随者,方法如下:智能体i从能够通信的剩余智能体中选取第二跟随目标j,其中智能体j的通信等级高于或者等于智能体i,且若智能体i与智能体j同级,则智能体j处于稳定状态或者与i不具有同一第一跟随目标。若智能体i周围存在多个满足条件的智能体,则选取等级最高的智能体;若周围存在多个通信等级相同的且满足条件的智能体,则选取距离最近的智能体。

智能体只能获取跟随目标的状态信息,而对其他进行感知范围智能体,则将依据感知器进行避障操作,即斥力目标。

确定智能体i的跟随目标集合为避障集合为

步骤4:一种多智能体编队的动态切换策略方法,包括:

当存在智能体α故障时,周围以智能体α作为跟随目标的智能体β会迅速感知,智能体β确认最新等级,并进行局部通信等级更新。

当智能体α在不稳定状态感受到新的智能体时,确认新的等级,判断是否达到稳定要求,若稳定,进行局部通信更新。

步骤5:一种基于有向跟随的自适应多智能体编队控制系统,包括:

当跟随者智能体处于不稳定状态时,则需要加入领导者的引导作用,使之在趋向于领导者,从而并入编队中。

若智能体处于稳定状态即完全并入编队中,则不需要领导者的引导。

引入具有二阶动力学模型的智能体:其中xi∈rd,vi∈rd,ui∈rd分别代表智能体的位置,速度和控制输入,rd代表智能体所在的空间维数,本设计实例主要针对二维平面控制,即d=2。

设计智能体控制率:

其中ψα(z)为聚合势能函数,ψβ(z)为斥力场势能函数,k1,k2>0,c代表是否对领导者进行跟随,当智能体稳定状态时,c=0;不稳定时,c=1。

然后通过证明显示了基于有向跟随的自适应多智能体编队控制系统最终稳定,且所有智能体的速度保持一致。

本发明与现有技术相比具有如下优点:

本发明提供了一种基于有向跟随的自适应多智能体编队控制方法和系统,在多智能体系统存在单一领导者、个体只具备局部感知能力、能够获取周围智能体状态信息的情况下,定义了一种基于领导者的通信等级网,确定通信等级,为防止出现编队失败,同时为了减少智能体之间的通信损耗,提出了一种跟随的控制协议,以及相应的智能体控制率,最终通过数学推导,论证实现多智能体的编队控制(最终保持在编队内,速度一致);当多智能体编队出现单一智能体故障时,根据提出的一种通信拓扑切换的策略,最终形成新的编队控制,保证了编队的稳定性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明所提供的基于有向跟随的自适应多智能体编队控制方法流程图。

图2为本发明所提供的一个基于通信等级交互网进行等级确定的实例。

图3为本发明所提供的一个根据多智能体跟随策略进行编队控制的实例。

图4为本发明所提供的关于聚合势能函数的图示。

图5为本发明所提供的关于斥力场势能函数的图示。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种基于有向跟随的自适应多智能体编队控制方法,达到智能体自适应编队控制,进行有领导者的有向跟踪,解决只具有局部通信情况下的编队失败问题。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明所提供的基于有向跟随的自适应多智能体编队控制方法和系统整体流程图。一种基于有向跟随的自适应多智能体编队控制方法和系统,包括:

步骤1:对多智能体系统进行初始操作,包括:

步骤1.1:获取一个由多个智能体组成的智能体系统,保证初始状态智能体之间能够信息传递,这些智能体可以是无人机、潜艇、卫星、水雷等等。确定领导者,并进行编号,领导者编号为1,其他编号为2,…,n。

步骤1.2:获得智能体之间的通信半径c,利用图论g(v,a)进行抽象描述,其中v代表各个智能体,根据智能体之间的位置距离和通信范围确定获取通信拓扑结构a,当aij=1时,即智能体j能与智能体i进行通信,相反aij=0表示不能通信,由于领导者不接受其他智能体状态信息,

步骤1.3:为保证自适应智能体的编队控制,设定最优编队之间的距离r1和斥力场作用距离r2,设置r2≤r1;同时,为了防止通信范围过大对稳定的编队控制产生影响,设置r1≤c≤1.5r1。

步骤1.4:本发明多智能体编队的通信分为状态信息通信和通信等级交互网的等级确定通信两种,其中,等级交互的通信在范围内的智能体必须接收,从而确定跟随目标;对于状态信息通信,智能体采用广播式通信,其他智能体根据是否把该智能体确定为跟随目标进行选择接收,这样能够最大限度的降低通信损耗。

图2为本发明设计的一种基于有领导者的多智能体通信等级交互网实例。

步骤2:通信等级交互网的确定方法,包括:

步骤2.1:把领导者智能体的通信的等级定义为1,且领导者智能体不接收周围的等级确定信息。

步骤2.2:通过领导者智能体向周围智能体发送带有等级信息的交流信息,为防止在等级确定交流中出现混乱,可以在等级交流时在交流信息中加入领导者时间戳。

步骤2.3:每个跟随者智能体都能够接收到周围智能体发出的通信等级交流信息,在接收到的所有信息中,选择通信等级最大的智能体作为第一跟随目标,在第一跟随目标的等级上减1即为智能体本身等级,然后向周围智能体发送带有自己通信等级的等级交流信息。

步骤2.4:在跟随者智能体确定通信等级时,都要以最新的领导者时间戳代替旧的时间戳等级,从而防止出现混乱情况。

步骤2.5:当最后的智能体确定好通信等级后,此次的基于领导者的多智能体交互等级网确认完毕。

步骤2.6:在理想情况下,通信交流等级网需要随着多智能体编队的动态变化而切换,但在实际的应用中,由于自适应智能体无法获得全局信息,只能获取局部信息,所以在实际中需要领导者每隔一段时间对全局进行一次通信等级更新。

图3为本发明在基于通信等级的跟随控制策略的跟随实例,表现不同智能体的通信等级和跟随目标,可以看到部分智能体处于不稳定状态。

步骤3:基于通信等级交互网,多智能体编队控制的跟随策略方法,包括:

步骤3.1:对于领导者智能体来说,会一直处于稳定状态;对于跟随者智能体来说,通信等级为2的跟随者智能体只要在领导者的通信范围内,则都是稳定范围;通信等级为其他的跟随者智能体,只有同时存在两个跟随目标时,才处于稳定状态。

步骤3.2:对于通信等级为2的跟随者智能体,只接受领导者的状态信息。

步骤3.3:对于通信等级小于2的跟随者智能体,除了步骤2.3中确定好的第一跟随目标外,还需要当前智能体i从能够通信的剩余智能体中选取第二跟随目标j,其中智能体j的通信等级高于或者等于智能体i,且若智能体i与智能体j同级,则智能体j处于稳定状态或者与i不具有同一第一跟随目标。若智能体i周围存在多个满足条件的智能体,则选取等级最高的智能体;若周围存在多个通信等级相同的且满足条件的智能体,则选取距离最近的智能体。

步骤3.4:智能体只能获取跟随目标的状态信息,而对其他进行感知范围智能体,则将依据感知器进行避障操作,即变为斥力目标。

步骤3.5:对于智能体i的跟随目标集合为避障目标集合为整个智能体系统跟随矩阵为a1(t),避障矩阵为a2(t),且满足a1(t)+a2(t)=a(t)。

步骤4:当局部智能体通信拓扑结构由于智能体故障发生变化,或者是智能体故障,或者增加新的智能体,多智能体编队的动态切换方法,包括:

步骤4.1:当存在智能体α故障时,周围以智能体α作为跟随目标的智能体β会迅速感知,然后向另一跟随目标发送等级确认信息,若另一跟随目标也是β智能体,则回复无法确定,若另一跟随目标正常回复,则确认智能体β等级,加入智能体α编号,不会影响的通信等级,发送新的更新信息,进行局部更新。

步骤4.2:当智能体α在不稳定状态感受到新的智能体时,将会向周围发送等级确认信息,收到回复后确认新的等级,判断是否达到稳定要求,若稳定,加入智能体α编号,不会影响的通信等级,发送新的更新信息,进行局部更新。

步骤5:当智能体系统中的智能体存在不稳定状态时,若出现智能体故障或者通信受阻,则会把多智能体的单一编队分成两个或者多个,从而造成编队失败,使一些跟随者不能重返编队中,所以保持每个跟随者智能体处于稳定状态对编队控制其重要作用。一种基于有向跟随的自适应多智能体编队控制系统,包括:

步骤5.1:当跟随者智能体处于不稳定状态时,则需要加入领导者的引导作用,使之在趋向于领导者,从而并入编队中。若智能体处于稳定状态即完全并入编队中,则不需要领导者的引导。

步骤5.2:这里考虑的智能体具有二阶动力学模型:其中xi∈rd,vi∈rd,ui∈rd分别代表智能体的位置,速度和控制输入,rd代表智能体所在的空间维数,本设计实例主要针对二维平面控制,即d=2。

步骤5.3:确认系统稳定条件:rank(l(t))=n(t)-1,其中n(t)代表保持编队的智能体,l(t)为在时间t时a(t)的laplace变换,lij(t)=-aij(t),i≠j;

步骤5.4:设计智能体控制率:

其中ψα(z)为聚合势能函数,ψβ(z)为斥力场势能函数,k1,k2>0,c代表是否对领导者进行跟随,当智能体稳定状态时,c=0;不稳定时,c=1。

图4为聚合势能函数曲线,其中r1=10,c=16。

图5为斥力场势能函数曲线,其中r2=10,c=16。

步骤5.3:当智能体i处于不稳定状态时,此时c=1,即把领导者作为引导量。若智能体i具有一个跟随目标,智能体i的理想运动轨迹为以跟随目标智能体为圆心,最佳距离r1为半径,向领导者方向的圆弧,停留在跟随目标智能体与领导者连线中,然后向领导者前进,最终,智能体稳定。若不稳定智能体没有跟随目标,则将进全速向领导者前进,直到稳定。

步骤5.4:对于处于稳定状态的智能体进行编队控制,领导者速度在短时间内不变的一致性分析:

这里u1=0。

由于此时等级为2的智能体只存在对领导者的跟随和对等级3和等级2智能体的斥力,由于r2≤r1,所以可以不考虑等级3的智能体,首先由等级1-2智能体组成的多智能体系统进行分析。

由于为正定矩阵,则所以q1(t)是一个非增函数,最终当时,系统稳定,所有等级1-2的智能体速度一致,编队位置不再变动。

由上可知,领导者为2的智能体处于稳定状态,在考虑等级为2及其以下所有稳定的智能体组成的多智能体系统

由于为正定矩阵,则所以q2(t)是一个非增函数,最终当时,系统稳定,整个智能体的编队控制平稳。

步骤5.5:多智能体系统在编队发生通信拓扑切换时,若存在不稳定智能体,则依据步骤5.3证明,最终达到稳定状态,然后进行编队的一致性控制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1