基于生物捕食能量模型的无人机集群自主任务分配方法与流程

文档序号:20697503发布日期:2020-05-12 15:11阅读:158来源:国知局
基于生物捕食能量模型的无人机集群自主任务分配方法与流程

本发明是一种基于生物捕食能量模型的无人机集群自主任务分配方法,用以解决未知动态环境下无人机集群搜索和打击多目标的任务规划问题,属于多无人系统决策与控制领域。



背景技术:

在当前无人机设计追求小型化、轻载荷、隐蔽化的趋势之下,通过单一无人机实现复杂任务的可能性正在逐渐减小。相比之下,无人机集群利用互补性能优势来协作完成任务,不仅能够维持低成本研制,同时提升了系统整体多任务状态下的执行鲁棒性,在军用和民用领域均具有良好的应用前景。然而,在特定任务驱动下如何分配集群中每架无人机的子任务,使其在保证个体运动和资源消耗等约束的前提下,最大化地提升集群系统的整体任务效能,是目前多无人系统智能决策领域亟待解决的难题。其中,任务载荷的均衡性作为维持系统在未知环境中任务效能鲁棒性的一项关键性指标,是多无人系统协同任务规划与智能决策应该重点考虑的问题。

目前,无人机集群自主协同任务分配方法主要侧重于集中式规划算法,包括混合整数线性规划(mixedintegerlinearprogramming,milp)、马尔科夫决策方法(markovdecisionprocesses,mdp)以及鸽群算法(pigeon-inspiredoptimization,pio)、粒子群算法(particleswarmoptimization,pso)、遗传算法(geneticalgorithm,ga)等启发式智能优化算法。然而,集中式规划方法存在一个显著的缺陷,即对中心规划节点的依赖性。当通信需求过高或中心节点失效时,集中式规划算法便无法正常工作,即缺乏任务规划鲁棒性。另一方面,分布式规划算法(如拍卖算法、bundle算法等)能够克服传统集中式算法的缺陷,通过每架无人机的自主决策避免对中心节点的依赖,但规划结果的一致性与未知动态环境下的任务效能持久性和鲁棒性是其亟待攻关的难题。

自然界中诸如狼群、野狗等猛兽群体在捕食猎物过程中会采用短距、协作的捕食策略。其中,捕食前后的群体能量能够呈现吸收和消耗的均衡性,即保证捕食群体能量的鲁棒性。猛兽群体捕食过程采取的是分布式决策,而其能量模型所体现的均衡特性与无人机集群自主任务规划的任务效能鲁棒性要求也是相符的。因此,基于生物捕食群体能量模型设计无人机集群分布式协同任务分配方法,对于有效解决无人集群系统自主协同任务规划与智能决策问题有重要的借鉴意义。



技术实现要素:

本发明是一种基于生物捕食能量模型的无人机集群自主任务分配方法,其目的是提供一种支持任务载荷均衡性、保证未知动态环境下任务效能鲁棒性的分布式任务分配模型,以解决传统集中式规划方法对中心节点的依赖性和传统分布式规划方法的一致性等关键技术问题。

本发明针对无人机集群智能自主决策问题,结合猛兽群体捕食过程的能量均衡模型,设计了一种基于生物捕食能量模型的无人机分布式协同任务分配方法,具有无中心依赖、一致性、任务载荷均衡性等优点。该方法的具体实施步骤如下:

步骤一:协同任务分配初始化

未知环境下无人机集群动态任务可分为侦察(搜索拟定目标)和打击(释放任务载荷)两类。其中,侦察任务不消耗机载资源,而打击任务消耗资源。

s11、侦察任务初始化

对于侦察任务,需要初始化以下参数和变量:

sr(i)={vr(i),θr(i),rr(i),t(i),wp(i),e(i)}i∈nu(1)

其中,i为无人机编号;nu为无人机集群规模;sr为侦察任务状态集;为无人机巡航空速;为无人机侦察航向;为无人机侦察半径;为无人机已搜索到的目标集合;为上一次处于侦察任务时的无人机三维位置坐标;为侦察区域终点。

s12、打击任务初始化

对于打击任务,需要初始化以下参数和变量:

其中,sa为打击任务状态集;为无人机攻击目标空速;为无人机攻击航向;为无人机打击资源量;为无人机打击目标期望消耗的资源量;为无人机攻击半径;为无人机等待攻击的目标集合;为无人机攻击编队的期望同时到达时间。无人机攻击速度和方向满足以下关系:

其中,pu(i)=[pux(i),puy(i)]t为第i架无人机水平位置,pux(i)为其横轴位置坐标,puy(i)为其纵轴位置坐标;pt(j)=[ptx(j),pty(j)]t为第j个目标水平位置,nt为已搜索到的目标数量,ptx(j)为其横轴位置坐标,pty(j)为其纵轴位置坐标;t为当前时刻。

s13、启动未知环境目标搜索

初始化任务切换模态p∈{1,2,3}。其中,p=1表示处于侦察任务;p=2表示处于打击任务;p=3表示处于任务分配阶段。在起始时刻,每架无人机启动目标搜索,即进入侦察任务p=1。同时,初始化以下全局通信规划状态矩阵为零矩阵:发送组队请求的引领无人机编号矩阵全局响应配对矩阵其中gres(i1,i2)=1表示第i1架跟随无人机响应第i2架引领无人机的组队请求;协同打击决策矩阵其中gnot(i1,i2)=1表示第i1架引领无人机确定与第i2架跟随无人机进行协同打击。

步骤二:引领-跟随全局信息交互

s21、引领者广播协同请求

在侦察任务状态下,若第i架无人机发现第j个目标,即||pu(i)-pt(j)||<=rr(i),则第i架无人机作为对第j个目标实施打击的群体引领者,向集群发送协同打击请求,即greq(i)=1。同时,将j分别加入集合t(i)和ta(i)。若同时发现nm≤nt个目标,则将其组成一个协同打击目标集合第i架无人机作为集合cm(i)的群体引领者。另外,任务切换模态p(i)=3,进入任务分配阶段;当多架无人机同时发现一个目标时,距目标最近的无人机作为其群体引领者。

s22、跟随者响应协同请求

对于任意处于侦察任务状态的无人机i′,当接收到引领者i发送的协同打击请求后,若其资源量满足ru(i′)>εr(εr≥0为每架无人机保留的最低资源量),则向引领者i回馈响应信息gres(i′,i)=1,成为群体跟随者。任务切换模态p(i′)=3,进入任务分配阶段,等待分配结果gnot(i)。

s23、引领者进入打击任务预分配阶段

引领者i在发送协同打击请求后的tw个通信周期内始终接收跟随者响应信息,tw个通信周期后转步骤三。其中,通信周期受通信拓扑结构影响,通信拓扑需要保证在一定通信周期内广播信息能够被所有无人机接收。

步骤三:基于生物捕食总能量关系的打击任务预分配

s31、生成引领-跟随打击编队总集合

为引领无人机i接收到的跟随者集合,其中nr=|cres(i)|为跟随者数量,则引领无人机i根据组合关系生成集合{i,cres(i)}的幂集其中表示幂集ct(i)所包含的原集合{i,cres(i)}及其子集数量,则ct(i)构成打击编队总集合。

s32、根据生物捕食总能量关系进行编队子集预分配

对于打击编队总集合ct(i)中的第k个子集计算其打击资源的映射生物捕食总能量若满足则该子集符合捕食总能量关系,其中rt(j)为第j个目标需要消耗的打击资源量。对每个子集的生物捕食总能量依次轮询后,符合总能量关系的子集组成第i架无人机的任务预分配集合cu(i)。若则第i架无人机返回侦察任务,即p(i)=1。

步骤四:基于生物捕食能量均衡模型的协同打击任务分配

s41、计算期望消耗资源量

对于任务预分配集合cu(i)中的每个子集,按下式计算其包含的每架无人机期望消耗资源量:

其中,表示cu(i)中的第n个子集;p∈cn表示第p架无人机,其为子集cn中元素。表示子集cn中满足生物捕食能量均衡条件的无人机集合,即有

s42、计算预分配子集生物捕食能量收益值

根据期望消耗资源量,可通过下式得到cu(i)中每个子集的生物捕食能量收益值。对于参与消耗资源的无人机,其剩余资源量相同,而因资源欠缺未参与消耗的无人机,则保留打击资源,保证任务载荷的均衡性。

其中,q(p)为第p架无人机的期望剩余资源量;sin(cn)表示子集cn的生物捕食能量收益值;qin为能量收益平衡系数,其取值范围满足

s43、计算预分配子集生物捕食能量均衡模型

通过下式计算得到子集cn的生物捕食能量代价值:

其中,sout(cn)表示子集cn的生物捕食能量代价值;l(p)为第p架无人机到达目标集合cm(i)中的第1个攻击目标所需航程;j1为cm(i)中的第1个攻击目标编号。由于侦察目标打击采取连续攻击方式,所有无人机对cm(i)中后续目标打击所需航程均相同,在此忽略其对能量代价的影响。hu(p)为第p架无人机当前高度;ha为无人机攻击高度;qout为能量代价平衡系数,其取值范围受侦察距离和打击区域面积影响。

子集cn的捕食能量均衡模型可表示为es(cn)=sin(cn)-sout(cn)∈[-1,1]。

s44、选取最优预分配子集

对于第i架无人机任务预分配集合cu(i)中的每个子集计算其生物捕食能量均衡模型,选取能量均衡值最高的子集为第i架无人机针对目标序列cm(i)的最优预分配子集,并记为

步骤五:基于机会性捕猎协商的打击任务冲突消解

s51、引领无人机共享最优预分配子集

每架引领无人机通过广播将最优预分配子集任务预分配集合子集数|cu|与最优能量均衡值发送给其他引领无人机,同时接收邻域内其他引领无人机广播信息。对于第i架无人机(引领无人机),构建邻域引领无人机集合其中ω为当前时刻的集群引领无人机集合。因此,对于第i架无人机,判断其邻域引领无人机的最优预分配子集是否满足若是,更新并继续执行步骤s51直至已经遍历;否则,转步骤s52。若已经遍历,转步骤s53。

s52、根据机会性捕猎协商机制确定协同打击决策

根据机会性捕猎协商机制,判断引领无人机i与是否满足若是,则更新并返回步骤s51;否则,令更新cres(i)=cres(i)-γ(i)并返回步骤s31。

s53、确定协同打击编队同时到达时间

对于计算编队同时到达时间并转步骤六,其中η>1为追击速度增益。η越大追击速度越快,但需满足最大飞行速度约束。

步骤六:输出和执行协同任务分配结果

s61、输出协同打击决策矩阵

对于第i架无人机(引领无人机),令gnot(i,p)=1,即无人机集合构成协同打击编队。输出协同打击决策矩阵gnot,并广播通知跟随无人机p。若wp(p)非空,则分别更新无人机侦察任务三维位置坐标wp(p)=pu(p);任务切换模态转为打击任务,即p(p)=2。

s62、执行协同打击任务

协同打击编队根据va、θa和ha对目标集cm(i)中各目标依次执行协同打击。若打击编队与同一目标相对距离均小于攻击半径ra时,则该目标协同打击完成,ta(i)集合移除该目标且当目标集cm(i)所有目标均打击完成后,任务切换模态转为侦察任务,即p(i)=1且p(p)=1。引领无人机与编队无人机均返回各自航点wp;当到达侦察区域终点e时,集群任务结束。

本发明提出了一种基于生物捕食能量模型的无人机集群自主任务分配方法,提供一种支持任务载荷均衡性、保证任务效能鲁棒性的分布式任务分配模型。本发明采用分布式规划架构,避免传统集中式规划方法对中心规划节点的依赖性。同时,借鉴猛兽群体在捕食过程中呈现的生物捕食能量均衡模型,克服传统分布式规划方法的一致性、任务效能鲁棒性等瓶颈,能够有效支撑无人机集群在未知动态环境下执行长时、持久性搜索、打击等资源消耗型任务。

附图说明

图1本发明执行步骤流程图

图2仿真试验中5架无人机二维平面航迹图

图3仿真试验中5架无人机高度变化曲线

图4仿真试验中5架无人机剩余资源量变化曲线

图中标号及符号说明如下:

cu任务预分配集合

cres引领无人机根据响应配对矩阵确定的跟随者集合

γ当前引领无人机与邻域引领无人机最优预分配子集的交集

j协同打击目标集的目标顺序索引

wp上一次处于侦察任务时的无人机三维位置坐标

具体实施方式

下面通过具体的实例来验证本发明所提协同任务分配方法的有效性。在本实例中,给定nu=5架无人机参与对1km×1km未知区域的目标搜索和打击任务。5架无人机起点位置分别设为s1=[0,100,50]t,s2=[0,300,50]t,s3=[0,500,50]t,s4=[0,700,60]t,s5=[0,900,60]t;侦察终点位置分别设为e1=[1000,100,50]t,e2=[1000,300,50]t,e3=[1000,500,50]t,e4=[1000,700,60]t,e5=[1000,900,60]t,单位为m。无人机运动模型采用以下二阶线性系统:

其中,vu为无人机飞行空速,单位m/s;θu为无人机当前航向,单位rad;[uv,uθ,uh]t为无人机控制矢量,分别控制无人机前向加速度、航向角速度和垂向加速度,其取值范围分别受最大前向过载amax、最大偏转角速度ωmax和最大垂向过载限制。初始时刻vu、θu及控制量均为零,最大过载分别设为amax=5m/s2侦察区域中共设定nt=10个未知目标满足均匀分布,每个目标依次需要消耗的无人机打击资源量为rt=[10,10,10,10,10,20,20,20,30,30]t,攻击高度ha=10m。本实例的仿真环境配置为inteli7-4790处理器,3.60ghz主频,4g内存,软件为matlab2010a版本,仿真步长0.1s。

实例的具体实践步骤如下:

步骤一:协同任务分配初始化

s11、侦察任务初始化

对于第i架无人机,i∈{1,...,5},侦察任务变量sr(i)初始化为vr(i)=5m/s;e(i)=ei;rr(i)=100m;

s12、打击任务初始化

对于第i架无人机,i∈{1,...,5},打击任务变量sa(i)初始化为va(i)=θa(i)=0,当确定协同打击编队和同时到达时间后,按式(3)进行幅值;ru(i)=50;ra(i)=20m;

s13、启动未知环境目标搜索

对于第i架无人机,i∈{1,...,5},初始化任务切换模态p(i)=1;全局通信规划状态矩阵为零矩阵:greq=05×1,gres=05×5,gnot=05×5

步骤二:引领-跟随全局信息交互

s21、引领者广播协同请求

在侦察任务状态下,若第i架无人机发现nm个目标,则将其组成一个目标集合cm(i),其作为集合cm(i)的群体引领者,置位greq(i)=1,p(i)=3,并广播greq。

s22、跟随者响应协同请求

给定εr=0,在侦察任务状态下,当接收到greq(i)后,任意非引领无人机i′判断是否满足ru(i′)>εr。若是,则回馈响应信息gres(i′,i)=1,成为跟随者;同时置位p(i′)=3,并等待分配结果gnot(i)。

s23、引领者进入打击任务预分配阶段

给定tw=5,通信周期为1个仿真步长,则引领者i在发送greq(i)后0.5s内始终接收跟随者响应信息,之后转步骤三。

步骤三:基于总能量关系的打击任务预分配

s31、生成引领-跟随打击编队总集合

若引领无人机i接收到nr个跟随者回馈信息,则将跟随者编号组成集合cres(i)。根据组合关系生成集合{i,cres(i)}的幂集种打击编队子集,则ct(i)组成打击编队总集合。

s32、根据总能量关系进行编队子集预分配

对于ct(i)中的每个子集,计算其打击资源总能量sr。若满足则将该子集包含于任务预分配集合cu(i)。若则p(i)=1,即第i架无人机返回侦察任务。

步骤四:基于生物捕食能量均衡模型的协同打击任务分配

s41、计算期望消耗资源量

对于cu(i)中的每个子集,按式(4)计算其包含的每架无人机期望消耗的打击资源量

s42、计算预分配子集生物捕食能量收益值

给定qin=20,根据式(6)计算cu(i)中每个子集的生物捕食能量收益值sin。

s43、计算预分配子集生物捕食能量均衡模型

给定qout=400,根据式(7)计算cu(i)中每个子集的生物捕食能量代价值sout,并进一步计算每个子集的生物捕食能量均衡模型es。

s44、选取最优预分配子集

选取能量均衡值es最高的子集为第i架无人机针对目标序列cm(i)的最优预分配子集

步骤五:基于机会性捕猎协商的打击任务冲突消解

s51、引领无人机共享最优预分配子集

引领无人机广播|cu|及其对应的并接收邻域内其他引领无人机广播信息,构建邻域引领无人机集合遍历判断其包含的邻域引领无人机最优预分配子集是否与本机交集为空。若是,转步骤s53;否则,转步骤s52。

s52、根据机会性捕猎协商机制确定协同打击决策

判断本机i与邻域引领者是否满足若是,则更新并返回步骤s51;否则,令更新cres(i)=cres(i)-γ(i)并返回步骤s31。

s53、确定协同打击编队同时到达时间

给定η=2,对于中每架无人机,计算其编队同时到达时间并转步骤六。

步骤六:输出和执行协同任务分配结果

s61、输出协同打击决策矩阵

对于中任意无人机p,置位gnot(i,p)=1。输出并广播协同打击决策矩阵gnot。若wp(p)非空,则分别更新wp(p)=pu(p);任务切换模态转为打击任务,即p(p)=2。

s62、执行协同打击任务

协同打击编队根据va、θa和ha对目标集cm(i)中各目标依次执行协同打击。若打击编队与同一目标相对距离小于ra时,则该目标协同打击完成,ta(i)集合移除该目标,当目标集cm(i)所有目标均打击完成后,任务切换模态转为侦察任务,即p(i)=1且p(p)=1。引领无人机与编队无人机均返回航点wp;当到达侦察区域终点e时,集群任务结束。

图2、3给出了本实例每架无人机二维航迹和高度变化曲线,由实例初始化可知,每架无人机沿横轴方向执行侦察任务。根据侦察半径可知,无人机之间能够彼此覆盖搜索区域,保证不会遗漏目标。由图2目标分布可知,本实例中多数目标分布于上半平面。因此,无人机4、5会侦测到多数目标。由于个体资源量限制,无人机4、5需要与其余资源量冗余的无人机进行协同打击。实例运行结果显示,无人机1侦测到目标5,无人机2、3未侦测到目标,而无人机4、5分别侦测到目标2、4、8、9、10与目标1、3、6、7。为达到资源均衡性,无人机4分别在49.6s、188s和349.1s为目标4、10和8分配打击编队无人机1、3和2;无人机5分别在128.5s、303.9s和416.9s为目标1、6和3分配打击编队无人机2、1和4。图4给出了5架无人机剩余资源量变化曲线,结合图2可得,分配结果达到了无任务冲突、均衡资源量和减少路径消耗的目的。图3结果则表明,在同时达到时间约束下,打击编队能够在有限时间窗口按指定高度到达攻击地点,顺利完成打击任务。由于各机剩余资源量相近,当发现后续目标时,若存在多机协同攻击约束,本发明所提任务分配方法仍然适用。因此,本发明具有保证无人机集群在未知动态环境下执行分布式、长时、持久性任务,提升任务效能鲁棒性的优势。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1