一种针对大规模无人机集群动态对抗的决策方法与流程

文档序号:15702550发布日期:2018-10-19 20:05阅读:644来源:国知局

本发明属于空战决策技术领域,特别涉及了一种针对大规模无人机集群动态对抗的决策方法。



背景技术:

随着战场环境的日益复杂以及作战任务的日趋多样化,无人机的作战样式逐步从单平台向多平台“集群”(swarm)方向发展。利用大量成本低廉的无人机组成集群对敌方重要目标实施饱和打击,将成为无人机集群的主要作战样式。而应对无人机集群饱和攻击最有效的方法就是利用无人机集群对入侵的机群进行拦截,这就导致了无人机集群的空中对抗。在集群对抗过程中,空战态势不断变化,每架无人机必须根据变化的态势做出实时的决策,实现与友机的合作以及与敌机的对抗,这是作战双方面对战场局势的一种策略选择,所以决策方法对作战的结果具有决定性影响。

在集群动态对抗中,无人机实时做出的决策主要包括目标分配决策以及无人机的运动决策。目前解决目标分配问题的方法主要有蚁群算法(aco)、粒子群算法(pso)、遗传算法(ga)等,但普遍存在效率低以及不能收敛等问题,且只适用于静态的目标分配;而针对无人机集群的运动决策,通常采用基于仿生智能的行为控制方法,通过设计无人机个体行为规则和控制策略,使大规模的具有自主能力的无人机相互作用构成一个有序的整体,但针对特定作战任务的集群运动控制策略仍需进行进一步的研究。目前针对无人机集群对抗问题,主要的策略是将多对多的集群空战分解为一对一的对抗,但所设计的多无人机空战决策方法一般只适用于小规模的无人机群之间的作战和静态的目标分配,当对抗个体数量庞大,作战态势不断变化时,传统的空战决策方法将难以求解大规模无人机集群之间的动态对抗问题。



技术实现要素:

为了解决上述背景技术提出的技术问题,本发明旨在提供一种针对大规模无人机集群动态对抗的决策方法,通过无人机间的通信,实时进行目标分配与协商,并建立集群运动模型,实现无人机速度和位置的更新,从而进一步实现无人机集群之间的动态对抗。

为了实现上述技术目的,本发明的技术方案为:

步骤一,各无人机根据所获知的战场环境信息进行态势评估,根据态势评估结果计算各目标的攻击收益,以最大化攻击收益为目标,采用分布式一致性拍卖算法,实现多机协同多目标分配决策;

步骤二,在经典集群行为“聚集-避撞-对齐”的基础上,引入个体对作战任务的应激行为,将个体之间的交互抽象为力,建立基于社会力的集群运动模型,根据步骤一的多机协同多目标分配结果,各无人机选择相应的行为规则,实现自身速度及位置的更新;

步骤三,根据步骤一的多机协同多目标分配结果以及步骤二的无人机位置更新结果,各无人机进行攻击决策,针对所分配目标判断其是否满足攻击条件,若满足,则对目标进行攻击并更新自身武器数量以及敌方目标的生存概率;否则进入步骤四;

步骤四,判断作战是否结束,若未结束,则返回步骤一,继续循环;否则退出循环。

进一步地,在步骤一中,所述战场环境包括双方无人机集群以及各自的基地,各无人机对自身探测范围内的敌机以及已知的敌方基地进行态势评估,得到优势矩阵;

由于作战区域为二维平面且所有无人机同构,因此无人机与无人机间的态势优势采用角度优势指数、距离优势指数和速度优势指数进行评估,分别记为saij,srij,svij:

其中,αij为我方无人机的位置角,即双机目标线与我方无人机速度矢量vi的夹角,满足0≤|αij|≤π,dij为我方第i架无人机与敌方第j架无人机的距离,ra,rs分别为无人机的攻击半径与探测半径,vi,vj分别为第i架无人机和第j架无人机的速度,则综合优势sij为各类优势指数基于重要程度的线性加权:

sij=ω1×saij+ω2×srij+ω3×svij(4)

式中,ω1、ω2和ω3分别为角度、距离和速度优势指数权值,且满足

由于敌方基地静止,因此无人机与敌方基地间的态势优势采用角度优势指数和距离优势指数进行评估,分别记为saib,srib:

其中,αib为我方无人机的进入角,即我方第i架无人机的速度矢量vi与我机和敌方基地连线的夹角,满足0≤|αib|≤π,dib为我方第i架无人机与敌方基地的距离,则综合优势sib为各类优势指数基于重要程度的线性加权:

式中,分别为角度和距离优势指数权值,且满足

进一步地,在步骤一中,无人机对探测范围内的敌机以及已知的敌方基地的攻击收益计算如下:

cij=[αsij+(1-α)pj]·vj(8)

cib=[αsib+(1-α)pb]·vb(9)

其中,cij,cib分别为我方第i架无人机攻击敌方第j架无人机以及基地的收益,pj,pb分别为敌方第j架无人机以及敌方基地的生存概率,vj,vb分别为第j架无人机以及基地的价值,α为权重系数,α越大,表明无人机更倾向于攻击优势较大目标,而α越小,表明无人机更倾向于攻击生存概率更大的目标。

进一步地,在步骤一中,以总收益最大化为目标,建立多机协同多目标分配模型:

其中,m,n分别为我方以及敌方的无人机数量,xij,xib为决策变量,若将敌方第j架无人机分配给我方第i架无人机,则xij=1,否则xij=0,同理,若将敌方基地分配给第i架无人机,则xib=1,否则xib=0;wi为第i架无人机的剩余武器数量;f为攻防偏好因子,f越大,表明无人机更倾向于攻击敌方基地,而f越小,表明无人机更倾向于攻击敌机,保护己方基地;第1个约束条件代表每架敌机最多只能分配给1架无人机;第2个约束条件表示第i架无人机分配的敌机数量小于等于1且不得超过当前剩余武器数量。

进一步地,在步骤一中,所述分布式一致性拍卖算法包括拍卖和一致性两个阶段,通过这两个阶段的不断迭代,可得到最终的多目标分配方案;设有nt架敌方无人机,首先定义两个长度为nt+1的列表zi与yi,zi为第i架无人机的目标列表,若第i架无人机分配给第j个目标,则zij=1,否则zij=0;yi为第i架无人机的收益列表,yij为第i架无人机获知的当前竞标目标j的最大收益;这两个向量的前nt个元素存储的是敌机的信息,而第nt+1个元素存储的是敌方基地的信息;

在拍卖阶段,各无人机判断自身是否已分配目标,若是,则跳过该阶段,进入一致性阶段;否则竞标收益最大的目标;第i架无人机选择竞标目标前,先确定有效目标列表hi:

hij=θ(cij>yij(t)),j=1,2,...,nt+1(11)

其中,t表示当前迭代次数,θ(·)为指示函数,当括号中的内容为真时,其值为1,否则为0;若第i架无人机对第j个目标的收益大于当前所获知的最大收益时,hij=1;由于敌方基地始终是一个有效目标,因此修正然后无人机从有效目标列表中选择一个收益最大的目标:

j*=argmaxjhij·cij(12)

则无人机i对目标j*进行投标,更新zij*(t)=1,yij*(t)=cij*;

在一致性阶段,各无人机与邻居交换目标列表与收益列表,然后基于一致性策略,使系统收敛到一个最终解;由于敌方基地可被分配给多架无人机,因此一致性阶段只用于消除敌机之间的分配冲突,以防止一架敌机被分配给多架无人机从而造成资源的浪费;首先将无人机之间的通信关系表示为一个有向图,其邻接矩阵为g(τ)=[gik(τ)],gik(τ)=1表示第i架无人机能够接收到第k架友机的信息,此时称无人机k为无人机i的邻居,同时每架无人机都能与自身通信,因此无人机i接收所有邻居k的收益列表yk,并更新自身收益列表yi:

yij(t)=maxkgik(τ)·ykj(t),j=1,2,...,nt(13)

同时得到竞选目标j*的所有无人机中,收益最大的无人机:

xij*=argmaxkgik(τ)·ykj*(t)(14)

若发现存在其余竞选目标j*的无人机对其收益更高,则无人机i将目标j*从自身的目标列表中剔除,即若xij*≠i,则zij*(t)=0。

进一步地,在步骤二中,对无人机的速度和位置进行更新的方法如下:

其中,k表示当前时刻,xi,vi分别为第i架无人机的位置和速度,ui为运动控制量。

进一步地,所述运动控制量ui:

其中,为导航项,描述孤立个体的运动规律;为引力项,描述个体间的聚集行为;为斥力项,描述个体间的避撞行为;为速度协同项,描述个体间的结队行为;ue为环境应激项,描述环境对个体运动的作用;-ζ||vi||2vi为摩擦力,ζ>0为阻尼系数;ηξi表示强度为η≥0的随机噪声;gi用于标记个体是否受到环境刺激,在集群对抗场景中,环境刺激指无人机分配了一架敌机作为攻击目标,当个体未受环境刺激时,gi=0,否则gi=1,即若无人机分配的目标为敌方基地,则遵循“聚集-避撞-对齐”3条行为规则与其余分配目标也为敌方基地的无人机构成集群;若无人机分配的目标为敌机,则产生一个环境应激力,促使无人机脱离集群朝目标运动,同时避免与其它无人机发生碰撞。

进一步地,所述运动控制量中各控制项设计如下:

导航项为无人机未被分配攻打敌方无人机时,趋使其朝敌方基地运动的力:

其中,κn为导航项的控制增益,xb为敌方基地位置;

引力项为所有邻居无人机对第i架无人机产生的引力的合力:

其中,为第i架无人机的邻居集合,为引力项的模,是关于机间距离的函数;

斥力项为所有邻居无人机对第i架无人机产生的斥力的合力:

其中,为斥力项的模,是关于机间距离的函数;

速度协同项为调整个体速度与周围邻居的平均速度保持一致的作用力:

其中,κv为速度协同项的控制增益,ni为第i架无人机的邻居数量;

环境应激项为无人机被分配攻打敌机时,趋势其朝敌机运动的力:

其中,κe为环境应激项的控制增益,为第i架无人机所分配敌机的位置。

进一步地,在步骤三中,针对所分配目标判断其是否满足攻击条件的方法如下:

其中,nij(k),nib(k)分别为k时刻我方第i架无人机对敌方第j架无人机以及敌方基地的攻击决策,若攻击敌方目标,则对应值为1,否则为0;dij(k)为k时刻我方第i架无人机与敌方第j架无人机的距离,dib(k)为我方第i架无人机与敌方基地的距离,st,stb分别为攻击敌机以及敌方基地的态势优势阈值;当无人机所分配目标位于其攻击半径内,且优势值大于阈值时,则无人机攻击该目标。

进一步地,在步骤三中,各无人机生存概率与武器数量更新方法如下:

其中,pi(k),wi(k)分别为k时刻第i架无人机的生存概率以及武器数量,ai(k)为第i架无人机从k时刻到k+1时刻的生存概率,ni(k)为第i架无人机在k时刻发射的武器数量,若无人机的生存概率小于阈值pt,则视为被摧毁;

由于基地静止且不具备攻击和防御能力,因此其主要的变化状态为生存概率,更新方法如下:

pb(k+1)=pb(k)ab(k)(25)

其中,pb(k)为k时刻基地的生存概率,ab(k)为基地从k时刻到k+1时刻的生存概率,若基地的生存概率小于阈值ptb,则视为被摧毁。

采用上述技术方案带来的有益效果:

1.本发明所提出的大规模无人机集群动态对抗的决策方法包括目标分配决策与集群运动决策。目标分配决策基于分布式一致性拍卖算法实现,通过一致性准则可消除分配冲突,防止多架无人机分配给同一目标,造成资源的浪费。集群运动决策部分,在经典的集群行为“聚集-避撞-对齐”的基础上,引入个体对环境的应激行为,实现无人机接近所分配目标并对其进行打击。

2.本发明中两部分的决策均是实时进行的,根据决策结果,实时更新各无人机的速度、位置、武器数量以及生存概率,更新后的状态用于下一步决策的输入,以此实现无人机集群的动态对抗过程,这种动态过程的研究,具有较好的实时性,能够更好地适应作战环境的动态变化,更具有实际应用价值。

3.本发明所研究的无人机集群系统为分布式系统,不需要中心计算节点,各无人机基于自身状态以及与邻居无人机的信息交互,进行独立自主决策,该分布式结构可减少计算量,适用于大规模无人机集群的实时决策,同时具有较好的鲁棒性,能够适应集群中无人机的加入与退出。

附图说明

图1为本发明的方法流程图;

图2为本发明中作战态势示意图,包括(a)、(b)两幅图,分别代表无人机-无人机间的态势图和无人机-基地间的态势图;

图3为本发明中分布式一致性拍卖算法流程图;

图4为本发明中无人机行为规则示意图;

图5为采用本发明所得的无人机集群对抗轨迹图;

图6为采用本发明所得的双方基地生存概率变化图;

图7为采用本发明所得的双方无人机数量变化图。

具体实施方式

以下将结合附图,对本发明的技术方案进行详细说明。

一种针对大规模无人机集群动态对抗的决策方法,如图1所示,具体包括以下步骤:

步骤一:各无人机根据所获知的战场环境信息进行态势评估,根据态势评估结果,计算各目标的攻击收益,以最大化攻击收益为目标,采用分布式一致性拍卖算法,实现多机协同多目标分配决策。

其中,战场环境包括双方无人机集群以及各自的基地,各无人机对自身探测范围内的敌机以及已知的敌方基地进行态势评估,态势示意图如图2。由于作战区域为二维平面且所有无人机同构,因此无人机与无人机间的态势优势采用角度优势指数、距离优势指数和速度优势指数进行评估,分别记为saij,srij,svij:

其中,αij为我方无人机的位置角,即双机目标线与我方无人机速度矢量vi的夹角,满足0≤|αij|≤π,dij为我方第i架无人机与敌方第j架无人机的距离,ra,rs分别为无人机的攻击半径与探测半径,vi,vj分别为第i架无人机和第j架无人机的速度。则综合优势sij为各类优势指数基于重要程度的线性加权:

sij=ω1×saij+ω2×srij+ω3×svij(4)

式中,ω1、ω2和ω3分别为角度、距离和速度优势指数权值,且满足

由于敌方基地静止,因此无人机与敌方基地间的态势优势采用角度优势指数和距离优势指数进行评估,分别记为saib,srib:

其中,αib为我方无人机的进入角,即我方第i架无人机的速度矢量vi与我机和敌方基地连线的夹角,满足0≤|αib|≤π,dib为我方第i架无人机与敌方基地的距离。则综合优势sib为各类优势指数基于重要程度的线性加权:

式中,分别为角度和距离优势指数权值,且满足

在态势评估的基础上,计算无人机对探测范围内的敌机以及已知的敌方基地的攻击收益,方法如下:

cij=[αsij+(1-α)pj]·vj(8)

cib=[αsib+(1-α)pb]·vb(9)

其中,cij与cib分别为我方第i架无人机攻击敌方第j架无人机以及基地的收益,pj,pb分别为敌方第j架无人机以及敌方基地的生存概率,vj,vb分别为第j架无人机以及基地的价值。α为权重系数,α越大,表明无人机更倾向于攻击优势较大目标,而α越小,表明无人机更倾向于攻击生存概率更大的目标。

以总收益最大化为目标,建立多机协同多目标分配模型如下:

其中,m,n分别为我方以及敌方的无人机数量,xij,xib为决策变量,若将敌方第j架无人机分配给我方第i架无人机,则xij=1,否则xij=0,同理,若将敌方基地分配给第i架无人机,则xib=1,否则xib=0;wi为第i架无人机的剩余武器数量;f为攻防偏好因子,f越大,表明无人机更倾向于攻击敌方基地,而f越小,表明无人机更倾向于攻击敌机,保护己方基地。第1个约束条件代表每架敌机最多只能分配给1架无人机;第2个约束条件表示第i架无人机分配的敌机数量小于等于1且不得超过当前剩余武器数量。

基于分布式一致性拍卖算法求解目标分配问题,算法包括拍卖和一致性两个阶段,通过这两个阶段的不断迭代,可得到最终的目标分配方案,算法流程图如图3所示。假设有nt架敌方无人机,首先定义两个长度为nt+1的列表zi与yi,zi为第i架无人机的目标列表,若第i架无人机分配给第j个目标,则zij=1,否则zij=0;yi为第i架无人机的收益列表,yij为第i架无人机获知的当前竞标目标j的最大收益。这两个向量的前nt个元素存储的是敌机的信息,而第nt+1个元素存储的是敌方基地的信息。

在拍卖阶段,各无人机判断自身是否已分配目标,若是,则跳过该阶段,进入一致性阶段;否则竞标收益最大的目标。第i架无人机选择竞标目标前,先确定有效目标列表hi

hij=θ(cij>yij(t)),j=1,2,...,nt+1(11)

其中,t表示当前迭代次数,θ(·)为指示函数,当括号中的内容为真时,其值为1,否则为0。若第i架无人机对第j个目标的收益大于当前所获知的最大收益时,hij=1。由于敌方基地始终是一个有效目标,因此修正然后无人机从有效目标列表中选择一个收益最大的目标:

j*=argmaxjhij·cij(12)

则无人机i对目标j*进行投标,更新zij*(t)=1,yij*(t)=cij*。

在一致性阶段,各无人机与邻居交换目标列表与收益列表,然后基于一致性策略,使系统收敛到一个最终解。由于敌方基地可被分配给多架无人机,因此一致性阶段只用于消除敌机之间的分配冲突,以防止一架敌机被分配给多架无人机从而造成资源的浪费。首先将无人机之间的通信关系表示为一个有向图,其邻接矩阵为g(τ)=[gik(τ)],gik(τ)=1表示第i架无人机能够接收到第k架友机的信息,此时称无人机k为无人机i的邻居,同时每架无人机都能与自身通信,因此无人机i接收所有邻居k的收益列表yk,并更新自身收益列表yi:

yij(t)=maxkgik(τ)·ykj(t),j=1,2,...,nt(13)

同时得到竞选目标j*的所有无人机中,收益最大的无人机为

xij*=argmaxkgik(τ)·ykj*(t)(14)

若发现存在其余竞选目标j*的无人机对其收益更高,则无人机i将目标j*从自身的目标列表中剔除,即若xij*≠i,则zij*(t)=0。

步骤二:在经典集群行为“聚集-避撞-对齐”的基础上,引入个体对作战任务的应激行为,将个体之间的交互抽象为力,建立基于社会力的集群运动模型,根据步骤一的多机协同多目标分配结果,各无人机选择相应的行为规则,实现自身速度及位置的更新。

无人机的速度和位置的更新方法如下:

其中k表示当前时刻,xi,vi分别为第i架无人机的位置和速度,ui为运动控制量。

无人机个体所遵循的行为规则如图4所示,由此设计个体的运动控制量ui如下:

其中,为导航项,描述孤立个体的运动规律;为引力项,描述个体间的聚集行为;为斥力项,描述个体间的避撞行为;为速度协同项,描述个体间的结队行为;ue为环境应激项,描述环境对个体运动的作用;-ζ||vi||2vi为摩擦力,ζ>0为阻尼系数;ηξi表示强度为η≥0的随机噪声。gi用于标记个体是否受到环境刺激,在集群对抗场景中,环境刺激指无人机分配了一架敌机作为攻击目标。当个体未受环境刺激时,gi=0,否则gi=1。即若无人机分配的目标为敌方基地,则遵循“聚集-避撞-对齐”3条行为规则与其余分配目标也为敌方基地的无人机构成集群;若无人机分配的目标为敌机,则产生一个环境应激力,促使无人机脱离集群朝目标运动,同时避免与其它无人机发生碰撞。

运动控制量中各控制项设计如下:

导航项为无人机未被分配攻打敌方无人机时,趋使其朝敌方基地运动的力:

其中,κn为导航项的控制增益,xb为敌方基地位置。

引力项为所有邻居无人机对第i架无人机产生的引力的合力:

其中,为第i架无人机的邻居集合,为引力项的模,是关于机间距离的函数。

斥力项为所有邻居无人机对第i架无人机产生的斥力的合力:

其中,为斥力项的模,是关于机间距离的函数。

速度协同项为调整个体速度与周围邻居的平均速度保持一致的作用力:

其中,κv为速度协同项的控制增益,ni为第i架无人机的邻居数量。

环境应激项为无人机被分配攻打敌机时,趋势其朝敌机运动的力:

其中,κe为环境应激项的控制增益,为第i架无人机所分配敌机的位置。

步骤三:根据步骤一的多机协同多目标分配结果以及步骤二的无人机位置更新结果,各无人机进行攻击决策,针对所分配目标判断其是否满足攻击条件,若满足,则对目标进行攻击并更新自身武器数量以及敌方目标的生存概率;否则进入步骤四。

针对所分配目标判断其是否满足攻击条件的方法如下:

其中,nij(k),nib(k)分别为k时刻我方第i架无人机对敌方第j架无人机以及敌方基地的攻击决策,若攻击敌方目标,则对应值为1,否则为0。dij(k)为k时刻我方第i架无人机与敌方第j架无人机的距离,dib(k)为我方第i架无人机与敌方基地的距离,st,stb分别为攻击敌机以及敌方基地的态势优势阈值。当无人机所分配目标位于其攻击半径内,且优势值大于阈值时,则无人机攻击该目标。

基于攻击决策结果,更新各无人机的生存概率与武器数量,方法如下:

其中,pi(k),wi(k)分别为k时刻第i架无人机的生存概率以及武器数量,ai(k)为第i架无人机从k时刻到k+1时刻的生存概率,ni(k)为第i架无人机在k时刻发射的武器数量。若无人机的生存概率小于一定阈值pt,则视为被摧毁。

由于基地静止且不具备攻击和防御能力,因此其主要的变化状态为生存概率,更新方法如下:

pb(k+1)=pb(k)ab(k)(25)

其中,pb(k)为k时刻基地的生存概率,ab(k)为基地从k时刻到k+1时刻的生存概率。若基地的生存概率小于阈值ptb,则视为被摧毁。

步骤四:判断作战是否结束,若未结束,则返回步骤一,继续循环;否则退出循环。当某一方的无人机全部被摧毁或某一方的基地被摧毁时,作战结束。

综上,无人机集群动态对抗流程如图1所示,具体步骤为:

(1)各无人机进行态势评估;

(2)基于态势评估结果计算各目标的攻击收益;

(3)通过无人机间的通信与协商,得到目标分配方案;

(4)根据目标分配方案,各无人机按照公式(16)选择对应的行为规则;

(5)按照公式(15)更新各无人机速度与位置;

(6)各无人机判断对目标是否达到攻击条件,若达到攻击条件,则对目标进行攻击,并自身武器数量以及敌方目标的生存概率;若未达到攻击条件,则执行第(7)步;

(7)判断作战是否结束,未结束则转到第(1)步,否则作战结束。

为了验证本发明对大规模无人机集群动态对抗的有效性,进行如下仿真试验。仿真工具采用matlab软件。实验设定:作战区域为24km*12km,红方基地位于(-10,0)km,蓝方基地位于(10,0)km。双方各有30架无人机,均匀分布在基地附近,每架无人机携带5枚同型导弹。无人机的性能参数设置如下:最小速度为60m/s,最大速度为100m/s,最大加速度为5m/s2,最大转弯角速度为0.2rad/s,探测半径为5km,攻击半径为1km。

图5为某次随机试验得到的无人机轨迹图,从图中可以看到,双方无人机在初始阶段构成了一个有序整体朝敌方基地运动,随后探测到敌方无人机,经过一段时间的对抗后,红方无人机摧毁了大部分蓝方无人机,并摧毁了蓝方基地,因此红方取得了本次作战的胜利。双方基地的生存概率以及剩余无人机数量分别如图6和图7所示,可以看到蓝方基地生存概率最终变为0,即被摧毁,此时红方剩余16架无人机,而蓝方仅剩余1架无人机。实验表明,本发明所述的一种针对大规模无人机集群动态对抗的决策方法可以有效地进行目标分配决策以及集群运动决策,从而实现集群动态对抗过程。

以上实施例仅为说明本发明的技术思想,不能以此限定本发明的保护范围,凡是按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1