多场站多无人机任务分配与飞行路径的规划方法及系统与流程

文档序号:15460192发布日期:2018-09-18 17:56阅读:869来源:国知局

本发明涉及无人机的技术领域,尤其涉及一种多场站多无人机任务分配与飞行路径规划方法及系统。



背景技术:

在现代高技术条件下,无人作战飞机(Unmanned Combat Air Vehicle,UCAV)正在被越来越广泛地运用于执行各种军事行动。在高度信息化战场上,UCAV已经从传统单一的侦察、评估、监听及预警等战斗支援作用,向具有攻击和杀伤能力的方向迅速发展,成为可以执行压制敌防空系统,对地攻击、拦截战术弹道导弹和巡航导弹、甚至可执行对空作战任务的作战装备,并最终成为影响作战进程的重要力量。近年来,UCAV在侦察、反恐,尤其在几次高技术局部战争中表现卓越,引起了世界各国的高度重视,许多国家开始大力发展无人机技术。当UCAV被运用与对地攻击时,决策者必须考虑一系列问题,如, UCAV该挂载哪些武器?哪些武器用于攻击目标更加合适?UCAV从哪个场站出发? UCAV该如何选择目标打击的顺序?当上述一系列问题都须集中优化时,指挥决策将变得异常困难。

例如,在一次典型的UCAV对地攻击作战行动中,一系列固定目标要求必须被打击或摧毁,这些目标的目标属性、地理坐标和毁伤要求等信息已侦察获知。目标信息如表1所示。

表1目标点位置与毁伤要求

完成上述目标的打击任务可从多个场站动用多架UCAV,每架UCAV可挂载不同类型的武器,UCAV和挂载武器的基本信息如表2和表3所示。打击相同的目标,不同的武器其作战性能也不尽相同。表4列出了不同武器打击不同类型目标时的作战能力,如表4所示,某架UCAV挂载了W1武器(小型智能炸弹)要打击T5目标(机场),其作战能力仅为0.02。可见,用低当量的武器去打击大型目标很难取得较好的打击效果。所以,同样的 UCAV搭载了不同的武器,其作战性能是截然不同的。

从上述作战行动中可以看出,有两个关键决策必须引起决策者的高度重视,一是每架 UCAV负责打击的打击目标点是哪些,这些打击目标点的打击顺序是怎样的;二是每架 UCAV从哪个场站出发,须挂载哪几类武器,每类武器须要多少枚,哪几枚武器用于打击某个打击目标点更加合适。然而,每架UCAV可挂载武器的总数量和总重量是有限的,决策者在为UCAV配置武器时必须考虑UCAV的挂载能力等众多约束的限制。

表2无人机的基本参数

表3武器的基本参数

表4武器-目标的战斗能力矩阵

在实现本发明过程中,发明人发现现有技术中至少存在如下问题:现有的无人机作战任务规划中,将打击目标点的武器匹配和飞行路径分为两个阶段进行规划,没有将两者充分结合起来,进而没有充分发挥无人机打击目标的作战效能。



技术实现要素:

本发明实施例提供一种多场站多无人机武器配置和飞行路径进行协同的规划方法及系统,在完成打击目标点的任务的前提下,使作战费用最低。

一方面,本发明实施例提供了一种多场站多无人机任务分配与飞行路径的规划方法,所述方法包括:

根据已知的战场信息,根据武器配置与分配策略给每个打击目标点分配武器;

根据目标聚类策略为多个场站分配打击目标点,将每个场站和分配给所述场站的打击目标点组成一个区域,得到多个区域;

根据区域全回路生成策略,生成每个区域的包含区域内每个打击目标点的初始打击全回路;

根据区域全回路分割策略,将每个区域内的初始打击全回路分割成多条单架无人机执行的子回路打击序列,所述多个区域子回路打击序列的集合为所述多场站多无人机任务分配与飞行路径的初始可行解。

另一方面,本发明实施例提供了一种多场站多无人机任务分配与飞行路径的规划系统,所述系统包括:

武器配置与分配单元,用于根据已知的战场信息,根据武器配置与分配策略给每个打击目标点分配武器;

目标聚类单元,用于根据目标聚类策略为多个场站分配打击目标点,将每个场站和分配给所述场站的打击目标点组成一个区域,得到多个区域;

区域全回路构建单元,用于根据区域全回路生成策略,生成每个区域的包含区域内每个打击目标点的初始打击全回路;

区域全回路分割单元,用于根据区域全回路分割策略,将每个区域内的初始打击全回路分割成多条单架无人机执行的子回路打击序列,所述多个区域子回路打击序列的集合为所述多场站多无人机任务分配与飞行路径的初始可行解。

上述技术方案具有如下有益效果:因为采用根据已知的战场信息,通过武器配置与分配策略给每个打击目标点分配武器的技术手段,所以达到了保证每个打击目标点都可以被摧毁的技术效果;因为采用了根据目标聚类策略为多个场站分配打击目标点的技术手段,所以达到了将每个场站分配适宜的打击目标点的技术效果;因为采用了区域全回路分割策略,初步将单个场站与打击目标点协同规划的技术效果;根据区域全回路分割策略,将每个区域内的初始打击全回路分割成多条单架无人机执行的子回路打击序列,多个区域子回路打击序列的集合为所述多场站多无人机任务分配与飞行路径的初始可行解。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例多场站多无人机任务分配与飞行路径的规划方法的流程图;

图2是本发明实施例多场站多无人机任务分配与飞行路径的优化方法的流程图;

图3是本发明实施例多场站多无人机任务分配与飞行路径的规划系统的结构示意图;

图4是本发明实施例多场站多无人机任务分配与飞行路径的优化系统的结构示意图;

图5是本发明实施例多场站多无人机任务分配与飞行路径整体框架图;

图6是本发明实施例贪婪搜索聚类的过程示意图;

图7是本发明实施例场站互换的过程示意图;

图8是本发明实施例区域间打击目标点随机互交换的过程示意图;

图9是本发明实施例区域间邻近打击目标点互交换的过程示意图;

图10是本发明实施例区域内打击序列2交换的过程示意图;

图11是本发明实施例区域内打击序列3交换的过程示意图;

图12是本发明实施例场站与打击目标分布示意图;

图13是本发明实施例多场站多无人机任务分配与飞行路径的规划结果示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参考图1,图1是本发明实施例多场站多无人机任务分配与飞行路径的规划方法的流程图:

101、根据已知的战场信息,根据武器配置与分配策略给每个打击目标点分配武器;

102、根据目标聚类策略为多个场站分配打击目标点,将每个场站和分配给所述场站的打击目标点组成一个区域,得到多个区域;

103、根据区域全回路生成策略,生成每个区域的包含区域内每个打击目标点的初始打击全回路;

104、根据区域全回路分割策略,将每个区域内的初始打击全回路分割成多条单架无人机执行的子回路打击序列,所述多个区域子回路打击序列的集合为所述多场站多无人机任务分配与飞行路径的初始可行解。

请参考图2,图2是本发明实施例多场站多无人机任务分配与飞行路径的优化方法的流程图:

105、根据邻域结构的权重选择邻域结构对所述初始可行解进化至邻域解,邻域结构的初始权重相同;

106、经过预设次数的迭代后,统计每个邻域结构调用次数,根据所述邻域解的进化程度对对每个邻域结构评分;

107、根据每个邻域结构的评分更新每个邻域结构的权重;

108、重复105至步骤107,直到满足搜索终止准则;

109、每个循环过程,计算各个解的目标函数值,选择目标函数值最小的为最优解。

优选地,所述武器配置与分配策略包括:随机分配算法,打击能力优先算法,效费比优先算法;

优选地,所述武器配置与分配策略的约束为:分配给单个打击目标点的武器总数量小于或等于无人机的挂点数量,分配给单个打击目标点的武器总质量小于或等于无人机的载重质量;

优选地,所述目标聚类策略包括:随机聚类算法,最近距离优先聚类算法,贪婪搜索聚类算法,虚拟反馈聚类算法;

优选地,所述区域全回路生成策略包括:随机生成算法,毁伤要求优先打击算法,最近距离优先打击算法;

优选地,所述区域全回路分割策略的约束为:每条子回路中的打击目标点所分配到的武器的总数量小于或等于无人机的挂点数量,每条子回路中的打击目标点所分配到的武器的总质量小于或等于机人机的载重质量;每条子回路,单架无人机从区域中的场站出发,遍历这条子回路中的打击目标点,返回区域中的场站。

进一步优选地,所述最近距离优先聚类算法,具体包括:

计算每个打击目标点与各个场站的距离,

将每个打击目标点分配给距离最近的场站;

进一步优选地,所述贪婪搜索聚类算法,具体包括:

每个场站随机选择一个打击目标点,

以所述打击目标点为基础,寻找距离最近的打击目标点分配给所述场站,

重复上一步骤,直到每个打击目标点被分配到相应的场站;

进一步优选地,所述虚拟反馈算法,具体包括:

设多个场站周围有一个虚拟场站,所述虚拟场站为多无人机的唯一场站,

依次调用效费比优先算法,毁伤要求优先算法,区域全回路分割算法,得到从虚拟场站出发依次打击n(n≥1)个打击目标点的多无人机规划方案集合S,S={S1,S2…Su},其中u为无人机的数量;

将每个规划方案Si(i=1,2…u)中的虚拟场站依次更换成现实的每个场站,并计算更换场站后的规划方案中无人机的飞行总距离;

在更换场站后的规划方案集合中,选择无人机飞行总距离最小的规划方案,用所述规划方案中的场站替换虚拟场站,并将所述规划方案中的打击目标点分配给所述场站。

优选地,所述邻域结构包括:场站交换,区域间打击目标点随机互交换,区域间邻近打击目标点互交换,区域间打击序列2交换,区域间打击序列3交换;减少武器数量,降低武器费用,降低武器重量;

优选地,所述搜索终止准则,包括:当循环的次数达到预设循环次数,搜索终止;

或者,

经过特定次数的循环,当前最优解或者经过特定次数的循环,当前最优解没有更新,搜索终止;

优选地,所述每个循环过程中,计算各个解的目标函数值,选择目标函数值最小的为最优解,具体包括:

设初始可行解为当前最优解,g*为当前最优解的目标函数值;

计算各个邻域解的目标函数值;

当某个邻域解的目标函数值小于g*时,用所述邻域解更新当前最优解。

请参考图3,图3是本发明实施例多场站多无人机任务分配与飞行路径的规划系统的结构示意图;

武器配置与分配单元21,用于根据已知的战场信息,根据武器配置与分配策略给每个打击目标点分配武器;

目标聚类单元22,用于根据目标聚类策略为多个场站分配打击目标点,将每个场站和分配给所述场站的打击目标点组成一个区域,得到多个区域;

区域全回路构建单元23,用于根据区域全回路生成策略,生成每个区域的包含区域内每个打击目标点的初始打击全回路;

区域全回路分割单元24,用于根据区域全回路分割策略,将每个区域内的初始打击全回路分割成多条单架无人机执行的子回路打击序列,所述多个区域子回路打击序列的集合为所述多场站多无人机任务分配与飞行路径的初始可行解。

请参考图4,图4是本发明实施例多场站多无人机任务分配与飞行路径的优化系统的结构示意图;

进化单元25,用于根据邻域结构的权重选择邻域结构对所述初始可行解进化至邻域解,邻域结构的初始权重相同;

评分单元26,用于经过预设次数的迭代后,统计每个邻域结构调用次数,根据所述邻域解的进化程度对每个邻域结构评分;

更新单元27,用于根据每个邻域结构的评分更新每个邻域结构的权重;

循环单元28,用于重得25至26,直到满足搜索终止准则;

最优解单元29,用于每个循环过程,计算各个解的目标函数值,选择目标函数值最小的为最优解。

优选地,所述武器配置与分配策略包括:随机分配算法,打击能力优先算法,效费比优先算法;

优选地,所述武器配置与分配策略的约束为:分配给单个打击目标点的武器总数量小于或等于无人机的挂点数量,分配给单个打击目标点的武器总质量小于或等于无人机的载重质量;

优选地,所述目标聚类策略包括:随机聚类算法,最近距离优先聚类算法,贪婪搜索聚类算法,虚拟反馈聚类算法;

优选地,所述区域全回路生成策略包括:随机生成算法,毁伤要求优先打击算法,最近距离优先打击算法;

优选地,所述区域全回路分割策略的约束为:每条子回路中的打击目标点所分配到武器的总数量小于或等于无人机的挂点数量,每条子回路中的打击目标点所分配到武器的总质量小于或等于机人机的载重质量;每条子回路,单架无人机从区域中的场站出发,遍历这条子回路中的打击目标点,返回区域中的场站。

进一步优选地,所述最近距离优先聚类算法,具体包括:

计算每个打击目标点与各个场站的距离,

将每个打击目标点分配给距离最近的场站;

进一步优选地,所述贪婪搜索聚类算法,具体包括:

每个场站随机选择一个打击目标点,

以所述打击目标点为基础,寻找距离所述基础打击目标点最近的打击目标点分配给所述场站,

重复上一步骤,直到每个打击目标点被分配到相应的场站;

进一步优选地,所述虚拟反馈算法,具体包括:

设多个场站周围有一个虚拟场站,所述虚拟场站为多无人机的唯一基地,

依次调用效费比优先算法,毁伤要求优先算法,区域全回路分割算法,得到从虚拟场站出发依次打击n(n≥1)个打击目标点的多无人机规划方案集合S,S={S1,S2…Su},其中u为无人机的数量,

将每个规划方案中Si(i=1,2…u)的虚拟场站依次更换成现实的每个场站,并计算更换场站后的规划方案中无人机的飞行总距离;

在更换场站后的规划方案集合中,选择无人机飞行总距离最小的规划方案,用所述规划方案中的场站替换虚拟场站,并将所述规划方案中的打击目标点分配给所述场站。

优选地,所述邻域结构包括:场站交换,区域间打击目标点随机互交换,区域间邻近打击目标点互交换,区域间打击序列2交换,区域间打击序列3交换;减少武器数量,降低武器费用,降低武器重量;

优选地,所述搜索终止准则,包括:当循环的次数达到预设循环次数,搜索终止;

或者,

经过特定次数的循环,当前最优解或者经过特定次数的循环,当前最优解没有更新,搜索终止;

优选地,所述最优解单元,具体包括:

设初始可行解为当前最优解,g*为当前最优解的目标函数值;

计算各个邻域解的目标函数值;

当某个邻域解的目标函数值小于g*时,用所述邻域解更新当前最优解。

以下通过应用实施例进行详述:

请参考图5,图5是本发明实施例多场站多无人机任务分配与飞行路径整体框架图:

为求解多场站多无人机任务分配与飞行路径规划问题,本发明实施例采用了一种适应性大邻域启发式搜索方法(Adaptive Large Neighborhood Search,ALNS),方法主要包括两个求解阶段:一是初始解构造阶段,通过基于目标聚类的启发式初始解构造方法产生一个较好的初始可行解;二是可行解进化学习阶段,通过一系列邻域搜索策略中的邻域改进初始可行解,最终得到一个较优的最终解。

ALNS方法求解框架由“初始可行解生成阶段”和“可行解进行学习阶段”构成,方法框架如图5所示。

“初始可行解生成阶段”包含4个部分:首先,调用“武器配置与分配策略”中的3 种算法为每个打击目标点分配合适的武器;随后,调用“目标聚类策略”中的4种算法为每个场站分配各自负责打击的目标点,以确定哪些打击目标点由哪个场站负责打击;而后,利用“区域全回路生成策略”中的3种算法为每个场站所负责打击的打击目标点生成一个打击目标点打击全回路;最后,再调用“区域全回路分割策略”将每个场站的打击目标点打击全回路进行分割,最终得到一个初始可行解,该初始可行解包含UCAV所属的场站、 UCAV数量、UCAV的武器配置、打击目标点的打击顺序等信息。需要说明的是,在调用“武器配置与分配策略”、“目标聚类策略”和“区域全回路生成策略”中各自的算法时,采用的是“轮盘赌”调用策略,即每种算法的调用概率相同。

“可行解进化学习阶段”包含2个部分:首先,调用“邻域搜索策略”中的8个邻域结构对上一阶段产生的初始可行解进行调整,每次迭代过程均需要记录每个邻域结构被调用的次数,以及每个可行解的改进情况,将可行解的改进过程称之为“进化”过程,经过次进化之后,统计8个邻域结构的调用次数,根据可行解的改进程度对每个邻域结构进行“评分”并调整其调用概率;随后,继续调用8个邻域结构对可行解进行优化,把对邻域结构“评分”并调整调用概率的过程称之为“学习”过程,经过次学习之后得到的可行解即是最终解。

多场站多无人机任务分配与飞行路径的规划方法的模型构建:

(1)符号说明。

(1.1)集合

N:待打击目标点集合,且N={1,2,…,n};

M:场站集合,且M={n+1,n+2,…,n+m};

U:UCAV集合,且U={1,2,…,u};

W:可选武器种类集合,且W={1,2,…,w};

(1.2)参数

ai:打击目标点i的毁伤要求;

c:UCAV的武器载荷重量;

g:UCAV的武器挂点数量;

dij:从打击目标点i到打击目标点j的距离;

fl:第l类武器的固定费用,且l∈W;

ql:第l类武器的重量;

bli:第l类武器对抗打击目标点i的打击能力。

(1.3)决策变量

xijk:0-1变量,当第k架UCAV先攻击打击目标点i再攻击目打击标点j时等于1,否则等于0;

zkli:整数变量,表示攻击第i个打击目标点的第k架UCAV所挂载的第l类武器的数量,且zkli≥0。

(2)数学模型。

subject to:

公式(3.1)为问题的目标函数,其由三部分组成:第一部分表示作战行动中所使用UCAV的总费用;第二部分表示作战行动中所使用武器的总费用,第三部分表示作战行动中所有UCAV的飞行总成本,而P1,P2,P3为目标函数系数,分别表示UCAV的固定费用,武器的固定费用,以及UCAV 的飞行成本。约束(3.2)和(3.3)保证每个打击目标点有且仅由一架UCAV负责攻击。约束(3.4) 确保所有UCAV都从场站出发,完成任务后又返回场站。约束(3.5)确保每架UCAV挂载的第l类武器的总重量不能超过其载重限制。约束(3.6)确保每架UCAV上挂载的武器数量不能超过该UCAV的挂点数量。约束(3.7)确保对任意打击目标点i的打击不能低于该打击目标点的毁伤要求。约束(3.8)建立了决策变量zkli和决策变量xijk之间的联系,表示对打击目标点i(i∈N)进行打击的UCAV所使用的武器总数量不可能超过该UCAV所携带的武器总数。约束(3.9)确保决策变量xijk为0-1变量。约束(3.10)确保决策变量zkli为非负整数。

(3)解的定义

(3.1)编码:通过已知的战场信息(如,目标的地理坐标和毁伤要求等)快速构造一个较好的初始可行解,该初始可行解所对应的路径规划方案可以指导多个场站的多架 UCAV执行目标点的打击任务。首先,根据打击目标点的毁伤要求将不同类型和不同数量的武器分配到每个打击目标点;然后,将打击目标点进行聚类,来决定哪些目标由哪个场站负责打击;随后,将每个场站所负责打击的所有打击目标点进行排序,形成一条由场站出发依次访问所有打击目标点并最终回到场站的全回路;最后,让某架UCAV从场站出发,依次访问打击目标点,每经过一个打击目标点就将事先将分配到该点的武器拾回,并继续访问后续打击目标点,当该UCAV在某打击目标点拾回武器后的武器总数超过自身的挂点数量,或是武器总重量超过UCAV的最大载荷时,说明这架UCAV无法访问该目标点及后续目标点,它将携带已经拾回的武器返回场站,同时,再派遣其他UCAV执行后续访问任务。

针对多场站多无人机任务分配与飞行路径规划问题的特点,本发明实施例设计了一个 (w+2)×n的矩阵作为问题编码,其中w表示武器的种类数量,n表示打击目标点数量。编码方案如表1所示,矩阵第1行的打击目标点编号表示打击目标点的打击序列;矩阵第2 行的场站编号表示打击目标点的聚类方案;矩阵第3行至第5行表示每个打击目标点所分配到的武器数量。下面以矩阵第1列为例对编码方案的具体含义予以说明,第1列为(3,1, 1,0,1),表示打击目标点T3由场站-1的UCAV负责打击,打击该打击目标点的武器配置方案是:“武器1”和“武器3”各需要1枚。

表1一个12打击目标点小案例的编码方案

(3.2)解码:上述编码方案反映了所有打击目标点的分配方案、打击顺序以及打击每个目标点所需的武器配置方案,但还无法指导每架UCAV对打击目标点实施打击。为此,还需要根据区域全回路分割策略可以快速得到每个场站的每架UCAV的飞行路径和武器配置方案。解码的过程的约束是每架UCAV的挂点数量和最大载荷量。

(4)武器配置与分配策略的详述:

采用3个算法对多场站多无人机任务分配与飞行路径规划问题的目标进行武器配置与分配。这3种算法分别是,随机分配(Random allocation,RA)算法,打击能力优先分配(Combat ability priority based allocation,CAPA)算法,效费比优先分配(Efficiency-cost ratio priority based allocation,ECRPA)算法,且调用上述3种算法时采用的是“轮盘赌”调用策略,即每种策略的调用概率相同。

(5)目标聚类策略的详述:

目标聚类策略(Target clustering strategy,TCS)的目的是将打击目标点进行分类,来决定哪些打击目标点由哪个场站负责打击。“目标聚类”环节是多场站多无人机任务分配与飞行路径规划问题的关键环节,目标聚类方案的不同,往往直接影响最终路径规划方案的优劣,因此,本节针对实际作战中可能遇到的多种场景,提出了4个目标聚类算法。这 4个算法分别是:随机聚类(Random clustering,RC)算法,最近距离优先聚类(Nearest distance priority clustering,NDPC)算法,贪婪搜索聚类(Greedy search clustering,GSC) 算法,虚拟反馈聚类(Virtual feedback clustering,VFC)算法。

(5.1)随机聚类(Random clustering,RC)算法的详述:

RC算法将打击目标点随机分配到每个场站,RC算法通过随机操作起到了多样化邻域搜索空间的作用。RC算法的伪代码下所示。

(5.2)最近距离优先聚类(Nearest distance priority clustering,NDPC)算法的详述:

NDPC算法是按照距离最近原则将每个打击目标点分配到距离其最近的场站。NDPC 算法首先计算每个目标点到各个场站的距离,而后将每个目标点分配到距离其最近的场站。 NDPC算法的伪代码如下所示。

(5.3)贪婪搜索聚类(Greedy search clustering,GSC)算法

“贪婪算法”是在对问题求解时总是做出在当前看来是最好的选择。首先让每个场站随机选择一个目标点,再从该点开始寻找距离该点最近的目标点,重复该操作,直到所有目标点均被分配到相应的场站。下面以表1所示的12目标案例为例,对GSC算法的基本操作过程予以说明。请参考图6,图6是本发明实施例贪婪搜索聚类的过程示意图,首先,场站-1和场站-2分别随机选择了目标点T5和T10;而后,以目标点T5和T10为起点,分别搜索到距离其最近的其他目标点T3和T8;随后,再以目标点T3和T8为起点,重复上述操作,直到所有目标点均被分配到相应场站;最终,目标点T5、T3、T1、T6、T2和T12 被分配到了场站-1,目标点T10、T8、T9、T7、T4和T11被分配到了场站-2。GSC算法的伪代码下所示。

(5.4)虚拟反馈聚类(Virtual feedback clustering,VFC)算法

VFC算法的基本思想是,假设在红方的多个场站周围有一个虚拟场站hvirtual,且所有执行目标打击任务的UCAV均来自场站hvirtual,以此假设为基础,依次调用效费比优先算法、毁伤要求优先算法和区域全回路分割算法,得到由虚拟场站hvirtual出发依次打击n个打击目标点的多UCAV路径规划方案集合S,且S={s1,s2,…,su},其中u表示UCAV的使用数量,再将路径规划方案si(i=1,2,…,u)中的虚拟场站hvirtual依次更换为实际的每一个场站,并计算每次更换场站后飞行回路的总距离,要更换场站后得到的规划方案的集合中,选择飞行距离最小的方案中的场站替代虚拟场站hvirtual,将飞行距离最小的更换方案所对应的打击目标点分配到相应场站,重复上述更换操作,直到路径规划方案集合S中的所有元素均被分配完毕。VFC算法的伪代码如下所示。

(6)区域全回路生成算法的详述:

当所有打击目标点经过聚类之后,每个场站都分配到了相应的打击目标点,则多场站问题便分解成了多个单场站问题,区域全回路生成算法(Regional complete tour generation strategy,RCTG)采用3种算法对每个场站负责的多个目标进行打击序列生成。这3个算法分别是,随机生成(Random generation,RG)算法,毁伤要求优先打击(Damage requirement priority generation,DRPG)算法,最近距离优先打击(Nearest distance priority generation, NDPG)算法,且调用上述3种子策略时采用的是“轮盘赌”调用策略,即每种策略的调用概率相同。

(7)区域全回路分割算法

每个场站负责区域的目标经过打击序列生成操作之后,区域全回路分割算法(Regional feasible sub-tour splitting strategy,RFSS)采用可行解子回路分割算法(Feasible sub-tour splitting,FSS)对每个场站所负责区域的目标打击全回路进行分割。

多场站多无人机任务分配与飞行路径的优化方法:

初始可行解具备了指导多场站多UCAV实施目标打击的能力,但这并不是最优方案,这个初始可行解还有进一步改进的空间。本发明实施例构造了8种邻域结构用于进行有效地解空间搜索。这个初始可行解可以看作解空间搜索的“起点”,这个“起点”通过8种不同的邻域结构不断向其他空间进行“扩展”,“扩展”的过程就是可行解寻优的过程,经过不断地寻优,最终找到最优(或较优)的可行解,即为最终解。这8种邻域结构定义如下:场站互换(Exchange depot,ED),区域间打击目标点随机互交换(Random targets exchanging between regions,RTEBR),区域间邻近打击目标点互交换(Adjacent targetsexchanging between regions,ATEBR),区域内打击序列2交换(2-exchange of attack sequence within region,2-EXWR),区域内打击序列3交换(3-exchange of attacksequence within region,3-EXWR),减少武器数量(Reducing number of weapons,RNW),降低武器费用(Reducing cost of weapons,RCW),降低武器重量(Reducing weight of weapons,RWW)。

(1)场站交换(Exchange Depot,ED)

ED算法的目的是将初始可行解中u(u>2)个UCAV飞行回路中的m(m≥2)个场站进行互换,以得到新的飞行回路方案。首先,从m(m≥2)个场站的UCAV飞行回路中各选取一个飞行回路,即选取m(m≥2)个飞行回路;紧接着,将被选出的m(m≥2)个飞行回路中场站的位置进行互换,互换位置后再检验新的飞行回路是否满足UCAV的载荷能力约束。如果满足约束,则生成的飞行路径方案构成一个新的可行解;如果不满足约束,再重新交换场站,并重复上述步骤,直到满足终止条件,ED算法结束。请参考图7,图7是本发明实施例场站互换的过程示意图,以图7所示的案例为例对ED算法的基本操作过程予以说明,如图7所示,经过ED算法操作之后,原先的飞行回路Depot(场站)(1)→T15→T10→T16 →Depot(1)和Depot(2)→T4→T6→Depot(2)相互调换场站,得到了新的飞行回路:Depot(2) →T15→T10→T16→Depot(2)和Depot(1)→T4→T6→Depot(1)。需要说明的是,ED算法不可能确保每次场站互换都能优化初始可行解,甚至有时还可能得不到可行解,因此,ED 算法仅仅是提供了一种优化当前初始可行解的可能性。

(2)区域间打击目标点随机互交换(Random targets exchanging between regions, RTEBR)

RTEBR算法是通过交换不同场站所负责打击的目标点,改变目标聚类的方案,并最终达到改变初始可行解的目的。首先,RTEBR算法从m(m≥2)个场站所负责打击目标点中分别随机选择一个打击目标点;而后,交换这m(m≥2)个被选中的打击目标点所属的场站。需要说明的是,当仅有两个场站(m=2)时,RTEBR算法仅需完成2个目标点所属场站的互换,当有多个场站(m≥2)时,RTEBR算法需完成m!次场站互换操作。经过RTEBR 算法操作后,再依次调用RCTG策略和RFSS策略构造一个新的可行解。请参考图8,图 8是本发明实施例区域间打击目标点随机互交换的过程示意图,图8展示了仅有两个场站时RTEBR算法的基本操作过程,如图8所示,RTEBR算法首先从场站-1和场站-2所负责打击目标中分别随机选择目标T3和T18,然后,将原本属于场站-1的目标T3分配给场站-2,将原属于场站-2的目标T18分配给场站-1,经过上述互换操作后,得到了如8所示的新的目标聚类方案。

(3)区域间邻近打击目标点互交换(Adjacent targets exchanging between regions, ATEBR)

ATEBR算法是RTEBR算法的变化形式,ATEBR算法从每个场站所负责打击的目标区域选择打击目标点并非采取随机选择的方式,而是选择两个区域中相距最近的两个打击目标点进行场站互换。与RTEBR算法类似,当仅有两个场站(m=2)时,ATEBR算法仅需完成2个目标点所属场站的互换,当有多个场站(m≥2)时,ATEBR算法需完成m!次场站互换操作。经过ATEBR算法操作后,再依次调用RCTG策略和RFSS策略构造一个新的可行解。请参考图9,图9是本发明实施例区域间邻近打击目标点互交换的过程示意图,图9展示了仅有两个场站时ATEBR算法的基本操作过程,如图9所示,ATEBR算法首先从场站-1和场站-2所负责打击目标点中选择相邻最近的两个打击目标点T17和T12,然后,将原本属于场站-1的打击目标点T17分配给场站-2,将原属于场站-2的打击目标点 T12分配给场站-1,经过上述互换操作后,得到了如9所示的新的目标聚类方案。

(4)区域内打击序列2交换(2-exchange of attack sequence within region,2-EXWR)

2-EXWR算法是通过改变每个场站全回路的打击目标点的打击顺序,从而达到产生新的可行解的目的。2-EXWR算法首先在每个场站的全回路中随机选择两个打击目标点,随后交换这两个打击目标点的打击顺序,从而产生了一个新的打击全回路。经过2-EXWR算法操作后,再调用RFSS策略构造一个新的可行解。请参考图10,图10是本发明实施例区域内打击序列2交换的过程示意图,以如图10所示案例为例对2-EXWR算法的基本操作过程予以说明,2-EXWR算法首先分别随机选择场站-1和场站-2负责区域中的两个打击目标点(场站-1:T9,T2,场站-2:T13,T6),而后分别交换每个区域中两个打击目标点的打击顺序,经过2-EXWR操作之后,场站-1的打击目标点打击顺序变为: T15→T2→T8→T1→T9→T10→T3→T11→T16→T17,场站-2的打击目标点打击顺序变为: T18→T6→T12→T4→T5→T13→T7→T14→T20→T19。

(5)区域内打击序列3交换(3-exchange of attack sequence within region,3-EXWR)

3-EXWR算法是2-EXWR算法的变化形式,通过改变每个场站全回路的打击目标点的打击顺序,从而达到产生新的可行解的目的。3-EXWR算法首先在每个场站的全回路中随机选择3个打击目标点,随后交换这3个打击目标点的打击顺序,从而产生了一个新的打击全回路。经过3-EXWR算法操作后,再调用RFSS策略构造一个新的可行解。以如图11 所示案例为例对3-EXWR算法的基本操作过程予以说明,首先,3-EXWR算法分别随机选择场站-1和场站-2负责区域中的3个打击目标点(场站-1:T2、T3和T9,场站-2:T6、 T13和T20),然后,分别依次交换每个区域中3个打击目标点的打击顺序。经过3-EXWR 操作之后,每个场站的打击目标点打击顺序发生了改变,场站-1的打击目标点顺序变为 T15→T2→T8→T1→T3→T10→T9→T11→T16→T17,场站-2的打击目标点顺序变为 T18→T6→T12→T4→T5→T20→T7→T14→T13→T19。需要注意的是,与2-EXWR算法不同,3-EXWR算法在每个场站的全回路中随机选择的3个打击目标点可以有3!种交换方案,因此,经过3-EXWR操作后每个场站也将得到3!个新的打击序列。请参考图11,图11是本发明实施例区域内打击序列3交换的过程示意图;图11所示结果仅仅是其中一种交换情况。

(6)减少武器数量(Reducing number of weapons,RNW)

RNW算法是通过调整武器分配方案中武器的使用数量,从而达到减少总成本的目的。经过RNW算法操作后,再依次调用TCS算法、RCTG算法和RFSS算法构造一个新的可行解。

(7)降低武器费用(Reducing cost of weapons,RCW)

RCW算法是通过调换武器分配方案中的武器,将成本较高的武器调换为成本较低的武器,从而达到减少总成本的目的。经过RCW算法操作后,再依次调用TCS算法、RCTG 算法和RFSS算法构造一个新的可行解。

(8)降低武器重量(Reducing weight of weapons,RWW)

RWW算法是通过调换武器分配方案中的武器,将重量较大的武器调换为重量较小的武器,以期减少作战行动中UCAV的使用数量,进而达到减少总成本的目的。经过RWW 算法操作后,再依次调用TCS算法、RCTG算法和RFSS算法构造一个新的可行解。

(9)适应性学习策略

8个邻域结构分别从不同的角度对初始可行解进行了改进,其中,第1个邻域结构(ED) 注重从调整UCAV飞行回路的角度对初始可行解进行改进,第2和第3个邻域结构(RTEBR 和ATEBR)侧重从改变目标聚类方案的角度对初始可行解进行优化,第4和第5个邻域结构(2-EXWR和3-EXWR)主要从调整目标点打击顺序的角度对初始可行解进行改进,而第6至第8个邻域结构(WR、RNW、RCW和RWW)则是从调整武器分配方案的角度来改进初始可行解。邻域结构的优化侧重点不同,初始可行解的改进效果也不尽相同,为了实现更加广泛的邻域搜索,本节在适应性搜索过程中,为邻域结构附加了相应的权重,并且这些权重在邻域搜索过程中动态变化。

采取“轮盘赌”的原则随机选择8种邻域结构对初始可行解进行优化调整。给定h(h=8) 个分别赋予了权重wi的邻域结构,邻域结构j被选中的概率为当初始可行解“进化”次后,8种邻域结构的权重值更新一次。每次权重值更新,称为一次“学习”过程,共经过次学习之后,ALNS算法邻域搜索过程结束。邻域结构的权重计算公式如下所示:

其中,r(r∈[0,1])为常数,εij为邻域结构i在第j次进化中被调用的次数,σij为邻域结构i在第j次进化中获得的评分总和。

所述每个邻域结构评分标准如下:

邻域结构i(i=1,2,…8)在第j次进化中的初始分数为0;

如果邻域结构i(i=1,2,…8)在第j次进化中产生的邻域解的目标函数值是种群中解的目标函数值中最小值,则所述邻域结构加30分;

如果邻域结构i(i=1,2,…8)在第j次进化中产生的邻域解的目标函数值小于种群中解的目标函数值的平均值,则所述邻域结构加20分;

如果邻域结构i(i=1,2,…8)在第j次进化中产生的邻域解的目标函数值不小于种群中解的目标函数值的平均值,则所述邻域结构加10分;

如果邻域结构i(i=1,2,…8)在第j次进化中产生的邻域解的目标函数值小于种群中解的目标函数值的最大值,且被接受,则所述邻域结构加5分。

所述种群为,由至少一个可行解经邻域搜索算子产生的至少一个邻域解的集合。

(10)解接受标准

采用record-to-record算法来界定可行解的接受标准。设g*为当前最优解的目标函数值,称作记录(record);设δ为当前解的目标函数值同g*之间的差值,称作偏差量(deviation);设R为解,而R'为R的邻域解,gR'为R'的目标函数值。当gR'<g*+δ时,邻域解R'可被接受,其中δ=0.1×g*;当gR'<g*时,g*才允许被更新。

(11)邻域搜索终止准则

本发明实施例邻域搜索的终止准则有两种:

1)当解的质量在一定数量的迭代次数内没有得到提高时,算法搜索终止;例如,设定 300次为特定次数的循环,当循环了300次,当前最优解都没有被更新,则终止邻域搜索。

2)当算法迭代次数超过某个预设值时,算法搜索终止,例如,设定了预设值为1000,当循环了1000次,则无论当前解是否被更新,均终止邻域搜索。

设定的实验案例:

在某次作战行动中,我方拟从多个场站出动多架UCAV对敌方多个固定目标实施打击,每架UCAV可挂载多种武器(如,空对地导弹、精确制导炸弹等),每种武器对抗不同属性目标点的打击能力可根据以往作战数据得知,敌方目标的基本属性和地理坐标已侦察获知,每个打击目标点的毁伤要求已经明确。

本实例中,场站的位置分别为Depot_01(150.00,10.00)和Depot_02(350.00,20.00)。每架UCAV可挂载3种武器,无人机与武器的具体参数如表2所示。目标点信息如表3所示,每种武器对抗不同属性目标的打击能力如表4所示。上级要求,在确保敌方目标被有效压制和摧毁的前提下,要为多个场站的每架UCAV规划出武器挂载方案和目标打击顺序方案,使得我方的作战成本(包括UCAV的使用数量,UCAV所使用武器的总费用和UCAV 总的飞行距离)尽可能降到最小。其中指挥员确定的权重为P1=1200,P2=1,P3=1200

表2 UCAV相关参数设定

表3目标点位置与毁伤要求

表4武器-目标的战斗能力矩阵

考虑到多场站多UCAV空袭作战的特殊背景,实验设计中我方多个场站位于远离敌方目标群的一侧,且成带状分布态势。不同作战区域中我方场站和敌方目标的地理坐标采用随机生成的方式产生,但必须满足以下限制条件:①每个场站与敌方任一目标点之间还存在较远的安全距离(设为即UCAV匀速巡航1小时的飞行距离),且必须满足第二章约束(2.16)的要求;②我方每两个相邻场站之间存在一定的距离(设为)。我方场站与敌方目标群分布示意图如图12所示。

根据表2~表4的数据,采用本发明实施例中的方法进行求解,在2.75秒的计算时间内给出了实施例的最终解,目标函数值为2118740.89,UCAV动用4架。请参考图13,图 13给出了本发明实施例多场站多无人机任务分配与飞行路径的规划结果示意图。

本发明实施例提供了一种多场站多无人机任务分配与飞行路径的系统,可以实现上述提供的方法实施例,具体功能实现请参见方法实施例中的说明,在此不再赘述。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1