多无人机协同目标分配方法与流程

文档序号:18462027发布日期:2019-08-17 02:07阅读:835来源:国知局
多无人机协同目标分配方法与流程

本发明涉及无人机协同控制技术,特别涉及一种类似新的近似聚类双策略差分进化算法的多无人机协同目标分配方法。



背景技术:

多无人机协同目标分配问题是指在复杂任务环境中,为无人机编队分配一个或一组有序任务,即对有限的uav资源进行合理的分配,同时编队整体效率达到最优。多机协同目标分配问题具有协同性较高、计算难度大、复杂度高等特点。在目标分配过程中,既要考虑飞行器的性能差异、战场势态的复杂性、任务执行权重等因素;还需要考虑可行的飞行代价、合理的分配算法及各种协同约束条件。多无人机协同算法通常分成三类:

(1)基于数学规划法的协同目标分配:

数学规划法是解决集中式分配问题的经典方法。例如:柳毅等人提出了基于匈牙利算法的多目标分配处理方法,jonathanp.how等人提出了混合数学线性规划(milp)研究协同任务分配;这两种方法在处理维数较低的分配情况时,方法简单灵活,求解速度较快;但在处理维数较高的情况时,求解的难度呈指数级增长,因此很难找到最优解;而且该方法要求已知研究对象所有的信息,将复杂作战环境信息过度简化,因此仅适合低维的简单任务环境问题求解。

(2)基于协商法的协同目标分配:

协商法能够有效解决分布式目标分配问题。例如肖玉杰等人提出了基于合同网的分布式动态任务分配算法(cnbna),该类算法计算灵活,可以将不同层次的分配问题在各个节点上进行分布处理。但在复杂任务环境中,随着分配规模的增大,系统的鲁棒性较差;同时,对协同约束的处理能力较差,致使其实现效果偏差较大。

(3)基于进化算法的协同目标分配:

该类算法是建立在自然选择与群体遗传基础上的寻优算法,实质上遵循“优胜劣汰”和“适者生存”的思想,用于解决数学或者传统建模效果不佳的复杂多约束问题,具有灵活、自适应、计算复杂低等优点。但是该类算法容易出现局部最优解,收敛速度较慢,以及停滞等现象。例如遗传算法、粒子群算法、蚁群算法、差分进化算法等。

由于人们对无人机系统需求不断提高,尤其是三维真实环境和异构多无人机体系构建,使该领域的研究更注重复杂高精,密切贴合实际等要求。数学规划法与协商法在目标分配过程中都简化了三维真实环境。进化算法灵活的编码结构适合复杂三维问题的建模和求解。近年来,进化算法逐渐成为多机协同目标分配研究趋势之一。其中差分进化算法(de)运行稳定、收敛速度较快、空间复杂度较低,在处理高维问题中显示出较好的结果。

尽管de算法已经很好地处理多无人机协同目标分配问题,但在处理高维复杂环境下的多机协同目标分配仍然存在如下难点:

(1)在解决多机协同目标分配时,如何根据实际的任务代价值指导种群的进化,因为种群中的个体即为备选解,备选解的优劣直接影响搜索算法寻优效率的高低。因此在进化之前需要对种群进行有效地划分。划分方法有两种:随机和自选;不同的问题采用不用的划分方法产生的效果也不一样。

(2)现用的进化策略进行目标分配求解时,往往只关注优化的某一个方面,选择适合探索(寻找更多全局最优区域)和开发(在全局最优区域中的找出最优解)的适当繁衍方案非常困难。例如,高随机性的变异方案侧重于探索,贪婪的变异方案侧重于开发,这就导致了在解决组合优化问题时存在不足。因此针对不同策略的改进和混合,以平衡探索性与开发性也是目前的一个难点。



技术实现要素:

为解决这些难点,本发明提供一种多无人机协同目标分配方法,通过ac-dsde算法和结合归档技术的代间变异的结合,使ac-dsde算法针对不同性质的个体使用不同的变异策略,有助于平衡种群的多样性与收敛性,并利用归档技术保存收敛的个体,设置代间变异率取代原来的随机灭绝,以增加搜索覆盖范围的可控性。

为实现以上目的,本发明采用的技术方案。多无人机协同目标分配方法,其步骤如下:

1)仿真环境预处理:确定地形数据,确定无人机、目标点及雷达的具体参数,并显示在一张仿真图中;

2)设置近似聚类双策略差分进化算法的基本参数:种群规模np,解空间维度d;

3)初始化种群:在上述解空间中随机均匀生成np个个体,对多模型进行统一的基因编码,构建目标函数以及合理的约束条件;

4)计算父代个体的适应度值:根据适应度函数f(x)及约束函数,建立uavs与目标点之间的估计航程代价库,构建父代个体适应值库;

5)父代种群个体分类:根据speciation算法对父代个体适应度进行分类,分成探索性个体及开发性个体;

6)选择变异策略:根据父代个体适应度值选择“探索性”还是“开发性”的变异策略;

7)交叉算子:在变异之后,de通常执行二项式交叉操作,交叉算子是由交叉率cr决定,其从xj,i(g)和vj,i(g+1)进行部分信息交换以形成新的实验向量uj,i(g+1),其中xj,i(g)表示第g代第j个个体的第i个基因,vj,i(g+1)表示第g+1代第j个个体的第i个基因,uj,i(g+1)表示第g+1代第j个个体的第i个基因;

8)选择算子:de采用贪婪算法选择进入下一代种群的个体,该算子从实验向量uj,i(g+1)和原始向量xj,i(g)中选择更好的个体进入下一代:

9)结合代间变异率与归档技术替代代间变异随机重置:将种群中0.3np适应度较优个体归档技术进行保存存档,剩下的0.7np个个体全部重置,直到搜索结束;

10)计算最优的适应度值,并计算uavs与目标点的对应关系。

进一步,所述变异策略的公式为:

式中:r1,r2,r3,r4,r5是在[1,n]中随机选取的五个整数且i≠r1≠r2≠r3≠r4≠r5,表示随机选取五个整数所对应的个体;xbest,i(g)表示第g代中最好的个体,xr1,i(g)表示第g代中第r1个个体,vj,i(g+1)表示第g+1代变异个体,fd表示动态缩放因子,fitness(g)是第g代中排序中间的标准适应度值,fitness表示第g代中每个个体适应度值;

式中:cr为交叉率。

进一步,所述变异随机重置在世代间覆盖操作时,保存当前种群中0.3np适应度较优个体在存档中,而将剩下的0.7np个个体全部重置,直到搜索结束,其选择概率模型如下:

式中:fitness(g)表示第g代中每个适应度的值,fitnessmin表示第g代中最小个体的适应度值,fitnessmax表示第g代中最大个体的适应度值,p(g)表示被选中的概率。

本发明提出了基于ac-dsde混合双策略差分进化算法以解决无人机协同目标优化分配方法,根据不同类型的个体选用不同的变异策略,同时构建动态缩放因子fd,解决了目前进化过程中存在的探索性和开发性平衡的问题。结合归档技术与代间变异方法,在增加了种群的多样性的同时,也保证了收敛个体不会随着迭代次数消亡。最后扩展约束条件,增加了uavs的载弹量约束,限制uavs可执行的目标个数。能有效快速地解决多无人机协同目标分配问题,且协同能力强。

附图说明

图1本发明多无人机协同目标分配方法的流程图;

图2本发明中speciation算法实现个体分组的示意图;

图3本发明中归档技术选择概率模型;

图4本发明实验1当n=m时分配结果的单条收敛曲线图;

图5本发明实验1当n>m时分配结果的单条收敛曲线图;

图6本发明实验1当n<m时分配结果的单条收敛曲线图;

图7本发明实验1当n=m时分配结果的单条和平均收敛曲线对比图;

图8本发明实验1当n>m时分配结果的单条和平均收敛曲线对比图;

图9本发明实验1当n<m时分配结果的单条和平均收敛曲线对比图;

图10本发明实验1当n=m不同算法的平均收敛曲线图;

图11本发明实验1当n>m不同算法的平均收敛曲线图;

图12本发明实验1当n<m不同算法的平均收敛曲线图。

具体实施方式

下面结合附图和实施例对本发明作更进一步的说明。如图1所示,本发明的一种基于ac-dsde算法的多人机协同目标分配的方法,包括以下步骤:

1)仿真环境预处理:确定地形数据,确定无人机、目标点及雷达的具体参数,并显示在一张仿真图中;

2)设置近似聚类双策略差分进化算法的基本参数:种群规模np,解空间维度d;

3)初始化种群:在解空间中随机均匀生成np个个体,对多模型进行统一的基因编码,构建目标函数以及合理的约束条件;

4)计算父代个体的适应度值:根据适应度函数f(x)及约束函数,建立uavs与目标点之间的估计航程代价库,构建父代个体适应值库;

5)父代种群个体分类:根据speciation算法对父代个体适应度进行分类,分成“探索性个体”及“开发性个体”,其思想如图2所示,“parentpopulation”指父代个体,“exploratoryindividual”表示“探索性个体”,“developmentalindividual”表示“开发性个体”。

6)选择变异策略:根据个体不同性质选择合适自己的变异策略:

式中:r1,r2,r3,r4,r5是在[1,n]中随机选取的五个整数且i≠r1≠r2≠r3≠r4≠r5,表示随机选取五个整数所对应的个体;xbest,i(g)表示第g代中最好的个体,xr1,i(g)表示第g代中第r1个个体,vj,i(g+1)表示第g+1代变异个体,fd表示动态缩放因子,fd越小,算法对覆盖问题空间精细搜索能力更好,但收敛速度会变慢;fd越大,收敛速度更快,但会出现丢解的情况;fitness(g)是第g代中排序中间的标准适应度值,fitness表示第g代中每个个体适应度值;

式中:cr为交叉率;cr的值越大,个体间交换的基因比例越多,种群的多样性也会增加;cr的值越小,个体间交换的基因比例越少,种群的多样性也会减少。

7)交叉算子:在变异之后,de通常执行二项式交叉操作,交叉算子是由交叉率cr决定,其从xj,i(g)和vj,i(g+1)进行部分信息交换以形成新的实验向量uj,i(g+1):

式(3)中,jrand是区间[1,d]中随机整数;cr是交叉率,决定子代与父代、中间变异体之间交换个体基因大小程度。cr的值越大,个体间交换的基因比例越多,种群的多样性也会增加;cr的值越小,个体间交换的基因比例越少,种群的多样性也会减少,不利于全局寻优。

8)选择算子:de采用贪婪算法选择进入下一代种群的个体,该算子从实验向量uj,i(g+1)和原始向量xj,i(g)中选择更好的个体进入下一代:

式(4)中,f(x)是根据实际问题构建的适应度函数。例如,构建目标函数,对于求最大化问题,具有较高适应值的个体被选择到下一代。

9)结合代间变异率与归档技术替代代间变异随机重置:在进化过程中,最优解极有可能被重置之后若干代覆盖,这就使之前的搜索变的无效,导致资源浪费,因此,归档技术保存当前种群中0.3np的适应度较优个体在存档中,而将剩下的0.7np个体全部重置,直到搜索结束,其思想如图3所示,深色圆圈代表适应度较好的个体,浅色个体表示适应度较差的个体。

式中:fitness(g)表示第g代中每个适应度的值,fitnessmin表示第g代中最小个体的适应度值,fitnessmax表示第g代中最大个体的适应度值,p(g)表示被选中的概率。

10)计算最优的适应度值,并显示uavs与目标点的对应关系。

实验结果:

为验证改进后的ac-dsde算法处理muctaop有效性,本发明在matlabr2016a进行多组仿真实验。实验包括以下部分:

a选取数量较少的uavs和目标点验证改进算法的有效性;

b选取数量较多的uavs和目标点验证改进算法能够有效处理复杂环境下目标分配;

c将改进的ac-dsde与同类算法进行比较。

表1实验初始数据

表1中:“upos”、“tpos”、“rpos”分别表示uavs、目标点和雷达在三维山地环境中的坐标;“v(km)”表示各uavs的最小最大速度v=[vmin,vmax];“umission”表示各uavs最大携弹量;“d(km)”表示各uavs最大航程约束;“w”表示各目标点的权重;“tsort”表示协同时序约束矩阵;“twait”表示最大初始等待时间。

表2两组实验进化参数的设定

表2设定了两组不同实验参数。“un”表示uavs的数量,“tn”表示目标点的数量,“pn”表示种群的规模,“gen”代表进化迭代次数。因为差分进化算法是随机搜索算法,为了验证解的一致性,本文设置“num”参数对同一情境下进行多次实验。

a.验证改进算法的有效性:

实验1分配结果如表3所示:

表3实验1的分配结果

表3为实验1中三种不同模式下无人机与目标点最优分配的结果;其中uav表示uavs分配序列,target表示对应的目标点分配序列,cost是uav与target对应的总的航程代价,包含了飞行距离、飞行时间等。模式一中,每个无人机分配一个目标点,符合一一对应。模式二中,无人机可执行多个目标;模式三中,每个目标点均被执行。表3表明了改进的ac-dsde算法不但能够有效处理三种不同的模式,在规定的时间内得到合理的解。

b.验证算法处理复杂环境的有效性:

表4实验2分配结果的统计数据

表4统计了实验2分配结果的数据,数据结果显示,模式n=m,n>m,n<m均符合一对一、一对多、多对一原则,并且在有限的时间内找到了合理的解。

表5两组实验分配结果的统计数据

为验证算法处理复杂环境的有效性,本节中选取了五个评价指标对算法的性能进行评价:

(1)平均时间:

(2)平均代价:多组实验中总航程代价值的平均值

(3)最优代价cbest:多组实验中最小代价值;

(4)约束违背:最优解中约束违背量总和占最优代价的百分比,该评价指标衡量了算法的协同性能。

(5)“优解”表示陷入局部最优的次数和当前优于平均代价的次数占实验总次数的百分比。

其中,平均代价和最优代价都是综合了航程代价、时间代价和各种约束违背量的适应度值。

表5分别统计了实验1与实验2的数据,可以得出以下结论:

(1)实验1算法运行时间较短,且能得到较好的分配结果,数据表明所提出的ac-dsde算法能够有效地处理不同模式下的多无人机协同目标分配问题;

(2)实验2尽管增加了uavs与目标点的数量,算法中的执行效率有所降低,但是ac-dsde在有效的时间内搜索到最优解。

(3)各模式中平均代价值与最优代价值接近,表明改进算法搜索的结果接近全局最优解。

(4)较小的协同违背率证明改进算法协同能力较强。较高的优解率说明了实验发现最优解的可能性较大。

c.ac-dsde算法的性能:

本节将从单次实验收敛曲线与多组实验平均收敛曲线进一步研究ac-dsde算法性能。

(1)单次实验收敛曲线与多组实验平均收敛曲线:

图4、图5、图6是实验1分配结果的收敛曲线,深色曲线代表单次实验的收敛曲线,并且显示出改进算法进化迭代过程中的最优解以及代间变异随机搜索到的最优解,分别用圆圈“o”与星号“*”表示。从收敛曲线可以看出代间变异不仅增加了种群的多样性,而且找到了更多的优解。图7、图8、图9是单收敛曲线与平均收敛曲线的对比,深色曲线是单收敛曲线,浅色实线是多次实验统计的平均收敛曲线。图7、图8、图9可以看出,深色曲线和浅色的曲线具有相似的收敛趋势,搜索前期能够快速收敛到优解区域,后期能够很快地收敛最优解。因此ac-dsde具有较好的收敛性能。

(2)ac-dsde与同类目标分配算法之间的比较:

表6ac-dsde与其它算法之间的比较

本节将改进后的ac-dsde算法、dmde算法与apc-de算法进行比较。实验所采用的进化参数,种群规模,迭代次数相同。表6中,变量cr表示交叉率,变量mr表示变异率,变量gmr为de算法的代间变异率。图10、图11、图12是不同算法的平均收敛曲线,显示了任务分配代价值随着迭代次数的增加不断收敛到最优值的趋势,“generation/iteration”表示迭代的次数,“assignmentcostvalue”表示任务分配代价值,“--”划线表示ac-dsde算法求解多机协同目标分配的收敛曲线,“.”划线表示dmde算法求解多机协同目标分配的收敛曲线,“-”划线表示apc-dsde算法求解多机协同目标分配的收敛曲线;表6显示,ac-dsde算法总的航程代价值最小,收敛速度最快,执行时间最短。尽管其它两种算法都能在一定的时间内找到最优解,但总的航程代价值较高且需要更长的执行时间。

本发明通过近似聚类双策略差分进化算法解决了多无人机协同目标分配最优的问题。采用种群分组与动态混合双策略变异算子代替了传统的变异策略,使用进化算法解决muctaop需要考虑两个关键因素:第一,不同的种群划分方法往往产生不同的结果,适当的划分方法能够有效地指导种群的进化;第二,在进化过程中保持覆盖问题空间的“探索性”和“开发性”平衡;为解决这两个关键因素,首先,根据父代种群适应度值将个体分成“探索性个体”与“开发性个体”;然后根据混合双策略变异方案平衡后代的多样性与收敛性;实验结果表明,本文所提出的ac-dsde算法能够快速地找到合理的分配方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1