异构多无人机系统协同察打任务自组织方法

文档序号:10533986阅读:813来源:国知局
异构多无人机系统协同察打任务自组织方法
【专利摘要】本发明公开了一种异构多无人机系统协同察打任务自组织方法。本发明将异构多无人机系统分解为两个同构的子系统,并设计了两个子系统之间相应的协作方式,两个子系统分别进行任务规划并进行相互协作。本发明进一步针对分解后的同构侦察型无人机系统和同构察打型无人机系统,分别设计了协同搜索任务自组织方法和协同察打自主任务规划方法。协同搜索任务自组织方法采用基于分布式模型预测控制的方法进行问题分解,然后运用粒子群算法进行求解。协同察打自主任务规划方法基于分布式的蚁群算法,在每架无人机本地问题的构建过程中,设计了没有探测到威胁情况下的正常飞行模式以及探测到威胁时的躲避威胁模式,可以更好的适应在线要求。
【专利说明】
异构多无人机系统协同察打任务自组织方法
技术领域
[0001] 本发明涉及多无人机系统任务规划方法,尤其涉及一种异构多无人机系统协同察 打任务自组织方法。
【背景技术】
[0002] 无人机(Unmanned Aerial Vehicle,UAV)是一种不承载驾驶员、可以进行遥控或 自主飞行的无人驾驶航空器。与有人机相比,UAV除了在速度、尺寸和机动性等方面的优势 外,更具有无人员伤亡、全寿命周期成本低、持续作战和抗压作战能力强等特点。随着UAV的 发展,在未来五年左右,UAV将活跃于空中压制和打击作战中。
[0003] 美国空军研究实验室根据OODA(Observe-Orient-Decide-Act)模型将无人机自主 控制能力分为10个等级:遥引导、实时故障诊断、故障自修复和飞行环境自适应、机载航路 重规划、多级协调、多机战术重规划、多机战术目标、分布式控制、机载战略目标、全自主集 群。随着自主级别的提高,相应的无人机自主能力越强,具有更高的自适应性、智能性和复 杂性,所能完成的任务规模、作用范围也逐渐扩大,并逐步从战术层次上升到战略层次。UAV 系统的自主能力经历了一个由低到高不断发展的过程,无论军用还是民用,无人机发展的 必由之路是集群化,多UAV协同作战是未来UAV作战方式的重要发展趋势。
[0004] 目前多无人机的协同飞行属于一个新的研究领域,要应用于实际飞行中,还需要 解决很多问题,如分布式控制问题、防碰避障问题等。其中任务规划是无人机自主控制领域 一个重要的模块,涵盖了分布式控制问题和防碰避障问题等,为每架无人机生成合适的任 务执行序列以及执行时间,随着无人机自主控制等级的提升,要求配备的任务规划模块具 有较强的自适应性,能够应对外部环境、任务的动态变化以及多无人机系统内部无人机的 损坏退出以及新成员的加入等情况。任务规划,尤其是多无人机复杂环境下的协同任务规 划融合了数学建模、模型优化等理论知识,是一个多目标强耦合多约束的优化问题,求解过 程较为复杂,并且会随着多无人机系统规模的增加求解难度指数增加。美国研制的主要用 来验证无人作战飞机关键技术可行性的X-45A无人机,已经完成了实时动态任务规划的飞 行验证,成功规避模拟的突发威胁。而对于多机的任务规划问题,到目前为止仍然是一项挑 战性的技术难题,也是提升无人机自主水平亟待解决的关键技术之一,对提高无人机的生 存率和任务完成率具有重要意义。
[0005] 目前,针对任务规划,较常用的研究思路主要包括自顶向下和自底向上。自顶向下 主要基于分层递阶求解的思路,已成为主流方法,可以有效地降低问题求解难度。自底向上 主要基于自组织方法,强调个体对环境的感知、判断、决策和动态反应,以及多个个体之间 基于规则的行为协调。尽管分层递阶结构的分解策略能够有效降低问题的求解难度和复杂 性,但不得不面临"主问题分解一子问题建模一子问题求解一子问题协调"一系列复杂的求 解流程。当战场环境敌我态势发生动态变化时,这类方法将消耗更多的计算代价和通信代 价。基于自组织的自底向上的方法,更加强调个体对环境的动态响应,目前基于多群体智能 理论的自组织方法通过模拟蜂群、蚁群、鸟群、鱼群等生物群体的行为实现多无人机自组 织,具有计算简单、鲁棒性好等优点。
[0006] 由于每架无人机携带的装备有限,为了更大发挥每架无人机的性能,在一个多无 人机构成的编队里,往往会存在具有不同功能的无人机,通过无人机之间的合作,完成复杂 任务。然而,目前以侦察型和察打型无人机所组成的异构多无人机系统为研究对象的任务 自主规划方法还很罕见。一篇中国专利(公开号为105302153A,【公开日】为2016-2-3)公开了 一种"异构多无人机协同察打任务的规划方法",该方法利用异构多种群蚁群算法求解任务 规划模型,可以解决复杂约束条件下的多无人机多任务分配问题,但是该方法是针对离线 情况的整体任务规划,对于动态环境的适应性不强。

【发明内容】

[0007] 本发明所要解决的技术问题在于克服现有技术不足,提供一种异构多无人机系统 协同察打任务自组织方法,可在提高系统中无人机的自主水平的同时,有效提高异构多无 人机系统对重点区域内的目标搜索和打击能力。
[0008] 本发明具体采用以下技术方案解决上述技术问题:
[0009] 异构多无人机系统协同察打任务自组织方法,所述异构多无人机系统包括多架参 数相同的侦察型无人机和多架参数相同的察打型无人机;侦察型无人机负责环境的搜索, 确定目标;察打型无人机主要负责打击侦察确定之后的目标,其余时间辅助侦察型无人机 执行搜索任务,并将发现的可能存在的目标发送给侦察型无人机以待进一步确认;侦察型 无人机对察打型无人机的信息支持包括自身位置信息和目标信息,其中位置信息通信发生 在侦察型无人机的每次决策后,目标信息通信发生在侦察型无人机确认到目标时;在察打 型无人机未接到打击任务时,配合侦察型无人机进行搜索任务,并将发现的目标信息发送 给侦察型无人机;当侦察型无人机和察打型无人机之间的距离小于安全距离时,察打型无 人机机动避开侦察型无人机;所述任务自组织方法包括以下步骤:
[0010] 步骤1、将所述异构多无人机系统分解成一个同构的侦察型无人机系统和一个同 构的察打型无人机系统;
[0011] 步骤2、所述侦察型无人机系统利用协同搜索任务自组织方法进行系统中各侦察 型无人机的初步任务规划;所述察打型无人机系统利用协同察打自主任务规划方法进行系 统中各察打型无人机的初步任务规划;
[0012] 步骤3、侦察型无人机和察打型无人机根据各自的初步任务规划,按照以下方法进 行协同:
[0013] (1)侦察型无人机
[0014] 1:侦察型无人机根据规划结果前进一个步长;
[0015] 2 :侦察型无人机对周围环境进行搜索,如果确认目标,将目标信息发送给察打型 无人机;
[0016] 3:侦察型无人机更新对环境的认知信息;
[0017] 4:侦察型无人机将当前位置信息发送给察打型无人机;
[0018] 5:判断侦察型无人机任务是否结束,否,则转到1,重复执行1-5,直到任务结束;
[0019] (2)察打型无人机
[0020] 1:察打型无人机根据目标信息和自身位置信息决策执行打击任务还是搜索任务, 如果察打型无人机接收到目标被确认的信息,则根据目标价值及目标距离判断是否执行对 该目标的打击任务,如是,则继续执行2,否则执行辅助搜索任务,转到3;
[0021] 2:察打型无人机向目标位置移动并执行打击任务;
[0022] 3:察打型无人机继续进行转移,并对周围环境进行搜索,如果发现目标,将目标信 息发送给侦察型无人机;
[0023] 4:判断察打型无人机任务是否结束,否,则转到1,重复执行1-4,直到任务结束。
[0024] 优选地,所述协同搜索任务自组织方法具体如下:
[0025] 步骤1、根据侦察型无人机系统的当前状态对未来多个阶段的输入进行预测,并根 据预测输入以及运动模型计算未来多个阶段的侦察型无人机系统的状态;
[0026] 步骤2、以综合优化指标函数最大为优化目标,优化求解侦察型无人机系统最优的 决策输入序列,然后把决策序列的第一项输入到侦察型无人机系统中;所述综合优化指标 函数具体如下:
[0027] J(X(k),U(k)) = 〇iJt+〇2je
[0028] 其中,X(k)、U(k)分别表示侦察型无人机系统的状态和决策输入;《2是权重系 数;闳为在当前k时刻决策输入下无人机转移到下一位置期间发现目标的 可能性,乂.,(幻是第i架侦察型无人机掌握的目标存在概率值,(m,n)表示任务区域所离散化 栅格中的任意一个,SiS侦察型无人机的探测范围,Nv为所述侦察型无人机系统中的无人机 总数乂从)=|] Z 尤#))表示整个任务区域内信息确定度的增量,R表示整个任 {m,n )e:i? 务区域是第i架无人机掌握的信息确定度,xm(k)的更新公式如下:
[0029] = n,n
[lmt, (k) + 0-5(l - X,nn W)
[0030] e表示衰减因子,表征动态环境;
[0031] 步骤3、根据决策输入的下一时刻的目标位置,为侦察型无人机在线规划出安全航 迹。
[0032] 优选地,所述协同察打自主任务规划方法具体如下:利用分布式蚁群算法规划出 察打型无人机系统中各无人机的航路点,并使用Dubins曲线连接航路点,生成察打型无人 机系统中各无人机的在线察打航迹;察打型无人机在探测到所规划的在线察打航迹上存在 威胁时,生成躲避威胁路径以避过威胁。
[0033] 相比现有技术,本发明具有以下有益效果:
[0034] 本发明把多架侦察型无人机和多架察打型无人机所组成的异构系统分解成同构 的侦察型和察打型无人机系统,分别利用同构协同搜索和同构协同察打任务自组织算法进 行任务规划,然后基于此设计了侦察型和察打型无人机之间的协作方式,从而实现异构多 无人机系统的自主任务规划。进一步地,本发明的同构协同搜索任务自组织基于分布式模 型预测控制的方法,在决策时通过融入未来的环境信息,使得决策的结果能更好地应对环 境的变化,相当于系统根据变化提前做出应对,系统将会具有更好的环境适应性和任务适 应能力;同构协同察打任务自组织基于分布式的蚁群算法,在每架无人机本地问题的构建 过程中,设计了没有探测到威胁情况下的正常飞行模式以及探测到威胁时的躲避威胁模 式,可以更好的适应在线要求。
【附图说明】
[0035] 图1为本发明所述的异构多无人机系统的任务规划总体框架;
[0036] 图2为本发明所述的基于MPC的多无人机协同搜索任务过程;
[0037] 图3为本发明所述的多无人机协同搜索过程中粒子群算法流程图;
[0038]图4为本发明所述的多无人机协同搜索过程中Bezier曲线示意图;
[0039] 图5为本发明所述的多无人机协同察打过程中任务规划算法流程图;
[0040] 图6为本发明所述的多无人机协同察打过程中正常飞行模式流程图;
[0041] 图7为本发明所述的多无人机协同察打过程中威胁躲避模式流程图;
[0042] 图8为本发明所述的多无人机协同察打过程中无人机探测到障碍物示意图;
[0043]图9为本发明所述的异构多无人机系统的任务规划流程图;
[0044] 图10为采用本发明所述方法100s时无人机仿真航迹图;
[0045] 图11为采用本发明所述方法召集信息素浓度过程一个示例;
[0046] 图12为采用本发明所述方法召集信息素浓度过程另一个示例;
[0047] 图13为采用本发明所述方法目标被摧毁后信息素浓度示意图;
[0048] 图14为采用本发明所述方法1000s时无人机仿真航迹图。
【具体实施方式】
[0049]下面结合附图对本发明的技术方案进行详细说明:
[0050]首先进行如下说明:
[0051] 1、同构侦察型无人机系统:本发明所述的同构侦察型无人机系统是指由参数相同 的多架侦察型无人机构成的系统。
[0052] 2、同构察打型无人机系统:本发明所述的同构察打型无人机系统是指由参数相同 的多架察打型无人机构成的系统,其中察打型无人机配备了探测传感器和打击武器,具有 侦察和打击功能。
[0053] 3、异构多无人机系统:本发明中所述的异构多无人机系统是指由上述两种系统混 合在一起构成的多无人机系统。
[0054]本发明的异构多无人机系统协同察打任务自组织方法,具体如下:
[0055] 步骤1、基于分解的思想,设计侦察/察打型异构多无人机系统的任务规划总体框 架,把异构系统分解成同构的侦察型和察打型无人机系统,并设计侦察型和察打型无人机 之间的协作方式。
[0056] 设计侦察/察打型异构多无人机系统的任务规划总体框架如图1所示,侦察型UAV 负责环境的搜索,确定目标;察打型无人机主要负责打击侦察确定之后的目标,其余时间辅 助侦察型无人机执行搜索任务,并将发现的可能存在的目标发送给侦察型无人机以待进一 步确认。
[0057] (1)侦察型无人机对察打型无人机的信息支持
[0058] 侦察型无人机对察打型无人机的信息支持包括自身位置信息和目标信息,其中位 置信息通信发生在侦察型无人机的每次决策后,目标信息通信发生在侦察型无人机确认到 目标时。
[0059] (2)察打型无人机对侦察型无人机的信息支持
[0060] 在察打型无人机未接到打击任务时,要配合侦察型无人机进行搜索任务,察打型 无人机配备的探测传感器级别没有侦察型无人机高,察打型无人机发现的目标信息发送给 侦察型无人机,以便于进一步确认。
[0061] (3)察打型无人机与侦察型无人机之间的防碰处理
[0062]除了无人机内部的防碰处理,考虑到察打型的无人机的机动性比侦察型无人机 强,因此当侦察型和察打型无人机之间的距离小于安全距离时,察打型无人机机动避开侦 察型无人机,具体处理措施为察打型无人机状态转移规则中的防碰转移。
[0063] 步骤2、所述侦察型无人机系统利用协同搜索任务自组织方法进行系统中各侦察 型无人机的初步任务规划;所述察打型无人机系统利用协同察打自主任务规划方法进行系 统中各察打型无人机的初步任务规划:
[0064] 本发明基于分解的思想,将异构多无人机系统分解为两个同构的子系统,并设计 了两个子系统之间相应的协作方式,这样两个子系统可分别采用现有方法进行任务规划, 从而可有效减小任务规划的算法复杂度,提高任务规划的实时性。例如,其中同构的侦察型 无人机系统可米用Baum M在"A search-theoretic approach to cooperative control for uninhabited air vehicles"中采用的贪婪式等方法进行协同搜索任务的组织规划; 同构的察打型无人机系统可采用陈岩博士的博士学位论文"蚁群优化理论在无人机战术控 制中的应用研究"中的蚁群算法等方法进行协同察打任务的组织规划。
[0065] 本发明针对分解后的同构侦察型无人机系统和同构察打型无人机系统,分别设计 了一种协同搜索任务自组织方法和一种协同察打自主任务规划方法。其中,所述协同搜索 任务自组织方法采用基于分布式模型预测控制(distributed model predictive control,DMPC)的方法进行问题分解,然后运用粒子群算法进行求解。所述协同察打自主任 务规划方法基于分布式的蚁群算法,在每架无人机本地问题的构建过程中,设计了没有探 测到威胁情况下的正常飞行模式以及探测到威胁时的躲避威胁模式,可以更好的适应在线 要求。下面分别对这两种方法进行详细说明。
[0066] 一、协同搜索任务自组织方法:
[0067]基于DMPC的多无人机协同搜索任务过程如图2所示,主要包括状态预测、优化任务 决策以及在线航迹规划三部分。
[0068]步骤(1)、状态预测
[0069] 状态预测根据无人机的当前状态对未来N阶段的输入进行预测,并根据预测输入 以及运动模型计算未来N阶段的无人机状态。
[0070] 首先将任务区域R离散化为LXW个栅格,假设无人机的搜索是在平面进行的,建立 无人机系统的状态模型,第i架UAV在k时刻的状态为^(1〇 =[邱1(10,队(10],邱1(1〇是第1 架UAV在离散栅格中的坐标,队(k)是航向,第i架UAV在k时刻的决策输入为u 1 (k) = [ Vi (k), Aih(k)],Vi(k)是第i架无人机的速度,Aih(k)是航向偏转角度。
[0071] 系统的动态模型描述为: xpiiji + l) - xpi、k、+ f(wi(k、,i{k'),Ai//i、k))
[0072] -[_ ^(k) + A^(k) _ (1)
[0073 ]由k时刻的状态和输入便可以计算出k+1时刻UAV的状态。
[0074]步骤(2)、优化任务决策
[0075] 优化任务决策通过求解构建的综合优化指标函数得到最优的决策输入序列,然后 把决策序列的第一项输入到无人机系统中。
[0076] 多UAV协同搜索要求在UAV在尽量短的时间内发现并确认尽量多的目标,任务指标 用J(X(k),U(k))表示,其中X(k)是多无人机系统的状态,U(k)是多无人机系统的决策输入, 综合考虑目标发现收益和环境搜索收益,建立多无人机协同搜索任务性能指标。
[0077] 1.目标发现收益
[0078] 在进行无人机的每次决策时,首先要考虑的是目标发现收益,即在当前决策输入 下无人机转移到下一位置期间发现目标的可能性,用Jt表示。设每个栅格(m,n)(mG{l, 2,一丄},1^{1,2,一,1})在袖寸刻的目标存在概率为?_(1〇,信息确定度为乂_(1〇。1的计算 公式如下,用探测范围Si内的目标存在概率的总和表示。
[0079] J,(k) = Y, 2 ⑵
[0080] 式中,K,"㈨是第i架无人机掌握的目标存在概率值,p?(k)更新公式如下
(未探测) (已探测且咐)=1) (已探测且咐)=0)
[0082]式中,由于传感器的不确定性,PD是传感器的探测概率,即存在目标并且传感器探 测到目标的概率,Pf是虚警概率,表示不存在目标但传感器探测到目标的概率。
[0083] 2.环境搜索收益
[0084] 环境搜索收益反映了无人机对环境信息的掌握程度,用整个任务区域内信息确 定度的增量表示,如下
[0085] = (功 (4) t=\
[0086] 式中,R是整个LXW的任务环境,尤是第i架无人机掌握的信息确定度,xmn(k)的 更新公式如下
[0087] ,,",介 + 1)=卜1: (5:) {zmtl (k) + 0.5(1 - Xmn (k)) (BkJi)
[0088] 综上所述,多无人机系统在状态X(k),输入U(k)下的整体性能指标为
[0089] J(X(k),U(k))= c〇iJt+?2Je (6)
[0090] 式中,是权重系数,考虑到Jt和Je具有不同的数值范围,为了消除由于Jt和 1相差较大带来的决策影响,因此先要对Jt和1进行归一化处理。
[0091 ]设第k时刻多无人机系统的状态集合为办)= {.V(幻,x2⑷(幻),控制决策输入集 合为w(幻={々幻Y(幻,⑷丨,基于模型预测控制的思想,建立N步预测的滚动优化模型, 设x(k+q | k)和u(k+q | k)是在k时刻对k+q的状态和输入的预测。第k时刻N步预测的状态为X (k),控制决策输入为U(k),记
[0092] J(X{k),U(k)) = ^J(x(k + q I k},M(k + q \ k)) q=Q
[0093] 将多无人机系统看成有多个同构独立的单机和机间通信构成的网络,建立分布式 模型预测控制(DMPC)的优化模型。k时刻无人机i的N步预测状态集合记为X^k),控制决策 输入集合记为Udk),无人机i的掌握的其他无人机的状态信息和决策输入信息分别为 X,(k), 0,{k)〇 X:(k) = [y (/f + l|/r),--? ,x (/c + -1 i /c)] = (是 +11 々),'..,!'(/( +A'一 11/<)]
[0094] _ , , (7} Xl(k) = {Xl{k)\j*i] U,(k) = {U,{k)\j^i]
[0095] 分解成每个无人机的局部优化问题, U' () = arg max Jt (X;. (k), Ut (Ic), X, (/c), Ut (k)) f. "女): s.L
[0096] x ^ ^ + 11 ^) - /(x^k + q | k\ui (k + q\ k)) q:m2 X);(/r]^) = x;(/r) GiX^klU^klX^klU,^)) < 0
[0097]式中,G(*)<0为约束条件,如无人机之间的安全距离以及无人机最大偏转角度 等,其他无人机系统的i;⑷,泛⑷通过无人机之间的通信可以获得。
[0098] 假设多无人机系统不存在通信延时,在每架无人机的本地问题求解过程中无人机 之间可以进行多次通信,求解过程如下:
[0099] 1)在k时刻,每架无人机对未来N步的输入序列进行预测,并发送给其他无人机,同 时令迭代次数t = 1,(*) = k汾丨幻,…认+况-11幻];
[0100] 2)每架无人机在获知其他无人机的预测输入后,求解式(8),得到最优解序列 ufm;.
[0101] 3)每架无人机将各自的本次最优解与上次的求解结果进行对比,当每架无人机都 满足
[0102] |〇)-【/; (/c)L U 或,
[0103] 条件时,则终止本次迭代,= :,并转到4),否则,只要有一个系统没有满 足结束条件,则令t=t+i,并且将本次迭代结果w(/〇=t/r (幻发给其他无人机子系统,并转到 2);
[0104] 4)每架无人机取本地最优解〇):的第一项作为k时刻的最优决策输入即 (幻=?:(/c|幻输入到系统中;
[0105] 5)令k = k+l,进行下一时刻的决策,返回到1)。
[0106] 在本地问题的求解中,本发明采用PS0算法进行式(8)的求解。
[0107] 设粒子维数为L,第i粒子的第〇(l<〇<L)维元素的速度和位置的更新公式如下,
[0108] \〇k+l = +c\R{{Pbest -Xj J) + c2R2{Gbest -xj ok) (9)
[0109] + (10)
[0110] 式中,k代表迭代次数,Cl和C2是非负常数,一般取C1 = C2 = 2,多数情况下0<C1 = C2 彡4,心和1?2是分布于[0,1]区间的随机数,《为惯性因子,本发明采用如下线性递减公式,
(II)
[0112] 式中,m为当前迭代次数,Mmax是最大迭代次数,《max和《min分别表示《的最大值和 最小值。
[0113] 构建粒子结构为2XN维的矩阵,N为预测步数,第一维记为rv,第二维记为通过 下式便可以转化为速度和航向偏角。
[0114] |;;e[-U] (12) If: v 咖)+ 1'_ ;; e[0,l]
[0115] 选取式(8)中每架无人机的性能指标Ji(Xi(k) ,Ui(k),2,(/c),6T,(/c))作为粒子群算法 中适应度函数,得到粒子群算法的流程图如图3所示。
[0116] 步骤(3)、在线航迹规划
[0117] 经过粒子群算法求解后,得到下一时刻的航路点,在线航迹规划模块根据决策输 入的下一时刻的目标位置,为无人机在线规划出安全航迹。考虑到时间约束问题,本发明采 用Bezier(贝塞尔)曲线进行在线航迹的生成。
[0118] Bezier曲线的定义有四个点:起始点P:、终止点Pf (也称锚点)以及两个相互分离的 中间点Pi,P2,如图4所示,滑动两个中间点,曲线的形状会发生变化。
[0119] 曲线可以由下面的表达式生成,
[0120] Pbezier(t) = a-t)3Pi+3t(l-t)2Pi+3t2(l-t)P2+t 3Pf (13)
[0121 ] 式中,当t从0到1变化时,便会生成一条Bezier曲线。如果令,t = t/T代入上式,可 以得到,
(14)
[0127]式中,当t从0到T变化时,便会生成一条从起始点Pi到终止点Pf满足时间T约束的 Bez ier曲线,是沿着PiPi方向的单位向量,是沿着PfP2方向的单位向量,是沿着 PiPf方向的单位向量,设向量逆时针旋转为正,贝1J和% f可由、旋转得到,如式(17)和式 (18)所示。式(14)两边对t求导,可以得到速度曲线,在PdPPf处的速度大小相同,均为
(19)
[0129] 因此,为了保证速度的连续性,不同航路段需要保证以相同。
[0130] 在该航迹生成问题中,Pi是当前时刻无人机的位置,Pf是决策的下一时刻的目标位 置,是当前时刻速度矢量方向,.是下一时刻的目标方向,01 =加i-lfeiPf,且令01 = 02,当 给定Di的值时便可以求出Bez i er曲线的解。
[0131] 二、协同察打自主任务规划方法:
[0132] 针对同构多无人机协同察打自主任务规划问题,为每架无人机设计如图5所示的 算法流程图。考虑到实际环境不可避免的存在障碍以及威胁的情况,在无人机本地问题的 构建过程中,设计了两种飞行模式,包括没有探测到威胁情况下的正常飞行模式以及探测 到威胁时的躲避威胁模式。在正常飞行模式下,无人机根据一定的规则选择执行协同搜索 任务或是打击任务,并对周围环境实时探测,当探测到威胁时,转入到躲避威胁模式;在躲 避威胁模式下,每架无人机的躲避威胁路径生成器会快速生成躲避威胁的路径;当成功绕 开威胁后,无人机重新回归到正常飞行模式;两种模式之间在满足相应的条件时可以进行 相互切换,实现整个任务过程的安全协同飞行。
[0133] 假设无人机是在二维平面内运动,将任务区域离散化为LXW个栅格,并将无人机 机动性能对应于离散空间的搜索中,将无人机的运动体现为在离散栅格点中的运动。设无 人机的探测范围在任务区域平面上的投影半径为R,在半径为R的圆以内的栅格可以被探测 到,假设目标出现在无人机的探测范围内便可以被无人机发现,无人机最大转角为?,无 人机的速度为V,在单位时间内的位移为d。
[0134] 步骤(1)、正常飞行模式设计
[0135] 正常飞行模式下的协同察打任务自组织过程基于蚁群算法实现,用每只蚂蚁代替 一架无人机,设计每只蚂蚁的算法流程图,如图6所示。每个蚂蚁分配了一个独立的处理器, 用来构建自己的问题解决方案,每只蚂蚁按照一定的规则完成搜索、消耗行为,维护自身的 信息素结构,并与其他的蚂蚁进行有限的通信。其中,主要的问题包括信息素更新机制和状 态转移规则的设计。
[0136] 首先设计信息素更新机制。蚁群通信的一种重要介质是分泌在空间中的信息素, 通过判断信息素浓度的大小决定蚂蚁的运动方向。据此设计协同察打任务中的环境信息素 结构
[0137] = 1=1,…,% r=l,[ (20)
[0138] 式中,〇〇表示为第i只蚂蚁在k时刻存储的栅格(x,y)处的信息素浓度值。浓度 值的大小表征了该栅格对蚂蚁的吸引程度,是蚂蚁代理行动决策的基础。
[0139] 由于采用的无中心节点的分布式结构,因此蚂蚁代理只对本地的信息素结构进行 更新,包括搜索信息素更新、发现食物时的召集信息素更新。
[0140] 1.搜索信息素的更新
[0141 ] 1)搜索过区域的信息素浓度值更新
[0142] 当蚂蚁代理完成一次状态转移后,需要根据自身和其他蚂蚁代理的空间分布情况 进行信息素更新,降低已经搜索过的区域的信息素浓度,避免过多地对某块区域的进行重 复搜索。
[0143] 设当前时刻为k,蚂蚁代理i掌握的蚂蚁代理j的信息为
[0144] Info^f = {(xlli,yl,klPSIjJ,},k J<k (21)
[0145] 式中,)是蚂蚁代理j在kj时刻的位置,是蚂蚁代理j在kj时刻的运动 信息,即运动方向。据此蚂蚁代理i预测的蚂蚁代理j在k时刻的信息为
[0146] Inf0*j,k={(x*j, k,y*j,k),PSI*j,k} (22)
[0147] 设计蚂蚁代理i的本地局部信息素更新公式为
[0150] 式中,是蚂蚁代理j造成的信息素衰减量,Aq为局部信息素衰减常量, 叫^),(/^,//1))为两栅格&,5〇与(//』,/,. /()之间的距离。可以看出,式(24)仅针对搜索区 域内的信息素进行更新。
[0151] 2)全局信息素浓度值的更新
[0152] 由于环境的不确定性即目标的动态性,某一区域虽然被搜索过,但是随着时间的 推移仍然有目标出现的可能,因此需要隔一段时间就对信息素进行一次全局增强,更新公 式为
[0153] r(\. ^(^ + 1) = ^ v)W + FxAr^ (25)
[0154] 式中,FG(〇,l)为环境不确定因子,其值越大,说明环境的不确定性越强;ATg。是全 局信息素更新常量。
[0155] 2.召集信息素更新
[0156] 1)发现食物源
[0157] 当有UAV发现新目标时,为了缩短目标存在时间,可以通过召集信息素的更新召集 附近的UAV-起对目标进行打击。因此当发现新食物源时,将该食物源的信息发送给其他蚂 蚁,各蚂蚁代理在获知该食物源信息后对其本地的信息素结构进行更新,以便于决策自己 是否向该食物源移动。新增食物源信息时的信息素更新公式为,
(26)
[0159]式中,Vgain是食物源的价值,(XF,yF)是食物源的位置,S是食物源带来的信息素增 强的影响范围因子,通过调整S的大小可以对食物源召集蚂蚁的范围进行调整,反应了蚂蚁 之间的合作程度和范围。
[0160] 2)食物源被耗尽
[0161] 当食物源被耗尽时,需要消除召集信息素的影响,通过下面的公式使得食物源附 近区域的信息素浓度降低到被发现之前的水平。
(27)
[0163] 然后设计状态转移规则。状态转移规则分为常规转移和防碰转移。当蚂蚁代理周 围安全范围内不存在其他蚂蚁时,按照常规转移规则移动,当探测到其他蚂蚁代理时,则采 取紧急规避模式,尽快拉开与其他蚂蚁代理的距离。
[0164] 本发明的常规状态转移公式选取为: 「。1 {k + I) = nni iricix (ra(GR!D(k + I))x (GRIDik I))) (28) LUIUUJ
[0166] 式中,ct是状态转移中信息素浓度重要程度因子,0是状态转移中启发函数重要程 度因子,启发函数定义如下 L -W j
[0167] /? = P = YJlLnode^y lLxW (29) x=l.v-l j
[0168] 式中,nodex,y = 0表示栅格(x,y)未被搜索过,nodex,y=l表示栅格(x,y)已被搜索 过。
[0169] 另外,如果式(28)存在多个解时,取偏转角最小的栅格作为唯一解。进一步考虑蚂 蚁四周都是已经搜索的栅格的情况下,蚂蚁将陷入局部搜索中,靠自己跳出这种现象需要 的较长的时间,因此采用下面的改进方法:当迭代次数超出设定值Nt而覆盖率仍未发生改 变时,改变转移规则,使UAV向未搜索过的区域移动。
[0170] 步骤(2)、威胁躲避模式设计
[0171] 当障碍物与路径相交时,路径规划器将产生一个中间航路点使其避开障碍物,在 该算法中,路径规划器通过选择新航路点的方式重新规划该路径,如图8所示,图中阴影部 分是障碍物,安全圆上的点M和N是中间点,障碍物与原始路径的交点为X:(进入)和X 2(离 开)。用直线连接XjPX2,再作一条与这条直线垂直的线,这条垂线与障碍物安全圆的交点M 和N,即为可选的中间航路点。中间航路点的选取基于障碍物圆心C与直线XiX 2的相对位置, 如果C点在Xi-X2的右边,那么选择在障碍物左边的点M作为中间航路点,反之选择N点作为中 间航路点。图中虚线Y表示原始路径,实线Y '是通过中间点M产生的躲避威胁路径,本发明 采用Dubins曲线生成躲避威胁路径。
[0172]威胁躲避模式的流程图如图7所示,设威胁半径为Rt,无人机探测到威胁时距离威 胁边缘的距离为dt,dt$R,当无人机探测到威胁后,开始进入躲避威胁模式。
[0173] 步骤(3)、在线察打航迹生成
[0174] 在每架无人机的正常飞行模式下,利用分布式蚁群算法生成的仅是航路点,航路 点之间的连接要考虑到无人机实际飞行时的机动性能,不能直接直线连接,到此处不需要 考虑时间约束问题,因此采用简单的Dubins曲线连接,其中起始速度方向和目标点已知,起 始圆半径为无人机的最小转弯半径,此时Dubins曲线由一条圆弧和一条切线组成。
[0175] 步骤3、侦察型无人机和察打型无人机根据各自的初步任务规划,进行协同:
[0176] 本发明侦察/察打型异构多无人机系统的协同察打任务规划流程如图9所示,可以 描述为如下过程:
[0177] (l)R-UAV
[0178] 1:R-UAV根据决策结果前进一个步长;
[0179] 2: R-UAV对周围环境进行搜索,如果确认目标,将目标信息发送给RA-UAV;
[0180] 3 :R_UAV根据获取的环境和目标信息更新本地搜索图信息;
[0181 ] 4:R-UAV将当前位置信息发送给RA-UAV;
[0182] 5:判断R-UAV任务是否结束,否,则转到1,重复执行1-5,直到任务结束。
[0183] (2)RA-UAV
[0184] 1: RA-UAV根据目标信息和自身位置信息决策执行打击任务还是搜索任务,如果 RA-UAV接收到目标被确认的信息,且该RA-UAV处于目标召集信息素作用范围内,则下面执 行打击任务,继续执行2,否则执行辅助搜索任务,转到3;
[0185] 2:RA_UAV在召集信息素的作用下按照状态转移规则向目标位置移动;
[0186] 3: RA-UAV按照状态转移规则进行转移,并对周围环境进行搜索,如果发现目标,将 目标信息发送给R-UAV;
[0187] 4:判断RA-UAV任务是否结束,否,则转到1,重复执行1-4,直到任务结束。
[0188] 在R-UAV的3中获取的目标信息包含来自RA-UAV的3中发送的目标信息,RA-UAV的1 中的目标信息来自R-UAV的2。
[0189] 为了验证本发明对异构多无人机系统协同察打的有效性,进行如下仿真实验。仿 真工具采用Matlab软件。设18个目标分布在40kmX40km的任务区域内,进一步假设任务环 境中不存在威胁。
[0190] 步骤2中相关参数设置:环境因子t = 0.98,对环境信息的初始认知为:每个栅格的 目标存在概率均设为〇. 5,环境信息确定度均为0;N = 5,权重系数《 i = 0.5,《 2 = 0.5;最大 迭代次数为tmax = 5,无通信时延,Bezier曲线参数设置Di = 1.6km;粒子群参数设置:粒子数 50,ci = 2,C2 = 2, 〇max = 0.9, 〇1^ = 0.4,1111£? = 700,当迭代超过150次函数的梯度值仍然没 有变化则退出迭代;侦察型无人机的相关参数设置:R-UAV携带的传感器探测半径为lkm,P D =0.8,Pf = 0.2,存在两架无人机协同搜索,最大飞行速度为250m/s,最大转角式HX = 45deg, 初始位置分别为(〇,〇) km、( 40,40) km,每次决策间隔时间为30s。
[0191] 步骤3中相关参数设置:不考虑环境中存在威胁的情况下,将任务区域50kmX50km 划分为1000 X 1000的离散网格;察打型无人机的相关参数设置:RA-UAV携带的传感器探测 半径为lkm,PD = 0.7,PF = 0.3,两架无人机协同察打,速度为250m/S,每隔lS按照状态转移规 则转移一次,最大转角= 45deg,每次攻击对目标的损坏程度为1;为了与侦察型无人机初 始时保持一定的距离,设初始位置分别为(〇,〇.05)km、(40,39.95)km,每3s内部通信一次; 其他参数设置么气. =1..,=丨()o,F = O.O22,5 = 9O,a = l,0 = 5,Nt = 5O。
[0192] 侦察型无人机每次决策间隔时间为30s,即每隔30s侦察型无人机向察打型无人机 单向传递当前位置。
[0193] 仿真100 s (RA-UAV决策100次)时,此期间R-UAV向RA-UAV单向传递位置信息3次,在 6 0 s时,R-UA V1发现并确认目标11和4,此时R-UA V1把11和4的信息发送给RA-UA V1和RA-UAV2,RA-UAV1和RA-UAV2根据接收的目标信息更新本地的信息素浓度表,因为包含两个目 标,将两个目标产生的召集信息素叠加得到图11,此时,RA-UAV1和RA-UAV2根据自身距离目 标的位置,在式(26)的作用下,RA-UAV1处于目标11和4带来的召集信息素增强的影响范围 内,因此RA-UAV1被吸引去打击目标,从图10中也可以看出,RA-UAV1的航迹在(0,15)km附近 发生偏转,朝向目标11发展,便是由于召集信息素的吸引作用。
[0194] 图12所示的信息素浓度是RA-UAV1摧毁目标11后本地的信息素浓度,此时存在的 浓度的高斯分布是目标4造成的,也反映了图11中的信息素浓度是目标11和4的叠加效果, 当RA-UAV1继续摧毁目标4后,本地的信息素浓度如图13所示,此时不存在目标召集信息素 的高斯分布,浓度较低的地方是无人机已经搜索过的区域。
[0195] 进行一次1000s的仿真(RA-UAV决策1000次),无人机的航迹图如图14所示,此时被 摧毁目标数为15,目标5、9、15为被摧毁,任务区域覆盖率达到68.5 %。
[0196] 实验参数设置不变,进行10次仿真实验,每次仿真1000s(RA-UAV决策1000次),此 期间R-UAV向RA-UAV单向传递位置信息33次,18个目标,每次实验目标的位置分布不同,进 行如下几组仿真实验:
[0197] 实验1:同构的协同搜索采用基于DMPC的算法,同构的协同察打采用基于改进分布 式的蚁群算法,协作方式采用本发明所述目标信息的双向通信和位置信息的单向通信。
[0198] 实验2:同构的协同搜索采用贪婪时搜索算法,同构的协同察打采用基于改进分布 式的蚁群算法,协作方式采用本发明所述目标信息的双向通信和位置信息的单向通信。
[0199] 实验3:同构的协同搜索采用基于DMPC的算法,同构的协同察打采用基于改进分布 式的蚁群算法,协作方式采用侦察型向察打型的单向目标信息和位置信息通信。
[0200] 实验4:同构的协同搜索采用基于DMPC的算法,同构的协同察打采用基于改进分布 式的蚁群算法,协作方式仅采用侦察型向察打型的单向目标信息通信。
[0201] 其中实验1中的系统设置基于本发明所述方法,实验数据如表1所示,对比表中数 据可以看出,采用本发明所述异构多无人机协同察打的任务规划方法(实验1)具有最高的 平均发现及摧毁目标数。对比实验1和实验2的数据,进一步验证了基于DMPC的协同搜索算 法的发现目标的优势;实验1和实验3的数据对比体现了察打型无人机的辅助搜索功能,在 实验1中察打型无人机发现目标后通过把目标信息发送给侦察型无人机,有利于目标的快 速发现和确认;实验3和实验4的数据对比,说明了侦察型无人机的位置信息通过发送给察 打型无人机可以促进异构系统更多地发现目标,这是因为察打型无人机通过获取侦察型无 人机的位置信息,向未被侦察型无人机搜索过区域移动,从而在一定程度上扩大了异构多 无人机系统的搜索范围,进而能发现更多的目标。
[0202] 另外,实验1中平均摧毁的目标数少于发现数目是因为仿真停止时,有个别目标被 发现后未及时被RA-UAV摧毁。
[0203] 表1不同实验下多无人机异构系统的察打性能对比
【主权项】
1. 异构多无人机系统协同察打任务自组织方法,其特征在于,所述异构多无人机系统 包括多架参数相同的侦察型无人机和多架参数相同的察打型无人机;侦察型无人机负责环 境的搜索,确定目标;察打型无人机主要负责打击侦察确定之后的目标,其余时间辅助侦察 型无人机执行搜索任务,并将发现的目标发送给侦察型无人机以待进一步确认;侦察型无 人机对察打型无人机的信息支持包括自身位置信息和目标信息,其中位置信息通信发生在 侦察型无人机的每次决策后,目标信息通信发生在侦察型无人机确认到目标时;在察打型 无人机未接到打击任务时,配合侦察型无人机进行搜索任务,并将发现的目标信息发送给 侦察型无人机;当侦察型无人机和察打型无人机之间的距离小于安全距离时,察打型无人 机机动避开侦察型无人机;所述任务自组织方法包括以下步骤: 步骤1、将所述异构多无人机系统分解成一个同构的侦察型无人机系统和一个同构的 察打型无人机系统; 步骤2、所述侦察型无人机系统利用协同搜索任务自组织方法进行系统中各侦察型无 人机的初步任务规划;所述察打型无人机系统利用协同察打自主任务规划方法进行系统中 各察打型无人机的初步任务规划; 步骤3、侦察型无人机和察打型无人机根据各自的初步任务规划,按照以下方法进行协 同: (1) 侦察型无人机 1:侦察型无人机根据规划结果前进一个步长; 2:侦察型无人机对周围环境进行搜索,如果确认目标,将目标信息发送给察打型无人 机; 3:侦察型无人机更新对环境的认知信息; 4:侦察型无人机将当前位置信息发送给察打型无人机; 5:判断侦察型无人机任务是否结束,否,则转到1,重复执行1-5,直到任务结束; (2) 察打型无人机 1:察打型无人机根据目标信息和自身位置信息决策执行打击任务还是搜索任务,如果 察打型无人机接收到目标被确认的信息,则根据目标价值及目标距离判断是否执行对该目 标的打击任务,如是,则继续执行2,否则执行辅助搜索任务,转到3; 2:察打型无人机向目标位置移动并执行打击任务; 3:察打型无人机继续进行转移,并对周围环境进行搜索,如果发现目标,将目标信息发 送给侦察型无人机; 4:判断察打型无人机任务是否结束,否,则转到1,重复执行1-4,直到任务结束。2. 如权利要求1所述异构多无人机系统协同察打任务自组织方法,其特征在于,所述协 同搜索任务自组织方法具体如下: 步骤1、根据侦察型无人机系统的当前状态对未来多个阶段的输入进行预测,并根据预 测输入以及运动模型计算未来多个阶段的侦察型无人机系统的状态; 步骤2、以综合优化指标函数最大为优化目标,优化求解侦察型无人机系统最优的决策 输入序列,然后把决策序列的第一项输入到侦察型无人机系统中;所述综合优化指标函数 具体如下: J(X(k),U(k))= Q1J^O2Je 其中,X(k)、U(k)分别表示侦察型无人机系统的状态和决策输入;ω ^co2是权重系数;为在当前k时刻决策输入下无人机转移到下一位置期间发现目标的可 能性,K,,,(幻是第i架侦察型无人机掌握的目标存在概率值,(m,n)表示任务区域所离散化栅 格中的任意一个,&为侦察型无人机的探测范围,Nv为所述侦察型无人机系统中的无人机总 数表示整个任务区域内信息确定度的增量,R表示整个任务 区域,J:,, W是第i架无人机掌握的信息确定度,xm(k)的更新公式如下:ε表不衰减因子,表征动态环境; 步骤3、根据决策输入的下一时刻的目标位置,为侦察型无人机在线规划出安全航迹。3.如权利要求2所述异构多无人机系统协同察打任务自组织方法,其特征在于,所述优 化求解侦察型无人机系统最优的决策输入序列,具体方法如下: 设第k时刻侦察型无人机系统的状态集合为琳)=^#),彡(/4,…,祕,控制决策输入集 合为《(幻=丨Λ/t),?2(灯…#(幻丨,基于模型预测控制的思想,建立N步预测的滚动优化模型, 设x(k+q I k)和u(k+q I k)是在k时刻对k+q的状态和输入的预测;第k时刻N步预测的状态为X (k),控制决策输入为U(k),记:将侦察型无人机系统看成有多个同构独立的单机和机间通信构成的网络,建立分布式 模型预测控制的优化模型:k时刻无人机i的N步预测状态集合记为X1U),控制决策输入集 合记为U 1 (k),无人机i的掌握的其他无人机的状态信息和决策输入信息分别为 龙(幻、G(A),则有:分解成每个无人机的局部优化问题,具体如下: 'S..L 式中,G(*K〇为约束条件;所述求解过程具体如下: 1) 在k时刻,每架无人机对未来N步的输入序列进行预测,并发送给其他无人机,同时令 迭代次数t = 1(人.) = j 人.)]; 2) 每架无人机在获知其他无人机的预测输入后,求解所述局部优化问题,得到最优解 序列〇); 3) 每架无人机将各自的本次最优解与上次的求解结果进行对比,当每架无人机都满足 ΙΟ)-?/;(幻 I, U 或t>tmax 条件时,则终止本次迭代,)=[/T (々),并转到4),否则,只要有一个系统没有满足结束 条件,则令t = t+l,并且将本次迭代结果Κ(Α和〇)发给其他无人机子系统,并转到2); 4) 每架无人机取本地最优解<(々)的第一项作为k时刻的最优决策输入即w, (Zr) = <(/f I /f) 输入到系统中; 5) 令k = k+l,进行下一时刻的决策,返回到1)。4. 如权利要求3所述异构多无人机系统协同察打任务自组织方法,其特征在于,利用粒 子群算法求解所述局部优化问题。5. 如权利要求1所述异构多无人机系统协同察打任务自组织方法,其特征在于,所述协 同察打自主任务规划方法具体如下:利用分布式蚁群算法规划出察打型无人机系统中各无 人机的航路点,并使用Dubins曲线连接航路点,生成察打型无人机系统中各无人机的在线 察打航迹;察打型无人机在探测到所规划的在线察打航迹上存在威胁时,生成躲避威胁路 径以避过威胁。6. 如权利要求5所述异构多无人机系统协同察打任务自组织方法,其特征在于,所述分 布式蚁群算法中的常规状态转移公式如下:式中,gr/J (A·+ 1>表不是按照常规状态转移规则选出的下一时刻的位置,GRID(k+l)表 示下一时刻所有可能的位置点集合,α是状态转移中信息素浓度τ的重要程度因子,β是状态 转移中启发函数η的重要程度因子,启发函数定义如下:式中,nodex,y = 0表示栅格(x,y)未被搜索过,nodex,y=l表示栅格(x,y)已被搜索过,L、 W分别为整个任务区域的长度、宽度。
【文档编号】G05D1/10GK105892480SQ201610158677
【公开日】2016年8月24日
【申请日】2016年3月21日
【发明人】郜晨, 甄子洋, 龚华军
【申请人】南京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1