战场环境下多无人机时敏任务动态分配算法

文档序号:6306759阅读:365来源:国知局
战场环境下多无人机时敏任务动态分配算法
【专利摘要】本发明公开了一种多无人机时敏任务动态分配算法,可实现战场环境下多架无人机对多个时敏目标的打击;该算法利用任务拍卖思想构建时敏任务动态分配模型,该模型主要考虑了无人机的任务执行时间、毁伤能力、打击收益,以及执行当前任务对后续时敏任务时间窗口宽度和威胁程度的影响;无人机打击路径规划采用模型预测控制算法实现,主要完成无人机对威胁区域规避下的打击路径优化。
【专利说明】战场环境下多无人机时敏任务动态分配算法

【技术领域】
[0001] 本发明涉及一种分配算法,尤其涉及一种战场环境下多无人机时敏任务动态分配 算法。

【背景技术】
[0002] 时间敏感型目标简称时敏目标(Time-sensitive Targets, TST),主要指必须在有 限的"时间窗口"或"交战机会"内完成发现、定位、识别和打击的目标。由于TST的状态特 征存在很强的不确定性,使得无人机(Unmanned Aerial Vehicle, UAV)编队在打击该类型 目标时,需要根据TST的时间窗口宽度及当前状态,UAVs的性能及有效载荷差异,及时进行 任务和打击路径的动态优化,以保证UAVs编队执行时敏任务收益的最大化。
[0003] 目前,研究人员针对UAVs执行任务的耦合性与时间敏感特征,UAVs系统的异 构性与分散特征,提出了许多任务动态分配算法,如:分布式任务一致性算法、任务动 态规划算法、基于适应度优化的任务分配算法、基于市场拍卖的任务分配算法和基于博 弈论的任务分配算法等。其中,由美国麻省理工学院航空控制实验室Jonathan How、 Han-LimChoi 等人提出的捆绑一致性算法(Consensus-based Bundle Algorithm, CBBA)受 到了广泛关注。该算法将组合拍卖机制和分布式任务一致性理论相结合,能够在任务耦 合的条件下实现异构多智能体组合任务分配。该实验室在CBBA的基础上,进一步开发出 CCBBA(Coupled-Constraint Consensus-Based Bundle Algorithm)。该算法引入了智能体 执行任务时间,使CBBA具备了时敏任务分配能力。上述方法都是在TST时间窗口固定的假 设条件下,利用进化算法或贪婪搜索算法获得最优解,缺乏TST时间窗口随时间变化的情 况下任务动态分配能力,这将影响UAVs对TST打击的效果。


【发明内容】

[0004] 针对上述问题,本发明提出一种多无人机时敏任务动态分配算法,实现战场环境 下多架无人机对多个时敏目标的打击。该算法利用任务拍卖思想构建时敏任务动态分配模 型,该模型主要考虑了无人机的任务执行时间、毁伤能力、打击收益,以及执行当前任务对 后续时敏任务时间窗口宽度和威胁程度的影响;无人机打击路径规划采用模型预测控制算 法实现,主要完成无人机对威胁区域规避下的打击路径优化。
[0005] 为达到上述技术目的,本发明采用了一种战场环境下多无人机时敏任务动态分配 算法,UAVs编队采用Leader-Follower结构执行TST打击任务,Leader_UAV主要承担决策 者的角色,F 〇ll〇Wer_UAV承担打击者的角色。Leader_UAV将根据时敏任务变化情况,以及 F〇ll〇wer_UAV执行任务时间、毁伤能力和打击收益等因素完成编队任务分配。在Leader UAV任务分配的基础上,F 〇ll〇Wer_UAV将依照任务内容完成飞行路径规划和对TST打击,以 Leader_UAV充当任务拍卖者,Follower_UAV充当竞拍者。Follower_UAV将各自的竞拍价格 矩阵cost_auction (包括:与TST之间的距离d、执行执行TST打击任务的时间t、对TST的 毁伤能力Damage以及打击收益VLR)发送给Leader_UAV。在此基础上,Leader_UAV在TST 时间窗口宽度duration的约束下,根据cost_auction对竞拍者进行选择,完成任务分配。 duration受Follower_UAV执行当前任务的影响,其表达式如式(1)所示。cost_auction 中的各元素表达式如式(2)所示。
[0006] duratiorij (k) = duratiorij (k~l)+νΒΓ?Β--οη^· (1)
[0007] 式中,duratiorij表示TSTj的时间窗口宽度,variatior^j表示
[0008] Followei^UAVi执行当前任务对TSTj的时间窗口宽度的影响。
[0009] cos^auctioriij (k) = (1^· (k)/max ((1^-(k))+DamageiJ (k)
[0010] +VLRJJ (k) +max (t^· (k)) /1^· (k) (2)
[0011] +max (P-threatij (k)) /P-threati』(k)
[0012] 假设V = {1,2,…,N}为Follower_UAV数量,则编队中UAVs的数量为N+l,T = {1,2, ···,}为 TST 数量。式中,屯表示 FollowerJAV^i e V)与 TSTj(j e T)之间的距 离;hj 表示 FollowerJJAVi 执行 TSTj 打击任务时间;Damageij 表示 FollowerJJAVi 对 TSTj 的毁伤能力;表示FollowerJAVi打击TSTj的效益,它是Damageij和载弹量Loadi的 函数,其表达式如式(3)所示fjhreatij表示TSTj对FollowerJJAVi的威胁概率,将通过 TSTj的雷达对FollowerJAVi的瞬时跟踪概率Pdu在累计时间段Ts上的积分获得,其表达 式如式⑷所示。
[0013]

【权利要求】
1.战场环境下多无人机时敏任务动态分配算法,其特征如下,UAVs编队采用 Leader-Follower结构执行TST打击任务,Leader_UAV主要承担决策者的角色,Follower_ UAV承担打击者的角色,Leader_UAV将根据时敏任务变化情况,以及F〇ll〇Wer_UAV执行 任务时间、毁伤能力和打击收益等因素完成编队任务分配,在Leade r_UAV任务分配的基 础上,Follower_UAV将依照任务内容完成飞行路径规划和对TST打击,以Leader_UAV充 当任务拍卖者,F 〇ll〇Wer_UAV充当竞拍者,F〇ll〇Wer_UAV将各自的竞拍价格矩阵cost_ auction(包括:与TST之间的距离d、执行执行TST打击任务的时间t、对TST的毁伤能力 Damage以及打击收益VLR)发送给Leader_UAV,在此基础上,Leader_UAV在TST时间窗口 宽度duration的约束下,根据cost_auction对竞拍者进行选择,完成任务分配,duration 受Follower_UAV执行当前任务的影响,其表达式如式(1)所示,cost_auction中的各元素 表达式如式(2)所示, duratiorij (k) = duratiorij (k-1)+νΒΓ?Β--οη^· (1) 式中,duratiorij表示TST』的时间窗口宽度,variatior^j表示 Fo 11 owei^UAVi执行当前任务对TST」的时间窗口宽度的影响, cos^auctioriij (k) = (1^· (k) / max (?^· (k)) +DamageiJ (k) (k) +max (t。· (k)) /t。· (k) (2) +max (P-threatij (k)) /P-threatij (k) 假设V = {1,2, ···,N}为Follower_UAV数量,则编队中UAVs的数量为N+l,T = {1,2,…,M}为TST数量,式中,扎表示FollowerJAVdi e V)与TSTj(j e T)之间的距离; hj表示Follower_UAVi执行TST』打击任务时间;Damage^表示Follower_UAVi对TST』的毁 伤能力;VLRij表示FollowerJJAVi打击TST』的效益,它是Damageij和载弹量Loadi的函数, 其表达式如式(3)所示fjhreatij表示TST」对FollowerJAVi的威胁概率,将通过TST」的 雷达对Followei^UAVi的瞬时跟踪概率P dij在累计时间段Ts上的积分获得,其表达式如式 (4)所示,
(3) 式中,LoadiGO和Loadjk-l)分别表示FollowJAVi当前时刻与前一时刻的载弹量,
(4) 式中,C_t为当前的采样时刻,Ts为瞬时概率的累计时间段,Pdu是TSL的雷达对 Followei^UAVi的瞬时跟踪概率,其表达式如式(5)所示,
(5) 式中,Ru是FollowerJAVi与TST」之间的距离;Clj,c2j是常数,由TST」的雷达类型确 定;σ i 是?〇11〇?61'_1^\^ 的雷达散射截面积(Radar Cross-Section, RCS),UAV 的 RCS 是关 于UAV航向与TST水平方向的夹角λ,TST与UAV间的俯仰角侧向加速度与重力加速度 比值μ的函数,其表达式如式(6)、(7)、⑶所示,
Γ(6)
(7) (8) Leader_UAV 根据 cost_auction 完成任务分配,若 Follower_UAV 接到 Leader_UAV 下 发的任务,需计算其与执行TST之间的距离,如果该距离小于等于开始执行打击任务的最 短距离D_start,则Follower_UAV开始打击,并在原地盘旋直到目标击毁;否则,Follower_ UAV利用MPC算法进行打击路径规划,根据飞行器的运动学方程,建立非线性的预测模型如 式(9)、(10)、(11)、(12)、(13)所示,
(9) (10) z (k+1) = z (k) +s · sin ( Θ (k+1)) (11)
(12) Θ (k+1) = Θ (k) + θ 〇 · u0 (k) U0min 彡 u0 彡 U0max (13) 式中,(x,y,z)表示位置;s表示当前导航点和下一导航点之间的直线距离;P是方位 角,%是常量,表示方位角的变化步长,心是方位角的控制量,义_,是方位角控制 量的边界;Θ是俯仰角,Θ。是常量,表示俯仰角的变化步长, U0是俯仰角的控制量,Uemin, Uemax是俯仰角控制量的边界, ιιθ是通过滚动优化路径代价函数c〇st_path获得的最优控制量,本文的路径代 价函数c〇st_path由状态误差代价、TST雷达造成的威胁代价和控制域内的控制代价构成, C〇st_path中的各元素表达式如式(14)所示, cost_pathij (k) = α (k) CjC^· (k) (14) + β P_threatij (k) + y uT (k) u (k) 式中,Cij(k)表示Follower_UAVi与TST』之间的距离代价,即Cij(k)= (Xi-Xj, yi-yj,Zi-Zj)T, TSTj 的位置 Sj (k) = (Xj, Zj)τ 表示参考轨迹,α 为其权值,Q 为 UAVi 与TST之间的距离代价加权矩阵fjhreatij表示TST」对Followei^UAVi的威胁能力,β为 其权值;u(k)为控制量,γ为其的权值。
2.战场环境下多无人机时敏任务动态分配算法的实现,其特征在于,包含以下步骤: 步骤1 :Follower_UAV向Leader_UAV提交TST观测信息,Leader_UAV产生任务清单, 并根据式(1)进行任务拍卖,实现任务分配; 步骤2 :F〇ll〇wer_UAV根据任务分配结果,判断自身的任务列表是否为空,若为空,则 在当前位置盘旋等待,直到任务列表不为空时,按新的任务列表执行任务,否则执行步骤 3 ; 步骤3 :F〇ll〇wer_UAV根据自身的任务列表,判断与执行TST之间的距离,若此距离 小于等于D_start,则F〇ll〇Wer_UAV开始打击目标,并在原地盘旋直到目标击毁;否则, F〇ll〇wer_UAV将根据式(13)所获得的最优控制量进行路径规划,当达到打击距离后,开始 打击目标,并在原地盘旋直到目标击毁; 步骤4 :F〇ll〇Wer_UAV执行当前任务会对后续TST时间窗口宽度产生影响,需要对 UAVs编队任务分配和打击路径进行调整,将返回步骤1进行任务重规划,直至完成所有TST 的打击任务。
【文档编号】G05D1/12GK104155999SQ201410377834
【公开日】2014年11月19日 申请日期:2014年7月31日 优先权日:2014年7月31日
【发明者】任佳, 崔亚妮, 杜文才 申请人:海南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1