一种基于情景构建的无人机自主鲁棒决策方法

文档序号：6296680阅读：513来源：国知局

一种基于情景构建的无人机自主鲁棒决策方法
【专利摘要】本发明公开了一种基于情景构建的无人机自主鲁棒决策方法，其特征包括：1、定义战场中红方无人机的决策变量和蓝方阵地的决策变量；2、情景构建；3、利用影响图建模方法构建影响图；4、计算红方无人机决策候选行动方案集中每一种决策候选行动方案在情景集中的每一个情景下的期望效用值；5、红方无人机根据期望效用值进行鲁棒决策。本发明能有效解决无人机在复杂战场环境下的自主决策能力弱的问题，使得无人机在各种情景中都能进行自主决策，从而提高无人机的自主决策效率和决策效果，实现最优的行动方案选择，并保证决策方案的可行性、有效性和安全性。
【专利说明】一种基于情景构建的无人机自主鲁棒决策方法
【技术领域】
[0001]本发明涉及一种复杂战场环境下的基于情景构建的无人机自主鲁棒决策方法，属于计算机仿真与方法优化【技术领域】。
【背景技术】
[0002]无人机在现代战争中扮演着越来越重要的角色。在无人机的应用过程中，越来越强调其智能性、自主性，即在面临多变复杂外界条件时，要求无人机能够自主决策，决定自身下一步的行动方案。如无人机在执行情报搜索、目标追踪、目标侦查和精确打击等任务时，需要自主规划航路、自主采取机动动作、自主决定攻击方案等。这些决策行为通常是在复杂战场环境中做出的，存在巨大的风险性。因此，无人机在面临复杂战场环境时，自主决策应保证行动方案是可行的且在不同情景中能够有效执行，同时还能够最大幅度的降低风险，即无人机自主决策的鲁棒性。
[0003]无人机自主决策的研究目前主要集中于路径规划、任务分配和飞行控制领域。通常是根据决策任务提出路径规划算法、任务协同策略和资源分配优化算法，研究过程中很少考虑无人机自主决策时所处的复杂战场环境。然而，由于复杂战场环境具有多变性、动态性、高风险性等特点，无人机难以在有限的战斗时间内保证有效的自主决策。现存无人机自主决策的研究内容很少针对复杂战场环境下的无人机自主决策方法进行研究，往往只考虑某种特定环境下的无人机自主决策，导致无人机在面临复杂多变战场环境时，无法快速准确进行决策，且很难有效执行决策的同时最大幅度的降低决策风险，即保证决策的鲁棒性。所以，无人机在复杂战场环境下自主决策方法的研究显得尤为重要。目前还未发现复杂战场环境下无人机自主鲁棒决策方法的相关研究。

【发明内容】

[0004]本发明为了克服现有技术存在的不足之处，提出一种基于情景构建的无人机自主鲁棒决策方法，能有效解决无人机在复杂战场环境下的自主决策能力弱的问题，使得无人机在各种情景中都能进行自主决策，从而提高无人机的自主决策效率和决策效果，实现最优的行动方案选择，并保证决策方案的可行性、有效性和安全性。
[0005]本发明为解决以上技术问题采用如下方案：
[0006]本发明一种基于情景构建的无人机自主鲁棒决策方法，是应用于红方无人机攻打位于蓝方阵地中的蓝方高价值目标的复杂战场环境中，其特点是，所述无人机自主鲁棒决策方法按如下步骤进行：
[0007]步骤I :定义复杂战场环境中红方无人机的决策变量和蓝方阵地的决策变量
[0008]令红方无人机携带电子支援措`施状态Red_ESMState= {开,关}、红方无人机携带SAR雷达状态Red_SARState= {开，关}、红方无人机机载导弹类型Red_Missile= {A, B}、红方无人机飞行高度Red_Height={中，低}、红方无人机发现蓝方高价值目标位置Red_GetLocation= {是，否}、红方无人机被击中Red_Destroyed= {是，否}、红方无人机攻击效果Red_ReSult={蓝方高价值目标完全损毁，蓝方高价值目标高度损毁，蓝方高价值目标中度损毁，蓝方高价值目标未损毁}、红方无人机决策候选行动方案集RecLAction =(D1, D2,. . . , Di,. . . , DJ , n e N, N为自然数，所述红方无人机决策候选行动方案集Red_Action中，Di为第i种红方无人机决策候选行动方案，i e η ;红方无人机攻打蓝方阵地的效用={Utility}；
[0009]令蓝方雷达状态Blue_RadarState= {开，关}、蓝方电子干扰设备状态Blue_ECMState= {开，关}、蓝方高炮Blue_HasAA={是，否}、蓝方导弹类型Blue_Missile={中程导弹，近程导弹，无导弹}、蓝方发现红方无人机位置Blue_GetLocation={是,否};
[0010]令红方无人机与蓝方高价值目标之间的距离Distance=!：远，中，近};
[0011]步骤2:情景构建
[0012]利用所述红方无人机携带电子支援措施状态Red_ESMState、所述红方无人机携带SAR雷达状态Red_SARState、所述红方无人机机载导弹类型Red_Missile、所述红方无人机飞行高度Red_Height、所述蓝方雷达状态Blue_RadarState、所述蓝方电子干扰设备状态Blue_ECMState、所述蓝方高炮Blue_HasAA、所述蓝方导弹类型Blue_Missile以及红方无人机与蓝方高价值目标之间的距离Distance构建情景集S =(S1, S2,..., Sj, ..., SJ, m e N，所述情景集S中第j个情景表示为：
[0013]S」= (Red_ESMState (j) , Red_SARState (j) , Re d_M i s s i I e (j) , Re d_Height(j) , Blue_RadarState(j) , Blue_ECMState(j),Blue_HasAA (j),Blue_Missile(j), Distance(j))，j e m ；
[0014]步骤3 :根据所述红方无人机的决策变量和蓝方阵地的决策变量利用影响图建模方法按如下步骤构建影响图：
[0015]步骤3. I :利用所述红方无人机的决策变量和蓝方阵地的决策变量构建有向无环图G ：
[0016]G= (V, E)(I)
[0017]式（I)中，V代表所述有向无环图中节点的集合，E代表所述有向无环图中有向边的集合，并有：
[0018]V = Vc U Vd U Vu(2)
[0019]式⑵中V。代表所述有向无环图中所有的随机节点，Vd代表所述有向无环图中所有的决策节点，Vu代表所述有向无环图中所有的效用节点，并有：
[0020]Vc= (Red_ESMState,Red_SARState,Red_Missile,Red_Height,Blue_RadarState,Blue_ECMState, Blue_HasAA, Blue_Missile, Distance, Red_GetLocation, Blue_GetLocation, Red_Result, Red_Destroyed)；
[0021]Vd= (Red_Action)；
[0022]Vu= (Utility)；
[0023]所述有向无环图中有向边的集合E={ (Red_Missile, Red_Action), (Red_Height,Red_Action), (Red_ESMState, Red_Action), (Red_SARState, Red_Action), (Distance,Red_Action), (Blue_ECMState, Red_GetLocation), (Distance, Red_GetLocation), (Red_ESMState, Red_GetLocation), (Red_SARState, Red_GetLocation), (Red_GetLocation,Red_Result), (Distance, Red_Result), (Red_Action, Red_Result), (Red_Height, Red_Result)，（Distance， Blue—GetLocation)，（Red_SARState， Blue—GetLocation)， (Blue_RadarState， Blue—GetLocation)，（Red—Height， Red—Destroyed)，（Blue—GetLocation，Red—Destroyed)，（Blue—Missile， Red—Destroyed)，（Distance， Red—Destroyed)，（Red—Action，Red—Destroyed)，（Blue—HasAA，Red—Destroyed)，（Red—Result，Utility)，（Red—Destroyed, Utility)}；
[0024]由所述所有的随机节点Vc、所有的决策节点Vd和所有的效用节点Vu以及有向边的集合E构建出所述有向无环图；
[0025]步骤3. 2 :利用所述红方无人机的决策变量和蓝方阵地的决策变量构建变量集合X；
[0026]X = Xc U Xd(3)
[0027]式⑶中，Xc是随机变量集合，并有：
[0028]Xc= {Red—ESMState，Red—SARState，Red—Missile，Red—Height，Blue—RadarState，Blue_ECMState， Blue_HasAA， Blue_Missile， Distance， Red_GetLocation， Blue_GetLocation, Red—Result，Red—Destroyed}；
[0029]根据所述红方无人机的决策变量和蓝方阵地的决策变量获得所述随机变量集合Xc中每个随机变量的状态空间Ω为：
[0030]Ω Eed_ESMState- {开，关}，Ω Eed_SAEState- {开，关}，Ω Red—Missile- {A，B}、Ω Eed_Height- {中，低}，
^ Blue—RadarState
={开，关}， ^ Blue—ECMState ={开，关}， Q Blue—HasAA ={是，否}， Q Blue—Missile {中
程导弹，近程导弹，无导弹}，Ω_·={远，中，近}，

^ Eed GetLocation 刀，Pl I，Q Blue—
GetLocation=!是，否}，Ω MJfesult= {蓝方高价值目标完全损毁，蓝方高价值目标高度损毁，蓝方高价值目标中度损毁，蓝方高价值目标未损毁}，

^ Red—Destroyed

{是，否}；
[0031]式（3)中，Xd是决策变量集合，并有：
[0032]Xd= {Red—Action}；
[0033]根据所述红方无人机决策候选行动方案集Red—Action获得决策变量集合Xd中决策变量Red—Action的备选方案集为{Dn D2,……，Dj，n G N ;
[0034]步骤3. 3 :利用所述红方无人机的决策变量和蓝方阵地的决策变量构建随机变量概率分布的集合；
[0035]所述随机变量概率分布的集合为：
[0036]Pr={P(Red—ESMState)，P(Red—SARState)，P(Red—Missile)，P (Red—Height)，P(Blue—RadarState)，P(Blue—ECMState)，P (Blue—HasAA)，P (Blue—Missile)，P(Red_GetLocationPar(Red_GetLocation))，P(Blue_GetLocationPar (Blue_GetLocation))，P(Red—ResultPar(Red—Result))，P(Red—DestroyedPar(Red—Destroyed))，P (Distance)}；
[0037](4)
[0038]式⑷中，Par (Red—GetLocation)为所述随机变量集合Xc中随机变量Red—GetLocation 的父节点集合，并有 Par (Red—GetLocation) = {Red—ESMState，Red—SARState，Blue—ECMState，Distance}；
[0039]Par (Blue—GetLocation)为所述随机变量Blue—GetLocation的父节点集合，并有Par (Blue—GetLocation) = {Blue_RadarState，Red—SARState，Distance}；
[0040]Par (Red—Result)为所述随机变量Red—Result的父节点集合，并有Par (Red—Result) = {Red—Height，Red—Action，Distance，Red—GetLocation}；
[0041]Par (Red—Destoryed)为所述随机变量Red—Destoryed的父节点集合，并有Par(Red—Destoryed)={Red—Height， Blue_HasAA， Blue—Missile， Distance， Red—Action，Blue—GetLocation}；
[0042]步骤3. 4 :利用所述红方无人机的决策变量构建效用函数的集合；
[0043]令所述效用函数的集合为U ：
[0044]U= {U (Red—Result，Red—Destroyed)}(5)
[0045]式（5)中，U(Red—Result，Red—Destroyed)为所述所有的效用节点Vu中效用节点Utility的效用函数，并有：
[0046]

UpRed —Result =蓝方高价值目标完全损毁，=是 [0047]式(6)中，Up U2、U3、U4、U5、U6、％和队分别表示在不同条件下效用节点Utility的效用函数值；
[0048]利用所述有向无环图、变量集合、随机变量概率分布的集合和效用函数的集合构建出所述影响图；
[0049]步骤4 :根据所述影响图利用式（7)获得红方无人机决策候选行动方案集Red_Action中每一种红方无人机决策候选行动方案在情景集S中的每一个情景下的期望效用值 EU (Di, Sj)：
[0050]EU (Di, Sj) = Σ U (Red_Result, Red_Destroyed) P (Red_Result, Red_Destroyede)
(J)
[0051]式（7)中，e代表证据，Di表示第i种红方无人机决策候选行动方案，i e n, Sj表不第j个情景，j e m ；
[0052]步骤5 :红方无人机根据所述期望效用值EU (Di, Sj)进行鲁棒决策；
[0053]步骤5. I :选择鲁棒决策候选行动方案；
[0054]令红方无人机决策候选行动方案集Red_Action中的决策候选行动方案Df，在情景集 S 中满足 min(EU(Df，Sj)) a , (f e n, j e m, j = I, 2,. . . , m), α 为预定的收益阈值，则决策候选行动方案Df为鲁棒决策候选行动方案并保留Df ；
[0055]判断所有的决策候选行动方案，保留所有的鲁棒决策候选行动方案，删除剩余决策候选行动方案；
[0056]步骤5. 2 :识别最优鲁棒行动方案；
[0057]利用式（8)获得所述所有的鲁棒决策候选行动方案在每一个情景中的最大期望效用值集EU+:[0058]
【权利要求】
1.一种基于情景构建的无人机自主鲁棒决策方法，是应用于红方无人机攻打位于蓝方阵地中的蓝方高价值目标的复杂战场环境中，其特征在于，所述无人机自主鲁棒决策方法按如下步骤进行：步骤I:定义复杂战场环境中红方无人机的决策变量和蓝方阵地的决策变量令红方无人机携带电子支援措施状态Red_ESMState= {开，关}、红方无人机携带SAR雷达状态Red_SARState= {开，关}、红方无人机机载导弹类型Red_Missile= {A, B}、红方无人机飞行高度Red_Height={中，低}、红方无人机发现蓝方高价值目标位置Red_GetLocation= {是，否}、红方无人机被击中Red_Destroyed= {是，否}、红方无人机攻击效果Red_ReSult={蓝方高价值目标完全损毁，蓝方高价值目标高度损毁，蓝方高价值目标中度损毁，蓝方高价值目标未损毁}、红方无人机决策候选行动方案集RecLAction =(D1, D2,. . . , Di,. . . , DJ , n e N, N为自然数，所述红方无人机决策候选行动方案集Red_Action中，Di为第i种红方无人机决策候选行动方案，i e η ;红方无人机攻打蓝方阵地的效用={Utility}；令蓝方雷达状态Blue_RadarState= {开，关}、蓝方电子干扰设备状态Blue_ECMState= {开，关}、蓝方高炮Blue_HasAA= {是，否}、蓝方导弹类型Blue_Missile= {中程导弹，近程导弹，无导弹}、蓝方发现红方无人机位置Blue_GetLocation={是,否}; 令红方无人机与蓝方高价值目标之间的距离Distance=!：远，中，近}; 步骤2 :情景构建利用所述红方无人机携带电子支援措施状态Red_ESMState、所述红方无人机携带SAR雷达状态Red_SARState、所述红方无人机机载导弹类型Red_Missile、所述红方无人机飞行高度Red_Height、所述蓝方雷达状态Blue_RadarState、所述蓝方电子干扰设备状态Blue_ECMState、所述蓝方高炮Blue_HasAA、所述蓝方导弹类型Blue_Missile以及红方无人机与蓝方高价值目标之间的距离Distance构建情景集S = (S1, S2,. . .，S」,...，Sj，m e N,所述情景集S中第j个情景表示为：
Sj=(Red_ESMState (j), Red_SARState(j), Red_Missile(j), Red_Height(j), Blue_RadarState(j), Blue_ECMState(j), Blue_HasAA(j), Blue_Missile(j), Distance(j)),j e m ；步骤3 :根据所述红方无人机的决策变量和蓝方阵地的决策变量利用影响图建模方法按如下步骤构建影响图：步骤3. I :利用所述红方无人机的决策变量和蓝方阵地的决策变量构建有向无环图G ： G = (V, E)(I) 式（I)中，V代表所述有向无环图中节点的集合，E代表所述有向无环图中有向边的集合，并有： V = Vc U Vd U Vu(2) 式（2)中V。代表所述有向无环图中所有的随机节点，Vd代表所述有向无环图中所有的决策节点，Vu代表所述有向无环图中所有的效用节点，并有：
Vc= (Red_ESMState, Red_SARState, Red_Missile, Red_Height, Blue_RadarState,Blue_ECMState, Blue_HasAA, Blue_Missile, Distance, Red_GetLocation, Blue_GetLocation, Red_Result, Red_Destroyed)；Vd= (Red—Action)；
Vu= (Utility)；所述有向无环图中有向边的集合 E={ (Red—Missile，Red—Action)，（Red—Height，Red—Action)，（Red—ESMState， Red—Action)，（Red—SARState， Red—Action)，（Distance， Red—Action)，（Blue_ECMState， Red_GetLocation)，（Distance， Red_GetLocation)， (Red_ESMState, Red—GetLocation)，（Red—SARState，Red—GetLocation)，（Red—GetLocation，Red—Result)，（Distance，Red—Result)，（Red—Action，Red—Result)，（Red—Height，Red—Result)，（Distance， Blue_GetLocation)，（Red—SARState， Blue—GetLocation)， (Blue_RadarState, Blue—GetLocation)，（Red—Height， Red—Destroyed)，（Blue—GetLocation，Red—Destroyed)，（Blue—Missile， Red—Destroyed)，（Distance， Red—Destroyed)，（Red—Action，Red—Destroyed)，（Blue—HasAA，Red—Destroyed)，（Red—Result，Utility)，（Red—Destroyed, Utility)}；由所述所有的随机节点V。、所有的决策节AVd和所有的效用节点Vu以及有向边的集合E构建出所述有向无环图；步骤3. 2 :利用所述红方无人机的决策变量和蓝方阵地的决策变量构建变量集合X ； X = Xc U Xd(3) 式（3)中，Xc是随机变量集`合，并有：
Xc={Red—ESMState， Red—SARState， Red—Missile， Red—Height， Blue—RadarState，Blue_ECMState， Blue_HasAA， Blue_Missile， Distance， Red_GetLocation， Blue_GetLocation, Red—Result，Red—Destroyed}；根据所述红方无人机的决策变量和蓝方阵地的决策变量获得所述随机变量集合Xc中每个随机变量的状态空间Ω为：
^ Red—ESMState ={开，关}， ^ Red—SARState ={开，关}， ^ Red—Missile

= {A，B}、ΩRed—Height ={中，低}，^ Blue—RadarState={开，关}， ^ Blue—ECMState ={开，关}， Q Blue—HasAA ={是，否}， ^ Blue—Missile ={中程导弹，近程导弹，无导弹}，Ω

Distance

{远，中，近}，Ω

Eed_GetLocat ion

{是，否}，ΩBlue_GetLocati on {是，否丨，Qltedjtesult=I;蓝方高价值目标完全损毁，蓝方高价值目标高度损毁，蓝方高价值目标中度损毁，蓝方高价值目标未损毁}，

^ Red—Destroyed

{是，否}；式（3)中，Xd是决策变量集合，并有：
Xd={Red_Action}；根据所述红方无人机决策候选行动方案集Red_Action获得决策变量集合Xd中决策变量Red_Action的备选方案集为{D1; D2,……，Dj , n e N ；步骤3. 3 :利用所述红方无人机的决策变量和蓝方阵地的决策变量构建随机变量概率分布的集合；所述随机变量概率分布的集合为： Pr={P(Red_ESMState), P(Red_SARState)，P(Red_Missile), P(Red_Height)，P(Blue_RadarState), P(Blue_ECMState), P(Blue_HasAA), P(Blue_Missile), P(Red_GetLocationPar(Red_GetLocation)), P(Blue_GetLocationPar(Blue_GetLocation))，P(Red_ResultPar(Red_Result)), P(Red_DestroyedPar(Red_Destroyed)), P (Distance)}；

(4)式（4)中，PaHRed—GetLocation)为所述随机变量集合X。中随机变量Red—GetLocation 的父节点集合，并有 Par (Red—GetLocation) = {Red—ESMState，Red—SARState，Blue—ECMState，Distance}； Par (Blue—GetLocation)为所述随机变量Blue—GetLocation的父节点集合，并有Par (Blue—GetLocation) = {Blue_RadarState，Red—SARState，Distance}； Par (Red—Result)为所述随机变量Red—Result的父节点集合，并有Par (Red—Result) = {Red—Height，Red—Action，Distance，Red—GetLocation}； Par (Red—Destoryed)为所述随机变量Red—Destoryed的父节点集合，并有Par (Red—Destoryed)={Red_Height， Blue_HasAA， Blue—Missile， Distance， Red—Action， Blue_GetLocation}；步骤3. 4 :利用所述红方无人机的决策变量构建效用函数的集合；令所述效用函数的集合为U: U={U (Red—Result，Red—Destroyed)}(5) 式（5)中，U(Red—Result，Red—Destroyed)为所述所有的效用节点Vu中效用节点Utility的效用函数，并有：

【文档编号】G05D1/00GK103488171SQ201310455107
【公开日】2014年1月1日申请日期:2013年9月29日优先权日:2013年9月29日
【发明者】胡笑旋, 陈意, 罗贺, 马华伟, 靳鹏, 夏维申请人:合肥工业大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：胡笑旋;陈意;罗贺;马华伟;靳鹏;夏维
技术所有人：合肥工业大学
我是此专利的发明人

上一篇：一种基于高斯分布预测的多无人机协同搜索方法
上一篇：一种被控对象自动恒流调节装置及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、王老师：电子信息处理、先进检测方法和智能化仪表
4、周老师：1.智能电网 2.新能源利用 3.泛在电力物联网
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。