一种带有直觉模糊信息的无人机空战机动博弈方法与流程

文档序号:15461613发布日期:2018-09-18 18:17阅读:351来源:国知局

本发明属于无人机空战自主决策领域,特别是一种带有直觉模糊信息的无人机空战机动博弈方法。



背景技术:

无人作战飞机在空战过程中需要根据复杂的战场态势信息决策作出最优的战术方案或机动动作,无人机决策机制的优劣是能否顺利完成空战任务的关键。目前国内外对于无人机的自主决策已有了大量的成果,对于机动决策问题常采用的方法有影响图、神经网络、遗传算法、贝叶斯网络和博弈论等。其中博弈论方法由于充分考虑对抗双方之间的相互关系,更能客观地对空战态势进行预测分析,将博弈论应用到空战决策领域已成了一个热点研究方向。根据博弈论的分类不同对空战问题可有不同的分类,从信息的完备程度上看可分为完全信息空战博弈和不完全信息空战博弈,对有无合作可分为合作空战博弈和非合作空战博弈,从时间的连续性上又分为静态空战博弈和动态空战博弈。目前,基于博弈论的方法研究空战决策问题主要是在确定环境下进行,但由于在实际环境中,存在机载传感器误差和敌方干扰信号等因素的影响,无人机获取的态势信息往往具有模糊性,因此研究在不确定环境下无人机的空战决策更具有现实意义。

另外,利用智能算法对纳什均衡求解可解决传统方法计算复杂、仅适用单一问题的缺点,当前对纳什均衡求解主要有遗传算法(GA)、粒子群优化(PSO)算法、模拟退火(SAA)等智能算法,这些不同的智能算法各有优势,但目前的研究成果还不能完全兼顾算法的全局搜索能力和进化速度。因此,仍有许多问题臻待解决。



技术实现要素:

本发明的目的在于提供一种带有直觉模糊信息的无人机空战机动博弈方法,该方法可以有效解决不确定作战环境下的无人机空战机动最优决策问题。

为实现上述目的,本发明采用以下技术方案:

带有直觉模糊信息的无人机空战机动博弈方法,包括:

第一步,假设空战对抗双方分别为红方和蓝方,无人机基本的机动动作组成空战博弈的机动策略集S,红方无人机的机动策略集为S1={α1,α2,…,αm},蓝方无人机的机动策略集为S2={β1,β2,…,βn}。

第二步,设C为机动策略评估的属性集,根据属性相对之间的重要程度建立属性标度矩阵R,得到空战属性的权重向量ω。

第三步,对空战对抗双方的所有机动策略组合进行多属性直觉模糊评估,从而得到在属性ci下的直觉模糊矩阵再利用IFWA算子将集结为博弈的直觉模糊支付矩阵

第四步,建立满足直觉模糊全序关系下的直觉模糊矩阵博弈模型并将其转化为非线性规划模型。

第五步,采用个体操作算子和遗传代数自适应策略改进差分进化算法(Improved Differential Evolution,IDE),然后对非线性规划模型进行求解,从而得到空战机动博弈的最优策略。

本发明具有以下优点:

1.本发明充分考虑了战场信息的模糊性,利用直觉模糊多属性评估的方法得到不确定环境下的空战博弈模型支付矩阵,建立了支付值为直觉模糊形式的博弈模型,为研究在不确定环境下的空战机动博弈问题提供了新思路。

2.本发明所提出的满足在直觉模糊全序关系下的纳什均衡条件更具有一般性,并将求解转化为一般的非线性规划更具简单性。

3.通过引入个体操作算子和遗传代数自适应策略改进基本差分进化算法对模型求解,克服了传统算法进化后期迭代速度慢、精度低的缺点,使种群个体不仅有较好的全局搜索能力避免陷入局部最优解,又有较快的种群进化能力。

附图说明

图1为本发明的流程图。

图2为模糊语言与直觉模糊数对应关系。

图3为差分进化算法(DE)、粒子群算法(PSO)算法和改进差分进化算法(IDE)的计算结果对比。

图4为红蓝双方单独改变策略100组的直觉模糊收益得分值。

图5为差分进化算法(DE)、粒子群算法(PSO)算法和改进差分进化算法(IDE)适应度函数值对比。

具体实施方式

下面结合所附图对本发明的技术方案作具体说明:

本发明的一种带有直觉模糊信息的无人机空战机动博弈方法,具体包括以下步骤:

第一步,假设空战对抗双方分别为红方和蓝方,无人机基本的机动动作组成空战博弈的策略集,确定无人机的机动策略集为S={保持原定飞行、最大加速直飞、最大过载左转弯、最大过载右转弯、最大过载爬升、最大过载俯冲、最大减速飞行}。

第二步,设C={A,R,V,H}为空战评估属性集,其中A为角度威胁因子;R为距离威胁因子;V为速度威胁因子;H为高度威胁因子。假设属性ci相对于属性cj的重要标度为rij,反之,属性cj相对于属性ci的重要标度rji为rij的倒数,即rij=1/rij。可得到属性标度矩阵为

从而得到空战各项属性的权重为

则空战属性的权重向量为ω=(ω1,ω2,…,ωq)。

第三步,当红方无人机选择机动策略αi(i=1,2,…,m)、蓝方选择机动策略βj(j=1,2,…,n)时,由于空战信息的不确定性,用模糊语言描述策略的收益,在实际作战中需要将模糊语言转化为确定数值参与决策过程,可按照附图2将模糊语言转化为直觉模糊数aij=(μij,vij)对机动策略进行直觉模糊评价,则在属性ci下红方的直觉模糊矩阵为

定义1:设ai=(μi,vi)(i=1,2,…,n)为一组直觉模糊数,则称IFWA为直觉模糊加权集结算子,具体为

其中,ω=(ω1,ω2,…,ωn)为直觉模糊数ai的权重向量,满足条件0≤ωj≤1,

由IFWA算子将直觉模糊矩阵集结为博弈的直觉模糊支付矩阵具体为

其中,α1,α2,…,αm为红方无人机采取的机动策略;β1,β2,…,βn为蓝方无人机采取的机动策略;aij=(μij,vij)表示当红方无人机选择机动策略αi和蓝方无人机选择机动策略βj时的直觉模糊收益,j=1,2,…,n。相应地,红方的收益就为蓝方的损失。

第四步,建立满足直觉模糊全序关系下的直觉模糊矩阵博弈模型并将其转化为非线性规划模型,具体为

定义2:设为直觉模糊支付矩阵,局中人P1、P2分别以概率xi和yj选取纯策略αi∈S1和βj∈S2,称

分别为局中人P1、P2的混合策略空间,相应的称x=(x1,x2,…,xm)T、y=(y1,y2,…,yn)T分别为局中人P1、P2的混合策略,为直觉模糊二人零和矩阵对策。根据直觉模糊数的运算法则,称

为直觉模糊期望收益函数。

定义3:设为直觉模糊数,和分别为a1和a2的得分值,和分别为a1和a2的精确度。若δ(a1)<δ(a2),则a1小于a2,记为若δ(a1)=δ(a2),且h(a1)=h(a2),则a1和a2相等;若δ(a1)=δ(a2),且h(a1)>h(a2),则a1大于a2,记为若δ(a1)=δ(a2),且h(a1)<h(a2),则a1小于a2,记为

定义4:设为直觉模糊期望支付函数,若存在(x*,y*),对都有

成立,则称混合策略(x*,y*)为满足直觉模糊矩阵博弈的均衡策略。

局中人P1的最优策略是使自己的直觉模糊期望收益最大,即max(ρ,σ);局中人P2的最优策略是尽量减少自己的损失,即min(η,γ)。局中人都在对方的纯策略下,选择混合策略使自己的收益最大,则博弈问题转化为求解以下两非线性规划模型:

其中,εk是混合策略中第k个分量为1的纯策略。

第五步,采用个体操作算子和遗传代数自适应策略改进差分进化算法,然后对非线性规划模型进行求解,从而得到空战机动博弈的最优策略,具体为

首先对差分进化算法操作算子的个体自适应改进。个体操作算子包括个体变异算子和个体交叉算子,改进策略分别为

1)个体变异算子Fi满足

其中,fbest为种群最优的适应值,fworst为种群最差的适应值,fi为当前个体的适应值,G为最大迭代次数,g为当前迭代次数,Fmax与Fmin分别为Fi取值的最大值和最小值。

2)个体交叉算子CRi满足

其中,CRmax与CRmin分别为CR取值的上下限。

然后取式(21)和式(22)的目标函数作为适应度函数,由于都为求最值问题,可将这两个目标函数结合为一个适应度函数,具体为

利用上述个体操作算子和遗传代数自适应策略改进差分进化算法对非线性规划模型进行求解,从而得到空战机动博弈的最优策略,具体步骤为

步骤1:个体编码。假设红方无人机有m个机动策略、蓝方无人机有n个机动策略,算法的搜索空间表示为

v=[x1,x2,…,xm,y1,y2,…,yn] (26)

且满足

步骤2:种群初始化。设置算法的最大迭代次数G和种群规模NP,并取当前迭代次数g为1。随机产生在可行域上种群规模为NP的种群,每个个体表示为

vi,G(i=1,2,…,NP) (27)

步骤3:计算个体的适应度值fi,g,并记录当前种群的最优值fbest和最劣值fworst。

步骤4:变异。对于每个目标向量vi,G,由下式产生变异向量wi,g+1

步骤5:交叉。对于交叉操作由下式产生试验向量ui,g+1

步骤6:选择。按照贪婪准则选择下一代个体,使子代个体总是优于或等于父代个体。

步骤7:判断算法结束条件。若种群的最优适应度函数fbest保持连续ΔN次迭代未出现新的最优值时,认为算法达到稳定状态,或达到最大迭代次数时,结束算法输出最优值。反之,迭代次数g加1,返回步骤3。

下面结合实施例对本发明做进一步详细的描述。

假设红蓝方无人机进行一对一空战,红方坐标为(1000m,2000m,2000m),速度230m/s,航向偏转角13°,俯仰角5°;蓝方无人机坐标(3000m,4500m,2300m),速度250m/s,航向偏转角135°,俯仰角3°;红蓝双方无人机都有机动策略集S={保持原定飞行、最大加速直飞、最大过载左转弯、最大过载右转弯、最大过载爬升、最大过载俯冲、最大减速飞行}。取对机动策略的空战评估属性集C={A,R,V,H},其中A为角度威胁因子;R为距离威胁因子;V为速度威胁因子;H为高度威胁因子。

根据第二步,取属性标度为r12=2,r13=1.75,r14=1.25;r23=2,r24=1.75;r34=1,下标1~4依次代表角度、距离、速度和高度属性。可得到属性标度矩阵为

利用属性标度矩阵计算属性的权重,可得到属性权重ω1=0.34,ω2=0.3,ω3=0.17,ω4=0.19。

根据第三步,若红方无人机选择机动策略αi(i=1,2,…,m),蓝方无人机选择机动策略βj(j=1,2,…,n)时,在空战态势属性集C={A,R,V,H}下的威胁程度大小如表1~表4所示

表1 角度属性的直觉模糊矩阵

表2 距离属性的直觉模糊矩阵

表3 速度属性的直觉模糊矩阵

表4 高度属性的直觉模糊矩阵

利用IFWA算子将表1~表4的四个直觉模糊矩阵集结为直觉模糊支付矩阵如表5所示

表5 直觉模糊支付矩阵

根据第五步,设置种群规模NP=30,最大迭代次数G=50,交叉算子的取值范围为[0.6,1.2],变异算子的取值范围为[0.4,0.9],ΔN=30。参数设置完成后,仿真在AMD FX-7500 2.60GHz处理器、4GB内存的PC上,使用MATLAB R2015b平台实现。通过对本发明的一种带有直觉模糊信息的无人机空战机动博弈方法进行仿真。

图3为差分进化算法(DE)、粒子群算法(PSO)算法和改进差分进化算法(IDE)的计算结果对比。由图中可以看出,看出本发明改进的差分进化算法(IDE)有更好的最优解。本发明的改进差分进化算法得到最优的适应度函数值f=1.090,且红方最优混合策略为x*=[0,0,0,0.132,0.867,0,0]和蓝方最优混合策略y*=[0,0,0.78,0,0.22,0,0]。由最优混合策略可知,红方无人机更倾向于选择机动策略4和5,即最大过载右转或爬升;蓝方无人机则偏好于机动策略3和5,即最大过载左转或爬升。用本发明改进的差分进化算法求得的红蓝方无人机混合策略(x*,y*)计算其直觉模糊期望收益为直觉模糊收益得分值为0.501。

为验证本发明的带有直觉模糊信息空战机动博弈模型的有效性,随机生成100组混合策略(x,y),并单独改变混合策略计算直觉模糊收益得分值和

图4为红蓝双方单独改变策略100组的直觉模糊收益得分值。由图中可以看出,红方单独改变混合策略x的直觉模糊收益得分值均小于0.501,蓝方单独改变混合策略y得到的直觉模糊收益得分值均大于0.501,可见满足带有直觉模糊信息的纳什均衡条件

即当局中人单独改变自己的策略时,都不会使自己的局势占优。

图5为差分进化算法(DE)、粒子群算法(PSO)算法和改进差分进化算法(IDE)适应度函数值对比。由图中可以看出,DE算法容易陷入局部最小值且收敛速度较慢;PSO算法虽然收敛速度相对较快但取得的并不是最小值;本文改进的差分进化算法(IDE)则具有较快的收敛速度,快速性和准确性均得到了保证。

综上所述,本发明公布的一种带有直觉模糊信息的无人机空战机动博弈方法,将直觉模糊概念引入博弈论,建立了带有直觉模糊信息的空战机动博弈模型,采用个体操作算子和遗传代数自适应策略改进差分进化算法求解纳什均衡,算法的收敛性和精确性得到了明显的保证,解决了不确定环境下无人机空战机动决策的问题。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1