基于控制参数化的近距空战机动决策优化方法

文档序号:36391372发布日期:2023-12-15 09:49阅读:38来源:国知局
基于控制参数化的近距空战机动决策优化方法

本发明涉及飞行器机动决策,具体而言,涉及一种基于控制参数化的近距空战机动决策优化方法。


背景技术:

1、随着制空权在现代战争中愈发重要的地位,飞行器在制空权上的争夺能力成为现代化空战中最关键的能力。为了实现制空优势,飞行员如何最大程度上利用自身飞行器的机动性能和机载武器攻击能力实现及保持空战优势位是关键之处。空战对抗是为了在作战时避免陷入敌方飞行器的机载武器有效攻击范围的同时抢占有利态势位置,以达到能够实现提前对敌打击的目的。然而,由于复杂且时变的空战态势,飞行员如何作出对应的飞行器最优机动决策变得错综复杂。因此,如何根据当前空战态势迅速作出符合当前飞行器机动能力的较优机动决策是空战作战能力研究的重要方向。

2、根据是否考虑敌方飞行器的空战机动策略,目对近距空战机动决策算法的研究主要集中在两类:一类是不考虑敌方机动策略,以自身视角出发作出机动决策的机动决策点算法,如专家系统和强化学习算法。另一类则是考虑了敌方机动策略而作出的博弈对抗策略,主要为微分对策等博弈决策方法。然而,这些方法存在一定的局限性:(1)微分对策一类方法在复杂空战环境下无法准确建模且计算量较大;(2)专家系统方法的移植性和适应性较差,只能作为辅助机动决策算法;(3)基于强化学习的机动决策方法训练阶段漫长且训练成功后无法直接应用到其他空战环境或其他型号飞行器中,并且难以保证机动决策的安全性。以上方法不仅具有各自的缺点,并且都无法具备机动决策的安全性和当前飞行器机动性能下的较优性。


技术实现思路

1、本发明在于提供一种基于控制参数化的近距空战机动决策优化方法,其能够缓解上述问题。

2、为了缓解上述的问题,本发明采取的技术方案如下:

3、一种基于控制参数化的近距空战机动决策优化方法,包括以下步骤:

4、s1、定义近距空战核心因素优势函数,包括距离优势函数td,角度优势函数ta,速度优势函数tv,以及高度优势函数th;

5、s2、为各近距空战核心因素优势函数分别分配能随自适应规则变化的权重系数α=[αa αd αh αv],根据权重系数α=[αa αd αh αv]和近距空战核心因素优势函数构建近距自适应空战优势函数;

6、s3、根据近距自适应空战优势函数、飞行器质点动力学模型和飞行器实际机动性能安全约束,建立自适应飞行器空战机动决策最优控制问题;

7、s4、采用离散控制参数化方法对自适应飞行器空战机动决策最优控制问题进行离散近似处理,包括控制量离散化近似处理、动力学离散化近似处理和性能约束离散化近似处理,将自适应飞行器空战机动决策最优控制问题处理为有限维可在线求解的非线性规划问题;

8、s5、采用约束转录法对步骤s4得到的非线性规划问题中的非线性状态约束进行降维处理,将机动决策最优控制问题近似为在线可解且梯度可求的非线性规划问题;

9、s6、对步骤s5得到的在线可解且梯度可求的非线性规划问题进行求解,得到基于控制参数化的近距空战机动决策。

10、具体地,步骤s1中,

11、角度优势函数ta为:

12、

13、其中,φ为目标方位角,q为目标进入角;

14、距离优势函数td为:

15、

16、其中,d为我方飞行器与敌方飞行器的当前距离,d为我方飞行器的位置矢量与敌方飞行器位置矢量的差,σ1,σ2为两个控制距离优势值上升坡度的参数,[dmin,dmax]为双方飞行器的近距空空导弹的攻击范围;

17、速度优势函数tv为:

18、

19、

20、其中,|vr|,|vb|分别为我方和敌方飞行器的飞行速度,|vr|∈[vrmin,vrmax],为我方飞行器的飞行速度阈值;

21、高度优势函数th为:

22、

23、其中,σ3,σ4为两个控制高度优势值上升坡度的参数,δh0为我方飞行器与敌方飞行器在当前时刻的相对高度,δh为两机相对高度,[δhmin,δhmax]为我方飞行器与敌方飞行器间的最佳高度差。

24、更具体地,步骤s2中,αa,αd,αh,αv均大于等于0,且αa+αd+αh+αv=1,自适应规则如下:

25、当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d>1.5dmax时,α=[0 1 0 0];

26、当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d≤1.5dmax时,α=[0.8 0.2 0 0];

27、当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d<dmin,ta>0.25时,α=[0.7 0.3 0 0];

28、当我方飞行器和敌方飞行器未进入攻击范围[dmin,dmax]且距离d<dmin,ta≤0.25时,α=[1 0 0 0];

29、当我方飞行器和敌方飞行器进入攻击范围[dmin,dmax],但双方飞行器的目标方位角都小于最大攻击角度φm时,α=[1 0 0 0];

30、其余情况设置α=[0.5 0.2 0.1 0.2]。

31、更具体地,步骤s2中,近距自适应空战优势函数为:

32、r=αata+αdtd+αvtv+αhth。

33、更具体地,步骤s3中,自适应飞行器空战机动决策最优控制问题为:

34、

35、

36、x(0)=x0

37、u(t)=[nx(t),n(t),μ(t)]t

38、

39、

40、其中,nx、n和μ是控制量输入,分别为纵向过载、法向过载和速度滚转角;v、χ和γ分别为飞行器的速度、偏航角和爬升角;x(t)=[v,χ,γ,x,y,z]t,u(t)=[nx,nz,μ]t。

41、更具体地,步骤s4中得到的有限维可在线求解的非线性规划问题为:

42、

43、s.t. x(k+1)=x(k)+f(x(k),u(k))δt

44、u(k)=[nxk,nk,μk]t

45、k=1,2,...,m,m=tf/δt

46、x(0)=x0

47、

48、

49、其中,m为时间段等分离散数量,δt为离散步长,tf为未来的一段时间。

50、更具体地,步骤s5中得到的在线可解且梯度可求的非线性规划问题为:

51、

52、s.t. x(k+1)=x(k)+f(x(k),u(k))δt

53、u(k)=[nxk,nk,μk]t

54、k=1,2,...,m,m=tf/δt

55、x(0)=x0

56、

57、

58、

59、其中,gi,gi,υ分别为处理后的状态一维约束、原始的时变状态约束和松弛系数。

60、更具体地,步骤s6具体包括以下步骤:

61、s61、根据非线性规划算法当前迭代过程中的决策变量(若当前迭代为第一次优化,则决策变量由初始猜测值决定,其余迭代过程中的决策变量由非线性规划算法根据梯度决定),从飞行器当前初始状态出发,通过公式

62、x(k+1)=x(k)+f(x(k),u(k))δt

63、=f(k,x(k),u(k))

64、k=0,1,...,m-1

65、得到状态变量u(k),k=0,1,2,...,m,f(x(k),u(k))为飞行器质点动力学方程;

66、s62、根据公式

67、

68、计算当前得到的目标函数值;

69、s63、根据协态方程

70、

71、反向求解得到协态变量λ(k),h(x(k),u(k),λ(k+1),k)=-r(x(k))+λt(k+1)f(x(k),u(k),k)为哈密顿函数;

72、s64、将状态变量、协态变量以及控制变量带入方程

73、

74、计算得到目标函数j相对决策变量的梯度;

75、s66、由当前目标函数值及梯度,通过非线性规划算法得到下一次迭代的决策变量,若已满足优化停止条件,则算法结束,输出基于控制参数化的近距空战机动决策u*(0)t,u*(1)t,...,u*(m-1)t,否则跳转至步骤s61。

76、与现有技术相比,本发明的有益效果是:

77、本发明采用的基于离散控制参数化的机动决策优化算法,能够满足实时性要求且适用于更复杂的空战环境;

78、本发明机动决策算法具有较好的算法可解释性且具备决策安全性,能够严格保证飞行器的机动性能约束,并且能够较方便地移植到其他型号飞行器空战问题中,不需要重新训练;

79、本发明的机动决策算法具有较好的通用性、扩展性和考虑飞行机动性能下的较优性。

80、为使本发明的上述目的、特征和优点能更明显易懂,下文特举本发明实施例,并配合所附附图,作详细说明如下。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1