空战模拟环境中基于三方博弈的动态战术控制域解算方法

文档序号:33806494发布日期:2023-04-19 12:34阅读:247来源:国知局
空战模拟环境中基于三方博弈的动态战术控制域解算方法

本发明属于计算机仿真和人工智能,具体一种涉及空战模拟环境中基于三方博弈的动态战术控制域解算方法。


背景技术:

1、空战对抗游戏和空战模拟系统都是借助于计算机仿真手段对战斗机的整个作战过程进行细致、逼真的模拟。为了有效提高用户体验的真实性以及对抗游戏和模拟系统的易操控性,需要从实际空战角度仿真设计对抗游戏和模拟系统,更为重要的是战术模拟及其便捷性交互设计,从而在还原空战真实度的同时,提高用户在对抗游戏和模拟系统中的操控水平。

2、在空战对抗游戏和空战模拟系统中,战斗机所处的空战环境一般分为两种:超视距空战与近距空战。相比于近距空战,超视距空战从迎头态势开始且距离较远,其攻击占位的角度条件相对容易满足,更加注重距离层面的博弈与对抗。动态战术控制域围绕空战距离展开,指导战斗机选择恰当的方式与时机进行攻防转换,是指导战术行为的核心信息。动态战术控制域的解算精度对辅助用户准确把握空战进程起着决定性的作用,直接影响了空战仿真环境中超视距空战的作战效能。因此,如何设计高对抗、高时效性的动态战术控制域计算方法,对于提高空战对抗模拟系统的逼真度、可信度以及用户操控水平具有重要意义。

3、为空战对抗模拟系统设计战术决策的参考量化信息一直是空战仿真领域的重点研究问题之一,目前相关的理论模型主要有空空导弹攻击区与动态逃逸区。

4、空空导弹攻击区从进攻的层面分析战术控制的距离边界,研究成果主要有协同攻击区、三维攻击区以及全向攻击区等。此类方法基于空空导弹的动力学方程与制导律的数学模型,结合载机三自由度或六自由度模型,对攻击区的边界进行快速搜索,取得了较好的结果,相关研究如张平、方洋旺等提出的《空空导弹攻击区实时解算的新方法》和黄威、任洋等提出的《基于自适应步长的空空导弹攻击区解算方法》,等等。

5、在解算方法上,攻击区计算方法主要有对分法、指数搜索法、平移数值法、多项式拟合法、查表插值法与神经网络拟合法等。例如,《空空导弹动态攻击区的高精度快速算法研究》利用平移数值法搜索实战环境中存在风场干扰和目标机动条件下的导弹动态攻击区,获得了较为准确的计算效果。《导弹发射包线指数优化搜索仿真分析》在解算攻击区时综合考虑空战运动参数,并构建指数多项式函数粗略估算初始搜索空间,有效避免了搜索攻击区初始值的盲目性。

6、动态逃逸区从防御的角度分析空战典型事件触发时敌我距离的量化指标,是飞行员进行逃逸机动决策的重要支持信息。该类方法基于微分对策理论与简化几何模型,设计了规避机动时机的快速求解方法,并以此作为划分冒险进攻战术与保守防御战术的依据,从而为超视距空战战术控制中飞机的安全保障提供理论依据。方法相关内容可以参考《dynamic-escape-zone to avoid energy bleeding coasting missile》、《机载主动防御系统防御区仿真研究》等。

7、但由于超视距空战是进攻与防御高度协同、耦合的过程,攻击区与逃逸区仅从进攻或者防御单一的角度分析空战的战术距离,难以全面反映作战双方的态势变化,也无法准确给出超视距空战进攻与防御之间的转换时机,严重影响了空战对抗模拟系统的演练质量。在解算方法上,平移数值法、指数搜索法虽然解算精度较高,但是其收敛速度慢,难以满足高动态空战环境的需求;对分法虽然仿真时效性有所改善,但是解算结果误差较大,而且搜索过程中容易陷入攻击区黑洞,无法满足空战仿真环境的精度要求。在模型建立方面,现有方法进行解算时通常假设目标保持定常状态或给定的机动状态,导致解算出的结果与实际战场态势明显不符,由于忽略目标机动而产生的误差在超视距空战中尤为突出,极大地降低了在高保真空战模拟环境中的作战效能。在作战样式方面,随着空空导弹性能的不断提高,传统消极、被动的规避逃逸无法有效保证载机的生存。

8、目前,主动防御战术通过发射防御导弹拦截来袭的空空导弹,可有效提高载机在空战仿真环境中的生存能力,因此逐渐发展为空战对抗的新样式。但目前载机发射防御导弹场景下空战攻防对抗的量化参考信息尚未有研究涉及。


技术实现思路

1、为了解决现有技术中存在的上述问题,本发明提供了一种空战模拟环境中基于三方博弈的动态战术控制域解算方法,应用于主动防御战术下超视距空战模拟环境。本发明要解决的技术问题通过以下技术方案实现:

2、基于微分博弈理论建立表征三方飞行器博弈对抗关系的三方博弈系统模型,对所述三方博弈系统模型进行求解,得到各方飞行器的控制矢量以表示求解出的最优追逃制导策略;其中,所述三方飞行器分别为目标飞机、防御导弹和攻击导弹;控制矢量为飞行器的加速度矢量;

3、构建三方飞行器的运动模型,并设定仿真限制条件,得到仿真模型;

4、针对获得的每组仿真数据,在空战三方均执行最优追逃制导策略的基础上,利用该组仿真数据、所述仿真模型以及改进进退法对动态战术控制域的边界进行搜索,得到该组仿真数据对应的外边界动态战术控制距离值和内边界动态战术控制距离值;

5、将同一空战模拟环境下且态势连续的各组仿真数据所得到的同一种动态战术控制距离值依次连接,得到动态战术控制域的内边界和外边界,由所述内边界和所述外边界所围成的区域组成动态战术控制域;其中,任一组仿真数据表征所述三方飞行器的运动状态;所述同一空战模拟环境下且态势连续的各组仿真数据仅目标进入角不同,用于表示不同态势。

6、在本发明的一个实施例中,所述基于微分博弈理论建立表征三方飞行器博弈对抗关系的三方博弈系统模型,包括:

7、建立所述三方飞行器在惯性坐标系下的运动方程;

8、将所述运动方程改写为状态空间方程,得到微分博弈模型;

9、设定针对微分博弈模型的性能指标函数,将求解最优追逃制导策略的最大最小寻优问题转化为最小化问题,并进行微分博弈模型的求解假设,得到三方博弈系统模型。

10、在本发明的一个实施例中,所述对所述三方博弈系统模型进行求解,得到各方飞行器的控制矢量以表示求解出的最优追逃制导策略,包括:

11、对所述三方博弈系统模型利用哈密顿函数、矩阵黎卡提微分方程组进行求解,得到具有状态反馈增益形式的最优追逃指导策略;

12、对所述具有状态反馈增益形式的最优追逃指导策略施加控制系统的约束条件,得到各方飞行器的控制矢量以表示求解出的最优追逃制导策略。

13、在本发明的一个实施例中,所述构建三方飞行器的运动模型,包括:

14、通过构建飞机的三自由度运动模型、导弹的三自由度运动模型构建三方飞行器的运动模型。

15、在本发明的一个实施例中,所述仿真限制条件,包括:

16、当弹目距离小于导弹最大毁伤半径且不触发时间限制条件和速度限制条件时,判定导弹成功命中目标,否则判定导弹攻击失败;

17、所述时间限制条件为:当导弹飞行时间大于导弹可控飞行时间时,导弹能源耗尽无法命中目标;

18、所述速度限制条件为:当导弹速度小于导弹最小飞行速度时,导弹机动性能下降无法命中目标;

19、其中,所述导弹包括所述防御导弹和所述攻击导弹;所述目标为导弹攻击的对象;所述防御导弹攻击的对象为所述攻击导弹,所述攻击导弹攻击的对象为所述目标飞机。

20、在本发明的一个实施例中,所述针对获得的每组仿真数据,在空战三方均执行最优追逃制导策略的基础上,利用该组仿真数据、所述仿真模型以及改进进退法对动态战术控制域的边界进行搜索,得到该组仿真数据对应的外边界动态战术控制距离值和内边界动态战术控制距离值,包括:

21、针对获得的每组仿真数据,在空战三方均执行最优追逃制导策略的基础上,利用该组仿真数据、所述仿真模型以及进退法对动态战术控制域的外边界进行搜索,得到该组仿真数据对应的外边界动态战术控制距离值;

22、利用该组仿真数据对应的外边界动态战术控制距离值以及二分法对动态战术控制域的内边界进行搜索,得到该组仿真数据对应的内边界动态战术控制距离值。

23、在本发明的一个实施例中,所述针对获得的每组仿真数据,在空战三方均执行最优追逃制导策略的基础上,利用该组仿真数据、所述仿真模型以及进退法对动态战术控制域的外边界进行搜索,得到该组仿真数据对应的外边界动态战术控制距离值,包括:

24、针对获得的每组仿真数据,在空战三方均执行最优追逃制导策略的基础上,根据该组仿真数据、获取的所述攻击导弹与所述目标飞机的初始距离,利用所述仿真模型进行对应态势下的空战对抗模拟仿真,获得所述攻击导弹与所述目标飞机之间初始的脱靶量仿真结果;并根据所述初始的脱靶量仿真结果设置初始的外边界搜索点;

25、利用当前次迭代使用的外边界搜索点进行空战对抗模拟仿真,输出当前次迭代的脱靶量仿真结果;其中,首次迭代使用的外边界搜索点为所述初始的外边界搜索点;

26、根据所述当前次迭代的脱靶量仿真结果与预设的外边界搜索点范围中的下限值和上限值的数值比较关系,得到下一次迭代使用的外边界搜索点,并在所述当前次迭代的脱靶量仿真结果未落入所述外边界搜索点范围内时,根据得到的下一次迭代使用的外边界搜索点继续进行空战对抗模拟仿真,直至得到的脱靶量仿真结果落入所述外边界搜索点范围内,停止迭代并将对应得到的下一次迭代使用的外边界搜索点作为该组仿真数据对应的外边界动态战术控制距离值。

27、在本发明的一个实施例中,所述根据所述当前次迭代的脱靶量仿真结果与预设的外边界搜索点范围中的下限值和上限值的数值比较关系,得到下一次迭代使用的外边界搜索点,包括:

28、判断所述当前次迭代的脱靶量仿真结果是否小于所述外边界搜索点范围中的下限值;如果是,利用第一公式确定下一次迭代使用的外边界搜索点;

29、如果否,判断所述当前次迭代的脱靶量仿真结果是否大于或等于所述外边界搜索点范围中的上限值,若是,利用第二公式确定下一次迭代使用的外边界搜索点;若否,利用第三公式确定下一次迭代使用的外边界搜索点;

30、其中,所述第一公式为rk+1=rk+d-0.5mdk:所述第二公式为rk+1=rk-d-0.5mdk:所述第三公式为rk+1=rk-0.5mdk;rk表示第k次迭代使用的外边界搜索点;mdk为第k次的脱靶量仿真结果;d为预设的反向边界搜索步长;k为大于0的自然数。

31、在本发明的一个实施例中,所述利用该组仿真数据对应的外边界动态战术控制距离值以及二分法对动态战术控制域的内边界进行搜索,得到该组仿真数据对应的内边界动态战术控制距离值,包括:

32、根据当前次迭代使用的内边界搜索点范围,计算其二分法分割点;其中,首次迭代使用的内边界搜索点范围的下限值为0,上限值为该组仿真数据对应的外边界动态战术控制距离值;

33、根据所述当前次迭代对应的二分法分割点和该组仿真数据,利用所述仿真模型进行三方博弈对抗仿真,获得脱靶量仿真数值;

34、判断该脱靶量仿真数值是否表明所述目标飞机未被所述攻击导弹击中,并基于不同的判断结果,对所述当前次迭代使用的内边界搜索点范围进行相应缩小;

35、判断缩小后的内边界搜索点范围是否满足预设的误差要求;

36、如果否,将所述缩小后的内边界搜索点范围作为下一次迭代使用的内边界搜索点范围,并返回所述根据当前次迭代使用的内边界搜索点范围,计算其二分法分割点的步骤;

37、如果是,计算所述缩小后的内边界搜索点范围的二分法分割点,作为该组仿真数据对应的内边界动态战术控制距离值。

38、在本发明的一个实施例中,所述基于不同的判断结果,对所述当前次迭代使用的内边界搜索点范围进行相应缩小,包括:

39、如果该脱靶量仿真数值表明所述目标飞机被所述攻击导弹击中,将所述当前次迭代使用的外边界搜索点范围中的上限值替换为所述当前次迭代对应的二分法分割点;

40、如果该脱靶量仿真数值表明所述目标飞机未被所述攻击导弹击中,判断是否满足所述时间限制条件和所述速度限制条件中的至少一个;

41、如果不满足,返回根据所述当前次迭代对应的二分法分割点和该组仿真数据,利用所述仿真模型进行三方博弈对抗仿真的步骤以原输入数据重新仿真;

42、如果满足,将所述当前次迭代使用的外边界搜索点范围中的下限值替换为所述当前次迭代对应的二分法分割点。

43、针对超视距空战模拟对抗环境中决策信息支撑问题,本发明实施例提出了一种自适应性、高时效性以及高精度特点的动态战术控制域(dtcz)量化表征方案。首先基于微分博弈理论建立表征三方飞行器博弈对抗关系的三方博弈系统模型,并在此基础上解算出空战三方的最优追逃制导策略。然后构建用于边界搜素的仿真模型,在空战各方执行最优追逃制导策略的基础上,设计了一种基于改进进退法的dtcz实时解算方法,能够针对不同态势的各组仿真数据得到该对应的外边界动态战术控制距离值和内边界动态战术控制距离值,进而获得动态战术控制域,仿真结果能够满足空战仿真环境中态势剧烈变化场景下的决策信息解算需求。本发明实施例充分考虑了战斗机在超视距空战模拟环境中兼顾自身安全性和任务完成度的决策需求,基于空战过程分析建立了动态战术控制域理论模型,并设计了基于三方博弈的dtcz解算方法。该方法充分挖掘了空战各方博弈对抗的战术机理,克服了假定目标机动状态所带来的计算误差,有效提高了空战决策量化模型的求解精度。由于动态战术控制域是超视距空战模拟环境中对抗演练的关键节点信息,是操纵用户在空战模拟对抗环境中执行相应战术的重要参考标准。本发明实施例所提出的空战模拟环境中基于三方博弈的动态战术控制域解算方法具有优良的态势表现形式,能够满足高动态、强实时仿真环境下对决策信息支持的需求,有效弥补了空战节点信息的缺失,对于提高战斗机在空战对抗游戏和空战模拟系统中的超视距空战效能具有重要的意义。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1