本发明涉及武器目标分配,特别是指一种无人机群攻防对抗博弈目标分配方法及装置。
背景技术:
1、近年来,随着无人机小型化、智能化以及集群化技术快速发展,无人机集群作战已从理论走向战争实践,成为军事领域最活跃、最创新以及最贴近实战的发展方向,已成为新型战斗力生成的重要创新发展途径。在无人机集群作战模式中,无人机群攻防对抗多武器多目标分配问题是需要解决的关键问题。
2、无人机群攻防对抗多武器多目标分配问题是通过将多作战武器分配给多个打击目标,最优地实现作战意图,实现我方无人机武器群对来袭目标的打击毁伤效果最佳,并且使得我方的经济损失最低。
3、目前,针对无人机群攻防对抗多武器多目标分配问题的研究主要是构造非线性整数规划模型,最大化对目标的攻击有效性或最小化目标的生存价值。多无人机和对手之间的对抗实质是一个博弈的过程,具有不确定、强对抗以及高动态特点。然而,近年来针对无人机群攻防对抗多武器多目标分配问题的研究中,单一从己方角度考虑武器目标分配问题而忽略对手策略的关联性。在无人机攻防对抗中,面对武器目标分配问题时需要分析对手在不同策略下所表现的出来的可能转移行为,对我方不同能力领域资源分配的影响,辅助实现我方资源的优质分配,缩短与敌方的能力差距,减少因能力不足而带来的损失。另外现有无人机攻防对抗策略主要围绕攻防对抗建模和目标分配求解问题进行展开研究,忽略了对于协同空战作战任务的研究。
技术实现思路
1、本发明实施例提供了一种无人机群攻防对抗博弈目标分配方法及装置。所述技术方案如下:
2、一方面,提供了一种无人机群攻防对抗博弈目标分配方法,该方法由电子设备实现,该方法包括:
3、s1、获取作战双方的目标信息;作战双方的目标信息包括:无人机姿态信息、无人机数量、无人机出发位置、以及无人机态势信息;
4、s2、对无人机态势信息进行威胁度评估,获得作战双方威胁度评估序列;
5、s3、根据无人机数量、无人机姿态信息以及无人机出发位置,计算作战双方命中率;
6、s4、根据作战双方威胁度评估序列与所述作战双方命中率,建立静态的博弈模型;
7、s5、利用滚动时域控制法对静态博弈模型进行优化,获得多阶段动态博弈模型;
8、s6、对多阶段动态博弈模型求解纳什均衡,获得作战双方最优武器目标分配策略组合;作战双方最优武器目标分配策略组合包括:作战双方各自的最优武器目标分配策略;
9、s7、执行作战双方各自的最优武器目标分配策略。
10、可选地,s2的对作战双方目标信息进行威胁度评估,获得作战双方威胁度评估序列,包括:
11、s21、选取上级指定、相对角度、相对速度、相对高度、保卫要地以及雷达反射截面积6个威胁指标,构造6个威胁指标相对应的威胁指标模型;
12、s22、将无人机态势信息分别输入6个威胁指标相对应的威胁指标模型中,获得6个威胁度值;
13、s23、利用层次分析法计算6个威胁度值的第一权重,利用熵值法计算第二权重;将第一权重与第二权重进行融合计算,获得作战双方威胁度评估序列。
14、可选地,s3的根据无人机数量、无人机姿态信息以及无人机出发位置,计算作战双方命中率,包括:
15、s31、根据无人机姿态信息中的方位角,构造初始的命中率函数;
16、s32、根据无人机出发位置以及无人机数量,计算作战双方无人机之间的距离;
17、s33、将初始的命中率函数与作战双方无人机之间的距离相结合,构造最终的命中率函数。
18、s34、将作战双方无人机姿态信息中的方位角以及作战双方无人机之间的距离,输入到最终的命中率函数中,获取作战双方的命中率。
19、可选地,s4的根据作战双方威胁度评估序列与所述作战双方命中率,建立静态博弈模型,包括:
20、s41、将作战双方无人机作为博弈参与人;
21、s42、将作战双方无人机的武器目标分配方案作为博弈策略;
22、s43、利用作战双方威胁度评估序列与作战双方命中率计算作战双方的攻击价值,将攻击价值构建成的矩阵作为博弈收益矩阵。
23、可选地,s5的利用滚动时域控制法对静态博弈模型进行优化,获得多阶段动态博弈模型,包括:
24、s51、预设相同时间间隔;利用时间间隔对攻防对抗过程整个时间阶段进行划分,获得威胁度评估时间节点;
25、s52、在每个威胁度评估时间节点,清算前一回合中作战双方无人机的打击情况,并且更新新一回合中作战双方的无人机数量、无人机威胁度评估序列以及命中率;
26、s53、根据新一回合中作战双方的无人机数量、无人机威胁度评估序列以及命中率对静态博弈模型进行优化,获得多阶段动态博弈模型。
27、可选地,s6的对多阶段动态博弈模型求解纳什均衡,获得作战双方最优武器目标分配策略组合,包括:
28、利用最小最大定理判定博弈模型是否具有纯策略的纳什均衡。如果有直接进行求解,若没有,利用支付等值法求解混合策略纳什均衡;或利用博弈学习算法求解博弈模型的纳什均衡,获得作战双方最优武器目标分配策略组合。
29、可选地,利用最小最大定理求解法,对多阶段动态博弈模型中的目标分配策略组合进行求解,包括:
30、(1)利用最小最大定理获取作战双方的纯策略纳什均衡解;
31、(2)当作战双方的策略收益相等时,将作战双方的策略组合作为最优武器目标分配策略组合;
32、(3)如果模型不具有纯策略纳什均衡,利用支付等值法获取作战双方的混合策略纳什均衡解;
33、(4)作战双方以一定的混合策略概率分布选择纯策略,任意一种纯策略的期望收益相同,混合概率分布和为1。
34、可选地,利用博弈学习算法,对多阶段动态博弈模型中的目标分配策略组合进行求解,包括:
35、(1)初始化作战双方的混合策略,即策略集合的概率分布;
36、(2)计算作战双方在当前混合策略下的期望收益;
37、(2)作战双方运用期望收益根据特定的更新规则更新混合策略,采用的更新规则由博弈学习算法规定;
38、(4)算法收敛到纳什均衡,获得稳定的策略概率分布。
39、另一方面,提供了一种无人机群攻防对抗博弈目标分配装置,该装置应用于无人机群攻防对抗博弈目标分配方法,该装置包括:
40、获取单元,用于获取作战双方目标信息;作战双方目标信息包括:无人机姿态信息、无人机数量、无人机出发位置、无人机态势信息以及无人机速度;
41、评估单元,用于对作战双方目标信息进行威信度评估,获得作战双方威胁度评估序列;
42、计算单元,用于根据无人机数量、无人机姿态信息、无人机出发位置以及无人机速度,计算作战双方命中率;
43、构建单元,用于根据作战双方威胁度评估序列与作战双方命中率,建立静态动态博弈模型;
44、优化单元,用于利用滚动时域控制法对静态博弈模型进行优化,获得多阶段动态博弈模型;
45、求解单元,用于对多阶段动态博弈模型求解纳什均衡,获得最优武器目标分配策略组合;
46、执行单元,用于执行作战双方各自的最优武器目标分配策略。
47、可选地,评估单元,用于,
48、选取上级指定、相对角度、相对速度、相对高度、保卫要地以及雷达反射截面积6个威胁指标,构造6个威胁指标相对应的威胁指标模型;
49、将无人机态势信息输入6个威胁指标相对应的威胁指标模型中,获得6个威胁度值;
50、利用层次分析法计算6个威胁度值的第一权重,利用熵值法计算第二权重;将第一权重与第二权重进行融合计算,获得作战双方威胁度评估序列。
51、可选地,计算单元,用于,
52、根据无人机姿态信息中的方位角,构造初始的命中率函数;
53、根据无人机出发位置以及无人机数量,计算作战双方无人机之间的距离;
54、将初始的命中率函数与作战双方无人机之间的距离相结合,构造最终的命中率函数。
55、将作战双方无人机姿态信息中的方位角以及作战双方无人机之间的距离,输入到最终的命中率函数中,获取作战双方的命中率。
56、可选地,构建单元,用于,
57、将作战双方无人机作为博弈参与人;
58、将作战双方无人机的武器目标分配方案作为博弈策略;
59、利用作战双方威胁度评估序列与作战双方命中率计算作战双方的攻击价值,将攻击价值构建成的矩阵作为博弈收益矩阵。
60、可选地,优化单元,用于,
61、预设相同时间间隔;利用时间间隔对攻防对抗过程整个时间阶段进行划分,获得威胁度评估时间节点;
62、在每个威胁度评估时间节点,清算前一回合中作战双方无人机的打击情况,并且更新新一回合中作战双方的无人机数量、无人机威胁度评估序列以及命中率;
63、可选地,求解单元,用于,
64、利用最小最大定理判定博弈模型是否具有纯策略的纳什均衡。如果有直接进行求解,若没有,利用支付等值法求解混合策略纳什均衡;或利用博弈学习算法求解博弈模型的纳什均衡,获得作战双方最优武器目标分配策略组合。
65、可选地,利用最小最大定理求解法,对多阶段动态博弈模型中的目标分配策略组合进行求解,包括:
66、(1)利用最小最大定理获取作战双方的纯策略纳什均衡解;
67、(2)当作战双方的策略收益相等时,将作战双方的策略组合作为最优武器目标分配策略组合;
68、(3)如果模型不具有纯策略纳什均衡,利用支付等值法获取作战双方的混合策略纳什均衡解;
69、(4)作战双方以一定的混合策略概率分布选择纯策略,任意一种纯策略的期望收益相同,混合概率分布和为1。
70、可选地,利用博弈学习算法,对多阶段动态博弈模型中的目标分配策略组合进行求解,包括:
71、(1)初始化作战双方的混合策略,即策略集合的概率分布;
72、(2)计算作战双方在当前混合策略下的期望收益;
73、(3)作战双方运用期望收益根据特定的更新规则更新混合策略,采用的更新规则由博弈学习算法规定;
74、(4)算法收敛到纳什均衡,获得稳定的策略概率分布。
75、另一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述无人机群攻防对抗博弈目标分配方法。
76、另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述无人机群攻防对抗博弈目标分配方法。
77、本发明实施例提供的技术方案带来的有益效果至少包括:
78、本发明首先通过采用侦察预警系统监测飞行目标,获得作战双方的目标信息;通过对作战双方的目标信息进行威胁度评估,获得作战双方威胁度评估序列;根据作战双方无人机数量、无人机姿态信息以及无人机出发位置,计算作战双方命中率;通过作战双方的命中率以及威胁度评估序列,建立静态博弈模型;利用滚动时域控制法对静态博弈模型进行优化,从而获得多阶段动态博弈模型;最后对多阶段动态博弈模型求解纳什均衡,获得作战双方最优武器目标分配策略组合,执行作战双方各自的最优武器目标分配策略;本发明针对无人机攻防对抗武器目标分配问题,提出了利用最小最大定理或博弈学习算法求解法对纳什均衡进行求解,从而获得作战双方最优武器目标分配策略组合。同时利用滚动时域控制法对静态博弈模型优化,获取无人机攻防对抗武器目标分配的多阶段动态博弈模型,提高了决策实时性、防御系统的效率以及成功率。