技术总结
本发明提供一种多智能体强对抗仿真方法、装置及电子设备,其中所述方法包括:从对抗仿真引擎获取多轮演示对抗回放数据,并基于所述对抗回放数据,采用生成对抗网络技术,训练获取神经网络策略模型;利用所述神经网络策略模型,模拟所述多智能体在强对抗过程中的决策过程,完成多智能体强对抗仿真。本发明通过借助对历史数据的学习,能够加快多智能体强对抗模型的训练速度,从而有效提高运算效率,并有效节约计算资源。节约计算资源。节约计算资源。
技术研发人员:白桦 王群勇 孙旭朋
受保护的技术使用者:北京圣涛平试验工程技术研究院有限责任公司
技术研发日:2020.11.13
技术公布日:2021/3/2