技术特征:
技术总结
本发明提供了一种基于JADE和强化学习的多Agent应急行动决策方法,步骤包括:启动JADE平台并建立监控Agent,利用监控Agent实时判断是否有突发公共事件发生;在监控Agent上注册各个应急资源仓库Agent的应急资源保障服务行为,并执行各个应急资源仓库Agent的强化学习,从监控Agent上获得各个应急资源仓库Agent对应的强化学习回馈值;从各个强化学习回馈值中选择一个或多个应急资源仓库Agent加入应急资源调配序列中。该多Agent应急行动决策方法将多Agent技术与强化学习算法相结合,从整个应急行动系统的全局出发来调配应急资源仓库的供应,强化学习算法充分利用了Agent的自主性,来促进多Agent系统的智能化水平和自适应能力。
技术研发人员:赵佳宝;潘东旭;潘昱宸
受保护的技术使用者:南京大学
技术研发日:2019.03.11
技术公布日:2019.06.25