一种基于AI强化学习的无人艇对抗辅助方法及系统与流程

文档序号:35381625发布日期:2023-09-09 07:38阅读:55来源:国知局

本发明涉及数据处理,具体涉及一种基于ai强化学习的无人艇对抗辅助方法及系统。


背景技术:

1、无人艇对抗模拟对于许多作业有着重要的参考意义,其中包括对抗围捕的问题,攻击无人艇的位移参数调节控制是对抗围捕的一个非常关键的环节。

2、对于攻击无人艇的位移参数调节控制的准确性较为重要,且时间是非常紧迫的。然而,现有阶段在控制器设计、数据传输以及运算分析等方面还存在不足,导致控制反应速度慢,控制效果差,常常会错失攻击时机。

3、现有技术中存在对抗围捕过程中,攻击无人艇的位移参数调节控制的准确度和及时性不足,导致对抗围捕效率较低且成功率较低的技术问题。


技术实现思路

1、本申请提供了一种基于ai强化学习的无人艇对抗辅助方法及系统,用于针对解决现有技术中存在对抗围捕过程中,攻击无人艇的位移参数调节控制的及时性和准确度不足,导致对抗围捕效率较低且成功率较低的技术问题。

2、鉴于上述问题,本申请提供了一种基于ai强化学习的无人艇对抗辅助方法及系统。

3、本申请的第一个方面,提供了一种基于ai强化学习的无人艇对抗辅助方法,所述方法包括:获取待围捕的被动目标实时的被动位置参数以及被动移动参数;获取对所述被动目标进行对抗围捕的n个主动目标实时的n个主动位置参数和n个主动移动参数,n为大于1的整数,所述被动目标和主动目标均为无人艇;根据所述被动位置参数、被动移动参数、n个主动位置参数和n个主动移动参数,对所述n个主动目标进行控制,生成n个控制域;在所述n个控制域内,进行对所述n个主动目标进行控制的控制方案的寻优,其中,通过基于马尔科夫决策模型和对抗评价函数对每个控制方案的适应度进行评价计算,且寻优过程中每个控制方案迭代产生的控制方案的数量与适应度正相关,所述对抗评价函数包括围捕评价函数和位置评价函数;基于寻优获得的最优控制方案,对所述n个主动目标进行辅助控制。

4、本申请的第二个方面,提供了一种基于ai强化学习的无人艇对抗辅助系统,所述系统包括:实时参数获取模块,用于获取待围捕的被动目标实时的被动位置参数以及被动移动参数;移动参数采集模块,用于获取对所述被动目标进行对抗围捕的n个主动目标实时的n个主动位置参数和n个主动移动参数,n为大于1的整数,所述被动目标和主动目标均为无人艇;目标控制执行模块,用于根据所述被动位置参数、被动移动参数、n个主动位置参数和n个主动移动参数,对所述n个主动目标进行控制,生成n个控制域;控制方案寻优模块,用于在所述n个控制域内,进行对所述n个主动目标进行控制的控制方案的寻优,其中,通过基于马尔科夫决策模型和对抗评价函数对每个控制方案的适应度进行评价计算,且寻优过程中每个控制方案迭代产生的控制方案的数量与适应度正相关,所述对抗评价函数包括围捕评价函数和位置评价函数;辅助控制执行模块,用于基于寻优获得的最优控制方案,对所述n个主动目标进行辅助控制。

5、本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:

6、本申请实施例提供的方法通过获取待围捕的被动目标实时的被动位置参数以及被动移动参数;获取对所述被动目标进行对抗围捕的n个主动目标实时的n个主动位置参数和n个主动移动参数,n为大于1的整数,所述被动目标和主动目标均为无人艇;根据所述被动位置参数、被动移动参数、n个主动位置参数和n个主动移动参数,对所述n个主动目标进行控制,生成n个控制域;在所述n个控制域内,进行对所述n个主动目标进行控制的控制方案的寻优,其中,通过基于马尔科夫决策模型和对抗评价函数对每个控制方案的适应度进行评价计算,且寻优过程中每个控制方案迭代产生的控制方案的数量与适应度正相关,所述对抗评价函数包括围捕评价函数和位置评价函数;基于寻优获得的最优控制方案,对所述n个主动目标进行辅助控制。达到了获得能够快速逼近被动目标无人艇的主动目标移动参数控制方案,提高对被动目标进行对抗围捕过程中主动目标无人艇移动控制参数调整优化的智能性和有效性,间接实现了提高对被动目标进行围捕的效率和成功率的技术效果。



技术特征:

1.一种基于ai强化学习的无人艇对抗辅助方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取待围捕的被动目标实时的被动位置参数以及被动移动参数,包括:

3.根据权利要求1所述的方法,其特征在于,根据所述被动位置参数、被动移动参数、n个主动位置参数和n个主动移动参数,对所述n个主动目标进行控制,生成n个控制域,包括:

4.根据权利要求3所述的方法,其特征在于,在所述n个控制域内,进行对所述n个主动目标进行控制的控制方案的寻优,包括:

5.根据权利要求4所述的方法,其特征在于,基于马尔科夫决策模型和对抗评价函数对所述m个第二控制方案进行适应度评价,获得m个适应度,包括:

6.根据权利要求5所述的方法,其特征在于,分别构建所述围捕评价函数和位置评价函数,作为所述对抗评价函数,对所述m个第二控制方案进行评价,获得m个第二子适应度和m个第三子适应度,包括:

7.根据权利要求4所述的方法,其特征在于,基于所述m个适应度,获取m个调整迭代数量,包括:

8.一种基于ai强化学习的无人艇对抗辅助系统,其特征在于,所述系统包括:


技术总结
本发明提供了一种基于AI强化学习的无人艇对抗辅助方法及系统,涉及数据处理技术领域,通过根据被动目标实时和主动目标的位置参数和移动参数对主动目标进行控制生成N个控制域,在控制域内对主动目标进行控制方案寻优,以获得最优控制方案对主动目标进行辅助控制。解决了现有技术中存在对抗围捕过程中,攻击无人艇的位移参数调节控制的及时性和准确度不足,导致对抗围捕效率较低且成功率较低的技术问题。达到了获得能够快速逼近被动目标无人艇的主动目标移动参数控制方案,提高对被动目标进行对抗围捕过程中主动目标无人艇移动控制参数调整优化的智能性和有效性,间接实现了提高对被动目标进行围捕的效率和成功率的技术效果。

技术研发人员:叶刚,刘云平,倪宏宇,杨薛,葛愿
受保护的技术使用者:苏州优世达智能科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1