一种意图态势双驱动的数据链智能抗干扰决策方法

文档序号:36898667发布日期:2024-02-02 21:30阅读:32来源:国知局
一种意图态势双驱动的数据链智能抗干扰决策方法

本发明属于数据链网络,具体涉及一种意图态势双驱动的数据链智能抗干扰决策方法。


背景技术:

1、数据链系统是用于传输高价值实时情报信息的关键信息系统,在情报侦察、电子对抗、网络入侵和攻击系统中扮演者重要的角色。随着信息化程度的不断提高,无线通信业务迅猛增长,电子进攻能力迅速发展,干扰样式不断增多、智能化水平不断提高,无线通信面临的电磁环境日益复杂和恶劣,导致现有抗干扰技术逐渐难以满足干扰环境下可靠有效通信的要求。在未来高强度对抗环境下,亟需研究和开发新的抗干扰技术,以适应不断增长和演变的电磁威胁,使数据链系统具备迅速反应能力和较强的抗干扰能力,同时保持高度稳定性能,以确保信息传输的可靠性和有效性。

2、当前,通信抗干扰技术正朝着综合化、智能化、网络化以及软件化的趋势发展,通过智能化选择通信参数,可极大的提高通信抗干扰能力。近年来,人工智能算法在语音和视觉识别等领域的成功应用奠定了人工智能在未来科技发展中的地位,各领域对人工智能算法的研究层出不穷,在通信领域也掀起了一股研究热潮,基于人工智能算法的智能抗干扰通信系统也随之成为了热点研究问题。

3、现有技术一提出联合使用非协同跳频(ufh)和功率控制手段,使发送方可以在频域和功率域两个维度上实现抗干扰决策,以有效改善ufh技术的不足之处,提升抗干扰系统的性能。

4、现有技术二针对复杂电磁环境下跳频异步组网中的抗干扰问题,提出了基于集中式训练和分散式执行框架的多智能体模糊深度强化学习算法,应用多智能体深度强化学习算法进行各子网参数智能决策,实现避免同频干扰和对抗敌意干扰的目的。

5、现有技术三提出了一种基于二进制人工蜂群算法的抗干扰决策方法,通过增加约束条件和合理设置权重,从而使该算法更加贴近实际的通信需求。与基本遗传算法和粒子群算法相比,该算法具备较好的收敛性能,更能满足抗干扰通信对实时性能的要求。

6、现有技术四提出了一种基于在线学习的智能抗干扰系统架构,根据不同干扰环境,进行有针对性的自适应抗干扰方案设计,并对调制、编码、发射功率等多个参数进行联合优化,最终实现实时、高效、可靠的抗干扰通信。

7、通过上述分析,现有技术存在的问题及缺陷为:

8、现有技术难以同时适应复杂多变的任务需求和环境态势,无法保障未来高强度对抗环境下通信的实时性和可靠性。

9、现有技术往往采用单一的抗干扰手段,各个技术间相互独立,不能够很好地结合并发挥整体抗干扰的效应。

10、现有抗干扰技术或仅关注一到两个参数的调整,或只用一种算法进行智能决策,且并未将干扰考虑其中,不成系统性。


技术实现思路

1、为了克服上述现有技术存在的不足,本发明的目的在于提供一种意图态势双驱动的数据链智能抗干扰决策方法,解决现有数据链网络存在的缺乏自主性、优化程度低、反应速度慢、抗干扰效果差的问题。通过意图和态势的联合驱动机制,使数据链系统能够基于资源态势和任务需求自适应地生成抗干扰策略,实现数据链时、频、空等多维资源的自主、智能、敏捷调度,提升恶劣环境下的传输能力,智能抵御复杂未知的干扰威胁。

2、为了实现上述目的,本发明采用的技术方案是:

3、一种意图态势双驱动的数据链智能抗干扰决策方法,包括以下步骤;

4、步骤一:数据链各节点接收任务意图转译的消息需求,子任务执行区域的中心节点从态势数据库中调用与任务节点相关的多维资源态势信息;

5、步骤二:建立多目标优化决策模型,根据意图需求为多个子目标函数设置权重;

6、步骤三:基于所述意图需求和多维资源态势信息情况,在策略库中采用推理算法快速匹配已有抗干扰策略,若不存在则按需调用智能算法对多目标优化决策模型进行求解,得到各参数决策结果;

7、步骤四:对所述各参数决策结果进行验证,当策略可行时将抗干扰决策结果更新至策略库,同时下发至各任务节点,由任务节点执行该抗干扰策略。

8、进一步,在所述步骤一中,任务意图转译的消息需求、多维资源态势信息具体包括:

9、意图层通过命名体识别从所述任务意图中提取出任务类型、任务领域、任务对象的关键实体,进而转译为对于节点、带宽、时延、可靠性、传输功率方面的消息需求;

10、态势层中的多维资源态势信息包括频谱资源、时隙资源、空域资源、链路资源、功率域资源的数据链资源的多个状态参数;

11、决策层的决策中心上联意图层、下联态势层,自适应地生成最优抗干扰策略,包含对多个通信参数的耦合优化决策。

12、进一步,所述步骤二包括:

13、所述多目标优化决策模型的决策变量为x={f,p,r,l,t},分别表示跳频参数<跳频频点、跳频速率、跳频序列>、发射功率<功率档位>、传输速率<调制方式、编码方式>、分配时隙<时隙编号>、门限<门限档位>。

14、所述多个子目标函数的线性组合成多目标优化决策模型;子目标函数fmin-ber、fmin-power、fmax-throughout、fmin-jamming分别对应的通信决策准则为最小化误码率准则、最小化功耗准则、最大化数据吞吐量准则和最小化干扰准则:

15、y=ω1fmin-ber+ω2fmin-power+ω3fmax-throughout+ω4fmin-jamming

16、通过设定ωi(1≤i≤m)对子目标函数赋予一定权重,反映任务需求对目标函数的偏好程度。

17、具体地,权重系数由意图转译的消息需求决定,对应关系如下:当对可靠性要求较高时:ω1=ω4>ω2>ω3;当对时延要求较高时:ω3>ω1>ω4>ω2;当对带宽要求较高时:ω3>ω2>ω1=ω4;当对传输功率要求较高时:ω1>ω4>ω3>ω2。

18、所述多目标优化决策模型中的约束条件来源于数据链资源的有限性和可用性:

19、(1)对于跳频参数:综合考虑每个任务节点所处位置的频谱态势,选择一组受干扰相对较小的频点,即其中表示第i个频点的受干扰等级;

20、(2)对于发射功率:首先要满足数据链终端对功率档位的限制,即pi∈{p1,p2,p3,…,p11},其次,发射功率的选择会影响通信覆盖范围,因此应充分考虑源节点和目的节点之间的距离,即:

21、

22、其中,stateij表示节点i与节点j的连接需求,dij为两节点距离,di则表示所设功率下的覆盖范围,同时还会受到接收灵敏度、无线电波频率、介质损耗、信道带宽等参数的影响;

23、(3)对于传输速率:首先要满足数据链终端对速率档位的限制,即ri∈{r1,r2,r3},其次,为保证正常通信,所选传输速率应小于当前信道容量,即:

24、ri<ci=bilog(1+η)

25、其中,信道容量与链路资源中的可用带宽b以及信干噪比η密切相关;

26、(4)对于时隙:各任务节点的时隙资源需求分别为lx(x=1,2,...,n),时隙分配需要满足以下约束条件:

27、

28、其中,c表示周期t内的业务量,i表示业务消息容量,t表示业务产生的周期报告;

29、(5)对于门限:根据当前信道的干扰情况对门限进行调整,同时通过统计当前信道不同业务等级的比例和信道的占用情况,设置当前的门限档位,对高优先级意图优先保障。

30、进一步,所述步骤三包括:

31、策略库用于存储并更新不同意图、态势情况下对应的最优配置方案,策略库的初始化搭建基于已有干扰样式,包括部分频带干扰、宽带阻塞干扰,通过构建仿真场景得到不同干扰环境下的抗干扰策略;决策时首先利用推理算法快速搜索策略库中能够应对当前网络态势且满足意图需求的抗干扰策略,若不存在相似情况,进一步调用智能算法对决策模型在线求解。

32、进一步的,所述智能算法涉及遗传算法、人工蜂群算法、二进制粒子群算法以及强化学习算法,系统可根据不同的情景灵活切换决策算法,从而进一步提高决策性能。

33、当消息需求为低时延时,优先采用收敛速度最快的二进制粒子群算法对所述多目标优化决策模型进行求解;当对可靠性要求较高时,优先采用环境适应性较强的强化学习算法对所述多目标优化决策模型进行求解。

34、其中,所述强化学习算法涉及的主要参数如下:

35、(1)状态:记为st=<it,rt>,s∈s,其中i表示意图转译出的消息需求,r表示数据链系统中多维资源态势的集合,s为算法输入的状态集,包括频域、时域、空域、功率域、信息域的多域资源;

36、(2)动作:由跳频参数、发射功率、传输速率、时隙、门限5类可变参数组成,其中跳频参数包括跳频频点、跳频速率、跳频序列;传输速率取决于调制方式和编码方式,调制方式包括msk、qpsk、16qam、64oam,编码方式包括1/2卷积码、2/3卷积码、(7,3)rs码、(15,11)rs码;动作集中是否包含时隙和门限取决于数据链节点类型,对于link-16节点,需要分配时隙,对于ttnt节点,需要设置门限,而对于网关节点,时隙和门限都要考虑;

37、(3)奖励:奖励函数综合考虑误码率、信息传输速率、发射功率以及频点受干扰情况,当系统的误码率ber、发射功率不满足意图需求时,奖励为0;当信息传输速率r大于所选信道容量c时,给予惩罚;当跳频频点受到一定程度的干扰时,以频点受干扰等级fstate作为惩罚;否则以目标函数值y作为奖励,奖励函数表达式如下:

38、

39、定义评估函数值为节点i在状态si下选取动作ai,并在下个时隙选取最优动作的折扣奖励累积值;q值更新如下:

40、

41、其中,α是权衡上一次和本次学习结果的量,γ是考虑未来奖励对现在影响的因子;在学习过程中,通过递归的方式不断更新q值,以获得最大的长期累积奖励,从而得到能够满足意图需求的最优配置策略。

42、进一步,所述步骤四具体描述为:

43、验证所得抗干扰策略是否满足当前意图需求,以及在当前网络态势下是否可行,若不满足或不可行,通过切换智能算法修正决策结果,直至验证成功;反之将抗干扰决策结果更新至策略库,同时下发至各任务节点,由任务节点执行该抗干扰策略。

44、所述针对意图态势双驱动的数据链智能抗干扰决策方法用于实现强对抗环境下数据链多维资源的动态灵活调度,以抵御未知干扰,提高复杂环境下通信系统的传输性能。

45、本发明的有益效果:

46、本发明提出了一种意图态势双驱动的数据链智能抗干扰决策方法,能够基于任务意图转译的消息需求和实时感知得到的资源态势自适应地生成抗干扰策略,实现底层数据链资源与上层任务需求的高度适配。

47、本发明的方法通过灵活调用各种智能算法快速求解决策模型,对数据链网络的多个通信参数进行耦合优化,进一步实现对数据链时、空、频等多维资源的自主、智能、敏捷调度,从而增强高强度对抗环境下的通信保障能力和体系抗干扰能力,为未来数据链通信系统智能抵御复杂未知的干扰威胁提供可能性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1