一种基于环境反馈的战术通信网关键节点识别方法与流程

文档序号:21360416发布日期:2020-07-04 04:33阅读:265来源:国知局
一种基于环境反馈的战术通信网关键节点识别方法与流程

本发明涉及网络通信技术领域,具体而言,涉及一种基于环境反馈的战术通信网关键节点识别方法。



背景技术:

目前大部分重要节点评测方法是基于图论以及图的数据挖掘,主要分为两类:第一类认为节点与网络中其他节点相连后具有不同于其他节点的显著性特征,提出了介数、特征向量、以及子图中心等测度指标;第二类通过评测节点被删除后对整个网络连通性的影响程度,提出了核度、生成树数目等测度指标。少数部分研究在前面的基础上,认为单一测度标准不能完全衡量节点的重要性,从而利用灰度分析法等方法将各个测度指标关联起来。并且其中有部分研究将网络中的负载也作为测度标准之一。

现有的关键节点评测算法的前提是获得网络的拓扑结构,以及能够获得网络中明确负载信息。由于战术通信网的特点,网络拓扑结构以及明确的网络负载信息难以获得,从而导致上述方法并不能完美适用战术通信网。



技术实现要素:

本发明在于提供一种基于环境反馈的战术通信网关键节点识别方法,其能够缓解上述问题。

为了缓解上述的问题,本发明采取的技术方案如下:

一种基于环境反馈的战术通信网关键节点识别方法,包括以下步骤:

s1、对于战术通信网的numpoint个网络节点,将其中每个网络节点被干扰的次数playcount以及平均环境反馈值reward全部初始化为0;

s2、从战术通信网中选取一网络节点作为目标干扰节点;

s3、对目标干扰节点进行干扰,在干扰过程中,从战术通信网采集物理数据,并根据所采集物理数据的时间长度和帧数目计算得到目标干扰节点的环境反馈值v;

s4、根据目标干扰节点被干扰的次数playcount和环境反馈值v,计算目标干扰节点的平均环境反馈值reward;

s5、重复步骤s2~s4,直至所选取的目标干扰节点收敛,且所得到的平均环境反馈值reward稳定时,将当前物理干扰节作为战术通信网的关键节点,完成战术通信网关键节点的识别。

本技术方案的技术效果是:首先利用强化学习方法,本方案通过战场环境实时反馈物理数据信息来逐渐逼近关键节点,只需要获取干扰后的物理层数据,不需要获取网络拓扑结构;其次本方案采用的环境反馈是根据物理层数据的帧数量得到,不需要对物理数据进行解析,需要获取的反馈信息简单易得。

进一步地,所述步骤s2具体包括:

s21、设定动态的概率阈值ε=0.7n/20,其中n为战术通信网所有网络节点被干扰的次数和;

s22、产生(0,1)范围内均匀分布的随机实数,作为随机选择的概率

s23、若则从numpoint个网络节点中以均匀分布的方式随机选取一网络节点作为目标干扰节点,否则选择reward最大的网络节点作为目标干扰节点。

本技术方案的技术效果是:能以ε的概率去探索新的节点,以1-ε的概率利用目前干扰结果,在探索和利用之间可达成较好的折中。

更进一步地,所述步骤s23中,若reward最大的网络节点有多个,则以均匀分布的方式从该多个网络节点中选取一网络节点作为目标干扰节点。

本技术方案的技术效果是:在干扰优势上,回报最大的节点之间地位平等,以均匀分布进行随机选择,每个节点被选取的概率相同,保证选择的随机性和公平性。

进一步地,所述步骤s3中,对目标干扰节点进行物理干扰的方法为无线电干扰法,所述无线电干扰法为同频干扰/邻频干扰/互调干扰方法。

本技术方案的技术效果是:通过发送无线电信号降低信噪比的方式,能够达到破坏通信、阻值广播电台信号的效果,且操作简单,方便执行,能够满足关键节点识别方法中干扰需求。

进一步地,所述步骤s3中,从战术通信网中采集的物理数据时间长度t1根据网络规模和网络数据传输速度进行调整。

本技术方案的技术效果是:物理数据首先需体现网络整体的传输规律,而不是反映某些节点的发送规律;其次过长的数据长度会花费长时间进行处理,降低整个算法的学习效率;因此设置合适的反馈物理数据长度既保证了网络传输规律的完整呈现,又提高了算法效率。

更进一步地,干扰所述目标干扰节点的时间长度t2>t1。

本技术方案的技术效果是:由于数据传输延迟、干扰机从工作到稳定消耗时间等因素,如果要取得t1长的有效数据,干扰时长需要大于t1,这样保证了数据的有效性、完整性,为后期计算减小误差。

更进一步地,所述步骤s3中,设所采集物理数据帧数目为num,则环境反馈值v的计算公式为:

本技术方案的技术效果是:对于战术网络而言,单位时间内的网络中传输物理数据帧数量从某种程度反映了网络流量;若打击某个节点,能够使网络流量减小,则说明该节点重要;该环境反馈v的计算方法能反映打击节点后对网络性能的影响程度。

进一步地,所述步骤s4中,计算目标干扰节点的平均环境反馈值reward的公式如下:

本技术方案的技术效果是:通过对节点的有限次干扰,用平均反馈作为期望平均反馈的逼近,进而学习评估出干扰某个节点后对网络造成的影响。

进一步地,所述步骤s5中,设n为战术通信网所有网络节点被干扰的次数和,{x1,x2,...xn}为截止目前每次选择的目标干扰节点集合,目标干扰节点可重复选择,{reward1,...,rewardn}为截止目前每次干扰的平均环境反馈值,k为实验设定的最近交互次数,则目标干扰节点收敛和平均环境反馈值趋于稳定的定量描述为:

本技术方案的技术效果是:量化了关键节点的判定,增加了关键节点识别方法的准确度和合理性。

为使本发明的上述目的、特征和优点能更明显易懂,下文特举本发明实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1是本发明所述基于环境反馈的战术通信网关键节点识别方法流程图;

图2是本发明中目标干扰节点的选取方法流程图;

图3是针对目标干扰节点的信号发送以及物理数据采集的示意图;

图4是交互过程中平均环境反馈记录图;

图5是交互过程中目标干扰节点记录图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例

请参照图1,本实施例所述基于环境反馈的战术通信网关键节点识别方法,利用环境反馈指导干扰节点的选择,对选择的节点以干扰的方式作用于环境,通过与环境反复交互的方式逐渐逼近关键节点,其中numpoint表示战术通信网络中节点总数,playcount表示截止当前时刻每个节点被干扰的次数,reward表示每个节点获得的平均环境反馈值,其具体包括以下步骤:

s1、首先初始化每个节点被干扰的次数以及平均环境反馈值,全部为0;

s2、从战术通信网中选取一网络节点作为目标干扰节点;

s3、对目标干扰节点进行干扰,在干扰过程中,从战术通信网采集物理数据,并根据所采集物理数据的时间长度和帧数目计算得到目标干扰节点的环境反馈值v;

s4、根据目标干扰节点被干扰的次数playcount和环境反馈值v,计算目标干扰节点的平均环境反馈值reward;

s5、重复步骤s2~s4,直至所选取的目标干扰节点收敛,且所得到的平均环境反馈值reward稳定时,将当前物理干扰节作为战术通信网的关键节点,完成战术通信网关键节点的识别。

在本实施例中,请参照图2,步骤s2具体包括:

s21、设定动态的概率阈值ε=0.7n/20,其中n为战术通信网所有网络节点被干扰的次数和;

s22、产生(0,1)范围内均匀分布的随机实数,作为随机选择的概率

s23、若则从numpoint个网络节点中以均匀分布的方式随机选取一网络节点作为目标干扰节点,否则选择reward最大的网络节点作为目标干扰节点。

其中,若reward最大的网络节点有多个,则以均匀分布的方式从该多个网络节点中选取一网络节点作为目标干扰节点。

在本实施例的步骤s3中,一般利用无线电手段对网络节点进行干扰,主要干扰手段为同频干扰/邻频干扰/互调干扰方法。其中同频干扰指的是相同载频信号对接收机产生干扰;邻频干扰类似载频信号落在接收机范围内从而对接收机产生影响;互调干扰指的是多种频率互调产生新频率成分,对接收机产生干扰。

请参照图3,首先干扰机向被干扰节点(目标干扰节点)发送持续干扰脉冲,干扰时间长为t,干扰机应该保证能够准确对被干扰节点进行干扰;干扰一段时间后,信号采集器采集网络中的发送数据,且采集范围覆盖整个网络。

从战术通信网中采集的物理数据时间长度t1根据网络规模和网络数据传输速度进行调整,在本实施例中,t1长于1s,目标干扰节点的干扰时间长度t2为5s。采集的物理数据只需要能代表干扰此节点后的网络通信情况即可,不宜过长也不宜过短,过短观察不到网络通信变化,过长则会降低效率。

在本实施例中,设所采集物理数据帧数目为num,则环境反馈值v的计算公式为:如果环境反馈值v越大,说明此目标干扰节点在战术网络通信过程中越重要,如果环境反馈值v越小,则说明此目标干扰节点在战术网络通信过程中的重要性越弱。

在本实施例的步骤s4中,计算此次目标干扰节点的平均环境反馈值的公式如下:

在本实施例中,如果每次目标干扰节点和平均环境反馈值趋于稳定,说明已经找到战术通信网络中的最佳干扰节点。本实施例网络中节点数为20,如图4、5,通过实验发现,在后续300次交互内,目标干扰节点都是同一网络节点,并且计算发现平均环境反馈值波动不超过0.01,说明干扰策略已经稳定,即该被干扰的目标干扰节点为此战术通信网的最佳节点。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1