一种面向指挥控制网络管理系统的故障检测方法

文档序号:32031410发布日期:2022-11-03 01:46阅读:29来源:国知局
一种面向指挥控制网络管理系统的故障检测方法

1.本发明属于指挥控制网络管理技术领域,具体涉及一种面向指挥控制网络管理系统的故障检测方法。


背景技术:

2.现代战争环境下,信息化传输已成为不可或缺的一部分。信息数量大、信息变化迅捷是现代战争的主要特点,以网络为中心的体系对抗成为信息化战争的主要形态,对于网络故障检测也变得尤为重要。网络故障按照对象,可分为主机故障、路由器故障和线路故障;按照性质,可分为逻辑故障和物理故障;按照持续时间,可分为短暂性、间断性和永久性故障。网络故障检测是通过对网络状态信息(网络流量信息、设备状态信息、trap告警信息等)进行采集,然后检测这些信息数据是否偏离其正常状态,进而检测出网络是否发生故障。
3.有人提出一种采用编码输入的生成对抗网络故障检测策略,考虑故障检测方法中基于生成器的统计量计算成本高和对离群点敏感的问题,计算待测样本经编码后的曼哈顿距离来作为新统计量进行故障检测,但最终生成的模型故障检测贡献率并不高;后来提出一种基于主动探测的探测路径选择算法来进行网络故障检测,该方法能减少投入成本,但检测准确率却受影响;之后根据相似度方法结合支持向量机算法设计了一个网络故障检测系统,该算法提高了检测的准确率,但性能提升容易陷入瓶。


技术实现要素:

4.针对现有技术的不足,本发明的目的在于提供一种面向指挥控制网络管理系统的故障检测方法,解决了现有技术中指挥控制网络故障频发,导致网络故障检测准确率较低、耗时较长等问题。
5.本发明的目的可以通过以下技术方案实现:
6.一种面向指挥控制网络管理系统的故障检测方法,所述方法包括以下步骤:
7.s1:构建指挥控制网络故障管理系统架构;
8.s2:获取原始故障网络数据集,对数据集进行归一化预处理;
9.s3:对预处理后的数据集运进行数据集的特征降维;
10.s4:构建svm模型,将svm应用于指挥控制网络故障检测中;
11.s5:选取svm模型中需要优化的参数作为评价算法预测性能的性能指标;
12.s6:运用决策灰狼优化算法优化svm模型中的参数,选出最优参数运用于指挥控制网络故障检测模型中,进行网络故障检测;
13.s7:将指控系统实时采集到的数据信息按顺序传输到故障检测模块,从而实现智能化指挥控制网络故障检测,反馈出是否发生网络故障。
14.进一步地,所述步骤s1中,系统通过数据采集和传输模块采集网络性能数据,按照网络协议层次,可将网络性能数据分为3类:网络层性能数据、传输层性能数据和应用层性
能数据。
15.进一步地,所述步骤s2中,由于数据集中不同的特征之间数值存在很大差异,因此需要对数据集进行归一化处理,将所选用的训练集数据的各个指标进行归一化处理,处理的方法如下所示:
[0016][0017]
式中:为归一化后的数据,xi为原始数据,x
max
与x
min
分别为原始数据集中的最大值和最小值。
[0018]
进一步地,所述步骤s3中,选用pca对其特征进行降维。
[0019]
进一步地,所述pca对其特征进行降维包括以下步骤:
[0020]
s301:将数据集中的数据用向量表示,构成一个矩阵,设输入变量矩阵为q
nxk

[0021]
s302:求该矩阵的协方差矩阵;
[0022]
s303:对协方差矩阵的特征值与特征向量进行求解。
[0023]
进一步地,所述协方差矩阵的特征值与特征向量求解包括以下步骤:
[0024]
s3031:设变量s1满足:s1=qθ1,||θ1=1||;
[0025]
s3032:将标准化输入变量矩阵q
nxk
信息赋予s1;
[0026]
s3033:s1方差为:
[0027][0028][0029]
构造拉格朗日函数:
[0030]
l=θ
′1vθ
1-ρ1(θ
′1θ
1-1)
[0031]
其中ρ1为拉格朗日系数,计算l对ρ1和θ1的偏导数,则有:
[0032][0033]
θ1为v标准化特征向量,ρ1为其所对应的特征值,此时得出:
[0034]
var(s1)=θ
′1vθ1=θ
′1ρ1θ1=ρ1[0035]
s3034:将所得特征向量按照特征值降序排成矩阵,选择需要的主成分数目,取前n行n列形成最终矩阵,其中q的第m主成分是sm=qθm。
[0036]
s3035:使用上述所得降维后的矩阵,其中前m个主成分所携带的信息总和为:
[0037][0038]
进一步地,所述步骤s4中,svm将数据集分为训练集与测试集两部分,设已知训练样本集{(xi,yi),i=1,2,...,l},l为训练样本集中训练样本总数;期望输出yi∈r为评估模型的输出值,xi∈rn为评估模型的输入向量,构建基于svm的指挥控制网络故障检测模型为:
[0039][0040]
式中,xi为训练时的样本输入评估指标向量;x为预测时的输入评估指标向量;为sf(x)vm模型的输出,即网络故障检测结果。α
i*
、αi为拉格朗日乘子,λ为径向基核函数中的参数,λ>0,b是偏置量。
[0041]
进一步地,所述步骤s5中,参数优化选用决策灰狼优化算法来优化最佳的参数c和λ,选用的参数为均方误差(mse)、平均绝对误差(mae)、平均绝对百分比误差(mape)以及评估值与真实值之间的相关系数r2作为评价算法预测性能的性能指标,其中mse、mae以及mape计算公式如下:
[0042][0043][0044][0045][0046]
式中,yi为实际值,f(xi)为预测值,n为测试集样本个数,决策灰狼算法中,α,β,δ3个等级的狼群位置代表支持向量机的惩罚因子以及核函数的候选值,猎物位置代表惩罚因子以及核函数的最优值。
[0047]
进一步地,所述步骤s6中,选取决策灰狼优化算法对svm参数进行优化,决策灰狼优化算法包括以下步骤:
[0048]
s601、搜寻猎物:狼与猎物之间的距离为:
[0049][0050][0051]
其中,表示猎物的位置,表示当前狼的位置,t为当前迭代次数,是系数向量,的值是[0,1]范围内的随机数;
[0052]
s602、包围猎物:包围猎物的数学模型为:
[0053][0054][0055][0056]
其中,表示猎物的位置,是系数向量,的值是[0,1]范围内的随机数,a从2线性衰减到0,t为当前迭代次数,t为最大迭代次数;
[0057]
s603、判断猎物:判断阶段将α狼,β狼和δ狼的空间位置x
α
,x
β
和x
δ
赋予向量j
α
,j
β
和j
δ
,根据ω狼反馈回来维度值更新j
α
,j
β
和j
δ
对应的纬度值,j
α
,j
β
和j
δ
各个维度的更新方法为:
[0058][0059]
其中,代表ω狼更新后的位置,代表第j个ω狼的第i狼维度值;
[0060]
s604、攻击猎物:计算狼群适应度,将适应度进行排序,选出适应度最好的三只狼定为α狼,β狼和δ狼,其余定为ω狼:
[0061][0062][0063][0064][0065][0066][0067][0068]
其中,x
α
,x
β
和x
δ
分别代表α狼,β狼和δ狼在解空间中的位置
[0069]
进一步地,所述步骤s603中,将分别去替换j
α
,j
β
和j
δ
中的第i维度,判断j
α
,j
β
和j
δ
的适应度是否优先于x
α
,x
β
和x
δ
,若优于则将j
α
,j
β
和j
δ
的空间位置赋予x
α
,x
β
和x
δ
;若不优于,x
α
,x
β
和x
δ
位置不变,判断当前迭代次数是否达到最大迭代次数,若达到则输出α狼的位置x
α
;若未到达则跳到搜寻猎物阶段。
[0070]
本发明的有益效果:与现有技术相比,本发明提出了一种面向指挥控制网络管理系统的故障检测方法,首先构建了指挥控制网络故障管理系统架构,通过对指挥控制网络系统采集得到的数据进行预处理,获得合适的数据进行网络故障模型检测的训练和评估;其次提出pca方法对获取的指挥控制网络特征数据进行特征选择,删除不必要的特征数据,选出最好特征;最后运用决策灰狼优化算法优化svm检测模型的参数,从而提高了模型对数据中网络故障样本的学习能力,进而提升模型检测准确率并降低了运行时间。实验结果表明,本发明提出的方法处理的网络故障数据集相较于原始数据集能够训练出更佳性能的机器学习模型,从而使模型具有更高的精度,有效提高了网络故障检测的准确率。
附图说明
[0071]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0072]
图1是指挥控制网络故障管理系统架构;
[0073]
图2是基于决策灰狼优化支持向量机的网络故障检测模型;
[0074]
图3是决策灰狼优化算法位置更新过程;
[0075]
图4是基于决策灰狼优化支持向量机模型流程图;
[0076]
图5是pca降维贡献率图;
[0077]
图6是不同维度数据集的预测性能;
[0078]
图7是适应度值变化曲线图;
[0079]
图8是不同方法的网络故障预测性能对比。
具体实施方式
[0080]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0081]
在本发明的描述中,需要理解的是,术语“开孔”、“上”、“下”、“厚度”、“顶”、“中”、“长度”、“内”、“四周”等指示方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的组件或元件必须具有特定的方位,以特定的方位构造和操作,因此不能理解为对本发明的限制。
[0082]
一种面向指挥控制网络管理系统的故障检测方法,所述方法包括以下步骤:
[0083]
s1:构建指挥控制网络故障管理系统架构;
[0084]
s2:获取原始故障网络数据集,对数据集进行归一化预处理;
[0085]
s3:对预处理后的数据集运进行数据集的特征降维;
[0086]
s4:构建svm模型,将svm应用于指挥控制网络故障检测中;
[0087]
s5:选取svm模型中需要优化的参数作为评价算法预测性能的性能指标;
[0088]
s6:运用决策灰狼优化算法优化svm模型中的参数,选出最优参数运用于指挥控制网络故障检测模型中,进行网络故障检测;
[0089]
s7:将指控系统实时采集到的数据信息按顺序传输到故障检测模块,从而实现智能化指挥控制网络故障检测,反馈出是否发生网络故障。
[0090]
如图1所述,所述步骤s1中,系统通过数据采集和传输模块采集网络性能数据,按照网络协议层次,可将网络性能数据分为3类:网络层性能数据、传输层性能数据和应用层性能数据,网络层性能数据包括连通性、丢包率、单向时延、往返时延、带宽利用率、吞吐率等网络性能度量指标;传输层性能数据主要是针对tcp会话的传输能力,如吞吐量、流强度、流持续时间等;应用层性能数据旨在反映网络对应用提供服务的能力,往往被定义为用户体验质量指标。机器学习算法通常采用这些关键特征进行模型训练。未来战场环境中指控网络产生的数据多且繁杂,首先将经过数据采集和传输模块,数据操作处理模块,状态监控模块的历史数据作为数据集用于svm模型的训练。
[0091]
所述步骤s1中,为对所构建的模型进行验证,选用某实验室的网络管理数据集,数据集中包含了41种特征,其中:1-9为tcp连接基本特征;10-22为tcp连接的内容特征;23-31为基于时间的网络流量统计特征;32-41为基于主机的网络流量统计特征;数据故障类型如表1所示:
[0092]
表1.实验数据的识别类型
[0093][0094][0095]
所述步骤s2中,由于数据集中不同的特征之间数值存在很大差异,因此需要对数据集进行归一化处理,将所选用的训练集数据的各个指标进行归一化处理,处理的方法如下所示:
[0096][0097]
式中:为归一化后的数据,xi为原始数据,x
max
与x
min
分别为原始数据集中的最大值和最小值。
[0098]
所述步骤s3中,在所使用的网络数据集中,其内部所包含的样本特征维数过多,其中有些特征是重要的,有些特征却对最终结果影响较小,这些冗余的特征不仅会增加模型运行时间,还会对结果产生影响,因此选用pca对其特征进行降维,从而降低运行时间,提高模型效率。
[0099]
基于pca特征降维步骤如下:
[0100]
s301:将数据集中的数据用向量表示,构成一个矩阵,设输入变量矩阵为q
nxk

[0101]
s302:求该矩阵的协方差矩阵;
[0102]
s303:对协方差矩阵的特征值与特征向量进行求解。
[0103]
对协方差矩阵的特征值与特征向量求解特征步骤如下:
[0104]
s3031:设变量s1满足:s1=qθ1,||θ1=1||;
[0105]
s3032:将标准化输入变量矩阵q
nxk
信息赋予s1;
[0106]
s3033:s1方差为:
[0107][0108][0109]
构造拉格朗日函数:
[0110]
l=θ
′1vθ
1-ρ1(θ
′1θ
1-1)
[0111]
其中ρ1为拉格朗日系数,计算l对ρ1和θ1的偏导数,则有:
[0112][0113]
θ1为v标准化特征向量,ρ1为其所对应的特征值,此时得出:
[0114]
var(s1)=θ
′1vθ1=θ
′1ρ1θ1=ρ1[0115]
s3034:将所得特征向量按照特征值降序排成矩阵,选择需要的主成分数目,取前n行n列形成最终矩阵,其中q的第m主成分是sm=qθm。
[0116]
s3035:使用上述所得降维后的矩阵,其中前m个主成分所携带的信息总和为:
[0117][0118]
所述步骤s4中,svm将数据集分为训练集与测试集两部分,设已知训练样本集{(xi,yi),i=1,2,...,l},l为训练样本集中训练样本总数;期望输出yi∈r为评估模型的输出值,xi∈rn为评估模型的输入向量,构建基于svm的指挥控制网络故障检测模型为:
[0119][0120]
式中,xi为训练时的样本输入评估指标向量;x为预测时的输入评估指标向量;为sf(x)vm模型的输出,即网络故障检测结果。α
i*
、αi为拉格朗日乘子,λ为径向基核函数中的参数,λ>0,b是偏置量。
[0121]
所述步骤s5中,参数优化选用决策灰狼优化算法来优化最佳的参数c和λ,选用的参数为均方误差(mse)、平均绝对误差(mae)、平均绝对百分比误差(mape)以及评估值与真实值之间的相关系数r2作为评价算法预测性能的性能指标。
[0122]
其中mse、mae以及mape计算公式如下:
[0123][0124][0125][0126][0127]
式中,yi为实际值,f(xi)为预测值,n为测试集样本个数,决策灰狼算法中,α,β,δ3个等级的狼群位置代表支持向量机的惩罚因子以及核函数的候选值,猎物位置代表惩罚因子以及核函数的最优值。
[0128]
如图5所示,一般认为主成分累计贡献率不低于95%为满意结果,由图5和表2可得当主成分数目为6时,主成分累计贡献率为96.70%,当数目达到14时,贡献率增长缓慢,已
趋于平缓。因此选择前14特征,采用决策灰狼优化支持向量机模型进行网络故障预测,通过实验结果以及所需时间来选出最合适的维度:
[0129]
表2主成分累计贡献表
[0130][0131][0132]
所述步骤s6中,选取决策灰狼优化算法对svm参数进行优化,重新分析了狼的狩猎行为,观察到在狩猎过程中,领导者和ω狼之间有非常频繁的交流,因此在决策灰狼优化算法中加入判断猎物阶段,收敛速度更快,有效地防止了算法陷入局部最优,该算法由搜寻猎物、包围猎物、判断猎物和攻击猎物阶段四个步骤组成。
[0133]
决策灰狼优化算法包括以下步骤:
[0134]
s601、搜寻猎物:狼与猎物之间的距离为:
[0135][0136][0137]
其中,表示猎物的位置,表示当前狼的位置,t为当前迭代次数,是系数向量,的值是[0,1]范围内的随机数。
[0138]
s602、包围猎物:包围猎物的数学模型为:
[0139][0140][0141][0142]
其中,表示猎物的位置,是系数向量,的值是[0,1]范围内的随机数,a从2线性衰减到0,t为当前迭代次数,t为最大迭代次数。
[0143]
s603、判断猎物:在一个现实的场景中,狼群的首领需要评估猎物的不同特征和狼群的行为,比如猎物是否正在死亡并逃跑以改变自己的位置,猎物是否达到极限,狼群是否会集体攻击。狼的首领还会考虑许多战场上的因素,比如在同一地区是否有其他的捕食者或狼的天敌,或者在捕猎过程中是否找到了比当前猎物更合适的目标,其他因素可能包括它们是否进入了天敌的领地;地理环境是否适合狩猎等等,此外,领导者还需要收集和处理其他狼的信息,以便做出全面的判断,我们把这个过程称为狩猎的猎物判断阶段,在每次迭代之后,狼分散在狼的首领周围,比首领拥有更多的信息,例如,狼对猎物状态和战场因素有更好的了解,因此,各种因素被映射到狼的每个维度,每个因素用一个维度表示,所有的因素结合起来构成了狼的空间矢量。每只狼向每个维度的狼领袖报告,狼的首领评估所有
的因素,以便更好地指导狼,判断阶段将α狼,β狼和δ狼的空间位置x
α
,x
β
和x
δ
赋予向量j
α
,j
β
和j
δ
,根据ω狼反馈回来维度值更新j
α
,j
β
和j
δ
对应的纬度值,j
α
,j
β
和j
δ
各个维度的更新方法为:
[0144][0145]
其中,代表ω狼更新后的位置,代表第j个ω狼的第i狼维度值。
[0146]
将分别去替换j
α
,j
β
和j
δ
中的第i维度,判断j
α
,j
β
和j
δ
的适应度是否优先于x
α
,x
β
和x
δ
,若优于则将j
α
,j
β
和j
δ
的空间位置赋予x
α
,x
β
和x
δ
;若不优于,x
α
,x
β
和x
δ
位置不变,判断当前迭代次数是否达到最大迭代次数,若达到则输出α狼的位置x
α
;若未到达则跳到搜寻猎物阶段。
[0147]
s604、攻击猎物:计算狼群适应度,将适应度进行排序,选出适应度最好的三只狼定为α狼,β狼和δ狼,其余定为ω狼:
[0148][0149][0150][0151][0152][0153][0154][0155]
其中,x
α
,x
β
和x
δ
分别代表α狼,β狼和δ狼在解空间中的位置。α狼,β狼、δ狼和ω狼的位置更新过程如图3所示。
[0156]
如图4所示,所述步骤s6中,基于决策灰狼优化支持向量机模型包括以下步骤:
[0157]
s611:初始化狼群xi(i=1,2,...,n),初始化,a和确定最大迭代次数,初始迭代次数t=0;
[0158]
s612:计算狼群的适合度,将适应度进行排序,选出适应度最好的三只狼定为α狼,δ狼和δ狼,其余定为ω狼;
[0159]
s613:选取一组惩罚因子c以及核函数参数,根据输入的数据集进行训练,根据公式得到预测值f(xi),计算适应度函数;
[0160]
s614:将α狼,β狼和δ狼的空间位置x
α
,x
β
和x
δ
赋予向量j
α
,j
β
和j
δ
,根据ω狼反馈回来维度值更新j
α
,j
β
和j
δ
对应的纬度值,判断j
α
,j
β
和j
δ
的适应度是否优先于x
α
,x
β
和x
δ
,若优于则将j
α
,j
β
和j
δ
的空间位置赋予x
α
,x
β
和x
δ
;若不优于,x
α
,x
β
和x
δ
位置不变;
[0161]
s615:判断是否遍历惩罚因子c以及核函数参数λ,若没有,转到步骤s613;否则转到步骤s616;
[0162]
s616:计算狼群每个个体的位置,再计算最优的惩罚因子c以及核函数参数λ;
[0163]
s617:判断是否遍历每个灰狼个体,若没有,转到步骤s616,否则转到步骤s618;
[0164]
s618:当前迭代次数是否达到最大迭代次数,若达到则输出最优的惩罚因子c以及核函数参数λ;若未到达则t=t+1,跳到步骤s612。
[0165]
如图6所示,从数据集中随机选出30000条数据用来做实验测试,70%(21000条)用来训练,30%(9000条)用来测试,设置决策灰狼优化svm模型的种群数量为10,最大迭代次数为100,惩罚因子以及核函数参数的取值范围为[0.01,100],其中结果的预测准确率用折线表示,运行时间由柱状图表示,具体数值如表3所示:
[0166]
表3主成分数目准确率和运行时间表
[0167][0168]
如图7所示,所述步骤s6中,dgwo算法仅在9代左右就已经趋于收敛,且适应度值最高,ga算法收敛最慢,在45代左右才趋于收敛,bp神经网络法是对网络故障进行检测主流方法,该方法运行效率较快,但评估结果准确率并不高;svm方法也是目前用来对网络故障进行检测的一种方法,该方法用网格搜索的方式进行参数优化,效率较低,运行时间过长;在此之上运用了gwo-svm方法进行参数优化,该方法运行效率和准确率都有提高,但前期发展容易遭受停滞、后期会随着时间的变化收敛的速度逐渐变慢。因此在gwo-svm方法的基础上,提出了dgwo-svm方法进行网络故障检测,该方法收敛速度较快,运行效率和准确率更高,综上所述dgwo算法收敛速度更快,寻优效果好,有助于提高svm的模型评估效率,为进一步验证,选取相同数据集,在12维特征数据下,将dgwo-svm方法与pca方法、bpnn方法、svm方法、gwo-svm方法进行故障检测准确率对比,具体结果如表4所示:
[0169]
表4五种检测方法的实验结果
[0170][0171][0172]
由表4可得虽然pca方法和bpnn方法耗时较短,但评估准确率不高,而svm方法耗时过长,dgwo-svm方法在gwo-svm方法基础上准确率提高了0.23%,且用时减少了235.25s。综
上可得dgwo-svm方法,在对经过预处理降维后的12维数据集进行故障检测,预测精度达到了最佳。
[0173]
在本说明书的描述中,参考为术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0174]
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1