一种基于客观权重确定的网络设备健康度评估方法

文档序号:9420172阅读:683来源:国知局
一种基于客观权重确定的网络设备健康度评估方法
【技术领域】
[0001]本发明主要涉及到网络系统的性能评估及优化技术领域,特指一种主要适用于高速以太网、IP分组网络和InfiniBand高速网络的网络设备健康度评估方法。
【背景技术】
[0002]随着云技术的发展和成熟,数据中心网络承载越来越多种类的应用,如科学计算、生物制药、数学建模、天气预报、集群计算、分布式文件系统等。数据中心作为这些应用的数据计算和存储中心,以供应链方式提供共享的基础设施、信息处理与应用环境等服务。
[0003]数据中心不同于传统网络,现代数据中心通常具有上万节点的规模,随着网络规模的不断增大,除了通常的树型结构,一些新型的网络结构被提出,例如:Fat-tree、Portland、VL2、DCell等;这些新型网络结构能够支持多路径、提供更高的带宽。现代数据中心网络有以下特点:1)数据中心网络规模日益庞大,网络异构复杂;2)流量行为复杂,拥塞加剧;3)应用的多样化;4)网络故障率的指数增加;5)细粒度的网络性能评估需求。因此,数据中心网络运行的应用通常对网络设备性能要求严格,需要管理者能更加实时、精确的掌握全网设备态势,在网络性能下降初期能及时发现和定位网络设备性能瓶颈及可能故障点,给出一个快速的性能评估和预测方案。
[0004]网络健康度是指通过健康指数来评价网络及设备的性能状况。目前,网络设备健康度评估方法主要分为以下几类:
[0005](I)采用nProbe工具对大规模网络进行被动测量,该方法的优点是结合历史数据得到网络延迟、吞吐率、正常连接率的偏离度,能够反映出网络的整体运行情况。但缺点是作为评估参数的Tcpflags在Tcp连接超时后,会发生Tcp重传提高正常Tcp连接的比率,可能会造成评估值较大,而无法反映真实的网络情况。
[0006](2)基于SVM的网络性能评估方法,该方法的特点是通过对正常样本和故障样本进行SVM分类训练,结合云模型对网络性能进行评估,优点是提高了评估结果的客观性,缺点是在选择样本和样本归一化处理过程,如果样本的差距比较大,或导致归一化后的参数数据距离参数正常运行值偏离较远,会造成评估结果的不准确。
[0007](3)分析不同事件与网络性能之间的关联,考虑的影响事件较多,优点是能够根据发生的网络事件快速的做出反应,缺点是由于影响网络性能各个因素之间存在复杂的关联性,单纯的考虑每个事件对网络性能的影响,难以发现影响网络性能的关键因素,同时也增加了系统的复杂程度。
[0008](4)实现对影响网络运行的单元分层,每层都有若干的设备或链路,当每层的所有设备或链路都大于阈值时,才判断该层网络情况为正常,然后逐层判断,最终得到整个网络的健康度情况。这种方法可以将复杂的网络问题划分成简单的局部的模块,但没有考虑网络设备部署的层次结构,无法根据网络设备的层次结构进行动态的调整。

【发明内容】

[0009]本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种原理简单、操作简便、能够做出客观准确评估的基于客观权重确定的网络设备健康度评估方法。
[0010]为解决上述技术问题,本发明采用以下技术方案:
[0011]—种基于客观权重确定的网络设备健康度评估方法,其特征在于,步骤为:
[0012]S1:按层次划分设备;网络管理员通过导入静态网络拓扑信息,将设备按层次进行划分,层次号越大表示对应设备在网络中的位置越重要;
[0013]S2:据设备层次号为每个设备设置初始优先级;
[0014]S3:采集数据中心网络设备的运行数据信息,将采集信息按照采集时间写入到数据库中;
[0015]S4:采集参数数据的处理:根据采集的网络设备的运行数据信息,首先将网络设备掉线情况,各个端口丢包数目和错误包数目转化为掉线率、端口丢包率和端口错误包率,经过进一步数据处理,包括数据归一化处理以及各个参数权值的客观确定,对采集到的原始数据进行处理;
[0016]S5:网络设备健康度计算:根据网络设备集合信息,按照网络设备数据采集时间序列,分别分析单个网络设备,获得其经过处理后的参数数据;利用健康度计算公式得到该网络设备在该时间点的健康值,最后将处理过的设备经过分级处理分别定为健康、亚健康、不健康三种状态,得到网络设备集合中所有设备的健康值和运行状态的分布情况。
[0017]作为本发明的进一步改进:在所述步骤SI中,数据中心网络拓扑信息描述如下,数据中心网络DN= {S,C,E},其中S= (S1, S2, S3,, SM}表示交换机设备集合,C =IC1, C2, C3,, CJ表示网络中终端计算节点的集合,M和N分别为网络中交换设备及计算节点的总数;E= (E1, E2, E3,, EJ表示交换机设备的网络接口集合,每一个交换设备S1都含有X个接口,则有E1=Ie u,el2, el3,...,elXl},其中E1是交换设备S i的接口集合,en, el2, el3,...,elXl是设备S i的所有接口,X 1是S i的接口总数。
[0018]作为本发明的进一步改进:在所述步骤S2中,令DLEVEL(S1)为交换机在网络中的层次号,其中计算节点的层次号为1,接入交换机层次号为2,汇聚、核心交换机按照组网上下层关系分别赋予对应层次号,层次号越大表示对应设备在网络中的位置越重要,H为本网络的最大层次深度;网络数据采集模块根据设备层次号,为每个设备设置初始优先级PR1(V1),有PR1(V1) = DLEVEL(V1),根据设备优先级采用不同的采集策略,高优先级的设备为重点关注,有较高的采集频率。
[0019]作为本发明的进一步改进:在所述步骤S3中,运行数据信息包括网络设备在线和掉线情况,异常的交换设备端口数目PortDropNum,总端口数目DevicePortNum,进入端口的错误包数目InPortErrPkts,总进设备数据包数目InDevicePkts,出端口的错误包数目OutPortErrPkts,总出设备数据包数目OutDevicePkts,进入端口的丢包数目InPortDiscardPkts,总进设备数据包数目InDevicePkts,出端口的丢包数目OutPortDiscardPkts,总出设备数据包数目 OutDevicePkts0
[0020]作为本发明的进一步改进:所述步骤S4的具体步骤为:
[0021]S4.1:PortDropNum是操作状态异常的交换设备端口数目,DevicePortNum是设备正在使用总端口数目,端口掉线率PortDropPer:
[0022]PortDropPer = PortDropNum/DevicePortNum ;
[0023]S4.2 JnPortErrper是通信过程中交换机每个端口收到进入端口的错误包数目InPortErrPkts占总进设备数据包数目InDevicePkts的比值,即InPortErrper =InPortErrPkts/InDevicePkts ;OutPortErrper是通信过程中交换机每个端口收到出端口的错误包数目OutPortErrPkts占总出设备数据包数目OutDevicePkts的比值,即OutPortErrper = OutPortErrPkts/OutDevicePkts ;设备平均错误包率 AvgPortErrPer:
[0024]AvgPortErrPer = (InPortErrper+OutPortErrper)/DevicePortNum ;
[0025]S4.3 JnPortDiscardper是通信过程中交换机每个端口接收到进入端口的丢包数目InPortDiscardPkts占总进设备数据包数目InDevicePkts的比值,即InPortDiscardper = InPortDiscardPkts/InDevicePkts ;OutPortDiscardper 是通信过程中交换机每个端口接收到出端口的丢包数目OutPortDiscardPkts占总出设备数据包数目OutDevicePkts 的比值,即 OutPortDiscardper = OutPortDiscardPkts/OutDevicePkts ;设备平均丢包率AvgPortDiscardPer:
[0026]AvgPortDi sc ardPer = (InPortDi scar dp er + OutPortDi sc ardper) /DevicePortNum ;
[0027]S4.4:计算性能参数权值,首先采用基于标准方差系数的权值计算方法,分别求出PortDropPer、AvgPortErrPer、AvgPortDiscardPer 在时间点 t 下的期望值 μρ(1ρ,μ ape? μ apd?再求出标准方差δρ(1ρ,δ ape? 3apd,最后分别得到三个参数的标准差系数V5pdp,V5ape,V5apd;
[0028]由下面的公式得到权值wpdp,Wape?wapd:
[0029]其中Wpdp= V Spdp/ (V δ pdp+V δ ape+V δ apd) ;Wape= V δ ape/ δ pdp+V δ ape+V δ apd) ;Wapd= V δ apd/(V δ pdp+V δ ape+V 5 apd),
[0030]S4.5:数据的归一化阶段:对原始的数据值进行归一处理,让处理后的数据都落入一个较小的范围。
[0031]作为本发明的进一步改进:所述步骤S4.5的具体步骤为:
[0032]S4.5.1:在时间点 t 下,把 PortDropPer、AvgPortErrPer、AvgPortDiscardPer 的所有数据用科学计数法表示,并存入历史数据库;
[0033]S4.5.2:在指定时间内的历史数据库中,分别统计所有时间点PortDrop
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1