一种网络故障根源诊断的方法和装置的制造方法

文档序号:8474994阅读:416来源:国知局
一种网络故障根源诊断的方法和装置的制造方法
【技术领域】
[0001] 本发明涉及网络管理安全技术领域,尤其涉及一种网络故障根源诊断的方法和装 置。
【背景技术】
[0002] 随着业务发展对IT系统要求的不断提高,现有网络设备间的关系变得越来越复 杂。在如此多的相互依存的系统、流程和服务来支撑业务运营的过程中,进行全面且持续的 对网络系统监控至关重要。为了能够完整的、实时的、直观的查看不断变化的网络基础设 施,需要部署网络管理装置来监控网络中的所有网元设备。但是,当出现网络故障时,传统 的网络管理装置会为每台受影响的设备产生大量的故障告警信息,海量的故障告警信息会 降低运维人员排查故障的效率,特别是在网元设备较多的网络环境中,传统网管装置的监 控告警功能让网络管理员需要花费大量的时间去进行人工的告警关联及分析,严重影响了 网络维护人员排查根源故障的效率。
[0003] 目前,现有的对网络故障根源诊断的方法中,大多采用定期轮询或异步通知的方 式搜集网络中所有网元设备的网络事件,搜集到的事件存储于事件数据库中,这些事件由 故障根源分析引擎根据网络拓扑信息以及拓扑事件进行关联,故障根源分析引擎识别、关 联并压缩相互关联的事件,仅将故障根源发送给网络管理员以采取对应的解决方案。
[0004] 但是,现有的网络故障根源诊断方案存在如下缺陷:现有的网管软件中的故障根 源诊断引擎只对事件数据库中的事件进行分析和关联,以试图寻找出网络故障的根源;那 么,当进行网络故障根源分析时,如果事件数据库中的历史事件不足以支持进行完整分析 时,网络管理员将得不到故障根源分析的结果。
[0005] 此外,现有的网络故障根源诊断的方案中,将各种网元设备均简单地视为网络节 点,没能体现出主机设备、网络交换机、路由器等设备在网络系统中的特性和区别;进行网 络故障根源分析时,所需要计算的内容较多,需要消耗的资源较高,且结果准确率不高。

【发明内容】

[0006] 有鉴于此,本发明实施例期望提供一种网络故障根源诊断的方法和装置,能够有 效提高网络故障根源分析的效率和准确性。
[0007] 为达到上述目的,本发明的技术方案是这样实现的:
[0008] 本发明实施例一种网络故障根源诊断的方法,所述方法包括:
[0009] 根据网络的拓扑结构建立网络设备之间的拓扑关系;
[0010] 检测网络设备故障,当检测到网络故障告警时,分别计算网络拓扑中每个节点为 根源故障节点的概率;
[0011] 确定根源故障节点概率最大的节点,输出分析结果。
[0012] 上述方案中,所述网络设备之间的拓扑关系包括网络设备之间的连接关系和上下 游关系;
[0013] 其中,网络设备之间的连接关系由网络自动扫描建立,网络设备之间的上下游关 系根据设备类型及辅助输入决定。
[0014] 上述方案中,所述分别计算网络拓扑中每个节点为根源故障节点的概率包括:分 别计算每个节点的根源故障计算概率与加权后的根源故障历史事件分析概率的和。
[0015] 上述方案中,所述计算节点的根源故障计算概率包括:
[0016] 计算节点本身硬件故障导致的本节点的根源故障计算概率;
[0017] 依次计算本节点与相连的所有下级节点之间故障的对应的根源故障计算概率、本 节点与相连的所有平级节点之间故障的对应的根源故障计算概率、本节点与相连的所有上 级节点之间故障的对应的根源故障计算概率;
[0018] 计算节点本身硬件故障导致的本节点的根源故障计算概率与本节点与相连的所 有节点之间故障的对应的根源故障计算概率的和。
[0019] 上述方案中,所述计算节点本身硬件故障导致的本节点的根源故障计算概率为: 计算节点本身硬件故障值与对应权重的乘积;
[0020] 所述计算本节点与相连的所有下级节点之间故障的对应的根源故障计算概率包 括:计算与本节点相连的每个下级节点产生的故障告警数与每个下级节点告警数对应的权 重的乘积之和;
[0021] 所述计算本节点与相连的所有平级节点之间故障的对应的根源故障计算概率包 括:计算与本节点相连的每个平级节点产生的故障告警数与每个平级节点告警数对应的权 重的乘积之和;
[0022] 所述计算本节点与相连的所有上级节点之间故障的对应的根源故障计算概率包 括:计算与本节点相连的每个上级节点产生的故障告警数与每个上级节点告警数对应的权 重的乘积之和。
[0023] 本发明实施例还提供了一种网络故障根源诊断的装置,所述装置包括:拓扑结构 建立单元、故障检测单元、计算单元、输出单元,其中,
[0024] 所述拓扑结构建立单元,用于根据网络的拓扑结构建立网络设备之间的拓扑关 系;
[0025] 所述故障检测单元,用于检测网络设备故障告警;
[0026] 所述计算单元,用于当检测到网络故障告警时,分别计算网络拓扑中每个节点为 根源故障节点的概率;
[0027] 所述输出单元,用于确定根源故障节点概率最大的节点,输出分析结果。
[0028] 上述方案中,所述拓扑结构建立单元建立网络设备之间的拓扑关系包括建立网络 设备之间的连接关系和上下游关系;其中,网络设备之间的连接关系由网络自动扫描建立, 网络设备之间的上下游关系根据设备类型及辅助输入决定。
[0029] 上述方案中,所述计算单元分别计算网络拓扑中每个节点为根源故障节点的概率 包括:分别计算每个节点的根源故障计算概率与加权后的根源故障历史事件分析概率的 和。
[0030] 上述方案中,所述计算单元计算节点的根源故障计算概率包括:
[0031] 计算节点本身硬件故障导致的本节点的根源故障计算概率;
[0032] 依次计算本节点与相连的所有下级节点之间故障的对应的根源故障计算概率、本 节点与相连的所有平级节点之间故障的对应的根源故障计算概率、本节点与相连的所有上 级节点之间故障的对应的根源故障计算概率;
[0033] 计算节点本身硬件故障导致的本节点的根源故障计算概率与本节点与相连的所 有节点之间故障的对应的根源故障计算概率的和。
[0034] 上述方案中,所述计算单元计算节点本身硬件故障导致的本节点的根源故障计算 概率为:计算节点本身硬件故障值与对应权重的乘积;
[0035] 所述计算本节点与相连的所有下级节点之间故障的对应的根源故障计算概率包 括:计算与本节点相连的每个下级节点产生的故障告警数与每个下级节点告警数对应的权 重的乘积之和;
[0036] 所述计算本节点与相连的所有平级节点之间故障的对应的根源故障计算概率包 括:计算与本节点相连的每个平级节点产生的故障告警数与每个平级节点告警数对应的权 重的乘积之和;
[0037] 所述计算本节点与相连的所有上级节点之间故障的对应的根源故障计算概率包 括:计算与本节点相连的每个上级节点产生的故障告警数与每个上级节点告警数对应的权 重的乘积之和。
[0038] 本发明实施例所提供的网络故障根源诊断的方法和装置,根据网络的拓扑结构建 立网络设备之间的拓扑关系;检测网络设备故障,当检测到网络故障告警时,分别计算网络 拓扑中每个节点为根源故障节点的概率;确定根源故障节点概率最大的节点,输出分析结 果。如此,能够弥补现有的技术中故障根源分析引擎的不足,提高故障根源分析效率和准确 性;同时,能解决现有的网络拓扑与真实网络拓扑不一致的问题,使得用户能够快速高效的 进行网络故障根源分析。
【附图说明】
[0039] 图1为网络故障事件中的拓扑关联关系意图;
[0040] 图2为本发明实施例网络故障根源诊断方法流程示意图;
[
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1