网络故障根源的确定方法和分析设备的制作方法

文档序号:7709263阅读:153来源:国知局

专利名称::网络故障根源的确定方法和分析设备的制作方法
技术领域
:本发明涉及网络
技术领域
,尤其涉及一种网络故障根源的确定方法和分析设备。
背景技术
:随着网络规模和IT(InformationTechnology,信息技术)业务量的快速上升,网络设备上报给网管的告警数量也急巨上升,会呈现给网管大量的告警。因此有必要对告警进行精简和压缩,只呈现关键的、核心的告警,于是告警关联分析技术应运而生。通过告警关联分析,用户可以快速定位故障设备,缩短故障处理的周期,从而从根本上提高企业对网络的投资效益比,方便用户在网络上开展各项业务。网络拓朴结构决定了设备之间存在上下游连接关系,一个设备发生故障常会引起一片设备告警,如上游设备发生设备不可达告警时,必然导致只有唯一链路的所有下游设备也发生设备不可达告警。此时上游设备的不可达告警为根源告警,下游设备的不可达告警为上述告警的表象告警。这里的根源告警,是指引起其他告警的告警,为其他告警的根源。而表象告警,是指由于其他告警导致的告警,是根源告警的表象。定位解决了根源告警时,根源告警对应的表象告警也将同时被解决。以图l所示的组网场景为例,网管设备通过作为接入设备的设备l,访问作为核心设备的设备2、设备3、设备8,再访问子网中的设备4、设备5、设备6、设备7、设备9和设备10。这里的接入设备指连接网管设备与被管理网络的、离网管设备最近的路由器或交换机,没有接入设备时网管设备将无法访问被管理网络。接入设备也被网管设备管理。而核心设备,是指网络中各子网的网关设备,网络中的其他设备通过此核心设备访问子网中的各个设备。现有的区域告警关联分析方法中,将所有发生设备不可达告警的设备,根据拓朴链接关系汇聚成一个区域,识别出位于区域边缘的设备,即与没有发生设备不可达告警的设备存在连接的设备,将位于区域边缘的设备的设备不可达告警作为根源告警。在图l的网络中,如果设备8、设备9、设备10发生设备不可达告警,根据区域告警关联分析算法可以识别出设备8为位于区域边缘的设备,由此判断设备8对应的设备不可达告警为根源告警,设备9、设备10对应的设备不可达告警为设备8对应的设备不可达告警的表象告警。现有的区域告警关联分析方法中,对一个区域中有两个位于边缘的设备的情况不能识别出根源告警。仍以图l所示的网络场景为例,设备6连接到两个上游设备设备2和设备3,当设备2、设备3和设备6发生设备不可达告警时,无法判断设备2对应的设备不可达告警为根源告警、或设备3对应的设备不可达告警为根源告警。因此在网络中,位于备份链路中的一个设备连接到两个上游设备时,现有的区域告警关联分析方法无法进行根源告警的准确定位。
发明内容本发明提供一种网络故障根源的确定方法和分析设备,用于对网络中发生的告警进行准确定位。本发明提供了一种网络故障根源的确定方法,包括根据已经存储的根源告警记录,对接收到的待分析告警进行分析;所述待分析告警的分析结果为根源告警时,将所述待分析告警加入所述根源告警记录,并将所述根源告警记录中所述待分析告警的表象告警删除;所述待分析告警的分析结果为表象告警时,不将所述待分析告警加入所述根源告警记录;冲艮据所述根源告警记录确定网络故障根源。其中,所述对接收到的待分析告警进行分析包括每接收到一条待分析告警,即对所述接收到的待分析告警进行分析;或对接收到的待分析告警进行緩存,并定时触发对緩存的待分析告警的分析;所述对接收到的待分析告警进行分析后,将分析后的待分析告警从所述緩存中删除。其中,对接收到的待分析告警进行分析,包括根据所述待分析告警的对象标识OID,判断所述待分析告警的类型;所述待分析告警的类型为根源告警时,在所述已经存储的根源告警记录中,查找所述待分析告警的表象告警;所述待分析告警的类型为表象告警时,在所述已经存储的根源告警记录中,查找所述待分析告警的根源告警。其中,所述待分析告警的类型为根源告警时,在所述已经存储的根源告警记录中,查找所述待分析告警的表象告警,包括Al、将所述待分析告警加入根源告警记录;A2、获取所述根源告警记录中未分析的一条根源告警,判断所述根源告警是否为所述待分析告警的表象告警;不存在未分析的根源告警时则查找结束;如果不是则重复本步骤A2,否则进行步骤A3;A3、判断所述根源告警对应的设备是否为所述待分析告警对应的设备的下游设备;如果不是则进行步骤A2;如果是则进行步骤A4;A4、判断在网管设备和所述根源告警对应的设备之间是否存在不经过所述待分析告警对应的设备的物理链路;如果不存在则进行步骤A5,否则进行步骤A6;A5、判断所述根源告警为所述待分析告警的表象告警,在所述根源告警记录中删除所述根源告警,进行步骤A2;A6、判断所述物理链路中所述待分析告警对应的设备的每个上游设备是否都接收到所述待分析告警,如果不是则返回步骤A2;否则进行步骤A5。其中,所述待分析告警的类型为表象告警时,在所述已经存储的根源告警记录中,查找所述待分析告警的根源告警,包括Bl、获取所述根源告警记录中未分析的一条根源告警,判断所述根源告警是否为所述待分析告警的根源告警;不存在未分析的根源告警时则把所述待分析告警作为根源告警加入所述根源告警记录;如果不是则重复本步骤B1,否则进行步骤B2;B2、判断所述根源告警对应的设备是否为所述待分析告警对应的设备的上游设备;如果不是则进行步骤B1;如果是则进行步骤B3;B3、判断在网管设备和所述待分析告警对应的设备之间是否存在不经过所述根源告警对应的设备的物理链路;如果不存在则进行步骤B5,否则进行步骤B4;B4、判断所述物理链路中所述待分析告警对应的设备的每个上游设备是否都接收到所述待分析告警,如果不是则返回步骤B1;否则进行步骤B5。B5、判断所述待分析告警为所述根源告警的表象告警。其中,还包括建立物理链路连接关系集合,记录网络中每一设备的上游设备和下游设备,以及设备间的物理链路信息,根据所述物理链路连接关系集合判断所述根源告警对应的设备是否为所述待分析告警对应的设备的上游设备;所述根源告警对应的设备是否为所述待分析告警对应的设备的下游设备;在网管设备和所述待分析告警对应的设备之间是否存在不经过所述根源告警对应的设备的物理链路;在网管设备和所述根源告警对应的设备之间是否存在不经过所述待分析告警对应的设备的物理链路。其中,还包括设置关联分析标准,所述关联分析标准中包括根源告警的OID与表象告警的OID之间的关系;根据所述关联分析标准判断所述根源告警是否为所述待分析告警的根源告警或表象告警。本发明还提供一种网络故障根源的分析设备,包括告警接收单元,用于接收待分析告警;根源告警记录单元,用于保存根源告警记录;分析单元,用于根据所述根源告警记录单元中的根源告警记录,对所述告警接收单元接收到的待分析告警进行分析,并根据所述分析结果更新所述根源告警记录单元中的根源告警记录当所述待分析告警的分析结果为根源告警时,将所述待分析告警加入所述根源告警记录,并将所述根源告警记录中所述待分析告警的表象告警删除;所述待分析告警的分析结果为表象告警时,不将所述待分析告警加入所述根源告警记录;故障定位单元,用于在所述分析单元对所述根源告警记录单元中的根源告警记录进行更新后,根据所述根源告警记录确定网络故障根源。其中,所述告警接收单元具体用于每接收到一条待分析告警,即触发所述分析单元对所述接收到的待分析告警进行分析;或对接收到的待分析告警进行緩存,并定时触发所述分析单元对緩存的待分析告警的分析;当所述分析单元对待分析告警进行分析后,将分析后的待分析告警从所述緩存中删除。其中,所述分析单元包括类型判断子单元,用于根据所述待分析告警的对象标识OID,判断所述待分析告警的类型;根源告警分析子单元,用于当所述待分析告警的类型为根源告警时,将所述待分析告警加入所述根源告警记录,在所述根源告警记录单元中的根源告警记录中,查找所述待分析告警的表象告警;表象告警分析子单元,用于当所述待分析告警的类型为表象告警时,在所述根源告警记录单元中的根源告警记录中,查找所述待分析告警的根源告攀.更新子单元,用于将所述根源告警分析子单元在根源告警记录中查找到的所述待分析告警的表象告警,从所述根源告警记录单元的根源告警记录中删除。其中,所述根源告警分析子单元具体用于执行Al、将所述待分析告警加入根源告警记录;A2、获取所述根源告警记录中未分析的一条根源告警,判断所述根源告警是否为所述待分析告警的表象告警;不存在未分析的根源告警时则查找结束;如果不是则重复本步骤A2,否则进行步骤A3;A3、判断所述根源告警对应的设备是否为所述待分析告警对应的设备的下游设备;如果不是则进行步骤A2;如果是则进行步骤A4;A4、判断在网管设备和所述根源告警对应的设备之间是否存在不经过所述待分析告警对应的设备的物理链路;如果不存在则进行步骤A5,否则进行步骤A6;A5、判断所述根源告警为所述待分析告警的表象告警,在所述根源告警记录中删除所述根源告警,进行步骤A2;A6、判断所述物理链路中所述待分析告警对应的设备的每个上游设备是否都接收到所述待分析告警,如果不是则返回步骤A2;否则进行步骤A5。其中,所述表象告警分析子单元具体用于执行Bl、荻取所述根源告警记录中未分析的一条根源告警,判断所述根源告警是否为所述待分析告警的根源告警;不存在未分析的根源告警时则把所述待分析告警作为根源告警加入所述根源告警记录;如果不是则重复本步骤Bl,否则进行步骤B2;B2、判断所述根源告警对应的设备是否为所述待分析告警对应的设备的上游设备;如果不是则进行步骤B1;如果是则进行步骤B3;B3、判断在网管设备和所述待分析告警对应的设备之间是否存在不经过所述根源告警对应的设备的物理链路;如果不存在则进行步骤B5,否则进行步骤B4;B4、判断所述物理链路中所述待分析告警对应的设备的每个上游设备是否都接收到所述待分析告警,如果不是则返回步骤B1;否则进行步骤B5。B5、判断所述待分析告警为所述根源告警的表象告警。其中,还包括物理链路连接关系存储单元,用于建立物理链路连接关系集合,记录网络中每一设备的上游设备和下游设备,以及设备间的物理链路信息,将所述物理链路连接关系集合提供给所述分析单元用于判断所述根源告警对应的设备是否为所述待分析告警对应的设备的上游设备;所述根源告警对应的设备是否为所述待分析告警对应的设备的下游设备;在网管设备和所述待分析告警对应的设备之间是否存在不经过所述根源告警对应的设备的物理链路;在网管设备和所述根源告警对应的设备之间是否存在不经过所述待分析告警对应的设备的物理链路。其中,还包括关联分析标准存储单元,用于设置关联分析标准,所述关联分析标准中包括根源告警的OID与表象告警的OID之间的关系;将所述关联分析标准提供给所述分析单元用于判断所述根源告警是否为所述待分析告警的根源告警或表象告警。与现有技术相比,本发明具有以下优点通过使用本发明,网管设备可以准确的对接收到的告警进行分析,抑制了与网络故障无关的众多表象告警,将根源告警呈现给用户,方便用户快速定位网络故障,提高了告警系统的实用性。图1是现有技术中区域告警关联分析方法应用的一组网场景示意图2是本发明中提供的网络故障根源确定方法的流程图3是本发明应用场景中网络故障根源确定方法的流程图4A是本发明应用场景中当告警1是根源告警时,根据根源告警列表查找告警1对应的所有的表象告警的流程图4B是本发明应用场景中告警1是表象告警时,根据根源告警列表查找告警1对应的根源告警的流程图5是本发明中提供的分析设备的结构示意图6是本发明中提供的分析设备中分析单元的结构示意图。具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。如图2所示,本发明提供了一种网络故障根源的确定方法,包括步骤s201、根据已经存储的根源告警记录,对接收到的待分析告警进行分析;步骤s202、待分析告警的分析结果为根源告警时,将该待分析告警加入根源告警记录,并将根源告警记录中该待分析告警的表象告警删除;待分析告警的分析结果为表象告警时,不将该待分析告警加入根源告警记录;步骤s203、根据根源告警记录确定网络故障根源。并根据根源告警记录中记录的根源告警,可以对网络故障进行定位。以下结合具体的应用场景,对本发明中网络故障才艮源确定方法的实施方式进行详细说明。本发明的应用场景中,为了能够分析出根源告警和表象告警,必须先确定设备之间的拓朴连接上下游关系。其原因在于,以设备不可达告警为例,当轮询时,网管设备ping不通设备,则判断发生了设备不可达告警;当轮询时,网管ping设备成功则认为设备状态正常。对于设备不可达告警,只有基于网络中设备的上下游拓朴连接关系才能够正确分析出根源告警和表象告警。再例如其他的与拓朴相关的告警,如上游设备的接口报文丢包率过高告警、下游设备访问外网延迟告警,需要识别出上游设备和下游设备,进而才能确定上游设备的接口报文丢包率过高告警为根源告警,下游设备访问外网延迟告警为表象告警。本发明中,拓朴连接上下游关系的具体确定方法可以为根据获取到的网络中各设备的IP地址、MAC地址等参数,网管设备可以通过路由表反查等方法自动发现网络中的设备并计算出网络中设备的拓朴连接上下游关系,当自动计算得到的接入设备(例如图i所示组网环境中的设备1)不处于网管设备的所处的管理系统中时,管理员需要将接入设备加入由网管设备管理的系统。对于核心设备即对应网络中各子网的网关设备(例如图1所示组网环境中的设备2、设备3和设备8),由于网络的复杂程度不同可能无法通过计算直接得到,需要由用户在网管设备直接指定。上述拓朴连接上下游关系的具体确定方法只是一种可选方式,例如也可以采用管理员直接指定拓朴连接上下游关系的方式,本发明对此并不进行限定。上述流程结束后,网管设备对于网络中的每个设备,需要记录该设备的基于二层拓朴的、相对于核心设备和接入设备的所有物理链路连接关系集合,记为DevLinkMap。该DevLinkMap中记录有每一设备的上游i殳备、下游i殳备信息。当网络中的设备增加或删除,物理链路增加或删除时,都需要同时维护上述的物理链路连接关系集合DevLinkMap。该物理链路连接关系集合DevLinkMap的结构的一例如表1所示,表1.物理链路连接关系集合DevLinkMap的结构序号设备IDMAC上游设备ID下游设备ID1设备1MAC1设备S设备2;设备3;设备82设备2MAC2设备1设备4;设备5;设备63设备3MAC3设备l设备6;设备74设备4MAC4设备2—设备5MAC5设备2—6设备6MAC6设备2;设备3—7设备7MAC7设备3—8设备8MAC8设备l—9设备9MAC9设备8—10设备10MAC10设备8——通过该DevLinkMap,可以获知每一设备的上游设备、下游设备以及设备间的链路信息。例如,对于设备2,可以知道其上游设备为设备1,其下游设备为设备4、设备5和设备6。即设备2与设备1之间存在物理链路,设备2与设备4、设备5和设备6之间也分别存在物理链路。同时,通过该DevLinkMap,可以获知在设备1与设备6之间存在两条物理链路,即设备1-设备2-设备6,以及设备1-设备3-设备6。当网管设备检测到告警发生时,需要根据接收到的告警的OID(ObjectID,对象标识符),获取告警内容(不可达告警、CPU平均负荷超过门限告警等)、告警类型(根源告警和表象告警)以及该告警与已记录的根源告警的关系(已记录的根源告警是该告警的表象告警、或已记录的根源告警是该告警的根源告警)。以拓朴类告警为例,拓朴类告警包括的告警内容及其对应的OID包括以下几种1.3.6.1.4.1.2011.10.4.1.1.2.6.1(表示OID,以下相似),设备不可达告警(表示告警内容,以下相似);1.3.6.1.4.1.2011.10.2.35.1.6.15,CPU平均负荷超过门限告警;1.3.6.1.4.1.2011.10.9.1.2.6.8,CPU利用率超过阈值告警;1.3.6.1.4.1.2011.10.9.1.2.6.9,内存利用率超过阈^直告警对于上述四种告警,其告警类型既是根源告警也是表象告警。另外,为了对新接收到的告警与已记录的根源告警的关系进行分析,网管设备上需要存储若干关联分析规则,该规则的形式可以为(OIDl,OID2)、(OID3,OID4),....(OIDM,OIDN)。对于(OIDM,OIDN),表示OID为OIDM的告警为OID为OIDN的告警的表象告警,OID为OIDN的告警为OID为OIDM的告警的根源告警。当新接收到告警时,网管设备将新接收的告警的OID与已记录的根源告警的OID组合后,与已经存储的告警关联规则进行匹配,匹配成功时则可以认为记录的根源告警是该告警的表象告警、或已记录的根源告警是该告警的根源告警。例如,新接收到告警的OID为OIDl,已记录的一条根源告警的OID为OID2,由于关联分析规则中存在(OID1,OID2),因此可以认为OID为OID1的告警为OID为OID2的告警的表象告警,OID为OID2的告警为OID为OID1的告警的根源告警。上述关联分析规则只是一种可选形式,在具体的应用中可以在上述关联分析规则的基础上根据需要设置更加复杂的关联分析规则。另外,本发明中在网管设备上设置有用于存储根源告警的根源告警列表,记为RootTrapList,用于存储一定数量和一定时间窗内的根源告警。当RootTrapList中存储的根源告警的数量超过预设的数量阈值时,按照时间顺序丢弃时间最早的根源告警;另外,当RootTrapList中存储的根源告警的时间超过预先设置的时间窗时,丟弃该根源告警;最后,当网管设备确认某个根源告警对应的故障已经排除时,丢弃该根源告警。当网管设备初始化时,根源告警列表RootTrapList中的内容为空,此时若根据OID判断接收到的为表象告警,则由于根源告警列表RootTrapList中尚未有根源告警存在,也将接收到的表象告警作为根源告警存储在根源告警列表RootTrapList中。根源告警列表RootTrapList中记录有根源告警的ID、OID以及与该根源告警对应的设备的设备ID,该根源告警列表RootTrapList的结构的一例如表2所示,表2.根源告警列表RootTrapList的结构<table>tableseeoriginaldocumentpage18</column></row><table>本发明中,以网络故障根源的确定方法应用于网管设备为例,网管设备将接收到的每一条告警緩存在一个队列中,该队列为待进行分析的告警緩存队列。网管设备可以实时对告警緩存队列进行检测,在告警緩存队列中每接收到一条告警时,就对接收到的告警进行分析,并将已经分析过的告警从告警緩存队列中删除。为了提高处理效率,网管设备也可以定时对告警缓存队列进行检测,一次性对告警緩存队列中的所有告警进行分析,分析时的顺序可以根据各告警的接收时间、告警类型等,并将已经分析的告警从告警緩存队列中删除。假设告警緩存队列中的第一条告警待分析告警为告警1,来自设备l,则网管设备对告警缓存队列中的告警进行分析的流程如图3所示,包括以下步骤步骤s301、获取待分析的告警,假设该告警为告警l。步骤s302、根据告警1的OID判断告警1是表象告警还是根源告警,是根源告警时进行步骤s303,是表象告警时进行步骤s304。步骤s303、告警1是根源告警时,将告警1加入根源告警列表RootTrapList,同时根据根源告警列表RootTrapList,查找告警1对应的所有的表象告警,并将在根源告警列表中查找到的根源告警从根源告警列表RootTrapList中删除,转步骤s305。步骤s304、告警l是表象告警时,获取根源告警列表RootTrapList,查找告警1对应的根源告警,查找结束后转步骤s305。需要说明的是,若根据告警1的OID判断告警1既为表象告警,又为根源告警(即该告警既可以为其上游设备的表象告警,也可以为其下游设备的根源告警),则可以先进行步骤s303处理告警1对应的表象告警;然后进行步骤s304处理告警1对应的根源告警。当然,也可以先进行步骤s304处理告警1对应的根源告警;然后进行步骤s303处理告警1对应的表象告警。本发明对根源告警与表象告警的分析顺序并不进行限定。步骤s305,判断是否所有待分析的告警都已经分析完成,是则进行流程结束,否则进行步骤s301。以下对步骤s303中涉及的"告警1是根源告警时,根据根源告警列表RootTrapList,查找告警1对应的所有的表象告警,并将在根源告警列表中查找到的根源告警从根源告警列表RootTrapList中删除,,的处理流程进行详细描述。如图4A所示,包括以下步骤步骤s3031、获取根源告警列表RootTrapList。步骤s3032、判断根源告警列表RootTrapList中是否存在未分析的根源告警记录,是则进行步骤s3033,否则流程结束。步骤s3033、获取RootTrapList中未分析的根源告警记录如告警2的OID,根据关联分析规则,判断告警2是否为告警1的表象告警;如果不是则返回步骤s3032,如果是则进行步骤s3034。步骤s3034、判断告警2对应的设备2是否为设备1的下游设备;如果不是下游设备,则说明告警2不是告警1的表象告警,返回步骤s3032。如果是下游设备,则转步骤s3035。该步骤中,可以根据物理链路连接关系集合DevLinkMap中的记录,对设备2是否为设备1的下游设备进行判断。步骤s3035、根据物理链路连接关系集合DevLinkMap,判断在网管设备和告警2对应的设备2之间是否存在不经过设备1的物理链路;如果不存在,则说明告警2为告警1的表象告警,进行步骤s3036;如果存在,进行步骤s3037。步骤s3036、告警2为告警1的表象告警,在RootTrapList中删除告警2,同时网管设备在本地的告警记录数据库中记录告警2的根源告警为告警1。返回步骤s3032。步骤s3037、判断该物理链路中设备1的每个上游设备是否都接收到告警1,如果存在设备1的某一上游设备没有接收到告警1,则说明告警2不是告警1的表象告警,返回步骤s3032。如果设备1的所有上游设备都接收到了告警l,则说明告警2为告警1的表象告警,进行步骤s3036。执行上述步骤s3031s3037后,若对才艮源告警列表RootTrapList中的所有根源告警记录都进行了分析后,仍没有查找到告警1的表象告警,则说明在RootTrapList中不存在告警1的表象告警。以下对步骤s304中涉及的"告警1是表象告警时,根据根源告警列表RootTrapList,查找告警1对应的根源告警"的处理流程进行详细描述。如图4B所示,包括以下步骤步骤s3041、获取根源告警列表RootTrapList。步骤s3042、判断根源告警列表RootTrapList中是否存在未分析的根源告警记录,是则进行步骤s3043,否则进行步骤s3048。步骤s3043、根据RootTrapList中未分析的根源告警记录如告警2的OID,,根据关联分析规则,判断告警2是否为告警1的根源告警;如果不是则返回步骤s3042。如果是则进行步骤s3044。步骤s3044、判断告警2对应的设备2是否为设备1的上游设备,如果不是上游设备,则返回步骤s3042。如果是上游设备,则进行步骤s3045。该步骤中,可以根据物理链路连接关系集合DevLinkMap中的记录,对设备2是否为设备1的上游设备进行判断。步骤s3045、根据物理链路连接关系集合DevLinkMap,判断在网管设备和设备1之间是否存在不经过告警2对应的设备2的物理链路。如果不存在,则说明告警2为告警1的根源告警,进行步骤s3047;如果存在备份链路,进行步骤s3046。步骤s3046、判断该物理链路中设备1的每个上游设备是否都接收到告警1,如果存在设备1的某一上游设备没有接收到告警1,则说明告警2不为告警l的根源告警,返回步骤s3042。如果是,则说明告警2为告警1的根源告警,进行步骤s3047。步骤s3047,在网管设备本地的告警记录数据库记录中记录告警2为告警1的根源告警,对告警1的分析流程结束。步骤s3048、对根源告警列表RootTrapList中的所有根源告警记录都进行了分析后,仍没有查找到告警1的根源告警,因此将告警1作为根源告警加入RootTrapList。以下结合图1所示的网络结构,描述不同的应用场景下本发明提供的网络故障根源确定方法的具体实施方式。(场景1)网管设备在时刻Tl对设备4的关于设备不可达的告警1进行分析。对于设备不可达告警,其根源告警与表象告警的OID相同。因此根据OID可以判断告警1既为表象告警,又为根源告警。根据图3所示的流程及其描述,可以先进行步骤s303,处理告警1对应的表象告警,然后进行步骤s304,处理告警1对应的根源告警。由于此时根源告警列表RootTrapList中没有任何告警记录存在,因此不存在告警1的表象告警。则对告警1进行分析后,将告警1作为根源告警加入根源告警列表RootTrapList中。(场景2)网管设备在时刻T2对设备2的关于设备不可达的告警2进行分析。对于设备不可达告警,其根源告警与表象告警的OID相同。因此根据OID可以判断告警2既为表象告警,又为根源告警。此时根源告警列表RootTrapList中只存在告警1,告警1对应的设备为设备4。根据图1所示的网络结构,设备4为设备2的下游设备。根据图3和图4A所示的流程及其描述,首先判断告警1为告警2的表象告警(步骤s3033),进而判断告警1对应的设备4为告警2对应的设备2的下游设l步骤s3034),进而判断网关设备与设备4之间不存在不经过设备2的物理链路(步骤s3035),因此判断告警1为告警2的表象告警,从根源告警列表RootTrapList删除告警1(步骤s3036)。此时根源告警列表RootTrapList中只存在告警2。(场景3)网管设备在时刻T3对设备6的关于设备不可达的告警3进行分析。对于设备不可达告警,其根源告警与表象告警的OID相同。因此根据OID可以判断告警2既为表象告警,又为根源告警。此时根源告警列表RootTrapList中只存在告警2,告警2对应的设备为设备2。根据图1所示的网络结构,设备6为设备2的下游设备,设备6与网管设备之间存在两条物理链路,分别为链路l:设备6-设备2-设备l-网管设备,以及链路2:设备6-设备3-设备l-网管设备,链路2不经过设备2。根据图3和图4B所示的流程及其描述,首先判断告警2为告警3的根源告警(步骤s3043),进而判断告警2对应的设备2为告警3对应的设备6的上游设备(步骤s3044),进而判断在网管设备与设备6之间存在不经过设备2的物理链路(步骤s3045),进而判断链路中的设备3未接收到告警3(步骤s3047),进而判断告警3不为告警2的表象告警(步骤s3046)。因此,将告警3作为根源告警加入到根源告警列表RootTrapList中。此时根源告警列表RootTrapList存在告警2和告警3,告警2对应的设备为设备2,告警3对应的设备为设备6。(场景4)网管设备在时刻T4对设备3的关于设备不可达的告警4进行分析。对于设备不可达告警,其根源告警与表象告警的OID相同。因此根据OID可以判断告警2既为表象告警,又为根源告警。此时根源告警列表RootTrapList存在告警2和告警3,告警2对应的设备为设备2,告警3对应的设备为设备6。根据图1所示的网络结构,设备6为设备3和设备2的下游设备。根据图3和图4A所示的流程及其描述,首先判断告警3为告警4的表象告警(步骤s3033),进而判断告警3对应的设备6为告警4对应的设备3的下游设备(步骤s3034),进而判断网关设备与设备6之间存在不经过设备3的物理链路(步骤s3035),进而判断该设备3的所有上游设备都接收到告警4(步骤s3037),因此判断告警3为告警4的表象告警,从根源告警列表RootTrapList删除告警3(步骤s3036)。此时根源告警列表RootTrapList存在告警2和告警4,告警2对应的设备为设备2,告警4对应的设备为设备3。(场景5)网管设备在时刻T5对设备1的关于设备不可达的告警5进行分析。对于设备不可达告警,其根源告警与表象告警的OID相同。因此根据OID可以判断告警5既为表象告警,又为根源告警。此时根源告警列表RootTrapList存在告警2和告警4,告警2对应的设备为设备2,告警4对应的设备为设备根据图1所示的网络结构,设备1为设备2和设备3的上游设备。根据图3和图4A所示的流程及其描述,对于告警2,首先判断告警2为告警5的表象告警(步骤s30333),进而判断告警2对应的设备2为告警5对应的设备1的下游设备(步骤s3034),进而判断网关设备与设备2之间不存在不经过设备1的物理链路(步骤s3035),因此判断告警2为告警5的表象告警,从根源告警列表RootTrapList删除告警2(步骤s3036)。此时根源告警列表RootTrapList中存在告警4和告警5。对于告警4,首先判断告警4为告警5的表象告警(步骤s3033),进而判断告警4对应的设备3为告警5对应的设备1的下游设备(步骤s3034),进而判断网关设备与设备3之间不存在不经过设备1的物理链路(步骤s3035),因此判断告警4为告警5的表象告警,从根源告警列表RootTrapList删除告警4(步骤s3036)。此时根源告警列表RootTrapList中只存在告警5。通过上述应用场景可以发现,使用本发明提供的方法,网管设备可以准确的对接收到的告警进行分析,判断其为根源告警或是其他已经存在的根源告警的表象告警,抑制了与网络故障无关的众多表象告警,将根源告警呈现给用户,方便用户快速定位网络故障,提高了告警系统的实用性。本发明还提供一种网络故障根源的分析设备,该分析设备可以为网络中的网管设备,该设备的结构如图5所示,包括告警接收单元10,用于接收待分析的告警,并将待分析的告警发送给分析单元30。具体的,可以每接收到一条待分析告警,即触发所述分析单元30对接收到的待分析告警进行分析;或者对接收到的待分析告警进行緩存,并定时触发分析单元30对缓存的待分析告警的分析;当分析单元30对待分析告警进行分析后,将分析后的待分析告警从緩存中删除。根源告警记录单元20,用于保存根源告警记录。分析单元30,用于根据根源告警记录单元20中的根源告警记录,对接收到的待分析告警进行分析,并根据分析结果更新根源告警记录单元20中的根源告警记录当待分析告警的分析结果为根源告警时,将待分析告警加入根源告警记录,并将根源告警记录单元20保存的根源告警记录中待分析告警的表象告警删除;待分析告警的分析结果为表象告警时,不将待分析告警加入所述根源告警记录。故障定位单元40,用于在分析单元30对4艮源告警记录单元20中的根源告警记录进行更新后,根据根源告警记录确定网络故障根源。该分析设备还包括物理链路连接关系存储单元50,用于建立物理链路连接关系集合,记录网络中每一设备的上游设备和下游设备,以及设备间的物理链路信息,将物理链路连接关系集合提供给分析单元30用于判断根源告警对应的设备是否为待分析告警对应的设备的上游设备;根源告警对应的设备是否为待分析告警对应的设备的下游设备;在网管设备和待分析告警对应的设备之间是否存在不经过根源告警对应的设备的物理链路;在网管设备和根源告警对应的设备之间是否存在不经过待分析告警对应的设备的物理链路。关联分析标准存储单元60,用于设置关联分析标准,关联分析标准中包括根源告警的OID与表象告警的OID之间的关系;将关联分析标准提供给分析单元30用于判断根源告警是否为待分析告警的根源告警或表象告警。本发明提供的分析设备中,如图6所示,该分析单元30具体包括类型判断子单元31、根源告警分析子单元32、表象告警分析子单元33和更新子单元34。其中类型判断子单元31,用于根据告警接收单元IO接收的待分析告警的对象标识OID,判断待分析告警的类型;根源告警分析子单元32,用于当待分析告警的类型为根源告警时,将该待分析告警加入根源告警记录单元20中的根源告警记录,并在根源告警记录中查找待分析告警的表象告警;具体用于执行Al、将待分析告警加入根源告警记录;A2、获取根源告警记录中未分析的一条根源告警,判断根源告警是否为待分析告警的表象告警,该判断可以4艮据关联分析标准存储单元60中设置的关联分析标准进行;不存在未分析的根源告警时则查找结束;如果不是则重复本步骤A2,否则进行步骤A3;A3、判断根源告警对应的设备是否为待分析告警对应的设备的下游设备,该判断可以根据物理链路连接关系存储单元50中存储的物理链路连接关系集合进行;如果不是则进行步骤A2;如果是则进行步骤A4;A4、判断在网管设备和根源告警对应的设备之间是否存在不经过待分析告警对应的设备的物理链路,该判断可以根据物理链路连接关系存储单元50中存储的物理链路连接关系集合进行;如果不存在则进行步骤A5,否则进行步骤A6;A5、判断根源告警为待分析告警的表象告警,在根源告警记录中删除根源告警,进行步骤A2;A6、判断物理链路中待分析告警对应的设备的每个上游设备是否都接收到待分析告警,如果不是则返回步骤A2;否则进行步骤A5。表象告警分析子单元33,用于当待分析告警的类型为表象告警时,在根源告警记录单元20中的根源告警记录中,查找待分析告警的根源告警。具体用于执行Bl、获取根源告警记录中未分析的一条根源告警,判断根源告警是否为待分析告警的根源告警,该判断可以根据关联分析标准存储单元60中设置的关联分析标准进行;不存在未分析的根源告警时则把待分析告警作为根源告警加入根源告警记录;如果不是则重复本步骤Bl,否则进行步骤B2;B2、判断根源告警对应的设备是否为待分析告警对应的设备的上游设备,该判断可以根据物理链路连接关系存储单元50中存储的物理链路连接关系集合进行;如果不是则进行步骤B1;如果是则进行步骤B3;B3、判断在网管设备和待分析告警对应的设备之间是否存在不经过根源告警对应的设备的物理链路,该判断可以根据物理链路连接关系存储单元50中存储的物理链路连接关系集合进行;如果不存在则进行步骤B5,否则进行步骤B4;B4、判断物理链路中待分析告警对应的设备的每个上游设备是否都接收到待分析告警,如果不是则返回步骤B1;否则进行步骤B5。B5、判断待分析告警为根源告警的表象告警。更新子单元34,用于将根源告警分析子单元32在根源告警记录中查找到的待分析告警的表象告警,从根源告警记录单元20保存的根源告警记录中删除。通过上述应用场景可以发现,使用本发明提供的设备,可以准确的对接收到的告警进行分析,判断其为根源告警或是其他已经存在的根源告警的表象告警,抑制了与网络故障无关的众多表象告警,将根源告警呈现给用户,方便用户快速定位网络故障,提高了告警系统的实用性。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括如果干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的单元或流程并不一定是实施本发明所必须的。本领域技术人员可以理解实施例中的装置中的单元可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的单元可以合并为一个单元,也可以进一步拆分成多个子单元。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。权利要求1、一种网络故障根源的确定方法,其特征在于,包括根据已经存储的根源告警记录,对接收到的待分析告警进行分析;所述待分析告警的分析结果为根源告警时,将所述待分析告警加入所述根源告警记录,并将所述根源告警记录中所述待分析告警的表象告警删除;所述待分析告警的分析结果为表象告警时,不将所述待分析告警加入所述根源告警记录;根据所述根源告警记录确定网络故障根源。2、如权利要求l所述的方法,其特征在于,所述对接收到的待分析告警进行分析包括每接收到一条待分析告警,即对所述接收到的待分析告警进行分析;或对接收到的待分析告警进行緩存,并定时触发对緩存的待分析告警的分析;所述对接收到的待分析告警进行分析后,将分析后的待分析告警从所述緩存中删除。3、如权利要求1或2所述的方法,其特征在于,对接收到的待分析告警进行分析,包括根据所述待分析告警的对象标识OID,判断所述待分析告警的类型;所述待分析告警的类型为根源告警时,在所述已经存储的根源告警记录中,查找所述待分析告警的表象告警;所述待分析告警的类型为表象告警时,在所述已经存储的根源告警记录中,查找所述待分析告警的根源告警。4、如权利要求3所述的方法,其特征在于,所述待分析告警的类型为根源告警时,在所述已经存储的根源告警记录中,查找所述待分析告警的表象告警,包括Al、将所述待分析告警加入根源告警记录;A2、获取所述根源告警记录中未分析的一条根源告警,判断所述根源告警是否为所述待分析告警的表象告警;不存在未分析的根源告警时则查找结束;如果不是则重复本步骤A2,否则进行步骤A3;A3、判断所述根源告警对应的设备是否为所述待分析告警对应的设备的下游设备;如果不是则进行步骤A2;如果是则进行步骤A4;A4、判断在网管设备和所述根源告警对应的设备之间是否存在不经过所述待分析告警对应的设备的物理链路;如果不存在则进行步骤A5,否则进行步骤A6;A5、判断所述根源告警为所述待分析告警的表象告警,在所述根源告警记录中删除所述根源告警,进行步骤A2;A6、判断所述物理链路中所述待分析告警对应的设备的每个上游设备是否都接收到所述待分析告警,如果不是则返回步骤A2;否则进行步骤A5。5、如权利要求3所述的方法,其特征在于,所述待分析告警的类型为表象告警时,在所述已经存储的根源告警记录中,查找所述待分析告警的根源告警,包括Bl、获取所述根源告警记录中未分析的一条根源告警,判断所述根源告警是否为所述待分析告警的根源告警;不存在未分析的根源告警时则把所述待分析告警作为根源告警加入所述根源告警记录;如果不是则重复本步骤Bl,否则进行步骤B2;B2、判断所述根源告警对应的设备是否为所述待分析告警对应的设备的上游设备;如果不是则进行步骤B1;如果是则进行步骤B3;B3、判断在网管设备和所述待分析告警对应的设备之间是否存在不经过所述根源告警对应的设备的物理链路;如果不存在则进行步骤B5,否则进行步骤B4;B4、判断所述物理链路中所述待分析告警对应的设备的每个上游设备是否都接收到所述待分析告警,如果不是则返回步骤B1;否则进行步骤B5。B5、判断所述待分析告警为所述根源告警的表象告警。6、如权利要求4或5所述的方法,其特征在于,还包括建立物理链路连接关系集合,记录网络中每一设备的上游设备和下游设备,以及设备间的物理链路信息,根据所述物理链路连接关系集合判断所述根源告警对应的设备是否为所述待分析告警对应的设备的上游设备;所述根源告警对应的设备是否为所述待分析告警对应的设备的下游设备;在网管设备和所述待分析告警对应的设备之间是否存在不经过所述根源告警对应的设备的物理链路;在网管设备和所述根源告警对应的设备之间是否存在不经过所述待分析告警对应的设备的物理链路。7、如权利要求4或5所述的方法,其特征在于,还包括设置关联分析标准,所述关联分析标准中包括根源告警的OID与表象告警的OID之间的关系;根据所述关联分析标准判断所述根源告警是否为所述待分析告警的根源告警或表象告警。8、一种网络故障根源的分析设备,其特征在于,包括告警接收单元,用于接收待分析告警;根源告警记录单元,用于保存根源告警记录;分析单元,用于根据所述根源告警记录单元中的根源告警记录,对所述告警接收单元接收到的待分析告警进行分析,并根据所述分析结果更新所述根源告警记录单元中的根源告警记录当所述待分析告警的分析结果为根源告警时,将所述待分析告警加入所述根源告警记录,并将所述根源告警记录中所述待分析告警的表象告警删除;所述待分析告警的分析结果为表象告警时,不将所述待分析告警加入所述根源告警记录;故障定位单元,用于在所述分析单元对所述根源告警记录单元中的根源告警记录进行更新后,根据所述根源告警记录确定网络故障根源。9、如权利要求8所述的设备,其特征在于,所述告警接收单元具体用于每接收到一条待分析告警,即触发所述分析单元对所述接收到的待分析告警进行分析;或对接收到的待分析告警进行緩存,并定时触发所述分析单元对緩存的待分析告警的分析;当所述分析单元对待分析告警进行分析后,将分析后的待分析告警从所述緩存中删除。10、如权利要求8或9所述的设备,其特征在于,所述分析单元包括类型判断子单元,用于根据所述待分析告警的对象标识OID,判断所述待分析告警的类型;根源告警分析子单元,用于当所述待分析告警的类型为根源告警时,将所述待分析告警加入所述根源告警记录,在所述根源告警记录单元中的根源告警记录中,查找所述待分析告警的表象告警;表象告警分析子单元,用于当所述待分析告警的类型为表象告警时,在所述根源告警记录单元中的根源告警记录中,查找所述待分析告警的根源告更新子单元,用于将所述根源告警分析子单元在根源告警记录中查找到的所述待分析告警的表象告警,从所述根源告警记录单元的根源告警记录中删除。11、如权利要求io所述的设备,其特征在于,所述根源告警分析子单元具体用于执行Al、将所述待分析告警加入根源告警记录;A2、获取所述4艮源告警记录中未分析的一条根源告警,判断所述根源告警是否为所述待分析告警的表象告警;不存在未分析的根源告警时则查找结束;如果不是则重复本步骤A2,否则进行步骤A3;A3、判断所述根源告警对应的设备是否为所述待分析告警对应的设备的下游设备;如果不是则进行步骤A2;如果是则进行步骤A4;A4、判断在网管设备和所述根源告警对应的设备之间是否存在不经过所述待分析告警对应的设备的物理链路;如果不存在则进行步骤A5,否则进行步骤A6;A5、判断所迷根源告警为所述待分析告警的表象告警,在所述根源告警记录中删除所述根源告警,进行步骤A2;A6、判断所述物理链路中所述待分析告警对应的设备的每个上游设备是否都接收到所述待分析告警,如果不是则返回步骤A2;否则进行步骤A5。12、如权利要求10所述的设备,其特征在于,所述表象告警分析子单元具体用于执行Bl、获取所述根源告警记录中未分析的一条根源告警,判断所述根源告警是否为所述待分析告警的根源告警;不存在未分析的根源告警时则把所述待分析告警作为根源告警加入所述根源告警记录;如果不是则重复本步骤Bi,否则进行步骤B2;B2、判断所述根源告警对应的设备是否为所述待分析告警对应的设备的上游设备;如果不是则进行步骤B1;如果是则进行步骤B3;B3、判断在网管设备和所述待分析告警对应的设备之间是否存在不经过所述根源告警对应的设备的物理链路;如果不存在则进行步骤B5,否则进行步骤B4;B4、判断所述物理链路中所述待分析告警对应的设备的每个上游设备是否都接收到所述待分析告警,如果不是则返回步骤B1;否则进行步骤B5。B5、判断所述待分析告警为所述根源告警的表象告警。13、如权利要求11或12所述的设备,其特征在于,还包括物理链路连接关系存储单元,用于建立物理链路连接关系集合,记录网络中每一设备的上游设备和下游设备,以及设备间的物理链路信息,将所述物理链路连接关系集合提供给所述分析单元用于判断所述根源告警对应的设备是否为所述待分析告警对应的设备的上游设备;所述根源告警对应的设备是否为所述待分析告警对应的设备的下游设备;在网管设备和所述待分析告警对应的设备之间是否存在不经过所述根源告警对应的设备的物理链路;在网管设备和所述根源告警对应的设备之间是否存在不经过所述待分析告警对应的设备的物理链路。14、如权利要求11或12所述的设备,其特征在于,还包括关联分析标准存储单元,用于设置关联分析标准,所述关联分析标准中包括根源告警的OID与表象告警的OID之间的关系;将所述关联分析标准提供给所述分析单元用于判断所述根源告警是否为所述待分析告警的根源告警或表象告警。全文摘要本发明公开了一种网络故障根源的确定方法和分析设备。该确定方法包括根据已经存储的根源告警记录,对接收到的待分析告警进行分析;所述待分析告警的分析结果为根源告警时,将所述待分析告警加入所述根源告警记录,并将所述根源告警记录中所述待分析告警的表象告警删除;所述待分析告警的分析结果为表象告警时,不将所述待分析告警加入所述根源告警记录;根据所述根源告警记录确定网络故障根源。通过使用本发明,网管设备可以准确的对接收到的告警进行分析,抑制了与网络故障无关的众多表象告警,将根源告警呈现给用户,方便用户快速定位网络故障,提高了告警系统的实用性。文档编号H04L12/24GK101577648SQ200910148650公开日2009年11月11日申请日期2009年6月26日优先权日2009年6月26日发明者张学明申请人:杭州华三通信技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1