故障链路定位方法、告警根因分析方法及设备、系统的制作方法

文档序号:7718759阅读:166来源:国知局
专利名称:故障链路定位方法、告警根因分析方法及设备、系统的制作方法
技术领域
本发明涉及计算机网络技术领域,尤其涉及故障链路定位方法、告警根因分析方
法及设备、系统。
背景技术
在计算机网络中,告警根因分析通常被划分为设备级告警根因分析和网络级告警 根因分析。其中,设备级告警根因分析关注的是单个设备产生的告警之间的关系;而网络级 告警根因分析关注的是多个设备产生的告警之间的关系。设备级告警根因分析目前已经有 成熟的实现,而网络级告警根因分析因为网管系统缺少网络端到端的路径信息而只能做很 有限的分析。 现有的一种告警根因分析方案是基于业务对象模型来实现的,通过分析业务对象 模型可以得出对象之间的依赖关系。当一个对象发生故障时,会产生告警,并且对发生故障 的对象有依赖关系的其他对象也会因为受到影响而产生告警;前者即为根因告警,后者为 衍生告警。这样,根据对象与对象之间的依赖关系,当对象之间产生告警时,可以得到告警 与告警之间的关系,进而根据这些关系可以整理出告警相关性规则,当告警产生时可以按 照告警相关性规则进行告警根因分析。 图1为现有的一种基于业务对象模型的网络片段示意图。如图1所示,该网络片 段由设备A、设备B和设备C三个设备组成,其中,设备A、设备B和设备C分别作为网络 片段中的一个节点(比如路由器等)。设备A和设备C上分别建立了业务对象模型,包括 卡(Card)、物理端口 (Physical Port)、接口 (Interface)、隧道(Tunnel)、虚拟专用网络 (Virtual Private Network, VPN)、边界网关协议对端(Border Gateway Protocol Peer, BGP Peer)等对象。其中,业务对象模型中的对象是从上到下逐层依赖的。这样,当设备A 上承载的对象,例如物理端口 (Physical Port)发生故障时,设备A会产生告警,同时设备 A上承载的Interface/Tunnel/VPN/BGP Peer也会因为受到了影响而产生告警;与此同时, 还会导致设备C上的BGP Peer产生告警,根据业务对象模型中对象之间的关系可以进行告 警之间的根因分析。 换一个角度来看,如果设备B发生故障,设备B会产生告警;同时,由于设备B发生 故障将会导致设备A和设备C之间的路径不通,此时,设备A和设备C上承载的对象将随之 发生故障,并产生告警。直观来看,B设备产生的告警应该为根因告警,而设备A和设备C上 承载的对象产生的告警应该为衍生告警。但是,进行这种网络级告警根因分析的前提是网 管系统必须获悉设备A与设备C之间的路径信息。 —种可行的方案是,网管系统实时采集网络路由信息,并缓存最近一段时间内 (通常为几分钟)的路由信息,以便设备发生故障时进行告警根因分析。但是,这种方案要 求要求网管系统实时采集网络中所有设备中的路由信息,对网管系统的资源耗费比较大, 而且实时性很难得到保证;当路由信息量比较庞大时,必然耗费网络大量的带宽资源和设 备资源,从而影响网络性能,最终无法全面实现网络级告警根因分析。

发明内容
本发明实施例提供一种故障链路定位方法、告警根因分析方法及设备、系统,以实 现网络级告警根因分析。 为实现解决所述技术问题,本发明实施例提供如下技术方案
本发明实施例提供了一种故障链路定位方法,包括
获取告警产生时间; 将所述告警产生时间对应的故障前链路状态数据库和故障后链路状态数据库进 行比较,确定故障链路; 从全网路径向量矩阵中,确定所述故障链路对应的受损边缘设备及该受损边缘设 备的设备接口; 将所述故障链路的标识、所述受损边缘设备的标识及该受损边缘设备的设备接口 标识发送至告警根因分析设备。 本发明实施例提供了一种告警根因分析方法,包括 获取被管网络的至少一个告警; 向故障链路定位设备发送告警产生时间; 接收所述故障链路定位设备发送的故障链路的标识、受损边缘设备的标识及该受 损边缘设备的设备接口标识; 所述故障链路的标识、受损边缘设备的标识及该受损边缘设备的设备接口标识是 由所述故障链路定位设备根据所述告警产生时间定位出来的; 查询所述至少一个告警中是否存在来自于所述故障链路的告警,若存在,则将来 自于所述故障链路的告警标记根因告警; 查询所述至少一个告警中是否存在来自于所述受损边缘设备的告警,若存在,则 判断来自于所述受损边缘设备的告警所对应的业务对象是否承载于该受损边缘设备的设 备接口 ,若是,则将来自于所述受损边缘设备的告警标记为衍生告警。
本发明实施例还提供了一种故障链路定位设备,包括
接收模块,用于接收告警根因分析设备发送的告警产生时间; 比较模块,用于将所述告警产生时间对应的故障前链路状态数据库和故障后链路 状态数据库进行比较,确定故障链路; 确定模块,用于从全网路径向量矩阵中,确定所述故障链路对应的受损边缘设备 及该受损边缘设备的设备接口; 发送模块,用于将所述故障链路的标识、所述受损边缘设备的标识及该受损边缘
设备的设备接口标识发送至所述告警根因分析设备。 本发明实施例还提供了一种告警根因分析设备,包括 第二接收模块,用于获取被管网络的至少一个告警; 第二发送模块,用于向故障链路定位设备发送告警产生时间; 第三接收模块,用于接收所述故障链路定位设备发送的故障链路的标识、受损边 缘设备的标识及该受损边缘设备的设备接口标识;所述故障链路的标识、所述受损边缘设 备的标识及该受损边缘设备的设备接口标识是由所述故障链路定位设备根据所述告警产生时间定位出来的; 查询模块,用于查询所述至少一个告警中是否存在来自于所述故障链路的告警;以及,是否存在来自于所述受损边缘设备的告警; 标记模块,用于在所述查询模块查询到所述至少一个告警中存在来自于所述故障链路的告警时,将来自于所述故障链路的告警标记根因告警; 判断模块,用于在所述查询模块查询到所述至少一个告警中存在来自于所述受损边缘设备的告警时,判断来自于所述受损边缘设备的告警所对应的业务对象是否承载于该受损边缘设备的设备接口; 所述标记模块,还用于在所述查询模块查询到所述至少一个告警中存在来自于所述受损边缘设备的告警,且所述判断模块的判断结果为是时,将来自于所述受损边缘设备的告警标记为衍生告警。 本发明实施例还提供了一种告警根因分析系统,包括
故障链路定位设备和告警根因分析设备; 所述故障链路定位设备,用于接收所述告警根因分析设备发送的告警产生时间;将所述告警产生时间对应的故障前链路状态数据库和故障后链路状态数据库进行比较,确定故障链路;从全网路径向量矩阵中,确定所述故障链路对应的受损边缘设备及该受损边缘设备的设备接口 ;将所述故障链路的标识、所述受损边缘设备的标识及该受损边缘设备的设备接口标识发送至所述告警根因分析设备; 所述告警根因分析设备,用于获取被管网络的至少一个告警;向所述故障链路定位设备发送告警产生时间;接收所述故障链路定位设备发送的故障链路的标识、受损边缘设备的标识及该受损边缘设备的设备接口标识;所述故障链路的标识、受损边缘设备的标识及该受损边缘设备的设备接口标识是由所述故障链路定位设备根据所述告警产生时间定位出来的;查询所述至少一个告警中是否存在来自于所述故障链路的告警,若存在,则将来自于所述故障链路的告警标记根因告警;查询所述至少一个告警中是否存在来自于所述受损边缘设备的告警,若存在,则判断来自于所述受损边缘设备的告警所对应的业务对象是否承载于该受损边缘设备的设备接口 ,若是,则将来自于所述受损边缘设备的告警标记为衍生告警。 从以上技术方案可以看出,本发明实施例具有以下优点 在本发明实施例中,通过比较故障前链路状态数据库和故障后链路状态数据库可以确定故障链路,继而可以从全网路径向量矩阵中确定受损边缘设备及该受损边缘设备的设备接口 ;在查询到至少一个告警中存在来自于故障链路的告警时,标记该告警为根因告警;在查询到至少一个告警中存在来自于受损边缘设备的告警,且该告警所对应的业务对象承载于该受损边缘设备的设备接口时,标记该告警为衍生告警。本发明实施例可以实现网络级告警根因分析,并且避免采集网络中所有设备中的路由信息,降低网络资源耗费。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付 创造性劳动的前提下,还可以根据这些附图获得其他的附图。 图1为现有的一种基于业务对象模型的网络片段示意图; 图2为本发明实施例中提供的一种故障链路定位方法的流程图 图3为本发明实施例中提供的一种告警根因分析方法的流程图 图4为本发明实施例中提供的一种故障链路定位设备的结构图 图5为本发明实施例中提供的一种告警根因分析设备的结构图 图6为本发明实施例中提供的一种告警根因分析系统的结构图,
具体实施例方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。 请参阅图2,图2为本发明实施例中提供的一种故障链路定位方法的流程图。如图2所示,该方法可以包括 201、接收告警根因分析设备发送的告警产生时间; —个实施例中,告警根因分析设备发送的告警产生时间可以携带在请求消息或者其他消息、信令中。例如,可以由故障链路定位设备接收告警根因分析设备发送的携带告警产生时间的请求消息,从而接收到告警根因分析设备发送的告警产生时间。当然,也可以通过其他方式来获取告警产生时间。 其中,告警产生时间是指被管网络的链路发生故障时,与故障链路有关联关系的设备发出告警的时间。例如,当被管网络中某一个链路发生故障时,该故障链路两端的设备均可以发出告警,同时,包含该故障链路的路径上的其他设备(包括边缘设备)也可能受到了影响而发出告警。 由于,同一条故障链路引起的多个设备发出告警的时间几乎是同时的(间隔一般为微妙级),所以,当被管网络中某一个链路发生故障时,与故障链路有关联关系的设备发出告警的时间可以看作一个告警时间。 另外,对于告警根因分析设备而言,可以采用简单网络管理协议(SimpleNetworkManagement Protocol, SNMP)方式来接收被管网络上报的一个或多个告警,或者,告警根因分析设备也可以主动扫描被管网络,发现被管网络的告警;然后将告警产生时间携带在请求消息中并发送至故障链路定位设备。 202、将上述告警产生时间对应的故障前链路状态数据库和故障后链路状态数据库进行比较,确定故障链路; —个实施例中,故障链路定位设备可以在执行步骤201之前,通过IS-IS路由协议,或最短路由选择(Open Shortest Path First, 0SPF)等方式来监听网络控制平面发送的链路状态数据库(Link State Database, LSDB)更新消息; 在这种场景下,故障链路定位设备可以在存储了故障前LSDB的基础上,进一步存储故障后LSDB ;其中,故障链路定位设备进一步存储故障后LSDB的开始时间对应于步骤201中的告警产生时间。
其中,上述的故障链路定位设备进一步存储故障后LSDB的开始时间对应于步骤201中的告警产生时间为故障链路定位设备进一步存储故障后LSDB的开始时间和步骤201中的告警产生时间相同,这种情况下,当被管网络中发出告警时,故障链路定位设备存储故障后LSDB ; 或者,故障链路定位设备进一步存储故障后LSDB的开始时间是由步骤201中的告警产生时间延时一定的时刻(延时大小由网络性能决定)得到的,这种情况下,当被管网络中发出告警时,故障链路定位设备在延时一定的时间后才存储故障后LSDB。
举例来说,故障链路定位设备可以将存储的告警产生时间对应的故障前链路状态数据库的每一条链路和故障后链路状态数据库的每一条链路一一进行状态比较,状态失效的链路即为故障链路。当被管网络中某一条链路发生故障时,该故障链路的状态将会失效。比如,链路L发生后了故障,此时,故障后链路状态数据库中链路L的状态将会失效,而故障前链路状态数据库中链路L的状态不会失效,只要比较一下故障前和故障后链路状态数据库中链路L的状态即可获知链路L故障。 203、从全网路径向量矩阵中,获取故障链路对应的受损边缘设备及其设备接口 ;
—个实施例中,故障链路定位设备可以采用最短路径优先算法预先计算出全网路径向量矩阵。 举例来说,故障链路定位设备可以从预先计算出的全网路径向量矩阵PV(N, N)中,确定包含故障链路的路径;该路径上的边缘设备即为受损边缘设备,与该路径连接的受损边缘设备的接口即为该受损边缘设备的设备接口 。 假设被管网络上有N台边缘设备(Provider Edge, PE),则故障链路定位设备经过
N次最短路径优先算法计算即可得出全网路径向量矩阵PV(N, N),如下表1所示。
PE丄PE2 PF
PE丄PVnPV12PV1N
PE2PV21PV22PV1N
PENPVN1PVN2PV丽 表1 其中,PVij表示边缘设备PEi到边缘设备PEj所经过的路径。在全网路径向量矩阵
PV(N,N)的基础上,可以计算出当某条链路故障(例如中断)时,所有受损边缘设备(PEi_>
PEj)。本发明实施例中所说的受损边缘设备即为业务受损的边缘设备。 例如,假设部分路径向量如下 PV12 = PE「 > A- > B- > C- > PE2 PV13 = PE「 > A- > B- > D- > PE3 PV14 = PE,- > E- > B- > C- > PE4
贝U,当链路B-〉C故障时,受损边缘设备PE为(PE^PE》、(PEpPE》;其中,PV^与PEpPE2连接的接口即为PEi的设备接口、PE2的设备接口 ;其中,PVM与PE^PE4连接的接口即为PE工的设备接口 、 PE4的设备接口 。 204、将故障链路的标识、受损边缘设备的标识及其设备接口标识发送至告警根因分析设备。 其中,受损边缘设备的标识可以是受损边缘设备的网络协议(InternetProtocol,
IP)地址,或者是受损边缘设备的名称;而受损边缘设备的设备接口标识可以是受损边缘
设备的设备接口的名称,或者是受损边缘设备的设备接口的序号。 其中,受损边缘设备的设备接口所在的路径包含了上述的故障链路。 举例来说,上述的步骤204中的故障链路的标识可以包括故障链路两端的设备地
址以及故障链路两端的设备接口。例如,故障链路的标识可以为设备i地址,接口a-〉设
备j地址,接口 b ;其中,设备i、设备j的地址可以是网络协议(Internet Protocol, IP)地址。 在本发明实施例提供的故障链路定位方法中,通过比较故障前链路状态数据库和故障后链路状态数据库可以确定故障链路,继而可以从全网路径向量矩阵中确定受损边缘设备及其设备接口。本发明实施例可以容易地获取故障链路,避免了采集网络中所有设备中的路由信息,可以降低网络资源耗费。 请参阅图3,图3为本发明实施例中提供的一种告警根因分析方法的流程图。如图3所示,该方法可以包括 301、获取被管网络的至少一个告警; —个实施例中,可以由告警根因分析设备来接收被管网络上报的至少一个告警;或者,由告警根因分析设备主动扫描被管网络,发现被管网络的告警。 对于告警根因分析设备而言,可以采用SNMP协议、程序NETCONF等方式来接收被管网络上报的一个或多个告警。 302、向故障链路定位设备发送告警产生时间; 其中,告警根因分析设备在接收到被管网络上报的至少一个告警之后,可以将告警产生时间携带在请求消息中,并发送至故障链路定位设备。 其中,关于步骤302中的告警产生时间在前面实施例中已经详细给予介绍了,本发明实施例在此不作赘述。 303、接收故障链路定位设备发送的故障链路的标识、受损边缘设备的标识及其设备接口标识; 其中,步骤303中的故障链路的标识、受损边缘设备的标识及其设备接口标识是由故障链路定位设备根据上述的告警产生时间定位出来的; 其中,故障链路定位设备根据上述的告警产生时间定位出故障链路、受损边缘设备及其设备接口的具体实现方法在前面实施例中也给予了详细介绍,本发明实施例在此不作赘述。 304、查询至少一个告警中是否存在来自于故障链路的告警,若存在,则将来自于故障链路的告警标记为根因告警; 如前面实施例中所述的,故障链路的标识可以包括故障链路两端的设备地址以及故障链路两端的设备接口。这样,告警根因分析设备可以查询在至少一个告警中每一个告警所携带的设备地址是否与故障链路任意一端的设备地址相同;若相同,则进一步查询该告警所对应的业务对象是否承载于该故障链路,若是,则该告警为来自于故障链路的告警;反之,则该告警为来自于其他链路或者其他设备的告警。 其中,业务对象包括设备、单板、端口、信道中的至少一个或多个。以单板为例,如果查到单板故障告警,而故障链路对应的端口是该故障单板上的端口 ,并且单板告警时间与链路故障时间吻合,则可确定链路故障是由该单板故障引起,即该单板故障告警是根因
告塾 不同的告警所对应的业务对象可能是不一样的,例如端口故障对应的业务对象是端口 ,单板故障对应的业务对象是单板。 其中,可以查询该告警所对应的业务对象承载的设备接口和该故障链路两端的设备接口是否相同,如果相同,则说明该告警是来自于故障链路的告警;反之,则说明该告警是来自于其他链路或者其他设备的告警。 其中,每一个告警所对应的业务对象承载的设备接口是系统预先配置的。
举例来说,假如链路L两端的设备分别为设备i,地址为192. 168. 1. 20,接口 A ;设备j,地址为192. 168. 1. 31,接口 B。由于设备i和设备j是链路L的两端设备,当链路L发生故障时,设备i和设备j可以同时发出告警,或者仅仅是设备i发出告警,或者仅仅是设备j发出告警; 其中,设备i发送的告警会携带设备i的地址192. 168. 1. 20 ;设备j发送的告警会携带设备j的地址192. 168. 1. 31 ;这样,如果在至少一个告警中查询到携带了地址192. 168. 1. 20的告警,或者查询到携带了地址192. 168. 1. 31的告警;或者既查询到携带了地址192. 168. 1. 20的告警,也查询到携带了地址192. 168. 1. 31的告警,则进一步查询该告警所对应的业务对象承载的设备接口为接口 A和接口 B(即承载于该故障链路),说明该告警来自于发生故障的链路L。 305、查询至少一个告警中是否存在来自于受损边缘设备的告警,若存在,则进一步判断来自于受损边缘设备的告警所对应的业务对象是否承载于该受损边缘设备的设备接口 ,若是,则将来自于受损边缘设备的告警标记为衍生告警。 举例来说,告警根因分析设备也可以采用上述的方法来查询至少一个告警中每一
个告警所携带的设备地址是否与受损边缘设备的设备地址相同;若相同,则该告警是来自
于受损边缘设备的告警;反之,则该告警是来自于其他链路或者其他设备的告警。 由于受损边缘设备上可能会存在多个接口 ,用于承载业务,所以,S卩使步骤305中
查询到了在至少一个告警中存在来自于受损边缘设备的告警,可能也无法确定该告警的产
生是由该故障链路导致的,可以进一步判断来自于受损边缘设备的告警所对应的业务对象
承载于受损边缘设备的设备接口(即承载于受损边缘设备的设备接口所在的路径),从而
确定该告警是由该故障链路导致的。因为,路径包括若干条 路,如果受损边缘设备的设备
接口所在的路径包含的链路发生了故障,受损边缘设备将会发出告警,且该告警是由于故
障链路间接导致的,可以标记为衍生告警;而故障链路两端的设备发出的告警则为根因告
氛 —个实施例中,本发明实施例提供的告警根因分析方法还可以进一步建立故障链路的标识、根因告警以及衍生告警之间的对应关系,这样,当被管网络发生告警时,可以根据该对应关系进行告警的关联分析。 在本发明实施例提供的告警根因分析方法中,通过接收故障链路定位设备发送的故障链路、受损边缘设备及其设备接口之后,如果查询到至少一个告警中存在来自于故障链路的告警,则标记该告警为根因告警;如果查询到至少一个告警中存在来自于受损边缘设备的告警,且该告警所对应的业务对象承载于受损边缘设备的设备接口时,,则标记该告警为衍生告警。本发明实施例可以实现网络级告警根因分析,而且避免了采集网络中所有设备中的路由信息,降低网络资源耗费。 请参阅图4,图4为本发明实施例中提供的一种故障链路定位设备的结构图。如图4所示,该故障链路定位设备可以包括 接收模块401,用于接收告警根因分析设备发送的告警产生时间; 其中,关于接收模块401接收告警产生时间的介绍和前面实施例中的介绍相同,
本发明实施例在此不作赘述。 比较模块402,用于将上述的告警产生时间对应的故障前链路状态数据库和故障后链路状态数据库进行比较,确定故障链路; 确定模块403,用于从全网路径向量矩阵中,确定该故障链路对应的受损边缘设备及该受损边缘设备的设备接口; 发送模块404,用于将该故障链路的标识、该受损边缘设备的标识及该受损边缘设
备的设备接口标识发送至告警根因分析设备。 如图4所示,该故障链路定位设备还可以进一步包括 监听模块405,用于监听网络控制平面发送的链路状态数据库更新消息;该链路状态数据库更新消息是因链路故障而触发的; 存储模块406,用于存储故障前链路状态数据库及存储故障后链路状态数据库;其中,存储模块406存储故障后链路状态数据库的开始时间对应于上述的告警产生时间;
此时,比较模块402具体可以用于将存储模块406存储的上述告警产生时间对应的故障前链路状态数据库和故障后链路状态数据库进行比较,确定故障链路。
如图4所示,该故障链路定位设备还可以进一步包括
计算模块407,用于采用最短路径优先算法预先计算出全网路径向量矩阵;
此时,确定模块403可以用于从计算模块407预先计算出的全网路径向量矩阵中,确定故障链路对应的受损边缘设备及该受损边缘设备的设备接口。 优选地,比较模块402具体可以将上述的告警产生时间对应的故障前链路状态数据库的每一条链路和故障后链路状态数据库的每一条链路一一进行状态比较,状态失效的链路即为故障链路。 优选地,确定模块403具体可以从预先计算出的全网路径向量矩阵中,确定包含故障链路的路径;其中,该路径上的边缘设备为受损边缘设备,该路径连接受损边缘设备的接口为该受损边缘设备的设备接口 。 举例来说,故障链路的标识可以包括故障链路两端的设备地址以及该设备的设备接口。 本发明实施例提供的故障链路定位设备中,通过比较故障前链路状态数据库和故障后链路状态数据库可以获得故障链路,继而可以从全网路径向量矩阵中获得受损边缘设 备及该受损边缘设备的设备接口。本发明实施例可以容易地确定故障链路,避免了采集网 络中所有设备中的路由信息,降低网络资源耗费。 请参阅图5,图5为本发明实施例中提供的一种告警根因分析设备的结构图。如图 5所示,该告警根因分析设备可以包括 第二接收模块501,用于获取被管网络的至少一个告警; 第二发送模块502,用于向故障链路定位设备发送告警产生时间; —个实施例中,第二发送模块502可以将告警产生时间携带于请求消息或者其他
消息、信令中,并发送给故障链路定位设备。 第三接收模块503,用于接收故障链路定位设备发送的故障链路的标识、受损边缘 设备的标识及该受损边缘设备的设备接口标识; 其中,故障链路的标识、受损边缘设备的标识及该受损边缘设备的设备接口标识 是由故障链路定位设备根据上述的告警产生时间定位出来的; 查询模块504,用于查询第三接收模块503接收的至少一个告警中是否存在来自 于该故障链路的告警;以及,是否存在来自于受损边缘设备的告警; 标记模块505,用于在查询模块504查询到第三接收模块503接收的至少一个告警 中存在来自于该故障链路的告警时,将来自于该故障链路的告警标记根因告警;
判断模块506,用于在查询模块504查询到第三接收模块503接收的至少一个告警 中存在来自于该受损边缘设备的告警时,进一步来自于受损边缘设备的告警所对应的业务 对象是否承载于该受损边缘设备的设备接口(即承载于受损边缘设备的设备接口所在的 路径); 此时,标记模块505,还用于在查询模块查询到第三接收模块503接收的至少一个 告警中存在来自于受损边缘设备的告警,并且判断模块506的判断结果为是时,将来自于 受损边缘设备的告警标记为衍生告警。 优选地,故障链路的标识可以包括故障链路两端的设备地址以及该设备的设备接□。 举例来说,查询模块504具体可以查询第三接收模块503接收的至少一个告警中 每一个告警所携带的设备地址是否与故障链路任意一端的设备地址相同;若相同,进一步 查询该告警所对应的业务对象是否承载于该故障链路,若是,则该告警来自于故障链路的 告警;反之,则该告警来自于其他链路或者其他设备的告警。 举例来说,查询模块504具体可以查询第三接收模块503接收的至少一个告警中
每一个告警所携带的设备地址是否与受损边缘设备的设备地址相同;若相同,则该告警来
自于受损边缘设备的告警;反之,则该告警来自于其他链路或者其他设备的告警。 如图5所示,本发明实施例提供的告警根因分析设备还可以进一步包括 建立模块507,用于建立第三接收模块503接收的故障链路的标识、标记模块505
标记的根因告警以及衍生告警之间的对应关系。这样,当被管网络发生告警时,可以根据该
对应关系进行告警的关联分析。 在本发明实施例提供的告警根因分析设备中,通过接收故障链路定位设备发送的 故障链路、受损边缘设备及该受损边缘设备的设备接口之后,如果查询到至少一个告警中存在来自于故障链路的告警,则标记该告警为根因告警;如果查询到至少一个告警中存在 来自于受损边缘设备的告警,且受损边缘设备的设备接口所在的路径包含了故障路径,则 标记该告警为衍生告警。本发明实施例可以实现网络级告警根因分析,并避免采集网络中 所有设备中的路由信息,降低网络资源耗费。 请参阅图6,图6为本发明实施例中提供的一种告警根因分析系统的结构图。如图
6所示,该告警根因分析系统可以包括 故障链路定位设备601和告警根因分析设备602 ; 其中,故障链路定位设备601,用于接收告警根因分析设备602发送的告警产生时 间;将该告警产生时间对应的故障前链路状态数据库和故障后链路状态数据库进行比较, 确定故障链路;从预先计算出的全网路径向量矩阵中,确定该故障链路对应的受损边缘设 备及其设备接口 ;将该故障链路的标识、受损边缘设备的标识及其设备接口标识发送至告 警根因分析设备602 ; 告警根因分析设备602,用于获取被管网络的至少一个告警;向故障链路定位设 备601发送告警产生时间;接收故障链路定位设备601发送的故障链路的标识、受损边缘设 备的标识及该受损边缘设备的设备接口标识;其中,故障链路的标识、受损边缘设备的标识 及其设备接口标识是由故障链路定位设备601根据该告警产生时间定位出来的;查询至少 一个告警中是否存在来自于该故障链路的告警,若存在,则将来自于该故障链路的告警标 记根因告警;查询至少一个告警中是否存在来自于受损边缘设备的告警,若存在,则进一步 判断来自于受损边缘设备的告警所对应的业务对象是否承载于受损边缘设备的设备接口 , 若是,则将来自于受损边缘设备的告警标记为衍生告警。 优选地,告警根因分析设备602还可以用于建立故障链路的标识、根因告警以及 所述衍生告警的对应关系。这样,当被管网络发生告警时,可以根据该对应关系进行告警的 关联分析。 在本发明实施例提供的告警根因分析系统中,故障链路定位设备通过比较故障前 链路状态数据库和故障后链路状态数据库可以获得故障链路,继而可以从全网路径向量矩 阵中获得受损边缘设备及其设备接口 ;告警根因分析设备在查询到至少一个告警中存在来 自于故障链路的告警时,标记该告警为根因告警;在查询到至少一个告警中存在来自于受 损边缘设备的告警,且该告警所对应的业务对象承载于受损边缘设备的设备接口时,标记 该告警为衍生告警。本发明实施例可以实现网络级告警根因分析,并避免采集网络中所有 设备中的路由信息,降低网络资源耗费。 本领域普通技术人员可以理解实现上述方法实施例的全部或部分步骤可以通 过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该 程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括只读存储器 (Read-Only Memory, R0M)、随机存取器(Random-Access Memory, RAM)、磁碟或者光盘等各 种可以存储程序代码的介质。 以上对本发明实施例所提供的一种故障链路定位方法、告警根因分析方法及设 备、系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述, 以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一 般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上可得,本说明书内容不应理解为对本发明的限制。
权利要求
一种故障链路定位方法,其特征在于,包括获取告警产生时间;将所述告警产生时间对应的故障前链路状态数据库和故障后链路状态数据库进行比较,确定故障链路;从全网路径向量矩阵中,确定所述故障链路对应的受损边缘设备及该受损边缘设备的设备接口;将所述故障链路的标识、所述受损边缘设备的标识及该受损边缘设备的设备接口标识发送至告警根因分析设备。
2. 根据权利要求1所述的方法,其特征在于,所述获取告警产生时间之前,还包括 监听网络控制平面发送的链路状态数据库更新消息; 存储故障前链路状态数据库及故障后链路状态数据库; 所述存储故障后链路状态数据库的开始时间对应于所述告警产生时间。
3. 根据权利要求1所述的方法,其特征在于,所述从全网路径向量矩阵中,确定所述故 障链路对应的受损边缘设备及该受损边缘设备的设备接口之前,还包括采用最短路径优先算法计算出全网路径向量矩阵。
4. 根据权利要求1或2或3所述的方法,其特征在于,将所述告警产生时间对应的故障 前链路状态数据库和故障后链路状态数据库进行比较,确定故障链路的步骤包括将存储的所述告警产生时间对应的故障前链路状态数据库的每一条链路和故障后链 路状态数据库的每一条链路一一进行状态比较,状态失效的链路为故障链路。
5. 根据权利要求1或2或3所述的方法,其特征在于,所述从全网路径向量矩阵中,确 定所述故障链路对应的受损边缘设备及该受损边缘设备的设备接口的步骤包括从全网路径向量矩阵中,确定包含所述故障链路的路径;所述路径上的边缘设备为受损边缘设备,所述路径连接所述受损边缘设备的接口为设 备接口。
6. 根据权利要求1或2或3所述的方法,其特征在于,所述故障链路的标识包括所述故 障链路两端的设备地址以及该设备的设备接口。
7. —种告警根因分析方法,其特征在于,包括 获取被管网络的至少一个告警; 向故障链路定位设备发送告警产生时间;接收所述故障链路定位设备发送的故障链路的标识、受损边缘设备的标识及该受损边 缘设备的设备接口标识;所述故障链路的标识、受损边缘设备的标识及该受损边缘设备的设备接口标识是由所 述故障链路定位设备根据所述告警产生时间定位出来的;查询所述至少一个告警中是否存在来自于所述故障链路的告警,若存在,则将来自于 所述故障链路的告警标记根因告警;查询所述至少一个告警中是否存在来自于所述受损边缘设备的告警,若存在,则判断 来自于所述受损边缘设备的告警所对应的业务对象是否承载于该受损边缘设备的设备接 口 ,若是,则将来自于所述受损边缘设备的告警标记为衍生告警。
8. 根据权利要求7所述的方法,其特征在于,所述故障链路的标识包括所述故障链路两端的设备地址以及该设备的设备接口。
9. 根据权利要求8所述的方法,其特征在于,所述查询所述至少一个告警中是否存在 来自于所述故障链路的告警的步骤包括查询所述至少一个告警中每一个告警所携带的设备地址是否与所述故障链路任意一 端的设备地址相同;若相同,查询该告警所对应的业务对象是否承载于所述故障链路,若是,则该告警来自 于所述故障链路的告警。
10. 根据权利要求7所述的方法,其特征在于,所述查询所述至少一个告警中是否存在 来自于所述受损边缘设备的告警的步骤包括查询所述至少一个告警中每一个告警所携带的设备地址是否与所述受损边缘设备的 设备地址相同;若相同,则该告警来自于所述受损边缘设备的告警。
11. 根据权利要求7至10任一项所述的方法,其特征在于,还包括 建立所述故障链路的标识,所述根因告警以及所述衍生告警的对应关系。
12. —种故障链路定位设备,其特征在于,包括 接收模块,用于获取告警产生时间;比较模块,用于将所述告警产生时间对应的故障前链路状态数据库和故障后链路状态 数据库进行比较,确定故障链路;确定模块,用于从全网路径向量矩阵中,确定所述故障链路对应的受损边缘设备及该 受损边缘设备的设备接口;发送模块,用于将所述故障链路的标识、所述受损边缘设备的标识及该受损边缘设备 的设备接口标识发送至告警根因分析设备。
13. 根据权利要求12所述的故障链路定位设备,其特征在于,还包括监听模块,用于监听网络控制平面发送的链路状态数据库更新消息; 存储模块,用于存储故障前链路状态数据库及存储故障后链路状态数据库;所述存储故障后链路状态数据库的开始时间对应于所述告警产生时间;所述比较模块,具体用于将所述存储模块存储的所述告警产生时间对应的故障前链路状态数据库和故障后链路状态数据库进行比较,确定故障链路。
14. 根据权利要求12所述的故障链路定位设备,其特征在于,还包括 计算模i央,用于采用最短路径优先算法计算出全网路径向量矩阵; 所述确定模块,具体用于从所述计算模块计算出的全网路径向量矩阵中,确定所述故障链路对应的受损边缘设备及该受损边缘设备的设备接口 。
15. 根据权利要求12或13或14所述的故障链路定位设备,其特征在于, 所述比较模块,具体用于将所述告警产生时间对应的故障前链路状态数据库的每一条链路和故障后链路状态数据库的每一条链路一一进行状态比较,状态失效的链路为故障链 路。
16. 根据权利要求12或13或14所述的故障链路定位设备,其特征在于, 所述确定模块,具体用于从计算出的全网路径向量矩阵中,确定包含所述故障链路的路径;所述路径上的边缘设备为受损边缘设备,所述路径连接所述受损边缘设备的接口为设备接口。
17. 根据权利要求12或13或14所述的故障链路定位设备,其特征在于,所述故障链路 的标识包括所述故障链路两端的设备地址以及设备接口。
18. —种告警根因分析设备,其特征在于,包括 第二接收模块,用于获取被管网络的至少一个告警; 第二发送模块,用于向故障链路定位设备发送告警产生时间;第三接收模块,用于接收所述故障链路定位设备发送的故障链路的标识、受损边缘设 备的标识及该受损边缘设备的设备接口标识;所述故障链路的标识、所述受损边缘设备的 标识及该受损边缘设备的设备接口标识是由所述故障链路定位设备根据所述告警产生时 间定位出来的;查询模块,用于查询所述至少一个告警中是否存在来自于所述故障链路的告警;以及, 是否存在来自于所述受损边缘设备的告警;标记模块,用于在所述查询模块查询到所述至少一个告警中存在来自于所述故障链路 的告警时,将来自于所述故障链路的告警标记根因告警;判断模块,用于在所述查询模块查询到所述至少一个告警中存在来自于所述受损边缘 设备的告警时,判断来自于所述受损边缘设备的告警所对应的业务对象是否承载于该受损 边缘设备的设备接口;所述标记模块,还用于在所述查询模块查询到所述至少一个告警中存在来自于所述受 损边缘设备的告警,且所述判断模块的判断结果为是时,将来自于所述受损边缘设备的告 警标记为衍生告警。
19. 根据权利要求18所述的告警根因分析设备,其特征在于,所述故障链路的标识包 括所述故障链路两端的设备地址以及设备接口。
20. 根据权利要求19所述的告警根因分析设备,其特征在于,所述查询模块,具体用于查询所述至少一个告警中每一个告警所携带的设备地址是否 与所述故障链路任意一端的设备地址相同;若相同,查询该告警所对应的业务对象是否承 载于所述故障链路,若是,则该告警来自于所述故障链路的告警。
21. 根据权利要求18所述的告警根因分析设备,其特征在于,所述查询模块,具体用于查询所述至少一个告警中每一个告警所携带的设备地址是否 与所述受损边缘设备的设备地址相同;若相同,则该告警来自于所述受损边缘设备的告警。
22. 根据权利要求18至21任一项所述的告警根因分析设备,其特征在于,还包括 建立模块,用于建立所述故障链路的标识,所述根因告警以及所述衍生告警的对应关系。
23. —种告警根因分析系统,其特征在于,包括 故障链路定位设备和告警根因分析设备;所述故障链路定位设备,用于接收所述告警根因分析设备发送的告警产生时间;将所 述告警产生时间对应的故障前链路状态数据库和故障后链路状态数据库进行比较,确定故 障链路;从全网路径向量矩阵中,确定所述故障链路对应的受损边缘设备及该受损边缘设 备的设备接口 ;将所述故障链路的标识、所述受损边缘设备的标识及该受损边缘设备的设 备接口标识发送至所述告警根因分析设备;所述告警根因分析设备,用于获取被管网络的至少一个告警;向所述故障链路定位设 备发送告警产生时间;接收所述故障链路定位设备发送的故障链路的标识、受损边缘设备 的标识及该受损边缘设备的设备接口标识;所述故障链路的标识、受损边缘设备的标识及 该受损边缘设备的设备接口标识是由所述故障链路定位设备根据所述告警产生时间定位 出来的;查询所述至少一个告警中是否存在来自于所述故障链路的告警,若存在,则将来自 于所述故障链路的告警标记根因告警;查询所述至少一个告警中是否存在来自于所述受损 边缘设备的告警,若存在,则判断来自于所述受损边缘设备的告警所对应的业务对象是否 承载于该受损边缘设备的设备接口 ,若是,则将来自于所述受损边缘设备的告警标记为衍 生告警。
24.根据权利要求23所述的告警根因分析系统,其特征在于,所述告警根因分析设备,还用于建立所述故障链路的标识,所述根因告警以及所述衍 生告警的对应关系。
全文摘要
本发明实施例公开了一种故障链路定位方法、告警根因分析方法及设备、系统,其中,告警根因分析方法包括获取被管网络的至少一个告警;向故障链路定位设备发送告警产生时间;接收故障链路定位设备发送的故障链路的标识、受损边缘设备的标识及该受损边缘设备的设备接口标识;查询至少一个告警中是否存在来自于故障链路的告警,若存在,将来自于故障链路的告警标记为根因告警;是否存在来自于受损边缘设备的告警,若存在,判断该告警所对应的业务对象是否承载于该受损边缘设备的设备接口,若是,将来自于受损边缘设备的告警标记为衍生告警。本发明实施例可以实现网络级告警根因分析,避免采集网络中所有设备中的路由信息,降低网络资源耗费。
文档编号H04L12/26GK101707537SQ20091022338
公开日2010年5月12日 申请日期2009年11月18日 优先权日2009年11月18日
发明者叶智明, 张红德, 李国平, 王晨敏, 王瑞红, 罗义, 蒙伟 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1