一种分析告警相关性的方法及装置与流程

文档序号:15281382发布日期:2018-08-28 23:34阅读:159来源:国知局

本发明涉及通信网管领域,特别涉及一种分析告警相关性的方法及装置。



背景技术:

随着通信技术的迅猛发展,通信设备的推陈出新,业务不断扩大,功能不断增加,通信设备支持的告警数量也在大量增加。而随着网络规模的扩大,网管管理通信设备的数量也在急剧增大。同时告警的数据量也随之增加。在某些场景下,当一条光纤中断,可能在其承载的业务上,产生上万条告警。这样对网络运维来说会造成很大的困难。因此如果从大量告警中能够自动分析出根源告警,故障发生时将目光聚焦在真正的故障点,从而迅速解决问题,将给运维工作带来极大的帮助。

而目前告警相关性的主流技术,是首先在网管上预定义各种规则,在设备上报告警以后,网管根据预定义将告警两两匹配,判断两者是否存在抑制关系。而其中,准确性较高的规则则是根据告警查询关联的业务及业务路由。因为告警通常是随着业务流向依次往下传递的,所以判断两个告警产生位置是否存在一条业务上下游、或一条告警所在位置是另一条告警所在位置的服务层业务上等规则能比较准确的判断告警抑制关系。但是业务的路由可能是比较复杂的,告警量大的时候频繁查询,效率难免低下。



技术实现要素:

根据本发明实施例提供的方案解决的技术问题是在业务路由复杂和告警量大,频繁查询造成效率低。

根据本发明实施例提供的一种分析告警相关性的方法,包括:

网管接收各设备在产生告警时发送的告警消息,所述告警消息携带与告警有关的业务以及业务路由节点的路由权重;

网管根据所述告警消息中携带的所述业务和所述路由权重,确定所收到的关于同一业务的多个告警的相关性。

优选地,还包括:

网管根据各业务全路由展开的顺序,计算各业务中的每个业务路由节点的路由权重,并将所计算的各业务中的每个业务路由节点的路由权重发送给各设备,以便各设备在发生告警时查找与告警有关的业务路由节点的路由权重。

优选地,所述网管根据各业务全路由展开的顺序,计算各业务中的每个业务路由节点的路由权重,并将所计算的各业务中的每个业务路由节点的路由权重发送给各设备包括:

网管根据各业务全路由展开的顺序,计算每个业务路由节点在所述业务中的路由权重,并生成包含业务、业务路由节点以及路由权重的路由组合序列;

网管将所生成的路由组合序列发送给各设备。

优选地,所述网管根据各业务全路由展开的顺序,计算每个业务路由节点在所述业务中的路由权重包括:

网管根据各业务全路由展开的顺序,每个业务路由节点在所述业务中的路由权重依次增加;或者

网管根据各业务全路由展开的顺序,每个业务路由节点在所述业务中的路由权重依次递减。

优选地,所述网管根据所述告警消息中携带的所述业务和所述路由权重,确定所收到的关于同一业务的多个告警的相关性包括:

网管根据所述各设备发送的告警消息中携带的所述业务和所述路由权重,统计产生在同一业务上的各个告警消息;

网管根据所统计产生在同一业务上各个告警消息,对所述各个告警消息中的路由权重进行比较,确定所收到的关于同一业务的多个告警的相关性。

优选地,所述网管对所述各个告警消息中的路由权重进行比较,确定所收到的关于同一业务的多个告警的相关性包括:

若业务路由节点在所述业务中的路由权重依次增加,且第一告警消息中的路由权重大于第二告警消息中的路由权重,则网管确定所收到的关于同一业务的第一告警消息是第二告警消息的衍生告警;或者

若业务路由节点在所述业务中的路由权重依次递减,且第一告警消息中的路由权重大于第二告警消息中的路由权重,则网管确定所收到的关于同一业务的第一告警消息是第二告警消息的根源告警。

根据本发明实施例提供的一种分析告警相关性的装置,包括:

接收模块,用于接收各设备在产生告警时发送的告警消息,所述告警消息携带与告警有关的业务以及业务路由节点的路由权重;

确定模块,用于根据所述告警消息中携带的所述业务和所述路由权重,确定所收到的关于同一业务的多个告警的相关性。

优选地,还包括:

计算及发送单元,用于根据各业务全路由展开的顺序,计算各业务中的每个业务路由节点的路由权重,并将所计算的各业务中的每个业务路由节点的路由权重发送给各设备,以便各设备在发生告警时查找与告警有关的业务路由节点的路由权重。

优选地,所述计算及发送单元包括:

计算子单元,用于根据各业务全路由展开的顺序,计算每个业务路由节点在所述业务中的路由权重,并生成包含业务、业务路由节点以及路由权重的路由组合序列;

发送子单元,用于将所生成的路由组合序列发送给各设备。

优选地,所述计算子单元具体用于根据各业务全路由展开的顺序,每个业务路由节点在所述业务中的路由权重依次增加;或者根据各业务全路由展开的顺序,每个业务路由节点在所述业务中的路由权重依次递减。

优选地,所述确定模块包括:

统计单元,用于根据所述各设备发送的告警消息中携带的所述业务和所述路由权重,统计产生在同一业务上的各个告警消息;

确定单元,用于根据所统计产生在同一业务上各个告警消息,对所述各个告警消息中的路由权重进行比较,确定所收到的关于同一业务的多个告警的相关性。

优选地,所述确定单元具体用于当业务路由节点在所述业务中的路由权重依次增加,且第一告警消息中的路由权重大于第二告警消息中的路由权重,则网管确定所收到的关于同一业务的第一告警消息是第二告警消息的衍生告警;或者当业务路由节点在所述业务中的路由权重依次递减,且第一告警消息中的路由权重大于第二告警消息中的路由权重,则网管确定所收到的关于同一业务的第一告警消息是第二告警消息的根源告警。

根据本发明实施例提供的一种电子设备,所述电子设备包括处理器和存储器,其中,所述存储器用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行以下步骤:

接收各设备在产生告警时发送的告警消息,所述告警消息携带与告警有关的业务以及业务路由节点的路由权重;

根据所述告警消息中携带的所述业务和所述路由权重,确定所收到的关于同一业务的多个告警的相关性。

根据本发明实施例提供的方案,网管配置业务路由信息发给设备,设备上报告警时,根据告警发生位置,携带影响的相关业务及路由权重,网管收到后根据业务和路由权重信息判断告警的抑制关系。这样网管只需要根据告警自身携带的信息即可完成告警相关性判断,而不用查询大量数据,提高了分析效率,减轻了网管计算与缓存的压力。

附图说明

图1是本发明实施例提供的一种分析告警相关性的方法流程图;

图2是本发明实施例提供的一种分析告警相关性的装置示意图;

图3是本发明实施例提供的告警相关性分析系统的结构图;

图4是本发明实施例提供的告警相关性方法的流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

图1是本发明实施例提供的一种分析告警相关性的方法流程图,如图1所示,包括:

步骤s101:网管接收各设备在产生告警时发送的告警消息,所述告警消息携带与告警有关的业务以及业务路由节点的路由权重;

步骤s102:网管根据所述告警消息中携带的所述业务和所述路由权重,确定所收到的关于同一业务的多个告警的相关性。

本发明实施例还包括:网管根据各业务全路由展开的顺序,计算各业务中的每个业务路由节点的路由权重,并将所计算的各业务中的每个业务路由节点的路由权重发送给各设备,以便各设备在发生告警时查找与告警有关的业务路由节点的路由权重。

其中,所述网管根据各业务全路由展开的顺序,计算各业务中的每个业务路由节点的路由权重,并将所计算的各业务中的每个业务路由节点的路由权重发送给各设备包括:网管根据各业务全路由展开的顺序,计算每个业务路由节点在所述业务中的路由权重,并生成包含业务、业务路由节点以及路由权重的路由组合序列;网管将所生成的路由组合序列发送给各设备。具体地说,所述网管根据各业务全路由展开的顺序,计算每个业务路由节点在所述业务中的路由权重包括:网管根据各业务全路由展开的顺序,每个业务路由节点在所述业务中的路由权重依次增加;或者网管根据各业务全路由展开的顺序,每个业务路由节点在所述业务中的路由权重依次递减。

其中,所述网管根据所述告警消息中携带的所述业务和所述路由权重,确定所收到的关于同一业务的多个告警的相关性包括:网管根据所述告警消息中携带的所述业务和所述路由权重,统计产生在同一业务上的各个告警消息;网管根据所统计产生在同一业务上各个告警消息,对所述各个告警消息中的路由权重进行比较,确定所收到的关于同一业务的多个告警的相关性。

其中,所述网管对所述各个告警消息中的路由权重进行比较,确定所收到的关于同一业务的多个告警的相关性包括:若业务路由节点在所述业务中的路由权重依次增加,且第一告警消息中的路由权重大于第二告警消息中的路由权重,则网管确定所收到的关于同一业务的第一告警消息是第二告警消息的衍生告警;或者若业务路由节点在所述业务中的路由权重依次递减,且第一告警消息中的路由权重大于第二告警消息中的路由权重,则网管确定所收到的关于同一业务的第一告警消息是第二告警消息的根源告警。

图2是本发明实施例提供的一种分析告警相关性的装置示意图,如图2所示,包括:接收模块201,用于接收各设备在产生告警时发送的告警消息,所述告警消息携带与告警有关的业务以及业务路由节点的路由权重;确定模块202,用于根据所述告警消息中携带的所述业务和所述路由权重,确定所收到的关于同一业务的多个告警的相关性。

本发明实施例还包括:计算及发送单元,用于根据各业务全路由展开的顺序,计算各业务中的每个业务路由节点的路由权重,并将所计算的各业务中的每个业务路由节点的路由权重发送给各设备,以便各设备在发生告警时查找与告警有关的业务路由节点的路由权重。

其中,所述计算及发送单元包括:计算子单元,用于根据各业务全路由展开的顺序,计算每个业务路由节点在所述业务中的路由权重,并生成包含业务、业务路由节点以及路由权重的路由组合序列;发送子单元,用于将所生成的路由组合序列发送给各设备。

其中,所述计算子单元具体用于根据各业务全路由展开的顺序,每个业务路由节点在所述业务中的路由权重依次增加;或者根据各业务全路由展开的顺序,每个业务路由节点在所述业务中的路由权重依次递减。

其中,所述确定模块202包括:统计单元,用于根据所述告警消息中携带的所述业务和所述路由权重,统计产生在同一业务上的各个告警消息;确定单元,用于根据所统计产生在同一业务上各个告警消息,对所述各个告警消息中的路由权重进行比较,确定所收到的同一业务的多个告警的相关性。具体地说,所述确定单元具体用于当业务路由节点在所述业务中的路由权重依次增加,且第一告警消息中的路由权重大于第二告警消息中的路由权重,则网管确定所收到的关于同一业务的第一告警消息是第二告警消息的衍生告警;或者当业务路由节点在所述业务中的路由权重依次递减,且第一告警消息中的路由权重大于第二告警消息中的路由权重,则网管确定所收到的关于同一业务的第一告警消息是第二告警消息的根源告警。

本发明实施例提供的一种电子设备,所述电子设备包括处理器和存储器,其中,所述存储器用于存储可执行程序代码;所述处理器通过读取所述存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行以下步骤:

接收各设备在产生告警时发送的告警消息,所述告警消息携带与告警有关的业务以及业务路由节点的路由权重;

根据所述告警消息中携带的所述业务和所述路由权重,确定所收到的关于同一业务的多个告警的相关性。

图3是本发明实施例提供的告警相关性分析系统的结构图,如图3所示,包括网管和一个或多个设备。其中,所述网管包含业务配置模块和告警相关性计算模块;所述设备包含业务信息存储模块和告警采集上报模块。

所述网管的业务配置模块:根据网管上已经配置好业务信息,按照客户业务全路由(包括服务层业务路由)展开的顺序,计算每个业务路由节点的路由权重,形成[节点tp,业务id,本节点在业务中的路由权重]这样一个组合的序列,并下发给设备保存。

权重的计算方法,一个典型示例为:将业务路由按顺序完全展开(包含服务层路由),假设总共包含n个节点,每个节点的权重可以按节点顺序从1开始依次累加到n。

所述网管的业务信息存储模块:保存网管下发的与本设备相关的业务及路由权重信息。

比如当前设备保存了一个[b1-p1,s1,5]的权重信息,表示b1单板的端口p1在业务s1上的路由权重为5。该端口上的业务权重信息可能有多个。

所述设备的告警采集上报模块:告警产生时,根据告警所在位置tp,到业务信息存储模块查询关联的业务id及路由权重,作为附加属性(如[s1,5]),随告警一起上报给网管。当告警影响多条业务时,此属性会包含多个业务权重信息。

所述设备的告警相关性计算模块:根据告警中的业务及路由权重,与当前告警池中告警比较,计算告警之间的抑制关系。

计算规则如下:假如两个告警关联了同一个业务s1,一个告警a的权重信息为[s1,1],另一个告警b的权重信息为[s1,5],则权重值小的告警a是权重值大的告警b的根源告警。

图4是本发明实施例提供的告警相关性方法的流程图,如图4所示,包括以下步骤:

第一步,在网管上创建并配置好业务及路由信息。

第二步,业务配置模块根据业务及路由信息,计算每个业务路由节点的路由权重,形成[tpi,sidi,wi]这样一个组合的序列,并下发给设备。

其中,tpi表示节点tp,可能是物理端口、虚端口等,sidi表示业务id,wi表示tpi在业务sidi中的路由权重值。

具体的,将某条业务s1的业务路由按从a点到z点的顺序完全展开(同时包含服务层路由),假设总共包含n个节点(tp1~tpn),每个节点的权重可以按节点顺序从1开始依次累加到n,形成[tp1,s1,1],[tp2,s1,2]…[tpn,s1,n]的路由权重序列。

然后将其他业务按上述方法也展开得到其他业务的权重序列,再根据tp点的位置重新组合,发给tp点所在的设备。

第三步,设备收到与自身相关的业务及节点权重配置信息后,保存在设备上。

第四步,告警产生时,根据告警所在位置,到业务信息存储模块查询关联的业务及路由权重,作为附加属性,随告警一起上报给网管。

具体的,如果单板b1的端口p1产生了一个告警a1,根据a1的产生位置去步骤2中存储的数据中,查找匹配的tpi。如果找到,就将tpi关联的业务和路由权重序列[sidi,wi]随告警一起上报。假设这里上报的是[s1,5]。

第五步,网管收到新上报的告警时,根据告警中的业务及路由权重,与当前告警池中告警比较,计算告警之间的抑制关系。

具体的,当网管收到新上报的告警a1时,与当前告警池中告警比较,如果已经存在告警a2,关联了相同的业务s1,且权重为1。则可以认为a2是a1的根源告警,a1是a2的衍生告警。

另外,具体判断过程中,还可以加入其他条件,如告警产生时间相差不能超过30秒等条件,以进一步提高判断效率和准确度。

根据本发明实施例提供的方案,1、将业务路径信息提前配置、提前下发设备,告警上报时,不需要再频繁查询业务信息。2、提出了权重计算的方法,为每个业务路由节点计算一个绝对权重值,告警上报时根据这个值的大小就能轻松的比较出位置关系。3、按照客户层业务全路由展开后,能得到包含服务层路由的完整路由,统一计算权重,减少了规则判断的复杂度。

尽管上文对本发明进行了详细说明,但是本发明不限于此,本技术领域技术人员可以根据本发明的原理进行各种修改。因此,凡按照本发明原理所作的修改,都应当理解为落入本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1