一种端到端业务告警状态监测方法及系统与流程

文档序号:23097306发布日期:2020-11-27 12:59阅读:207来源:国知局
一种端到端业务告警状态监测方法及系统与流程
本发明涉及通信
技术领域
,具体涉及一种端到端业务告警状态监测方法及系统。
背景技术
:随着通信网络的飞速发展,管理的通信设备数量以及端到端业务量也日益增长。ems(networkelementmanagementsystem,网元管理系统)是通信设备图形化管理系统,在ems中设备告警是关注度最高的状态监控数据,但是设备告警都是基于物理网元的,一条端到端业务可能经过几个或几十个物理网元,并且端到端业务还存在工作路径和保护路径、以及服务层和客户层的复杂关系,在如此庞大复杂的工程环境中,很难直观的体现一条端到端业务的状态。因此在ems中提出了将设备告警关联到端到端业务的方法,但是由于一条业务经过的设备很多,导致业务关联的设备告警也很多,并且业务的数量也非常庞大,ems维护人员通常只会关注业务的严重告警,即此时业务已出现严重故障,而一般的告警则会被忽略。然而一般的告警也是设备运行过程中出现异常的体现,如果进行故障排查,可很大程度上减少业务出现严重故障的风险,但是业务的一般告警数量过于庞大,如果全部逐个进行排查处理,对于ems系统的维护成本过高。技术实现要素:针对现有技术中存在的缺陷,本发明的目的在于提供一种端到端业务告警状态监测方法及系统,可将设备端口的告警数据体现在端到端业务上,并在第一时间反应业务的当前状态。本发明第一方面提供一种端到端业务告警状态监测方法,其包括步骤:接收并解析网元设备上报的告警,根据网元设备找到业务路径,并更新业务路径的告警数据;获取业务路径的关联路径及其告警数据,根据业务路径和关联路径的告警数据统计业务的本层告警数据;找到业务的服务层,获取服务层告警数据;然后根据业务的本层告警数据和服务层告警数据计算业务的告警状态;当业务存在客户层时,根据上述业务的本层告警数据和服务层告警数据计算该客户层的告警状态;如果客户层为多层,则从最接近本层的客户层开始,自下而上通过递归计算,得到各客户层的告警状态。基于第一方面,在可能的实施例中,告警数据包括告警级别和每个告警级别的告警个数;告警状态包括最高告警级别和业务健康指数;业务健康指数根据业务包含的每个告警级别的告警个数及其权重进行计算。基于第一方面,在可能的实施例中,告警级别包括提示告警、次要告警、主要告警和严重告警,提示告警、次要告警、主要告警和严重告警的权重和为100。基于第一方面,在可能的实施例中,告警级别还包括特殊告警,其中,i为告警级别,ki为告警级别i的权重,ni为告警级别i的告警个数,j为特殊告警类别,pj为特殊告警类别j的权重,n为特殊告警的类别总数。基于第一方面,在可能的实施例中,根据业务的本层告警数据和服务层告警数据计算该客户层的告警状态,具体包括:根据业务的客户层和服务层关系数据,找到业务的客户层;根据客户层的客户层和服务层关系数据,找到该客户层的所有服务层;根据该客户层的本层告警数据及其服务层告警数据计算该客户层的告警状态。基于第一方面,在可能的实施例中,当业务路径为工作路径时,业务路径的关联路径为该业务的所有保护路径和该业务的其他工作路径;当业务路径为保护路径时,业务路径的关联路径为该业务的所有工作路径和该业务的其他保护路径基于第一方面,在可能的实施例中,根据网元设备找到业务路径,并更新业务路径的告警数据后,还包括:将业务路径更新的告警数据与已有的告警数据进行比较,当二者相同时,忽略上报的告警;当二者不同时,存储更新的告警数据。基于第一方面,在可能的实施例中,计算业务的告警状态后,还包括:将业务更新的告警状态与已有的告警状态进行比较,当二者相同时,则无需更新;当二者不同时,则存储更新的告警状态。本发明第二方面提供一种实现上述方法的端到端业务告警状态监测系统,其包括:网元告警模块,其用于接收并解析网元设备上报的告警,根据网元设备找到业务路径,并更新业务路径的告警数据;还用于将业务路径和更新的告警数据上报给业务告警模块;业务告警模块,其用于获取业务路径的关联路径及其告警数据,根据业务路径和关联路径的告警数据统计业务的本层告警数据;其还用于找到业务的服务层,获取服务层告警数据,并根据业务的本层告警数据和服务层告警数据计算业务的告警状态;当业务存在客户层时,业务告警模块还用于根据业务的本层告警数据和服务层告警数据计算该客户层的告警状态,如果客户层为多层,则从最接近本层的客户层开始,自下而上通过递归计算,得到各客户层的告警状态。基于第二方面,在可能的实施例中,还包括:端口模块,其用于将业务路径的id与其经过的网元设备的端口建立并存储绑定关系;网元告警模块通过端口模块找到业务路径的id。与现有技术相比,本发明的优点在于:(1)本发明的端到端业务告警状态监测方法,通过加入客户层和服务层关系的计算,可将设备端口上报的告警体现在端到端业务上,实现对所有告警的监控,并在第一时间反应业务的当前状态,评估业务产生严重故障的风险。(2)本发明的端到端业务告警状态监测方法,通过业务健康指数可以更准确、简洁地体现端到端业务的当前工作状态,且通信系统维护人员可以根据告警状态的业务健康指数快速定位重要的故障,降低工程中业务出现严重故障的风险。附图说明图1为本发明实施例1提供的端到端业务告警状态监测方法的流程图;图2为本发明实施例7提供的端到端业务关系示意图。具体实施方式以下结合附图及实施例对本发明作进一步详细说明。实施例1参见图1所示,本发明实施例提供一种端到端业务告警状态监测方法,其包括步骤:s1.接收并解析网元设备上报的告警,根据网元设备找到业务路径,并更新业务路径的告警数据。s2.获取业务路径的关联路径及其告警数据,根据业务路径和关联路径的告警数据统计业务的本层告警数据。当网元设备找到的业务路径为工作路径时,业务路径的关联路径为该业务的所有的保护路径和该业务的其他工作路径;当网元设备找到的业务路径为保护路径时,业务路径的关联路径为该业务的所有的工作路径和该业务的其他保护路径。当网元设备找到的业务路径为工作路径,且该业务没有保护路径和其他的工作路径时,则该业务路径的关联路径为空,业务的本层告警数据根据业务路径的告警数据进行统计。上述告警数据包括告警级别和每个告警级别的告警个数,告警数据中还包括已有的告警状态。告警状态包括最高告警级别和业务健康指数。业务健康指数根据业务包含的每个告警级别的告警个数及其权重进行计算。具体地,基于该业务统计业务本层中与该业务相关的各告警级别的告警数量,得到业务的本层告警数据。因此,网元设备上报的告警带有告警级别信息。s3.找到业务的服务层,获取服务层告警数据;然后根据业务的本层告警数据和服务层告警数据计算并显示业务的告警状态。具体地,该业务即为其服务层的客户层,该业务的告警状态包括该业务的本层告警状态及其服务层告警状态两个部分,即该业务的告警状态根据该业务的本层告警数据及其服务层告警数据两个部分计算得到,并在计算后更新已有的告警状态。当上述业务存在客户层时,还包括步骤s4.根据上述业务的本层告警数据和服务层告警数据计算并显示该客户层的告警状态;如果客户层为多层,则从最接近该业务的本层的客户层开始,自下而上通过递归计算,得到各客户层的告警状态,并对已有的告警状态进行更新显示。具体地,在业务层次拓扑结构中,当该业务存在客户层时,该客户层的告警状态由该客户层的本层告警数据及其服务层告警数据两个部分进行计算得到,而该业务为该客户层的服务层之一。若是该客户层之上还存在客户层,则须通过递归计算,得到各客户层的告警状态。其中,最顶层客户层的告警状态则包括该最顶层客户层的本层告警状态及其服务层告警状态两个部分,即该最顶层客户层的告警状态根据该最顶层客户层的本层告警数据及其服务层告警数据计算得到。因此,在业务层次拓扑结构中,当上述业务为最顶层客户层时,即该业务之上是不存在客户层的;上报的告警对该业务的影响程度即为对全网业务的影响程度。另外,当上述业务为拓扑结构中最底层业务时,该业务则没有服务层告警数据,只有其本层告警数据,上报的告警对该业务的影响程度即为对最底层业务的影响程度。当告警影响经过逐层递归计算后,即可将最底层业务的告警体现在最顶层业务上。本发明实施例的监测方法,通过加入客户层和服务层关系的计算,即可将设备端口上报的告警体现在端到端业务上,实现对所有告警的监控,并在第一时间反应业务的当前状态,评估业务产生严重故障的风险。实施例2在实施例1的基础上,如下表1所示,告警级别通过颜色进行区分。设备上报的告警级别从低到高可分为绿色代表的无告警、蓝色代表的提示告警、黄色代表的次要告警、橙色代表的主要告警和红色代表的严重告警等,告警状态中的显示颜色选取业务包含的全部告警中最高级别的告警颜色。在本实施例中,上述告警级别包括提示告警、次要告警、主要告警和严重告警。由于不同的告警级别对业务的影响不同,因此,对于每个告警级别均需要设定一个权重值,该权重值可根据用户需求自定义。其中,提示告警、次要告警、主要告警和严重告警的权重和为100。表1告警级别告警颜色权重值提示告警蓝色k1次要告警黄色k2主要告警橙色k3严重告警红色k4另外,对于个别特殊的告警可作为特殊告警处理,对于特殊告警可以单独定义权重值,以便于计算业务健康指数时,根据该特殊告警的权重值进行计算。因此,其中,i为告警级别,ki为告警级别i的权重,ni为告警级别i的告警个数,j为特殊告警类别,pj为特殊告警类别j的权重,n为特殊告警的类别总数,k1+k2+k3+k4=100。业务健康指数的范围在0-100,当计算出的业务健康指数小于0时,该业务健康指数为0。因此,对于关联到业务上的告警,当存在一条告警级别i的告警时,业务健康指数降低ki×1/2,当存在两条告警级别i的告警时,业务健康指数降低ki×2/3,如此类推。假设,某条业务有1条提示告警,2条主要告警,且没有设置特殊告警权重时,即该业务不存在次要告警和严重告警,那么该业务的健康指数为:k1×1/2+k2+k3×1/3+k4。业务健康指数表示业务出现严重故障的风险随着告警数量的增加而增加。当出现权重较低的告警时,业务健康指数降低较小,则由该告警引起此条业务出现严重故障的风险较小;当出现权重相对较高的告警时,业务健康指数降低较大,则由该告警引起此条业务出现严重故障的风险也大大增加。通信系统维护人员可以根据业务的业务健康指数提前对业务做故障检测处理,降低工程中业务出现严重故障的风险。实施例3在实施例1的基础上,上述步骤s4中,根据业务的本层告警数据和服务层告警数据计算客户层的告警状态,具体包括:首先根据业务的客户层和服务层关系数据,即客户层业务须承载于服务层业务,找到业务的客户层。然后根据该客户层的客户层和服务层关系数据,找到该客户层的所有服务层;上述业务也属于该客户层的服务层之一。最后,根据该客户层的本层告警数据及其服务层告警数据计算该客户层的告警状态,即该客户层的告警状态包括该客户层的本层告警状态及其服务层告警状态两个部分。根据全网业务层次拓扑结构,可递归计算出该上报的告警影响的所有业务,并计算业务健康指数。实施例4在实施例1的基础上,上述步骤s1中,在根据网元设备找到业务路径,并更新业务路径的告警数据后,还包括:将业务路径更新的告警数据与已有的告警数据进行比较,当二者相同时,忽略上报的告警;当二者不同时,存储更新的告警数据。具体地,一种情况是上报的告警数据原本就存在,另一种情况是上报的告警数据不属于任一告警级别,也不属于特殊告警,即其权重为0,则更新后的告警数据与已有的告警数据相同。另外,若上报一个告警的同时,有同级别的一个告警结束,即隐患排除,则更新的告警数据与已有的告警数据也相同。当业务路径的更新后的告警数据与已有的告警数据相同时,忽略该上报的告警数据,即其对业务的告警状态没有影响。实施例5在实施例1的基础上,上述步骤s3中,计算业务的告警状态后,还包括:将业务更新的告警状态与已有的告警状态进行比较,当二者相同时,则无需更新;当二者不同时,则存储更新的告警状态。本实施例中,若上报告警的同时,有告警结束,即隐患排除,则计算得到的告警状态与已有的告警状态可能一致。实施例6本发明实施例提供一种实现上述方法的端到端业务告警状态监测系统,其包括网元告警模块和业务告警模块。网元告警模块用于接收并解析网元设备上报的告警,根据网元设备找到业务路径,并更新业务路径的告警数据;网元告警模块还用于将业务路径和更新的告警数据上报给业务告警模块。业务告警模块用于获取业务路径的关联路径及其告警数据,根据业务路径和关联路径的告警数据统计业务的本层告警数据;业务告警模块还用于找到业务的服务层,获取服务层告警数据,并根据业务的本层告警数据和服务层告警数据计算业务的告警状态。当业务存在客户层时,业务告警模块还用于根据业务的本层告警数据和服务层告警数据计算客户层的告警状态,如果客户层为多层,则从最接近本层的客户层开始,自下而上通过递归计算,得到各客户层的告警状态。优选地,上述业务告警模块还用于将业务路径更新的告警数据与已有的告警数据进行比较,当二者相同时,忽略上报的告警,无需再进行后续计算;当二者不同时,存储更新的告警数据。优选地,上述业务告警模块还用于将业务更新的告警状态与已有的告警状态进行比较,当二者相同时,则无需更新;当二者不同时,则存储更新的告警状态,然后再递归计算得到该告警数据影响的所有业务,并计算业务健康指数。通过业务健康指数可以更准确、简洁地体现端到端业务的当前工作状态,且通信系统维护人员可以根据告警状态的业务健康指数快速定位重要的故障,降低工程中业务出现严重故障的风险。实施例7在实施例6的基础上,本实施例的监测系统还包括端口模块和显示模块。端口模块用于将业务路径的id与其经过的网元设备的端口建立并存储绑定关系。网元告警模块可通过端口模块找到业务路径的id。显示模块用于对各业务的告警状态进行显示,即显示业务健康指数和最高级别告警的告警颜色。业务告警模块可将告警状态改变的全部端到端业务及其更新的告警状态上报给显示模块,以供显示模块进行更新显示。参见图2所示,业务1的保护路径b经过网元1的端口a和端口b、网元2的端口c和端口d、以及网元3的端口e和端口f。保护路径b创建时,经过的全部端口都会记录保护路径b的id。假设设备网元2上报了一条端口c的告警,且业务1仅有一条工作路径a和一条保护路径b,本实施例的告警状态监测方法如下:a1.网元告警模块接收并解析网元2端口c上报的告警,将告警源定位到端口c,然后通过端口模块,根据端口c找到保护路径b的id,并更新保护路径b的告警数据,将保护路径b及其更新后的告警数据上报给业务告警模块。a2.业务告警模块从本地缓存中获取保护路径b已有的告警数据,与更新后的告警数据进行比较,当二者不同时,将更新的告警数据存储至本地缓存中,然后根据业务的工作路径和保护路径关系数据,找到保护路径b的工作路径a,并从本地缓存中获取工作路径a的告警数据,根据工作路径a和保护路径b的告警数据,统计出业务1的本层告警数据。a3.业务告警模块根据内存中业务的客户层服务层关系数据,根据工作路径a找到业务1的服务层业务2,根据路径对象b找到业务1的服务层业务3,并通过业务2获取业务2的工作路径c和保护路径d,通过业务3获取业务3的工作路径e和保护路径f;根据本地缓存中获取路径c、d、e、f的告警数据,统计得到业务2和业务3的本层告警数据;根据业务2和业务3的本层告警数据及其从本地缓存中获取的服务层告警数据,统计出业务2和业务3的全部告警数据,作为业务1的服务层告警数据。a4.根据业务1的本层告警数据及其服务层告警数据,统计出业务1的全部告警数据,并计算得到业务1的告警状态,即得到业务1的业务健康指数,以及最高告警级别的告警颜色。a5.将业务1更新的告警状态与本地缓存中业务1已有的告警状态进行比较,当二者不同时,将更新的告警状态存储至本地缓存中并在显示模块中进行显示。当业务1还存在客户层时,还包括a6.根据业务1的本层告警数据和服务层告警数据计算客户层的告警状态;如果客户层为多层,则根据全网业务层次拓扑结构,从最接近业务1本层的客户层开始,自下而上通过递归计算,得到各客户层的告警状态,分别存储至本地缓存中,并在显示模块中进行显示。本发明的监测系统,适用于上述各创建方法,通过业务健康指数可以更准确、简洁地体现端到端业务的当前工作状态,评估业务产生严重故障的风险。通信系统维护人员可以根据告警状态快速定位重要的故障,进行检测,降低工程中业务出现严重故障的风险。本发明不局限于上述实施方式,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1