告警处理方法及装置的制造方法

文档序号:10626636阅读:487来源:国知局
告警处理方法及装置的制造方法
【专利摘要】本发明公开了一种告警处理方法及装置,其中,该方法包括:控制器接收到来自网络设备的告警;该控制器对告警进行分析得出分析结果;该控制器依据分析结果对告警进行处理,通过本发明,解决了相关技术中,不仅存在告警处理不及时,而且在告警数量多的情况下,造成上层网络设备性能低下的问题,进而达到了高效及时处理告警的效果。
【专利说明】
告警处理方法及装置
技术领域
[0001 ] 本发明涉及通信领域,具体而言,涉及一种告警处理方法及装置。
【背景技术】
[0002]在通讯网络中,网络由许多通讯设备节点组成,这些网络节点叫做网元。网元之间通过通讯线路进行连接,包括光纤电缆等多种形式。网元则分散分布在各个地区,有的在城市里的通讯大楼实验室里,有的网元在偏远地区。然而这些网元的设备需要进行配置,维护和监控,不可能每处都派人值守,这样就需要一个中心网络管理系统,放在中心机房,通过远程通讯对网络上各个节点进行配置,维护和监控。
[0003]通过控制器管理网络可以由一种新出现的网络管理控制系统来实现。在这个控制系统中,把传统网管中对业务资源的控制功能独立出来,仅仅关注业务资源。控制器可以按树型层次化组织,以便关联大规模网络。其中,直接管理网元的可以称为域控制器(DomainController,或者 D-ControlIer,简称为 DC);而上层的控制器(Super Controller,或者S-Controller,简称为SC)不直接管理网元,而是管理域控制器,然后再通过域控制器提供的虚拟网络管理,实现对实际网络的管理。图1是相关技术中使用控制器管控网络的组网示意图,如图1所示,在一个应用场景中,控制器形成树形管理体系,上层是SC,底层的DC划分管理域,管理通讯网络和网元。控制器除了南向和网络设备通过接口进行管理,还有北向接口可以让应用层的网络APP (Applicat1n)接入进行网络管理,还可以通过侧接口,同网管平面(包括:网元管理系统(Element Management System,简称为EMS),网络管理系统(Network Management System,简称为 NMS),或者操作支撑系统(Operat1n SupportSystem,简称为OSS))沟通管理信息。网络APP是网络的实际业务应用,使用控制器提供的资源,发出业务建立,删除,修改的请求。而控制器根据网络APP的请求建立,删除,修改业务,并对业务的告警,性能进行监控。图2是相关技术中软件定义网络(Software DefinedNetwork,简称为SDN)网络中控制器与其它网络实体之间的关系示意图,如图2所示,DC直接管理通讯网络,而SC管理DC,同时还可以和传统网络管理系统进行交流,最终提供给APP提供资源和服务。
[0004]网络实际运行过程中,可能会遇到故障,或者收到干扰而通讯质量下降。一旦发送这种情况,网络设备就会报告警。由于网络设备直接的通讯是密切关联的,一个设备或者一部分资源有故障上报告警,就会引发网络大面积产生告警。产生非常多的告警量。对网络管理员来说,这么多告警要找出真正的故障原因是困难的。网络中一个故障的出现会引发一个直接反映该故障的告警,同时由于故障影响到其他设备或者业务,会引发一系列告警。例如,告警A引发了告警B,告警A是根源告警,告警B是衍生告警。
[0005]在传统的网络中,告警都是在设备产生的,网络控制器接收到告警后直接将告警转发给处理告警的上层网络设备,因而在相关技术中,不仅存在告警处理不及时,而且在告警数量多的情况下,造成上层网络设备性能低下的问题。

【发明内容】

[0006]本发明提供了一种告警处理方法及装置,以至少解决相关技术中,不仅存在告警处理不及时,而且在告警数量多的情况下,造成上层网络设备性能低下的问题。
[0007]根据本发明的一个方面,提供了一种告警处理方法,包括:控制器接收到来自网络设备的告警;所述控制器对所述告警进行分析得出分析结果;所述控制器依据所述分析结果对所述告警进行处理。
[0008]优选地,所述控制器对所述告警进行分析得到所述分析结果包括以下至少之一:依据产生所述告警的告警原因,分析得出所述告警是否对控制器管理的业务产生影响的所述分析结果;依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系,分析得出所述告警是否对所述控制器管理的所述业务产生影响的所述分析结果。
[0009]优选地,依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系,分析得出所述告警是否对所述控制器管理的所述业务产生影响的所述分析结果包括以下之一:在产生所述告警的根资源不被所述控制器管理的业务所占用,并且也没有所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务不产生影响;在产生所述告警的根资源不被所述控制器管理的业务所占用,但所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务产生影响;在产生所述告警的根资源不被所述控制器管理的业务所占用,所述根资源对应的子资源也不被所述控制器管理的业务所占用,但所述根资源和/或所述根资源对应的子资源与所述控制器管理的业务存在映射关系的情况下,确定所述告警对所述控制器管理的所述业务产生影响;在产生所述告警的根资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务产生影响。
[0010]优选地,所述控制器依据所述分析结果对所述告警进行处理包括以下之一:在依据所述告警原因,分析得出所述告警对所述控制器管理的业务不产生影响的情况下,对所述告警进行抑制;在依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系确定所述告警对所述控制器管理的所述业务不产生影响的情况下,对所述告警进行抑制;在产生所述告警的根资源不被所述控制器管理的业务所占用,但所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,将所述告警衍生为子资源衍生告警;在产生所述告警的根资源不被所述控制器管理的业务所占用,所述根资源对应的子资源也不被所述控制器管理的业务所占用,但所述根资源和/或所述根资源对应的子资源与所述控制器管理的业务存在映射关系的情况下,依据所述映射关系,将所述告警衍生为关系衍生告警;在产生所述告警的根资源被所述控制器管理的业务所占用的情况下,直接将所述告警上报给上层网络设备。
[0011]优选地,在对所述告警进行衍生处理的情况下,还包括:记录所述告警与衍生后的衍生告警之间的关联关系,其中,所述衍生告警包括:子资源衍生告警和/或关系衍生告警;将所述衍生告警以及所述关联关系上报给上层网络设备,和/或提供所述关联关系供所述控制器管理系统中的网元设备查询。
[0012]优选地,在所述控制器依据所述分析结果对所述告警进行处理之后,还包括:依据所述告警所引起的网元设备的状态变化,或者所述告警的代表资源的对象的状态变化,生成所述网元设备或者所述代表资源的对象的状态通知;将生成的所述网元设备或者所述代表资源的对象的状态通知上报给上层网络设备。
[0013]根据本发明的另一方面,提供了一种告警处理装置,应用于控制器,包括:接收模块,用于接收到来自网络设备的告警;分析模块,用于对所述告警进行分析得出分析结果;处理模块,用于依据所述分析结果对所述告警进行处理。
[0014]优选地,所述分析模块包括以下至少之一:第一分析单元,用于依据产生所述告警的告警原因,分析得出所述告警是否对控制器管理的业务产生影响的所述分析结果;第二分析单元,用于依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系,分析得出所述告警是否对所述控制器管理的所述业务产生影响的所述分析结果。
[0015]优选地,所述第二分析单元包括以下之一:第一确定子单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,并且也没有所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务不产生影响;第二确定子单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,但所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务产生影响;第三确定子单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,所述根资源对应的子资源也不被所述控制器管理的业务所占用,但所述根资源和/或所述根资源对应的子资源与所述控制器管理的业务存在映射关系的情况下,确定所述告警对所述控制器管理的所述业务产生影响;第四确定子单元,用于在产生所述告警的根资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务产生影响。
[0016]优选地,所述处理模块包括以下之一:第一抑制单元,用于在依据所述告警原因,分析得出所述告警对所述控制器管理的业务不产生影响的情况下,对所述告警进行抑制;第二抑制单元,用于在依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系确定所述告警对所述控制器管理的所述业务不产生影响的情况下,对所述告警进行抑制;第一衍生单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,但所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,将所述告警衍生为子资源衍生告警;第二衍生单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,所述根资源对应的子资源也不被所述控制器管理的业务所占用,但所述根资源和/或所述根资源对应的子资源与所述控制器管理的业务存在映射关系的情况下,依据所述映射关系,将所述告警衍生为关系衍生告警;第一上报单元,用于在产生所述告警的根资源被所述控制器管理的业务所占用的情况下,直接将所述告警上报给上层网络设备。
[0017]优选地,该处理模块还包括:记录单元,用于在对所述告警进行衍生处理的情况下,记录所述告警与衍生后的衍生告警之间的关联关系,其中,所述衍生告警包括:子资源衍生告警和/或关系衍生告警;第二上报单元,用于将所述衍生告警以及所述关联关系上报给上层网络设备,和/或,提供单元,用于提供所述关联关系供所述控制器管理系统中的网元设备查询。
[0018]优选地,该装置还包括:生成模块,用于依据所述告警所引起的网元设备的状态变化,或者所述告警的代表资源的对象的状态变化,生成所述网元设备或者所述代表资源的对象的状态通知;上报模块,用于将生成的所述网元设备或者所述代表资源的对象的状态通知上报给上层网络设备。
[0019]优选地,所述控制器包括以下至少之一:域控制器DC、超级控制器SC,其中,所述SC为所述DC的上层控制器。
[0020]通过本发明,采用控制器接收到来自网络设备的告警;所述控制器对所述告警进行分析得出分析结果;所述控制器依据所述分析结果对所述告警进行处理,解决了相关技术中,不仅存在告警处理不及时,而且在告警数量多的情况下,造成上层网络设备性能低下的问题,进而达到了高效及时处理告警的效果。
【附图说明】
[0021]此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0022]图1是相关技术中使用控制器管控网络的组网示意图;
[0023]图2是相关技术中SDN网络中控制器与其它网络实体之间的关系示意图;
[0024]图3是根据本发明实施例的告警处理方法的流程图;
[0025]图4是根据本发明实施例的告警处理装置的结构框图;
[0026]图5是根据本发明实施例的告警处理装置中分析模块44的优选结构框图;
[0027]图6是根据本发明实施例的告警处理装置中分析模块44中第二分析单元54的优选结构框图;
[0028]图7是根据本发明实施例的告警处理装置中处理模块46的优选结构框图一;
[0029]图8是根据本发明实施例的告警处理装置中处理模块46的优选结构框图二;
[0030]图9是根据本发明实施例的告警处理装置的优选结构框图;
[0031]图10是根据本发明实施例的控制器告警分析模块的结构示意图;
[0032]图11是根据本发明优选实施例一的告警上报处理的示意图;
[0033]图12是根据本发明优选实施例二的告警上报处理的示意图。
【具体实施方式】
[0034]下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0035]在本实施例中提供了一种告警处理方法,图3是根据本发明实施例的告警处理方法的流程图,如图3所示,该流程包括如下步骤:
[0036]步骤S302,控制器接收到来自网络设备的告警,需要说明的是,该网络设备可以是产生该告警的网元设备本身,也可以是控制器设备;
[0037]步骤S304,该控制器对告警进行分析得出分析结果;
[0038]步骤S306,该控制器依据分析结果对告警进行处理。
[0039]通过上述步骤,由控制器来对接收到的告警进行分析处理,解决了相关技术中,不仅存在告警处理不及时,而且在告警数量多的情况下,造成上层网络设备性能低下的问题,进而达到了高效及时处理告警的效果。
[0040]优选地,控制器对告警进行分析得到分析结果时,采用不同的分析依据,分析的结果也可以不同,例如,可以依据产生告警的告警原因,分析得出告警是否对控制器管理的业务产生影响的分析结果;也可以依据产生告警的资源与控制器管理的业务所占用的资源之间的关系,分析得出告警是否对控制器管理的业务产生影响的分析结果。
[0041]在依据产生告警的资源与控制器管理的业务所占用的资源之间的关系,分析得出告警是否对控制器管理的业务产生影响的分析结果时,可以包括以下之一:在产生告警的根资源不被控制器管理的业务所占用,并且也没有根资源对应的子资源被控制器管理的业务所占用的情况下,确定告警对控制器管理的业务不产生影响;在产生告警的根资源不被控制器管理的业务所占用,但根资源对应的子资源被控制器管理的业务所占用的情况下,确定告警对控制器管理的业务产生影响;在产生告警的根资源不被控制器管理的业务所占用,根资源对应的子资源也不被控制器管理的业务所占用,但根资源和/或根资源对应的子资源与控制器管理的业务存在映射关系的情况下,确定告警对控制器管理的业务产生影响;在产生告警的根资源被控制器管理的业务所占用的情况下,确定告警对控制器管理的业务产生影响。
[0042]控制器依据分析结果对告警进行处理时,依据分析结果的不同,对该告警进行处理也不同,下面举例说明:可以在以下情况下,对告警进行抑制处理:例如,在依据告警原因,分析得出告警对控制器管理的业务不产生影响的情况下,对告警进行抑制;又例如,在依据产生告警的资源与控制器管理的业务所占用的资源之间的关系确定告警对控制器管理的业务不产生影响的情况下,对告警进行抑制;可以在以下情况下,对该告警进行衍生处理:例如,在产生告警的根资源不被控制器管理的业务所占用,但根资源对应的子资源被控制器管理的业务所占用的情况下,将告警衍生为子资源衍生告警;又例如,在产生告警的根资源不被控制器管理的业务所占用,根资源对应的子资源也不被控制器管理的业务所占用,但根资源和/或根资源对应的子资源与控制器管理的业务存在映射关系的情况下,依据映射关系,将告警衍生为关系衍生告警;另外,在产生告警的根资源被控制器管理的业务所占用的情况下,直接将告警上报给上层网络设备。需要说明的是,此处的上层网络设备是一个相对概念,例如,当控制器DC接收到该告警时,该上层网络设备即是该控制器DC的上层网络设备SC,再例如,当上层网络设备SC接收到该告警时,该上层网络设备即是该SC的上层网络设备WS。
[0043]需要说明的是,在对告警进行衍生处理的情况下,还可以:记录告警与衍生后的衍生告警之间的关联关系,其中,衍生告警包括:子资源衍生告警和/或关系衍生告警;将衍生告警以及关联关系上报给上层网络设备,和/或提供关联关系供控制器管理系统中的网元设备查询。
[0044]另外,在依据分析结果对告警进行处理之后,还可以包括以下处理:依据告警所引起的网元设备的状态变化,或者告警的代表资源的对象的状态变化,生成网元设备或者代表资源的对象的状态通知;将生成的网元设备或者代表资源的对象的状态通知上报给上层网络设备。
[0045]在本实施例中还提供了一种告警处理装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
[0046]图4是根据本发明实施例的告警处理装置的结构框图,如图4所示,该装置可以应用于控制器,包括接收模块42、分析模块44和处理模块46,下面对该装置进行说明。
[0047]接收模块42,用于接收到来自网络设备的告警;分析模块44,连接至上述接收模块42,用于对告警进行分析得出分析结果;处理模块46,连接至上述分析模块44,用于依据分析结果对告警进行处理。
[0048]图5是根据本发明实施例的告警处理装置中分析模块44的优选结构框图,如图5所示,该分析模块44包括以下至少之一:第一分析单元52、第二分析单元54,下面对该分析模块44进行说明。
[0049]第一分析单元52,用于依据产生告警的告警原因,分析得出告警是否对控制器管理的业务产生影响的分析结果;第二分析单元54,用于依据产生告警的资源与控制器管理的业务所占用的资源之间的关系,分析得出告警是否对控制器管理的业务产生影响的分析结果。
[0050]图6是根据本发明实施例的告警处理装置中分析模块44中第二分析单元54的优选结构框图,如图6所示,该第二分析单元54包括以下之一:第一确定子单元62、第二确定子单元64、第三确定子单元66、第四确定子单元68,下面对该第二分析单元54进行说明。
[0051]第一确定子单元62,用于在产生告警的根资源不被控制器管理的业务所占用,并且也没有根资源对应的子资源被控制器管理的业务所占用的情况下,确定告警对控制器管理的业务不产生影响;第二确定子单元64,用于在产生告警的根资源不被控制器管理的业务所占用,但根资源对应的子资源被控制器管理的业务所占用的情况下,确定告警对控制器管理的业务产生影响;第三确定子单元66,用于在产生告警的根资源不被控制器管理的业务所占用,根资源对应的子资源也不被控制器管理的业务所占用,但根资源和/或根资源对应的子资源与控制器管理的业务存在映射关系的情况下,确定告警对控制器管理的业务产生影响;第四确定子单元68,用于在产生告警的根资源被控制器管理的业务所占用的情况下,确定告警对控制器管理的业务产生影响。
[0052]图7是根据本发明实施例的告警处理装置中处理模块46的优选结构框图一,如图7所示,该处理模块46包括以下之一:第一抑制单元70、第二抑制单元72、第一衍生单元74、第二衍生单元76、第一上报单元78,下面对该处理模块46进行说明。
[0053]第一抑制单元70,用于在依据告警原因,分析得出告警对控制器管理的业务不产生影响的情况下,对告警进行抑制;第二抑制单元72,用于在依据产生告警的资源与控制器管理的业务所占用的资源之间的关系确定告警对控制器管理的业务不产生影响的情况下,对告警进行抑制;第一衍生单元74,用于在产生告警的根资源不被控制器管理的业务所占用,但根资源对应的子资源被控制器管理的业务所占用的情况下,将告警衍生为子资源衍生告警;第二衍生单元76,用于在产生告警的根资源不被控制器管理的业务所占用,根资源对应的子资源也不被控制器管理的业务所占用,但根资源和/或根资源对应的子资源与控制器管理的业务存在映射关系的情况下,依据映射关系,将告警衍生为关系衍生告警;第一上报单元78,用于在产生告警的根资源被控制器管理的业务所占用的情况下,直接将告警上报给上层网络设备。
[0054]图8是根据本发明实施例的告警处理装置中处理模块46的优选结构框图二,如图8所示,该处理模块46除包括上述第一衍生模块74和/或第一衍生模块76外,还包括:记录单元82、第二上报单元84和/或提供单元86,下面对该处理模块46进行说明。
[0055]记录单元82,用于在对告警进行衍生处理的情况下,记录告警与衍生后的衍生告警之间的关联关系,其中,衍生告警包括:子资源衍生告警和/或关系衍生告警;第二上报单元84,用于将衍生告警以及关联关系上报给上层网络设备,和/或,提供单元86,用于提供关联关系供控制器管理系统中的网元设备查询。
[0056]图9是根据本发明实施例的告警处理装置的优选结构框图,如图9所示,该装置除包括图4所示的所有模块外,还包括:生成模块92和上报模块94,下面对该装置进行说明。
[0057]生成模块92,连接至上述处理模块46,用于依据告警所引起的网元设备的状态变化,或者告警的代表资源的对象的状态变化,生成网元设备或者代表资源的对象的状态通知;上报模块94,连接至上述生成模块92,用于将生成的网元设备或者代表资源的对象的状态通知上报给上层网络设备。
[0058]优选地,该控制器可以包括以下至少之一:域控制器DC、超级控制器SC,其中,SC为DC的上层控制器。需要指出的是,SC可以有多个,从DC看,SC都是上层控制器,SC上面如果还有SC,上面的是更上层的控制器,这个是相对关系。
[0059]在SDN控制器管控的网络中,由于SDN控制器的控制特性,其只关心业务相关的资源,而且由于权限划分原因,原始告警可能是由与业务无关的资源产生的,或者是由控制器不管理的业务产生的,但是对控制器管理的业务会产生影响,造成业务不通,或者质量下降。由于控制器的主要核心是进行业务管理,在网络管理系统或者控制平面是不对设备资源和业务产生告警的,鉴于此,在本实施例中,提出了告警也要表现成业务的告警,要由控制器衍生出受影响的业务告警。另外,除了告警衍生外,控制器还需要对告警进行影响业务的分析,告警继续上报等处理。
[0060]下面对该方案进行简单说明。
[0061]在网络控制器中增加一个告警分析模块,图10是根据本发明实施例的控制器告警分析模块的结构示意图,如图10所示,该告警分析模块执行以下步骤的分析处理:
[0062]步骤1:设备检测到故障后产生告警,同时上报给控制器和网管。
[0063]步骤2:控制器收到设备告警后进行分析和处理,包括下面几个子步骤的一个或多个的灵活组合:
[0064]步骤2.1:根据告警原因进行分类,部分告警原因对业务没有影响,如果收到的是这些告警原因之一,该告警可以不处理,或者加以抑制。这样的告警原因包括但不限于??温度告警,电压告警,烟雾告警,等等很多,不一一列出。控制器需要处理的告警,包括但不限于:LOS(Loss of Signal),DEG(Degraded Signal),LOC(Loss of Connectivity/Loss ofConnect1n),AIS (Alarm Indicat1n Signal)。
[0065]步骤2.2:分析告警,发现产生告警的资源,不是业务占用的资源,也不对业务所占用的资源产生影响,这样的告警也可以不处理,或者加以抑制。这样的资源包括但不限于:电源模块,风扇模块,背板总线等等不一一列出。控制器需要处理的产生告警资源,包括但不限于:物理端口,连接终端点,路径终端点,逻辑终端点,流点,流点池。
[0066]步骤2.3:分析告警,发现产生告警的资源,不是业务直接占用的资源,但是该资源下有子资源被业务占用,可以把告警衍生为业务所占用的子资源的告警,然后控制器把衍生告警上报给上层控制器和网管平面。原始告警可以根据实现需要继续上报或者不上报。
[0067]步骤2.4:分析告警,发现产生告警的资源,是业务占用的资源,上报的告警直接就属于业务的告警,可以不做衍生,把该告警继续上报给上层控制器和网管平面。
[0068]步骤2.5:分析告警,发现产生告警的资源,没有和业务的资源对象有直接对应关系,而是存在间接的映射关系(例如,虚拟化virtualizat1n),控制器根据这种间接的映射关系,衍生出业务资源的告警,然后控制器把衍生告警上报给上层控制和网管平面。原始告警可以根据实现需要继续上报或者不上报。
[0069]步骤2.6:分析告警,发现该告警是网元告警,但是控制器对该告警不感兴趣,而是对告警所引起的网元状态变化感兴趣,控制器抑制或丢弃该告警,生成状态通知,修改本地网元状态,将状态通知上报上层控制器和网管平面。
[0070]步骤2.7:控制器衍生出的新告警,原始告警和衍生告警的对应关系记录下来,并在上报告警时提供,或者提供查询,以便网管平面进行根因分析,找出故障根源,进行修复和排除故障。
[0071]步骤3:EMS从设备收到原始告警和从控制器收到衍生告警后,可以进行本地保存、显示、确认、注释等管理,EMS把这两个告警都上报给匪S/0SS。
[0072]步骤4:上层控制器收到下层控制器上报的衍生告警后,采用步骤2的分析处理方法,进行本地分析处理,结果上报APP和OSS/匪S。
[0073]步骤5:APP收到业务告警后,用于界面显示,以及业务质量评估等用途。
[0074]步骤6:0SS/WS收到EMS上报的原始告警,和衍生告警,以及从上层控制器上报的衍生告警,进行综合分析,包括分析告警关联关系,根因分析等,为网络运行、维护、排除故障、计费等提供根据。
[0075]通过控制器对设备资源告警进行处理的方法,包括收到告警后的分析,处理,衍生,和继续向其他系统上报的方法。为控制器处理告警提供一种高效可行的,满足业务管理目的的告警处理方法。
[0076]下面以一个跨多控制器的业务中产生告警为例,说明告警分析处理方法。
[0077]优选实施例一
[0078]图11是根据本发明优选实施例一的告警上报处理的示意图,如图11所示,域控制器DCl和DC2,划分区域管理通讯网络,以及超级控制器SC,作为上层控制器管理DCl和DC2。两个管理域中连接NE1,NE2到NE6组成通讯网络。NEl到NE6的连线表示一个APP关心的业务,业务A端点在NEl, Z端点在NE6,中间经过NE2,NE3,NE4,NE5,分别被DCl, DC2直接管理,图中虚线表示管理关系。DCUDC2和SC分别有配对的网管系统,假设在网元I产生了一个告警Alarml,其他几个网元也有告警产生。
[0079]第I步:NE1检测到故障,烟雾探测器感觉到烟雾超标,烟雾探测模块产生告警alarml,同时上报给DCl和EMSl。
[0080]第2步:DC1收到Alarml后分析,分析模块对告警原因进行分析,发现alarml的告警原因是烟雾告警,属于和业务无关的告警原因,于是DCl忽略这个告警。
[0081]第3步:NE2检测到故障,风扇模块发现风扇转速异常,产生告警alarm2,同时上报给 DCl 和 EMSl0
[0082]第4步:DC1收到alarm2后分析,分析模块对告警源进行分析,发现alarm2产生的资源是风扇模块,和业务无关,于是DCl忽略这个告警。
[0083]第5步:NEl的OTN光端口有故障,OTN有信号劣化告警,产生告警alarm3,同时上报给DCl和EMSlo
[0084]第6步:DC1收到alarm3后分析,分析模块分析OTN端口,该资源虽然没有被业务直接使用,但是OTN下的子通道0DU1-1被正在业务I使用,DCl衍生出了 0DU1-1资源的劣化告警alarm4,并记录alarm3-alarm4的对应关系,然后DCl把alarm4报告给SC和EMSl,并附带alarm3-alarm4的关联关系。
[0085]第7步:EMS总共收到alarml,alarm2,alarm3,alarm4。在进行传统的EMS告警管理的同时,把这几个告警都上报给匪S/0SS1。
[0086]第8步:SC收到告警alarm4,分析模块发现,由于告警的资源ODUl以及所在的业务I在SC经过虚拟化(virtualizat1n)和映射到业务2,并且ODUl虚拟化成LTPl。衍生模块SC从alarm4衍生出LTPl资源的alarm5,并记录alarm4_alarm5的对应关系。SC把alarm5报告给app和NMS/0SS1,并附带alarm4_alarm5的关联关系。
[0087]第9 步:NMS/0SS1 总共收到告警 alarml,alarm2, alarm3, alarm4, alarm5。由于已经有alarm3-alarm4-alarm5的衍生对应关系,NMS/0SS1很容易分析得出alarm3是根源告警,需要通知维护人员修复设备,排除故障。
[0088]第10步:APP收到alarm5后,得知自己的业务2,产生了告警5,业务2收到影响。App用户以此和网络运营商沟通协调。
[0089]类似的NE3,NE4产生的告警,在DC2,EMS2,NMS/0SS2进行了类似的处理流程。
[0090]优选实施例二
[0091]图12是根据本发明优选实施例二的告警上报处理的示意图,如图12所示,网络中的一个网元NE1,被实施的域控制器DCl管理,同时被EMSl网管系统管理,NEl产生了一个告警a,结果处理流程如下
[0092]第I步:NE1检测到故障,上报了告警a。
[0093]第2步:DC1对告警a进行分析,根据告警原因和告警源进行分析,发现告警a的子资源被业务使用,按照分析结果把告警a丢弃,衍生了告警b,然后把告警b上报给上层控制器SC1,和网管系统EMS1.
[0094]第3步:EMS1收到告警a和告警b后,告警a和b都上报到上层网管0SS1。
[0095]第4步:SCl收到DCl上报的告警b后,根据告警原因和告警源进行分析,发现告警b的资源经过虚拟化后,变成了逻辑对象objl,他们属于虚拟化的映射关系,SCl丢弃告警b,衍生了告警c。SCl把告警c同时上报给app和0SS1。
[0096]第5步:app收到告警通知,得知自己的业务中的抽象对象objl有告警C,出于排除故障的目的,app向OSSl发出查询所有告警以及关联关系的请求。
[0097]第6步:0SS1从SCl查询告警关联关系,得到告警b和告警c之间的关联关系。
[0098]第7步:0SS1从EMSl查询告警关联关系。
[0099]第8步:EMS1从DCl那里查到告警a和告警b的关联关系。汇报给OSSl。
[0100]第9步:0SS1汇总得到告警a,b,c的关联关系,报告给APP。
[0101]第10步:app从查询应答得到所有告警a,b,c并知道a是根源告警。用于通知运维人员进行修复设备排除故障。
[0102]显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
[0103] 以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种告警处理方法,其特征在于,包括: 控制器接收到来自网络设备的告警; 所述控制器对所述告警进行分析得出分析结果; 所述控制器依据所述分析结果对所述告警进行处理。2.根据权利要求1所述的方法,其特征在于,所述控制器对所述告警进行分析得到所述分析结果包括以下至少之一: 依据产生所述告警的告警原因,分析得出所述告警是否对控制器管理的业务产生影响的所述分析结果; 依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系,分析得出所述告警是否对所述控制器管理的所述业务产生影响的所述分析结果。3.根据权利要求2所述的方法,其特征在于,依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系,分析得出所述告警是否对所述控制器管理的所述业务产生影响的所述分析结果包括以下之一: 在产生所述告警的根资源不被所述控制器管理的业务所占用,并且也没有所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务不产生影响; 在产生所述告警的根资源不被所述控制器管理的业务所占用,但所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务产生影响; 在产生所述告警的根资源不被所述控制器管理的业务所占用,所述根资源对应的子资源也不被所述控制器管理的业务所占用,但所述根资源和/或所述根资源对应的子资源与所述控制器管理的业务存在映射关系的情况下,确定所述告警对所述控制器管理的所述业务产生影响; 在产生所述告警的根资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务产生影响。4.根据权利要求3所述的方法,其特征在于,所述控制器依据所述分析结果对所述告警进行处理包括以下之一: 在依据所述告警原因,分析得出所述告警对所述控制器管理的业务不产生影响的情况下,对所述告警进行抑制; 在依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系确定所述告警对所述控制器管理的所述业务不产生影响的情况下,对所述告警进行抑制; 在产生所述告警的根资源不被所述控制器管理的业务所占用,但所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,将所述告警衍生为子资源衍生告警; 在产生所述告警的根资源不被所述控制器管理的业务所占用,所述根资源对应的子资源也不被所述控制器管理的业务所占用,但所述根资源和/或所述根资源对应的子资源与所述控制器管理的业务存在映射关系的情况下,依据所述映射关系,将所述告警衍生为关系衍生告警; 在产生所述告警的根资源被所述控制器管理的业务所占用的情况下,直接将所述告警上报给上层网络设备。5.根据权利要求4所述的方法,其特征在于,在对所述告警进行衍生处理的情况下,还包括: 记录所述告警与衍生后的衍生告警之间的关联关系,其中,所述衍生告警包括:子资源衍生告警和/或关系衍生告警; 将所述衍生告警以及所述关联关系上报给上层网络设备,和/或提供所述关联关系供所述控制器管理系统中的网元设备查询。6.根据权利要求1至5中任一项所述的方法,其特征在于,在所述控制器依据所述分析结果对所述告警进行处理之后,还包括: 依据所述告警所引起的网元设备的状态变化,或者所述告警的代表资源的对象的状态变化,生成所述网元设备或者所述代表资源的对象的状态通知; 将生成的所述网元设备或者所述代表资源的对象的状态通知上报给上层网络设备。7.一种告警处理装置,其特征在于,应用于控制器包括: 接收模块,用于接收到来自网络设备的告警; 分析模块,用于对所述告警进行分析得出分析结果; 处理模块,用于依据所述分析结果对所述告警进行处理。8.根据权利要求7所述的装置,其特征在于,所述分析模块包括以下至少之一: 第一分析单元,用于依据产生所述告警的告警原因,分析得出所述告警是否对控制器管理的业务产生影响的所述分析结果; 第二分析单元,用于依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系,分析得出所述告警是否对所述控制器管理的所述业务产生影响的所述分析结果O9.根据权利要求8所述的装置,其特征在于,所述第二分析单元包括以下之一: 第一确定子单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,并且也没有所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务不产生影响; 第二确定子单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,但所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务产生影响; 第三确定子单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,所述根资源对应的子资源也不被所述控制器管理的业务所占用,但所述根资源和/或所述根资源对应的子资源与所述控制器管理的业务存在映射关系的情况下,确定所述告警对所述控制器管理的所述业务产生影响; 第四确定子单元,用于在产生所述告警的根资源被所述控制器管理的业务所占用的情况下,确定所述告警对所述控制器管理的所述业务产生影响。10.根据权利要求9所述的装置,其特征在于,所述处理模块包括以下之一: 第一抑制单元,用于在依据所述告警原因,分析得出所述告警对所述控制器管理的业务不产生影响的情况下,对所述告警进行抑制; 第二抑制单元,用于在依据产生所述告警的资源与所述控制器管理的业务所占用的资源之间的关系确定所述告警对所述控制器管理的所述业务不产生影响的情况下,对所述告警进行抑制; 第一衍生单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,但所述根资源对应的子资源被所述控制器管理的业务所占用的情况下,将所述告警衍生为子资源衍生告警; 第二衍生单元,用于在产生所述告警的根资源不被所述控制器管理的业务所占用,所述根资源对应的子资源也不被所述控制器管理的业务所占用,但所述根资源和/或所述根资源对应的子资源与所述控制器管理的业务存在映射关系的情况下,依据所述映射关系,将所述告警衍生为关系衍生告警; 第一上报单元,用于在产生所述告警的根资源被所述控制器管理的业务所占用的情况下,直接将所述告警上报给上层网络设备。11.根据权利要求10所述的装置,其特征在于,还包括: 记录单元,用于在对所述告警进行衍生处理的情况下,记录所述告警与衍生后的衍生告警之间的关联关系,其中,所述衍生告警包括:子资源衍生告警和/或关系衍生告警; 第二上报单元,用于将所述衍生告警以及所述关联关系上报给上层网络设备,和/或,提供单元,用于提供所述关联关系供所述控制器管理系统中的网元设备查询。12.根据权利要求7至11中任一项所述的装置,其特征在于,还包括: 生成模块,用于依据所述告警所引起的网元设备的状态变化,或者所述告警的代表资源的对象的状态变化,生成所述网元设备或者所述代表资源的对象的状态通知; 上报模块,用于将生成的所述网元设备或者所述代表资源的对象的状态通知上报给上层网络设备。13.根据权利要求7至11中任一项所述的装置,其特征在于,所述控制器包括以下至少之一:域控制器DC、超级控制器SC,其中,所述SC为所述DC的上层控制器。
【文档编号】H04L12/24GK105991332SQ201510088503
【公开日】2016年10月5日
【申请日】2015年2月26日
【发明人】陈俏钢, 薄开涛
【申请人】中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1