故障告警的方法及设备的制作方法

文档序号:7763982阅读:356来源:国知局
专利名称:故障告警的方法及设备的制作方法
技术领域
本发明实施例涉及通信领域,尤其涉及一种故障告警的方法及设备。
背景技术
告警是设备故障的体现,用以提醒运维人员,进行故障处理。但是不必要的告警可能会使运维人员误判,不利于故障处理。同时,大量的告警会造成设备稳定性差的误解,因此需要去除虚假和无用的告警,保留本质告警。在对象消亡时,容易产生很多无用或者虚假的告警。现有技术中提供两种告警方式方法1、父对象及其子对象的所有告警,都呈现给用户,不做关联处理,依靠运维人员的经验,判断主要告警来排障处理;方法2、管理站在呈现时,依据特定的告警,以及不同的对象,按照不同的模型做关联显不。但是,方法1的告警方式中,全部告警都呈现给用户,要求只有运维经验丰富的人员,才能抓获知告警对象的父子关联关系,从而抓住本质告警,排除故障,设备本身很难维护。方法2的告警方式中,虽然管理站可以对告警对象进行关联显示,但是管理站管理过多的网元,如果管理站维护告警对象的关联关系,则会造成管理站处理耗时时间长,甚至有可能造成管理站无法对其他网元的请求作处理。

发明内容
本发明实施例提供了一种故障告警的方法及设备,使得管理站根据网元的告警上报报文确定告警对象的父子关联关系。本发明实施例提供了一种故障告警的方法,包括当网元设备内部告警时,所述网元设备确定故障源网络设备标识OID和故障源的父对象OID ;所述网元设备向管理站发送携带所述故障源OID和父对象OID的告警上报报文。本发明实施例提供了一种故障告警的方法,包括管理站接收网元设备发送的告警上报报文;所述管理站解析所述告警上报报文中携带的故障源OID和父对象0ID,维护所述故障源OID和父对象OID的关联关系。本发明实施例提供了一种网元设备,包括确定单元,用于当网元设备内部告警时,确定故障源网络设备标识OID和故障源的父对象OID ;发送单元,用于向管理站发送携带所述故障源OID和父对象OID的告警上报报文。本发明实施例提供了一种管理设备,包括接收单元,用于接收网元设备发送的告警上报报文;解析单元,用于解析所述告警上报报文中携带的故障源OID和父对象0ID,维护所述故障源OID和父对象OID的关联关系。与现有技术相比,本发明实施例至少具有以下优点本发明实施例中,网元设备向管理站发送携带故障源OID和父对象OID的告警上报报文,使得管理站能够根据告警上报报文确定告警对象的父子关联关系,从而使得管理站即能够显示告警对象的父子关联关系,又不需要预先配置存储大量网元设备的对象的父子关联关系,提高管理站的工作效率。


为了更清楚地说明本发明的实施例或现有技术中的技术方案,下面将对本发明的实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本发明实施例一提供的故障告警的方法的流程示意图;图2是本发明实施例二提供的方法所应用的网管系统结构示意图;图3是本发明实施例二提供的网元向管理站发送告警上报报文的过程示意图;图4是本发明实施例二提供的告警清除的过程示意图;图5-图7是本发明实施例三提供的网元设备的结构示意图;图8是本发明实施例四提供的管理设备的结构示意图。
具体实施例方式下面将结合本发明的实施例中的附图,对本发明的实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明的实施例保护的范围。实施例一本发明实施例一提供一种故障告警的方法,如图1所示,包括步骤101,当网元设备内部告警时,所述网元设备确定故障源网络设备标识OID和故障源的父对象0ID;步骤102,所述网元设备向管理站发送携带所述故障源OID和父对象OID的告警上报报文。管理站接收网元设备发送的告警上报报文后,解析所述告警上报报文中携带的故障源OID和父对象0ID,维护所述故障源OID和父对象OID的关联关系。其中,所述网元设备确定故障源网络设备标识OID和故障源的父对象OID包括所述网元设备的OM(Operation and Maintenance,操作维护模块)接收告警对象发送的告警消息,所述告警消息携带故障源和故障源父对象的索引信息、以及告警编号;所述网元设备查找存储的告警编号、故障对象类型和父对象类型的对应关系,确定所述告警消息携带的告警编号对应的故障对象类型和父对象类型;所述网元设备根据所述故障对象类型和故障源的索引信息确定故障源0ID,根据所述父对象类型和父对象的索引信息确定父对象0ID。
所述网元设备在告警原始信息表中记录告警编号、故障对象类型和父对象类型的对应关系,所述告警原始信息(即告警编号、故障对象类型和父对象类型的对应关系)存储于所述网元设备的配置文件。该方法还包括步骤103,网元设备在活跃告警表中记录故障源OID和故障源的父对象OID的对应关系。所述网元设备向管理站发送携带所述故障源OID和父对象OID的告警上报报文之前,还包括所述网元设备在活跃告警表中遍历查找故障对象的活跃告警、以及以所述故障对象为父对象的所有子对象的活跃告警,清除查找到的活跃告警。所述网元设备在活跃告警表中清除活跃告警之前,还包括所述网元设备向所述管理站发送携带所述故障源OID 的清除通知报文,用以通知所述管理站清除所述故障对象的告警、以及以所述故障对象为父对象的所有子对象的告警。所述管理站接收所述网元设备发送的清除通知报文,根据所述清除通知消息携带的故障源0ID,清除故障对象的告警、以及以所述故障对象为父对象的所有子对象的告警。所述网元设备在活跃告警表中遍历查找以所述故障对象为父对象的所有子对象的活跃告警包括所述网元设备查找以所述故障对象为父对象的所有活跃告警记录;所述网元设备查找该活跃告警记录对应的故障源对象,查找以该故障源对象为父对象的所有活跃告警记录。实施例二本发明实施例二提供一种故障告警的方法,该实施例提供的方法适用于 SNMP (Simple Network Management Protocol,简单网络管理协议)网管系统,管理站与网元之间、以及对象与对象之间的关联关系如图2所示。本发明实施例提供的故障告警的方法,在网元内部定义的原始告警信息表中预先定义各种故障的告警编号、以及该告警编号对应的故障对象类型和父对象类型,在 MIB (Management Information Base,管理信息库)中定义告警上报TRAP (陷阱报文)和活跃告警记录表结构,TRAP中体现两个源的OID (Object Identification,网络设备标识), 分别为故障源OID和父对象的0ID,其中OID中包含MIB中定义的对象类型和索引信息。网元将上报的告警信息记录到活跃告警表中,该表结构包含了父子对象的OID信息。具体的,网元向管理站发送告警上报报文的过程如图3所示,包括以下步骤步骤301,网元内部故障对象产生告警,通知上报源对象。其中,上报源对象为故障对象(告警源)的父对象。步骤302,上报源对象封装故障对象发送的告警消息并向网元OM发送,告警消息中携带故障源实例索引信息。其中,告警消息内包括告警编号、故障对象位置和上报源对象的位置信息等。步骤303,网元OM解析告警消息,获取告警消息中携带的告警编号和故障源实例索引信息,封装成完整的故障源OID和父对象0ID。具体的,网元OM在原始告警信息表中查找告警编号对应的故障对象类型和父对象类型。网元OM根据故障源实例索引信息中的故障对象位置信息和查找到的故障对象类型封装成完整的故障源0ID,根据故障源实例索引信息中的父对象位置信息和查找到的父对象类型封装成完整的父对象OID。步骤304,网元OM向管理站发送携带故障源OID和父对象OID的告警上报报文。步骤305,管理站解析告警上报报文,获取其中携带的故障源OID和父对象0ID,维护故障源对象与其父对象的关联关系。当某一对象消亡时,网元OM需要首先在活跃告警记录表中清除相应告警,并通知管理站清除相应告警,然后网元OM向管理站发送故障对象的告警,使得管理站只有故障对象的告警呈现给用户,消除无用告警,同时也解决了在父对象消亡时,子对象告警无法清除的问题。具体的,如图4所示,包括以下步骤步骤401,当对象故障或者被移出时,网元内部产生针对该故障的告警,网元OM在接收到该告警后,向管理站上报一条特殊告警编号的TRAP,通知管理站进行告警清除处理。步骤402,网元OM在活跃告警记录表中进行告警清除处理。网元OM在活跃告警记录表中查找以该对象为故障源的所有活跃告警,并作清除处理。网元OM在活跃告警记录表中查找以该故障对象为父对象的所有活跃告警记录,查找该记录对应的故障源,并查找以此故障源为父对象的所有活跃告警记录,依次类推下去,查找出所有子对象对应的活跃告警,做清除处理。步骤403,管理站接收TRAP,获取其中携带的故障对象0ID,进行活跃告警清除处理。管理站根据故障对象OID查找以该故障对象为故障源的所有活跃告警,并作清除处理;查找以该故障对象为父对象的所有活跃告警记录,查找该记录对应的故障源,并查找以此故障源为父对象的所有活跃告警记录,依次类推下去,查找出所有子对象对应的活跃告警,做清除处理。由此保证管理站上显示的活跃告警与网元内部记录的活跃告警相一致。步骤404,网元将故障告警上报给管理站。由于管理站已删除了针对该故障的其余告警,保证管理站上只保留针对该故障一条本质告警。需要说明的是,图4所示方法可以与图3结合,在步骤304之前,网元OM首先在活跃告警记录表中查找以故障对象为故障源的所有活跃告警,作清除处理;在活跃告警记录表中查找以故障对象为父对象的所有活跃告警记录,查找该记录对应的故障源,并查找以此故障源为父对象的所有活跃告警记录,依次类推下去,查找出所有子对象对应的活跃告警,做清除处理。网元OM还通知管理站做相应清除处理。在清除结束后,执行步骤304,网元OM向管理站上报故障告警报文。本发明实施例中,网元设备向管理站发送携带故障源OID和父对象OID的告警上报报文,使得管理站能够根据告警上报报文确定告警对象的父子关联关系,从而使得管理站即能够显示告警对象的父子关联关系,又不需要预先配置存储大量网元设备的对象的父子关联关系,提高管理站的工作效率。实施例三基于与上述方法相同的技术构思,本发明实施例三提供一种网元设备,如图5所示,包括确定单元11,用于当网元设备内部告警时,确定故障源网络设备标识OID和故障源的父对象OID ;发送单元12,用于向管理站发送携带所述故障源OID和父对象OID的告警上报报文。如图6所示,所述确定单元11包括接收子单元111,用于接收告警对象发送的告警消息,所述告警消息携带故障源和故障源父对象的索引信息、以及告警编号;查找子单元112,用于查找存储的告警编号、故障对象类型和父对象类型的对应关系,确定所述告警消息携带的告警编号对应的故障对象类型和父对象类型;确定子单元113,用于根据所述故障对象类型和故障源的索引信息确定故障源 0ID,根据所述父对象类型和父对象的索引信息确定父对象0ID。如图7所示,还包括存储单元13,用于在告警原始信息表中记录告警编号、故障对象类型和父对象类型的对应关系,将所述告警原始信息(即告警编号、故障对象类型和父对象类型的对应关系)存储于所述网元设备的配置文件。存储单元13,还可以用于所述发送单元12向管理站发送所述告警上报报文之后, 在活跃告警表中记录所述故障源OID和所述故障源的父对象0ID。还包括清除单元14,用于在所述发送单元12向管理站发送所述告警上报报文之前,在活跃告警表中遍历查找故障对象的活跃告警、以及以所述故障对象为父对象的所有子对象的活跃告警,清除查找到的活跃告警。具体的,所述清除单元14还用于查找以所述故障对象为父对象的所有活跃告警记录;查找该活跃告警记录对应的故障源对象,查找以该故障源对象为父对象的所有活跃告警记录。所述发送单元12还用于向所述管理站发送携带所述故障源OID的清除通知报文,用以通知所述管理站清除所述故障对象的告警、以及以所述故障对象为父对象的所有子对象的告警。实施例四基于与上述方法相同的技术构思,本发明实施例四提供一种管理设备,如图8所示,包括接收单元21,用于接收网元设备发送的告警上报报文;解析单元22,用于解析所述告警上报报文中携带的故障源OID和父对象0ID,维护所述故障源OID和父对象OID的关联关系。所述接收单元21还用于接收所述网元设备发送的清除通知报文;还包括清除单元23,用于根据所述清除通知报文携带的故障源0ID,清除故障对象的告警、以及以所述故障对象为父对象的所有子对象的告警。本发明实施例中,网元设备向管理站发送携带故障源OID和父对象OID的告警上报报文,使得管理站能够根据告警上报报文确定告警对象的父子关联关系,从而使得管理站即能够显示告警对象的父子关联关系,又不需要预先配置存储大量网元设备的对象的父子关联关系,提高管理站的工作效率。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
权利要求
1.一种故障告警的方法,其特征在于,包括当网元设备内部告警时,所述网元设备确定故障源网络设备标识OID和故障源的父对象 OID ;所述网元设备向管理站发送携带所述故障源OID和父对象OID的告警上报报文。
2.如权利要求1所述的方法,其特征在于,所述网元设备确定故障源网络设备标识OID 和故障源的父对象OID包括所述网元设备的OM接收告警对象发送的告警消息,所述告警消息携带故障源和故障源父对象的索引信息、以及告警编号;所述网元设备查找存储的告警编号、故障对象类型和父对象类型的对应关系,确定所述告警消息携带的告警编号对应的故障对象类型和父对象类型;所述网元设备根据所述故障对象类型和故障源的索引信息确定故障源0ID,根据所述父对象类型和父对象的索引信息确定父对象0ID。
3.如权利要求2所述的方法,其特征在于,所述网元设备在告警原始信息表中记录告警编号、故障对象类型和父对象类型的对应关系,所述告警原始信息表存储于所述网元设备的配置文件。
4.如权利要求1-3任一项所述的方法,其特征在于,所述网元设备向管理站发送携带所述故障源OID和父对象OID的告警上报报文之后,还包括所述网元设备在活跃告警表中记录所述故障源OID和所述故障源的父对象0ID。
5.如权利要求4所述的方法,其特征在于,所述网元设备向管理站发送携带所述故障源OID和父对象OID的告警上报报文之前,还包括所述网元设备在活跃告警表中遍历查找故障对象的活跃告警、以及以所述故障对象为父对象的所有子对象的活跃告警,清除查找到的活跃告警。
6.如权利要求5所述的方法,其特征在于,所述网元设备在活跃告警表中清除活跃告警之前,还包括所述网元设备向所述管理站发送携带所述故障源OID的清除通知报文,用以通知所述管理站清除所述故障对象的告警、以及以所述故障对象为父对象的所有子对象的告警。
7.如权利要求5所述的方法,其特征在于,所述网元设备在活跃告警表中遍历查找以所述故障对象为父对象的所有子对象的活跃告警包括所述网元设备查找以所述故障对象为父对象的所有活跃告警记录;所述网元设备查找该活跃告警记录对应的故障源对象,查找以该故障源对象为父对象的所有活跃告警记录。
8.一种故障告警的方法,其特征在于,包括管理站接收网元设备发送的告警上报报文;所述管理站解析所述告警上报报文中携带的故障源OID和父对象0ID,维护所述故障源OID和父对象OID的关联关系。
9.如权利要求8所述的方法,其特征在于,所述管理站接收网元设备发送的告警上报报文之前,还包括所述管理站接收所述网元设备发送的清除通知报文,根据所述清除通知消息携带的故障源0ID,清除故障对象的告警、以及以所述故障对象为父对象的所有子对象的告警。
10.一种网元设备,其特征在于,包括确定单元,用于当网元设备内部告警时,确定故障源网络设备标识OID和故障源的父对象OID ;发送单元,用于向管理站发送携带所述故障源OID和父对象OID的告警上报报文。
11.如权利要求10所述的网元设备,其特征在于,所述确定单元包括接收子单元,用于接收告警对象发送的告警消息,所述告警消息携带故障源和故障源父对象的索引信息、以及告警编号;查找子单元,用于查找存储的告警编号、故障对象类型和父对象类型的对应关系,确定所述告警消息携带的告警编号对应的故障对象类型和父对象类型;确定子单元,用于根据所述故障对象类型和故障源的索引信息确定故障源0ID,根据所述父对象类型和父对象的索引信息确定父对象0ID。
12.如权利要求11所述的网元设备,其特征在于,还包括存储单元,用于在告警原始信息表中记录告警编号、故障对象类型和父对象类型的对应关系,将所述告警原始信息表存储于所述网元设备的配置文件。
13.如权利要求10或11所述的网元设备,其特征在于,还包括存储单元,用于所述发送单元向管理站发送所述告警上报消息之后,在活跃告警表中记录所述故障源OID和所述故障源的父对象OID。
14.如权利要求13所述的网元设备,其特征在于,还包括清除单元,用于在所述发送单元向管理站发送所述告警上报报文之前,在活跃告警表中遍历查找故障对象的活跃告警、以及以所述故障对象为父对象的所有子对象的活跃告警,清除查找到的活跃告警。
15.如权利要求14所述的网元设备,其特征在于,所述发送单元还用于向所述管理站发送携带所述故障源OID的清除通知报文,用以通知所述管理站清除所述故障对象的告警、以及以所述故障对象为父对象的所有子对象的告警。
16.如权利要求14所述的网元设备,其特征在于,所述清除单元还用于查找以所述故障对象为父对象的所有活跃告警记录;查找该活跃告警记录对应的故障源对象,查找以该故障源对象为父对象的所有活跃告警记录。
17.—种管理设备,其特征在于,包括接收单元,用于接收网元设备发送的告警上报报文;解析单元,用于解析所述告警上报报文中携带的故障源OID和父对象0ID,维护所述故障源OID和父对象OID的关联关系。
18.如权利要求17所述的管理设备,其特征在于,所述接收单元还用于接收所述网元设备发送的清除通知报文;还包括清除单元,用于根据所述清除通知报文携带的故障源0ID,清除故障对象的告警、以及以所述故障对象为父对象的所有子对象的告警。
全文摘要
本发明实施例公开了一种故障告警的方法及设备,该方法包括当网元设备内部告警时,所述网元设备确定故障源网络设备标识OID和故障源的父对象OID;所述网元设备向管理站发送携带所述故障源OID和父对象OID的告警上报报文。本发明实施例中,网元设备向管理站发送携带故障源OID和父对象OID的告警上报报文,使得管理站能够根据告警上报报文确定告警对象的父子关联关系,从而使得管理站即能够显示告警对象的父子关联关系,又不需要预先配置存储大量网元设备的对象的父子关联关系,提高管理站的工作效率。
文档编号H04L12/24GK102457396SQ20101052891
公开日2012年5月16日 申请日期2010年10月28日 优先权日2010年10月28日
发明者刘华玲, 张嵘, 汤金辉 申请人:大唐移动通信设备有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1