一种网管系统中的告警信息管理方法及设备的制作方法

文档序号:7857366阅读:253来源:国知局
专利名称:一种网管系统中的告警信息管理方法及设备的制作方法
技术领域
本发明涉及网络管理技术领域,尤其涉及一种网管系统中的告警信息管理方法及设备。
背景技术
随着计算机和通信技术的发展,计算机网络已成为当今信息时代的支柱,信息社会对计算机网络的依赖,使得计算机网络本身运行的可靠性变得至关重要,网络管理的作用和地位也日益突出,而告警管理是网络管理的基础。网管告警系统主要包括被管网元、告警采集单元、告警处理单元、告警数据库四个部分。其中,告警采集单元与被管网元直接相连,用于收集告警并存储到相应告警数据库中;告警数据库包括活动告警数据库和历史告警数据库,活动告警数据库用于存储已发生且未恢复的告警,历史告警数据库用于存储已经恢复的告警;告警处理单元用于在告警采
集模块收到告警后进行相关处理。网元发生告警时,会通过告警上报单元主动向告警采集服务器上报告警信息,告警采集单元将收集到的告警信息存入活动告警数据库;对于一部分告警类型,当网元从告警状态恢复正常后,会通过告警上报单元主动向告警采集服务器上报告警清除信息,告警采集单元将收集的告警清除信息与活动告警数据库中的告警信息进行配对,并将对应的告警信息移到历史告警数据库。由上述告警装置工作流程可见,告警清除主要依靠告警源发送告警清除信息来进行。这种机制实现简单,但是告警采集服务器缺乏主动性,只能被动接收网元上报的告警清除信息。对于一些类型的告警,网元在告警恢复后并不会发送告警清除信息,因此网管系统无法知道网元告警是否已经恢复;而对于另外一些类型的告警,网元会在告警恢复后发送告警清除信息,但是一旦传输过程中发生告警清除信息丢失的情况,网管系统也不能得知告警状态的改变,这两种情况都会给网络管理者提供错误的告警信息。中国第CN102083091A号专利公开了一种网管告警管理方法和装置,该方法每隔预定时长就对每个网元设备采集一次告警信息,将采集到的告警信息与告警数据库中的告警信息和告警恢复信息进行比较进而对数据库进行修正,从而防止告警信息发生丢失的情况。但是上述方法对所有被管理网元采用固定周期查询,不能根据用户需求对不同告警采取不同的查询策略。另外在实际装置中,网元在告警没有恢复的情况下,会周期上报告警信息,而每次告警信息都丢失的概率是很小的,因此对网元上报的告警信息进行周期检测的意义不是很大。

发明内容
本发明的目的是提供一种能克服上述缺陷的网管系统中的告警信息管理方法及设备。在第一方面,本发明提供了一种网管系统中的告警信息管理方法,所述网管系统中维护一个活动告警数据库,所述活动告警数据库中存储着已发生但尚未恢复的告警信息,所述方法包括根据所述活动告警数据库中存储的告警信息判断接收的告警信息是否为新告警;在接收的告警信息为新告警的情况下为所述新告警建立告警索引,并将其插入告警索引队列;从所述告警索引队列中读取告警索引,检测当前读取的所述告警索引对应的告警是否已经恢复;以及在告警已恢复的情况下执行告警清除。在第二方面,本发明提供了一种网管系统中的告警信息管理设备,包括告警采集单元、告警处理单元、活动告警数据库存储器、告警索引队列存储器,其中所述活动告警数据库存储器,用于存储已发生但尚未恢复的告警信息;所述告警索引队列存储器,用于以队列的形式存储告警索引;所述告警采集单元,用于根据所述活动告警数据库中存储的告警信息判断接收的告警信息是否为新告警,并且在接收的告警信息为新告警的情况下为所述新告警建立告警索引,并将其插入所述告警索引队列;以及所述告警处理单元,用于从所述告警索引队列中读取告警索引,检测当前读取的所述告警索引对应的告警是否已经恢复,并且在告警已恢复的情况下执行告警清除。本发明通过在接收到告警信息后对网元的告警状态进行定期检测,确保在由于各种原因没有接收到告警清除信息的情况下,能够监测到网元告警是否恢复,从而提供更准确的网络管理。


图I是根据本发明实施例的网管系统中的告警管理设备的结构示意图;图2是根据本发明实施例的告警索引生成的流程图;图3是根据本发明实施例的基于告警索引的告警处理流程图;以及图4是根据本发明实施例的告警清除的工作流程图。
具体实施例方式下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。图I是根据本发明实施例的网管系统中的告警管理设备的结构示意图。如图I所示,根据本发明实施例的网管系统中的告警管理设备包括告警采集单元101、活动告警数据库102、历史告警数据库103、告警索引队列104和告警处理单元105。告警采集单元101负责收集来自网元的告警信息和告警清除信息。当告警采集单元收到告警信息时,会将告警信息存入活动告警数据库;当告警采集单元收到告警清除信息时,会将告警清除信息所对应的告警信息从活动告警数据库移到历史告警数据库。当告警采集单元101向活动告警数据库中添加一条新的告警信息时,还会同时根据该告警信息生成一条新的告警索引并将其插入告警索引队列,以记录此告警的告警类型、告警检测周期、告警源IP等信息。活动告警数据库102用于存储已发生但尚未恢复的告警信息,其中,已发生的告警信息是指网元已经向告警采集单元发出了告警信息;已发生尚未恢复的告警信息可能对应以下几种情况告警尚未解除,即网元没有发出告警清除信息,或者某些类型的告警恢复后,网元并不发送告警清除信息,或者网元在告警解除后发送的告警清除信息由于各种原因而丢失,并不被网管系统所知晓。历史告警数据库103用于存储别确认已恢复的告警信息。
告警索引队列104中维护当前告警索弓丨,其中可以包括一条或多条告警索引。告警处理单元105负责轮询告警索引队列,从告警索引队列中读取一条告警索弓I。然后,根据告警索引中的告警检测周期信息,创建并执行告警状态检测命令。在根据告警状态检测命令判断出某条告警索引对应的告警已恢复的情况下,告警处理单元105还会从告警索引队列104中删除该告警对应的告警索引,并且将对应的告警信息从活动告警数据库中删除,将对应的告警信息添加到历史告警数据库中。可以看出,通过对网元告警的状态进行检测从而进行告警清除,进一步实现了告警信息管理,而不受告警清除信息缺失或丢失的影响。图2是根据本发明实施例的告警索引生成的流程图,由告警采集单元执行,该流程包括下列步骤。流程开始,在步骤201,告警采集单元接收网元上报的告警信息,流程转到步骤202 ;在步骤202,根据接收到的告警信息判断其对应的告警是否为新告警,若为新告警,则流程转到步骤203,否则流程转到步骤204 ;在步骤203,将被判断为新告警的告警信息添加到活动告警数据库中,流程转到步骤 205 ;在步骤204,更新活动告警数据库,流程转到步骤201 ;由于网元的告警状态恢复之前,会周期性地向告警采集服务器发送告警信息。因此对同一条告警,告警采集单元可能收到重复的告警信息。告警采集单元在接收到活动告警数据库中已经存在的告警的情况下,会更新活动告警数据库,例如将活动告警数据库中记录的对应告警的告警次数加I ;在步骤205,根据告警信息中包含的告警源IP、告警类型、告警检测周期等信息生成告警索引,流程转到步骤206 ;在步骤206,将步骤205中生成的告警索引插入告警索引队列;流程结束。图3是根据本发明实施例的基于告警索引的告警处理流程图,由告警处理单元执行,该流程包括以下步骤。流程开始,在步骤301,告警处理单元轮询告警索引队列中的每条索引,每读取一条索引,流程转到步骤302 ;在步骤302,查询索引中的告警检测周期,判断是否达到该索引的检测时间,如果已达到,则流程转到步骤303,否则流程转到步骤301 ;在步骤303,通过告警类型、告警源IP信息,构造并执行告警状态检测命令,流程转到步骤304,告警状态检测命令的构造和执行可以采用简单网络管理协议SNMP中的相应命令,根据告警索引中的各项信息来进行;在步骤304,从发出该告警的对应网元获取告警状态检测命令的执行结果,流程转到步骤305 ;在步骤305,根据步骤304中的告警状态检测命令的执行结果,判断此告警是否恢复,如已恢复,则流程转到步骤306),否则流程转到步骤301 ;
在步骤306,执行告警清除流程;流程结束。图4为根据本发明实施例的告警清除的流程图,由告警处理单元执行,该流程包括以下步骤。流程开始,在步骤401,从告警索引队列中删除此告警索引,流程转到步骤402 ;在步骤402,向历史告警数据库增加此告警记录,流程转到步骤403 ;在步骤403,从活动告警数据库中删除该告警记录;流程结束。应当指出,图4中所述的告警清除流程意在对告警索引队列、历史告警数据库和活动告警数据库中的告警索引和对应告警记录进行调整,其可以用包括但不限于图4的步骤顺序来完成。综上所述,本发明使用告警索引队列维护已发生且未恢复的告警,并对队列中的告警定期检测是否恢复,从而实现了告警处理单元主动采集活动告警的状态信息,避免了网元告警清除信息缺失或丢失所带来的告警不能清除的问题;优选地,定期监测可通过告警状态监测周期控制,所述告警状态检测周期可以在网管系统中由用户设定,从而可以对用户比较关心的告警或者丢失概率比较大的告警设置更短的检测周期,提高告警信息的准确性。专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM),电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。以上所述的具体实施方式
,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式
而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种网管系统中的告警信息管理方法,所述网管系统中维护一个活动告警数据库,所述活动告警数据库中存储着已发生但尚未恢复的告警信息,所述方法包括 根据所述活动告警数据库中存储的告警信息判断接收的告警信息是否为新告警; 在接收的告警信息为新告警的情况下为所述新告警建立告警索引,并将其插入告警索引队列; 从所述告警索引队列中读取告警索引,检测当前读取的所述告警索引对应的告警是否已经恢复;以及 在告警已恢复的情况下执行告警清除。
2.根据权利要求I所述的方法,其中,所述方法还包括在接收的告警信息为新告警的情况下将所述接收到的告警信息添加到所述活动告警数据库中。
3.根据权利要求I所述的方法,其中,所述告警信息包括告警源IP和/或告警类型,在接收的告警信息为新告警的情况下为所述新告警建立告警索引的步骤包括根据所述告警源IP和/或告警类型生成告警索引。
4.根据权利要求I所述的方法,其中,所述告警信息还包括告警检测周期, 在接收的告警信息为新告警的情况下为所述新告警建立告警索引的步骤包括根据所述告警检测周期生成告警索引; 读取所述告警索引,检测所述告警索引对应的告警是否已经恢复的步骤包括根据所述告警检测周期判断是否达到所述告警索引的检测时间,在达到所述告警索引的检测时间的情况下,检测所述告警索引对应的告警是否恢复。
5.根据权利要求I所述的方法,其中,在告警已恢复的情况下执行告警清除的步骤包括从所述告警索引队列中删除所述当前读取的告警索引并且从所述活动告警数据库中删除所述当前读取的告警索引对应的告警信息。
6.根据权利要求I所述的方法,其中,所述网管系统中维护一个历史告警数据库,所述历史告警数据库中存储着已恢复的告警信息,所述方法还包括将已恢复的告警对应的告警信息添加到所述历史告警数据库。
7.根据权利要求4所述的方法,其中,所述告警检测周期可由网管系统的用户根据告警类型进行不同的预先设定。
8.—种网管系统中的告警信息管理设备,包括告警采集单元、告警处理单元、活动告警数据库存储器、告警索引队列存储器,其中 所述活动告警数据库存储器,用于存储已发生但尚未恢复的告警信息; 所述告警索引队列存储器,用于以队列的形式存储告警索引; 所述告警采集单元,用于根据所述活动告警数据库中存储的告警信息判断接收的告警信息是否为新告警,并且在接收的告警信息为新告警的情况下为所述新告警建立告警索弓丨,并将其插入所述告警索引队列;以及 所述告警处理单元,用于从所述告警索引队列中读取告警索引,检测当前读取的所述告警索引对应的告警是否已经恢复,并且在告警已恢复的情况下执行告警清除。
9.根据权利要求8所述的设备,其中,所述告警处理单元还用于在接收的告警信息为新告警的情况下将所述接收到的告警信息添加到所述活动告警数据库中。
10.根据权利要求8所述的设备,还包括历史告警数据库存储器,用于存储已恢复的告警信息,所述告警处理单元还用于将已恢复的告警对应的告警信息添加到所述历史告警数据库。 ·
全文摘要
本发明涉及一种网管系统中的告警信息管理方法和设备,所述网管系统中维护一个活动告警数据库,所述活动告警数据库中存储着已发生但尚未恢复的告警信息,所述方法包括根据所述活动告警数据库中存储的告警信息判断接收的告警信息是否为新告警;在接收的告警信息为新告警的情况下为所述新告警建立告警索引,并将其插入告警索引队列;从所述告警索引队列中读取告警索引,检测当前读取的所述告警索引对应的告警是否已经恢复;以及在告警已恢复的情况下执行告警清除。本发明通过在接收到告警信息后对网元的告警状态进行定期检测,确保在由于各种原因没有接收到告警清除信息的情况下,能够监测到网元告警是否恢复,从而提供更准确的网络管理。
文档编号H04L12/24GK102882700SQ201210275248
公开日2013年1月16日 申请日期2012年8月3日 优先权日2012年8月3日
发明者刘学, 李艳霞, 党寿江, 程钢 申请人:中国科学院声学研究所, 上海尚恩华科网络科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1