一种对集中监控系统的告警数据的处理方法

文档序号:7684947阅读:173来源:国知局
专利名称:一种对集中监控系统的告警数据的处理方法
技术领域
本发明涉及一种计算机无人值守的集中监控领域,特别涉及一种对集中监 控系统的告警数据的处理方法。
背景技术
集中监控系统管理的一个重要组成部分就是对告警的管理。集中监控系 统的监控对象不但种类繁多,而且由于监控规模的增大,集中监控系统的更加 集中化,所以造成监测点的数量更是无比庞大。这么庞大的监测数据点,外加 上监控系统复杂的网络拓扑结构、外加上施工、新站增加等原因,所以一丁点 的传输不稳定或者误码就可能造成告警,而由于传输线路不稳定、设备故障、 垃圾数据、误告、闪告等很多原因造成中心管理端告警数量居高不下。
中心管理系统面对每天新产生的成千上万的新告警, 一条一条的即时告 警在屏幕上闪动,报警笛声响个不停,这些众多的告警信息造成的结果就是根 本无法维护。因为包括监控设备、通讯线路、网络故障等等的告警全部呈现上 来了,最终无法确定哪些是对移动业务造成危害和潜在的危害确实需要派单的

发明内容
为了达到上述目的,本发明是采用如下技术方案予以实现的 一种对集中监控系统的告警数据的处理方法,当中心管理系统监测有告警 事件产生时,对相应的告警监测点进行派单维护,中心管理系统包括告警屏蔽 处理模块、告警延时处理模块、告警翻转处理模块、告警过滤处理模块、告警 收敛处理模块及构成上述模块相互连接的线路,其具体包括以下步骤a)告警屏蔽处理步骤,对已知要产生告警的监测点数据进行屏蔽;
(2) 告警延时处理步骤,对告警时间持续低于设置延时时间的告警数据 予以清除;
(3) 告警翻转处理步骤,对同一个不停产生或消失的告警数据进行次数
累计;
(4) 告警过滤处理步骤,对同一个事件引起的多个告警进行过滤,只显 示由根本原因导致产生告警的数据;
(5) 告警收敛处理步骤,将同种同类的告警数据罗列在一起,用一个大 类告警名称替代。
本发明的步骤(1)包括
1) 告警屏蔽处理模块接受告警事件;
2) 判断当前告警监测点是否设定告警屏蔽,如是,告警数据不显示,中 心管理系统进入告警事件监听状态;
3) 否则,中心管理系统进行告警延时处理歩骤。 本发明的步骤(2)包括
1) 告警延时模块接受告警事件;
2) 当前告警事件进入队列等待告警时间到达设置的延时时间;
3) 判断告警故障是否已解除,如是,从告警队列中删除该告警事件,中 心管理系统进入告警事件监听状态;
4) 否则,中心管理系统进行告警翻转处理步骤。 本发明的步骤(3)包括
1) 告警翻转模块接受告警事件;
2) 判断告警事件是否己经在告警翻转队列中,如是,告警翻转次数增加;
3) 否则,告警事件首次进入告警翻转队列,并设置告警翻转次数为1, 翻转开始时间为0;
64)中心管理系统转入告警过滤处理步骤。
更进一步的,当告警翻转开始时间超过配置的时间时,中心管理系统将其 告警事件从翻转中队列中清除。
本发明的步骤(4)的过滤规则是对告警事件类型设置告警的前置条件和
后置条件,当前置条件告警时,过滤后置条件,这时候,必须满足当前告警事 件的前置条件是影响该告警事件的后置条件这一要素,才进行告警过滤的处理
步骤。具体包括以下步骤
1) 告警过滤模块接受告警事件;
2) 判断前置条件是否存在告警,如是,该告警被过滤,并记录该告警事 件进行后置判断;否则,转步骤3);
3) 判断后置条件是否存在告警,如是,前置条件已经是告警状态的,后 置条件状态设置为不告警;否则,转步骤4);
4) 中心管理系统转入告警收敛处理步骤。
本发明的步骤(5)包括
1) 告警收敛模块接受告警事件;
2) 判断该事件是否配置收敛属性,如否,转步骤5);
3) 如是,判断是否有此收敛大类告警显示,如是,直接返回告警事件监 听状态;
4) 否则,收敛成对应的大类告警;
5) 告警收敛模块呈现告警事件,中心管理系统派单维护。 相对于现有技术,本发明的有益效果是
本发明对告警数据的综合处理是一套行之有效的处理方法。在集中监控 系统中应用了这一套告警处理方法,过滤掉那些因为闪告、误告、线路设备检 修、监控设备本身的故障等等而造成的告警,这样最终呈现给维护人员的就是 一些数量较少且可控可信而且还不会被遗漏的告警信息。本发明大大加强了集中监控系统的应用效果,有效地提高了操作人员对告警信息的维护工作。


图l是本发明的流程图2是本发明的告警屏蔽流程图3是本发明的告警延时流程图4是本发明的告警翻转流程图5是本发明的告警过滤流程图6是本发明的告警收敛流程图。
具体实施例方式
下面结合说明书附图对本发明作进一歩的描述,但本发明要求保护的范围 并不局限于实施例表述的范围。
一种对集中监控系统的告警数据的处理方法,当中心管理系统监测有告警 事件产生时,对相应的告警监测点进行派单维护,中心管理系统包括告警屏蔽 处理模块、告警延时处理模块、告警翻转处理模块、告警过滤处理模块、告警 收敛处理模块及构成上述模块相互连接的线路,其具体包括以下几个歩骤
1、 告警屏蔽处理步骤,就是对已经知道要产生告警的监测点进行告警屏 蔽,可以屏蔽掉因为施工、设备故障等等原因而产生的告警。屏蔽掉这些一直 存在的告警信息,以达到避免干扰真正告警信息的目的。
1) 告警屏蔽处理模块接受告警事件;
2) 判断当前告警监测点是否设定告警屏蔽,如是,告警数据不显示,中 心管理系统进入告警事件监听状态;
3) 否则,中心管理系统进行告警延时处理步骤。
2、 告警延时处理步骤,对告警时间持续低于设置延时时间的告警数据予 以清除。告警延时处理就是告警产生后根据配置的延时时间对告警进行处理, 利用这种方法可以屏蔽掉一些明显是闪断造成的告警,比如,产生一条设备停
8电告警20秒就恢复正常的告警信息,很明显这是线路闪断或者是传输误码造 成的误告警,需要清除,通过延时处理方法可以消除此类告警。
1) 告警延时模块接受告警事件;
2) 当前告警事件进入队列等待告警时间到达设置的延时时间;
3) 判断告警故障是否已解除,如是,从告警队列中删除该告警事件,中 心管理系统进入告警事件监听状态;
4) 否则,中心管理系统进行告警翻转处理步骤。
3、告警翻转处理步骤,对同一个不停产生或消失的告警数据进行次数累 计。由于在实际监控过程中,在设备故障或在告警临界值附近的数值变动都可 能导致终端设备在短时间内频繁产生告警和告警消失,导致界面频繁刷新,耗 费大量计算机和网络资源,而且大量闪动的告警也不便于用户的观察与统计, 告警翻转功能通过设立"翻转限时"机制,实现对监测点告警信息进行后台累 计,对同一告警的频繁消失和产生过程只是简单进行告警次数的累加上传,这 样不仅减少了网络传送和计算机处理,同时也方便告警维护。
1) 告警翻转模块接受告警事件;
2) 判断告警事件是否已经在告警翻转队列中,如是,告警翻转次数增加;
3) 否则,告警事件首次进入告警翻转队列,并设置告警翻转次数为1, 翻转开始时间为O;
4) 中心管理系统转入告警过滤处理步骤。
这里,当告警翻转开始时间超过配置的时间时,系统会自动将其从翻转队 列中清除,意思即是这已经是正常告警了,不在统计的翻转之列,需要重新开 始计算翻转次数。假定告警翻转设定的时间是五分钟,那么一条告警出现后在 间隔六分钟又出现一次,这会算做两条正常告警,而不是记录一条告警翻转两 次。
看这个处理流程可知告警翻转的延时时间对整个的告警处理流程是不会有延时阻碍的,都是及时转到下一个处理流程进行处理了。告警翻转延时判断 只在后台进行处理。
4、告警过滤处理步骤,对同一个事件引起的多个告警进行过滤,只显示 由根本原因导致产生告警的数据。告警过滤处理是对告警事件类型设置告警的 前置条件和后置条件进行过滤和被过滤操作。比如门禁设备的通信中断告警事 件发生了,找到其配置的前置条件是基站通信中断,结果发现基站通信中断告 警事件也同时发生了,很明显门禁设备的通信中断是由于基站的通信中断所引 起的。所以可以过滤掉门禁设备的通信中断,直接派修基站的通信线路,解决 了基站的通信问题,门禁设备的通信也就不存在了。
再比如,出现一个空调停止工作的告警,空调停止工作一个最直接的情况 就是会导致基站的温度过高,会产生基站髙温告警事件。而空调停止工作的告 警事件产生的前置条件有可能是基站停电造成的。这就是说先判断空调停止工 作的前置条件比如基站停电是否已经告警,如已经告警,则过滤掉空调停止工 作的告警,然后再做后置条件的过滤,如果基站高温告警事件也已经产生,则 过滤掉基站高温告警事件。最终出现的告警事件就只有一个告警就是直接导 致根本告警原因出现的告警事件基站停电告警。实际监控过程中通过这样的 自由配置过滤关系,可以将各个通道间连带性告警信息过滤,简化告警信息, 挖掘出告警的真正原因,极大的增强了用户的告警处理效率。
当前告警事件的前置条件是影响该告警事件的后置条件这一要素时,告警 过滤的处理步骤包括
1) 告警过滤模块接受告警事件;
2) 判断前置条件是否存在告警,如是,该告警被过滤,并记录该告警事 件进行后置判断;否则,转步骤3);
3) 判断后置条件是否存在告警,如是,前置条件已经是告警状态的,后 置条件状态设置为不告警;否则,转步骤4);4)中心管理系统转入告警收敛处理步骤。
5、告警收敛处理歩骤,将同种同类的告警数据罗列在一起,用一个大类 告警名称替代。告警收敛是实现对各种设备繁多的同类通道告警进行收敛成大 类告警,只显示一种虚拟的大类告警,便于用户对告警的管理与维护,提高工 作效率。比如一个开关电源设备存在许多电源模块,当这些模块由于故障都处 于告警状态的时候如果不加处理就会显示大量的模块1熔丝告警,模块1温度 告警,模块2熔丝告警,模块2温度告警等等大量的同类告警显示,很不方便 告警维护。告警收敛就是通过合并成一个虚拟的大类来处理这些繁多的小告 警,直接用一个模块告警就概括的描述所有的这些模块告警,这样处理后就能 很好的对告警维护人员起到指引作用。
1) 告警收敛模块接受告警事件;
2) 判断该事件是否配置收敛属性,如否,转歩骤5);
3) 如是,判断是否有此收敛大类告警显示,如是,直接返回告警事件监 听状态;
4) 否则,收敛成对应的大类告警;
5) 告警收敛模块呈现告警事件,中心管理系统派单维护。 本发明的中心管理系统对集中监控系统呈现的告警信息进行告警屏蔽、告
警延时、告警翻转、告警过滤、告警收敛等处理。使得最终处理后的告警信息 基本是可控的、可信的、可派单维护的且不遗漏任何告警信息。
权利要求
1、一种对集中监控系统的告警数据的处理方法,中心管理系统接受来自各个基站或设备的告警,其特征在于,所述中心管理系统对接收的告警数据进行以下一种或多种的处理步骤(1)告警屏蔽处理步骤,对已知要产生告警的监测点数据进行屏蔽;(2)告警延时处理步骤,对告警时间持续低于设置延时时间的告警数据予以清除;(3)告警翻转处理步骤,对同一个不停产生或消失的告警数据进行次数累计;(4)告警过滤处理步骤,对同一个事件引起的多个告警进行过滤,只显示由根本原因导致产生告警的数据;(5)告警收敛处理步骤,将同种同类的告警数据罗列在一起,用一个大类告警名称替代。
2、 根据权利要求1所述的对集屮监控系统的告警数据的处理方法,其特 征在于,所述中心管理系统对告警数据依次进行如下处理(1) 告警屏蔽处理步骤;(2) 告警延时处理步骤;(3) 告警翻转处理步骤;(4) 告警过滤处理步骤;(5) 告警收敛处理步骤。
3、 根据权利要求2所述的对集中监控系统的告警数据的处理方法,其特征在于,所述步骤(1)具体包括1) 告警屏蔽处理模块接受告警事件;2) 判断当前告警监测点是否设定告警屏蔽,如是,告警数据不显示,中心管理系统进入告警事件监听状态;3)否则,中心管理系统进行告警延时处理步骤。
4、 根据权利要求2所述的的对集中监控系统的告警数据的处理方法,其 特征在于,所述歩骤(2)具体包括1) 告警延时模块接受告警事件;2) 当前告警事件进入队列等待告警时间到达设置的延时时间;3) 判断告警故障是否己解除,如是,从告警队列中删除该告警事件,中 心管理系统进入告警事件监听状态;4) 否则,中心管理系统进行告警翻转处理步骤。
5、 根据权利要求2所述的对集中监控系统的告警数据的处理方法,其特 征在于,所述步骤(3)具体包括1) 告警翻转模块接受告警事件;2) 判断告警事件是否已经在告警翻转队列中,如是,告警翻转次数增加;3) 否则,告警事件首次进入告警翻转队列,并设置告警翻转次数为1, 翻转开始时间为0;4) 中心管理系统转入告警过滤处理步骤。
6、 根据权利要求5所述的对集中监控系统的告警数据的处理方法,其特 征在于,当告警翻转开始时间超过配置的时间时,中心管理系统将其告警事件 从翻转中队列中清除。
7、 根据权利要求2所述的对集中监控系统的告警数据的处理方法,其特 征在于,所述步骤(4)还包括对告警事件类型设置告警的前置条件和后置 条件,当前置条件告警时,过滤后置条件。
8、 根据权利要求7所述的对集中监控系统的告警数据的处理方法,其特 征在于,所述步骤(4)具体包括1)告警过滤模块接受告警事件;2) 判断前置条件是否存在告警,如是,该告警被过滤,并记录该告警事 件进行后置判断;否则,转步骤3);3) 判断后置条件是否存在告警,如是,前置条件已经是告警状态的,后 置条件状态设置为不告警;否则,转步骤4);4) 中心管理系统转入告警收敛处理步骤。
9、 根据权利要求8所述的对集中监控系统的告警数据的处理方法,其特 征在于,当告警事件的前置条件是影响该告警事件的后置条件时,才进行告警 过滤的处理步骤。
10、 根据权利要求2所述的对集中监控系统的告警数据的处理方法,其特 征在于,所述步骤4)具体包括1) 告警收敛模块接受告警事件;2) 判断该事件是否配置收敛属性,如否,转步骤5);3) 如是,判断是否有此收敛大类告警显示,如是,直接返回告警事件监 听状态;4) 否则,收敛成对应的大类告警;5) 告警收敛模块呈现告警事件,中心管理系统派单维护。
全文摘要
本发明公开了一种对集中监控系统的告警数据的处理方法。具体包括以下步骤(1)告警屏蔽处理步骤,对已知要产生告警的监测点数据进行屏蔽;(2)告警延时处理步骤,对告警时间持续低于设置延时时间的告警数据予以清除;(3)告警翻转处理步骤,对同一个不停产生或消失的告警数据进行次数累计;(4)告警过滤处理步骤,对同一个事件引起的多个告警进行过滤,只显示由根本原因导致产生告警的数据;(5)告警收敛处理步骤,将同种同类的告警数据罗列在一起,用一个大类告警名称替代。本发明方法过滤掉那些因为闪告、误告、线路设备检修、监控设备本身的故障等等而造成的告警,最终呈现给维护人员的就是一些数量较少且准确有用的告警信息。
文档编号H04L12/24GK101425924SQ200810028748
公开日2009年5月6日 申请日期2008年6月12日 优先权日2008年6月12日
发明者刘双广, 刘大君, 张永亮, 张荣祥, 杨晓桥, 勇 甘, 胡鹏武 申请人:广东高新兴通信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1