通信网络告警系统的告警消息传输和处理方法_2

文档序号:9219644阅读:来源:国知局
具有相关性的告警消息作为一组处理包括:判断告警消 息队列中的告警消息是否属于相同类型的不同版本的网元产生的告警消息;将属于相同类 型的不同版本的网元产生的告警消息作为具有相关性的告警消息作为一组处理。
[0028] 根据本发明,所述告警处理单元启动预先配置的过滤规则过滤告警消息掉队列中 的辅告警消息包括:
[0029] 所述告警处理单元启动预先为其配置的告警相关性规则,该告警相关性规则将最 能说明故障根源的告警特征设为主告警特征,其它的与该故障相关的告警特征设为辅告警 特征;
[0030] 根据所述告警相关性规则判断告警消息队列中的告警消息为主告警消息还是辅 告警消息;
[0031] 判断辅告警消息是否符合告警相关性规则的过滤条件,将符合告警相关性规则的 过滤条件的辅告警消息从所述告警消息队列中剔除。
[0032] 本发明的告警消息传输和处理方法进一步包括步骤:当所述告警处理单元根据告 警消息长队列长度确定其告警消息处理能力下降时,所述告警处理单元对告警消息队列中 过滤后的告警消息进行告警消息关联性分析,将所述告警消息队列中具有关联性的告警消 息作为一组处理。
[0033] 优选地,所述屏蔽规则为基于告警数据属性的布尔型逻辑表达式,所述告警数据 属性包括告警类型、告警位置、告警原因和告警级别。
[0034] 本发明的告警消息传输和处理方法进一步包括:
[0035] 当所述告警处理单元按照预定时间周期根据告警消息长队列长度确定其告警消 息处理能力恢复时,将告警消息处理能力恢复的通知消息发送给所述告警采集单元;
[0036] 所述告警采集单元恢复正常发送其所管理的网元设备产生的告警消息。
[0037] 本发明实施例的通信网络告警系统的告警消息传输和处理方法,在网络侧的告警 处理单元或者网元侧的网元发生故障导致告警处理单元的告警消息处理能力下降时,一方 面告警处理单元根据告警消息处理能力的下降变化调整对告警消息队列中的告警消息的 处理策略以提高告警消息的处理速度,另一方面将反应告警消息处理能力的下降变化的告 警消息处理能力下降值VpM和告警消息队列中的当前所有告警消息的优先级的平均优先级 Pm的告警消息处理能力下降的通知消息发送给告警采集单元,使得告警采集单元能够根据 告警消息能力下降值和平均优先级Pm以及反应了该告警采集单元所采集的告警消息中 最高优先级的数量状况的名义优先级调整因子0来调整该告警采集单元的名义优先级?" 并且将停止发送优先级低于名义优先级Pn的告警消息。本发明的通信网络告警系统的告警 消息传输和处理方法,能够在告警消息处理能力下降变化时,与告警消息处理能力的变化 值相适应地在网络侧和网元侧同时对告警消息的处理策略进行调整,从而在网络侧的告警 处理单元的告警消息处理告警能力暂时相对的严重不足时,优先保证优先级别高的告警消 息的发送和传输,并尽可能地允许告警采集单元发送适量的告警消息,防止或缓解网路堵 塞、告警丢失的问题,从而使得网络侧的告警处理单元及时地处理优先级较高的告警消息。
【附图说明】
[0038]图1为本发明的告警消息传输和处理方法所应用的通信网络告警系统;
[0039] 图2为本发明实施例的告警消息传输和处理方法的流程图;
[0040]图3为本发明实施例的告警处理单元检测其告警消息处理能力是否下降的流程 图;
[0041] 图4为本发明的一个实施例的告警处理单元启动预先配置的过滤规则过滤告警 消息掉队列中的辅告警消息的流程图。
【具体实施方式】
[0042] 为使本发明的目的、技术方案及优点更加清楚明白,以下参照附图并举出优选实 施例,对本发明进一步详细说明。然而,需要说明的是,说明书中列出的许多细节仅仅是为 了使读者对本发明的一个或多个方面有一个透彻的理解,即便没有这些特定的细节也可以 实现本发明的这些方面。
[0043] 本发明通过为网管侧的告警处理单元和网元侧的告警采集单元以及网元设备之 间建立一种告警通信协调机制,在网络侧告警处理单元的告警消息处理能力暂时相对的严 重不足时,基于告警消息处理能力的变化值,在包括多个告警采集单元和多个网元设备的 整个网络上,优先保证优先级别高的告警消息的发送和传输,从而使得网络侧的告警处理 单元在及时地处理优先级较高的告警消息的同时,与告警消息处理能力下降变化相适应地 保留了告警采集单元上报告警消息的能力,尽可能降低告警处理能力的变化对整个网络的 告警消息处理的影响。
[0044] 网络侧的告警处理单元可以有多个,每一个告警处理单元监测本告警处理单元所 接收的待处理的告警消息数量,并将告警消息放入到告警消息队列中。当网元大面积发生 故障或者有其它网络侧的告警处理单元出现问题将告警处理转移至本设备上,或者本告警 处理单元发生部分故障时,会发生待处理的告警消息数量急剧增的情况,即遇到了告警风 暴,有可能使得功能正常的告警处理单元接收和处理告警能力出现严重不足的情况。根据 待处理的告警消息数量、在预定的时间周期内该告警处理单元当年能够处理的告警消息的 数量Alarm、该告警处理单元在预定的时间周期内能够处理的额定告警消息数量,确定告警 消息处理能力下降变化值。适应于告警消息处理能力下降变化,网络侧的告警处理单元和 网元侧的告警采集单元共同启动临时的告警消息管控机制:告警处理单元启动预先配置的 过滤规则过滤告警消息队列中的辅告警消息,将包含告警消息处理能力下降值和告警消息 队列中的告警消息的平均优先级的通知消息发送给告警采集单元;告警采集单元利用通知 消息中的信息确定本告警采集单元的名义优先级Pn,并停止发送优先级低于名义优先级Pn 的告警消息。因此,本发明可以防止或缓解网路堵塞、告警丢失的问题,并同时使得各网元 设备中不能够发送给告警处理单元的告警消息是适应于告警消息处理能力的变化而确定 的,从而在发生告警消息处理能力下降的情况下,一方面可以使得高优先级的告警消息可 以正常被处理,另一方面尽可能在告警处理单元的处理能力范围内将尽可能多的告警消息 发送给告警处理单元。
[0045] 下面结合附图详细说明本发明实施例的技术方案。本发明中,通信网络告警系统 依然采用如图1所示的结构。即,告警系统包括多个系统终端,多个告警处理单元(图中示 例性的示出一个)和多个告警采集单元。告警采集单元采集所负责的被管网元的告警消息 并上报给告警处理单元,告警处理单元将待处理的告警消息放入到告警消息队列中并且对 告警消息队列中的告警消息进行告警分析处理。告警系统还可以包括数据库(未示出),用 于存储所接收的告警消息。本发明中,告警消息的内容至少包含:告警编号、告警优先级、告 警产生时间、告警对象ID、告警对象类型、网元版本和消息类型等。告警消息在告警采集单 元中的消息发送列表中的排列顺序是按照告警产生的时间先后或者其它策略生成的顺序。
[0046] 在一些特殊情况下若产生告警风暴,导致网元侧的告警发送与网管侧的告警接收 和处理会严重不对称。例如,网元设备发送的告警消息大量增加,或者网管侧部分设备出现 故障,网管侧的其它设备的处理任务,如待处理的告警消息被转移到告警处理单元,或者告 警处理单元由于部分故障不能以正常能力处理告警消息,从而导致告警消息队列中的待处 理的告警消息的数量大大增加。
[0047] 为了在告警处理单元的告警消息处理能力下降变化时,防止、缓解网路堵塞、告警 丢失的问题,以及重要告警处理的及时性得不到保证的问题,本发明提供了一种通信网络 的告警消息传输和处理方法的实施例,如图2所示。
[0048] 根据本发明的实施例,通信网络的告警消息传输和处理方法的流程起始于步骤 200。告警处理单元按照预定的时间周期检测其告警消息处理能力是否下降,步骤202。根 据本发明的实施例,每一个告警消息处理单元都预先设置有在预定时间周期内可以处理的 额定告警消息数量Alarnu^d,额定告警消息数量的设置对于本领域技术人员而言是熟知 的。预定的时间周期内,告警处理单元检测告警消息队列中的告警消息的数量Length,并 确定其在预定时间周期内的当前可以处理的告警消息数量Alarm。对于本领域技术人而 言,告警消息处理单元在预定时间周期内的当前可以处理的告警消息数量Alarm可以是实 际检测的,也可以是按照一定的规则设置的具体数值。例如,可以按照时间段来设置在每一 个时间段内的当前可以处理的告警消息数量。如果在预定的时间周期内,确定当前可以处 理的告警消
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1