基于服务器的告警过滤系统及方法

文档序号:7720837阅读:153来源:国知局
专利名称:基于服务器的告警过滤系统及方法
技术领域
本发明涉及告警监控技术领域,尤其涉及一种OSS告警监控系统的基于服务器的
告警过滤系统及方法。
背景技术
OSS(Operation Su卯ort System,运营支撑系统)的告警监控系统是用于实时地
采集电信运营商一定范围内所有网元(NE)生成的各种设备故障告警报告、网络事件报告
以及与网络、业务相关的故障告警报告数据,由系统按照监控业务的需求,将其整理成统一
格式呈现到计算机终端,由监控人员查看,然后对相关的告警做进一步的处理。 以往的类似系统都是客户端接收到所有告警信息后,再根据系统用户设置的告警
过滤条件进行告警过滤,然后将符合告警过滤条件的告警信息进行呈现,这种告警过滤的
实现方式会引发如下问题 1.告警过滤计算由客户端进行处理,这就需要将所有的告警信息通过无网络都发 送到客户端,因此加大了数据的网络传输量; 2.客户端的处理能力有限,当告警数据量非常大,尤其是当出现告警风暴(大量 设备同时出现问题,单位时间内产生大量的告警信息称之为"告警风暴",如1000条/秒告 警信息)时,客户端会因为运算能力有限出现系统死机、崩溃的情况或者延误告警的上报 时间,从而降低运维的效率。

发明内容
本发明的目的是提供一种基于服务器的告警过滤系统及方法,该系统及方法通过 在服务器端进行有效的告警信息过滤,摒除无用信息的网络传输,降低了网络资源占用率, 客户端只需要进行告警信息的呈现运算处理,有效的增强了客户端的稳定性和可用性,解 决了信息处理不及时造成的告警延时的问题,以弥补现有技术存在的不足。
为实现上述目的,本发明采用如下技术方案。 本发明提供的一种基于服务器的告警过滤系统,该系统包括告警监控服务端以及 告警监控客户端,告警监控客户端,用于向告警监控服务端发送连接请求、告警过滤器ID 以及告警监控客户端唯一标识,并接收告警监控服务端发送的过滤后的告警信息;告警数 据库,用于存储告警信息以及告警过滤器信息;所述告警监控服务端包括所述告警监控 服务端包括告警采集服务器,用于采集设定范围内所有网元生成的告警信息,并对采集到 的告警信息进行持久化处理,存储到告警数据库及消息队列中;告警监控服务器,用于实时 从所述消息队列获取告警信息,建立与所述告警监控客户端的连接,并根据所述告警监控 客户端发送的告警过滤器ID及告警监控客户端唯一标识,按照对应的告警过滤器的过滤 条件对告警信息进行过滤,将过滤后的告警信息发送至对应的告警监控客户端;所述告警
过滤器,配置有过滤条件,且每个告警过滤器对应一个唯一标识,即所述告警过滤器ID。
本发明还提供一种基于上述系统的告警过滤方法,该方法包括步骤
SI.告警监控服务器建立与告警采集服务器消息队列的连接,实时获取并存储告 警信息; S2.告警监控客户端向所述告警监控服务器发送连接请求、告警过滤器ID以及告 警监控客户端唯一标识; S3.告警监控服务器建立与所述告警监控客户端的连接,根据所述告警过滤器ID 及告警监控客户端唯一标识,按照对应的告警过滤器的过滤条件对告警信息进行过滤,并 将过滤后的告警信息发送至对应的告警监控客户端。 其中,所述告警过滤服务器判断缓存中是否存在与所述告警过滤器ID对应的告 警过滤器,若存在,从缓存中获取所述告警过滤器,否则,根据所述告警过滤器ID从告警数 据库中获取告警过滤器,并将其缓存。 其中,所述告警监控服务器按照所述告警过滤器的告警过滤条件对告警信息进行 过滤的方法为将每条告警信息根据所述告警过滤条件进行计算处理,将处理结果组合成 Python脚本再进行过滤。 其中,所述告警监控服务器将过滤后的告警信息缓存到其内存中,根据所述告警 监控客户端的处理能力,以设定时间间隔向所述告警监控客户端发送所述过滤后的告警信 息。 其中,所述告警监控客户端通过心跳机制实时判断与所述告警监控服务器的连接 情况,在连接出现异常恢复后,自动从所述告警数据库中同步网络连接异常时间段内的告
警信息。 本发明的系统及方法通过将告警过滤运算处理移交到服务器端,增加了告警监控 客户端的稳定性和可用性,客户端不会因为告警量过大而出现过死机或崩溃的情况;告警 过滤由服务器端进行处理能够充分运用服务器更为强大的运算处理能力,避免了告警延误 问题的出现,所有的告警呈现时间均符合OSS告警监控的规范要求。


图1为依照本发明一种实施方式的基于服务器的告警过滤系统原理示意图;
图2为基于依照本发明一种实施方式的基于服务器的告警过滤系统的告警过滤 方法流程图; 图3为告警监控服务器将过滤后的告警信息向告警监控客户端发送的应用接口 库流程图。
具体实施例方式
本发明提出的基于服务器的告警过滤系统及方法,结合附图和实施例说明如下。
如图1所示为依照本发明一种实施方式的OSS告警监控系统基于服务器的告警 过滤系统原理图,告警监控服务端向告警监控客户端发送的告警信息可以根据告警监控客 户端定义的过滤条件,由告警监控服务端进行自动筛选,过滤后,只发送符合条件的告警信 息。通过这种方式可以充分利用告警监控服务器硬件设备的强大数据运算处理能力,将冗 余的告警信息控制在信息源头,摒除无用信息的网络传输和告警监控客户端的运算处理, 从而提升告警监控客户端的处理能力和告警呈现程序的稳定性和可用性,彻底解决由于告
4警风暴导致的告警信息处理不及时从而产生告警延时的问题。 该系统包括告警监控服务端以及告警监控客户端。其中,告警监控客户端,用于向 告警监控服务端发送连接请求、告警过滤器ID以及告警监控客户端唯一标识,并接收告警 监控服务端发送的过滤后的告警信息;告警数据库,用于存储告警信息以及告警过滤器信 息,可为一个独立的物理服务器,在其上安装数据库软件实现上述功能。告警监控服务端包 括告警采集服务器,用于采集设定范围内所有网元生成的告警信息,并对采集到的告警信 息进行持久化处理,存储到告警数据库及消息队列MQ中;告警监控服务器,用于实时从MQ 获取告警信息,建立与告警监控客户端的连接,并根据告警监控客户端发送的告警过滤器 ID及告警监控客户端唯一标识,按照对应的告警过滤器的告警过滤条件对告警信息进行过 滤,并将过滤后的告警信息发送至对应的告警监控客户端。 告警过滤器最终体现是一段程序逻辑代码,通过告警系统的配置界面,系统用户 可以通过相关选项,选择配置过滤条件,配置完成后,每个告警过滤器对应一个唯一标识, 即告警过滤器ID,告警系统内部通过它来传递系统用户最终选择了哪个告警过滤器。告警 过滤器需要做持久化操作,将其信息保存到告警数据库中,这样系统用户在登录系统后,可 以选择对应的告警过滤器,对界面上不需要显示的告警信息进行过滤,本发明的系统将告 警过滤器ID传递到告警监控服务器,由告警监控服务器对告警信息进行过滤。
如图2所示,基于本发明的上述系统的告警过滤方法包括步骤
SI.告警监控服务器建立与告警采集服务器MQ的连接,实时获取告警信息;
S2.告警监控客户端向告警监控服务器发送连接请求、告警过滤器ID以及告警监 控客户端唯一标识; S3.告警监控服务器建立与告警监控客户端的连接,并根据告警过滤器ID及客户 端唯一标识,按照所述告警过滤器的告警过滤条件对告警信息进行过滤,并将过滤后的告 警信息发送至与告警监控客户端唯一标识对应的告警监控客户端。 在步骤S3中,告警过滤服务器在收到告警过滤器ID后首先判断缓存中是否存在 对应ID的告警过滤器,若存在,则从缓存中获取该告警过滤器,否则,根据告警过滤器ID从 告警数据库中获取告警过滤器,并将其缓存到内存中;接着告警监控服务器按照告警过滤 器的过滤条件对告警信息进行过滤,过滤的方法为将从MQ中获取的每条告警信息进行计 算处理,将处理结果组合成Python脚本再进行过滤处理。 本发明的告警过滤系统实施告警过滤实现过程如下告警监控客户端与告警监控 服务器建立连接,向其发送告警过滤器ID及告警监控客户端唯一标识信息;同时,告警监 控服务器与告警采集服务器的MQ建立连接,告警采集服务器将采集上来的告警信息进行 持久化处理,存储到告警数据库及MQ中;告警监控服务器实时获取MQ中的告警信息,将每 条告警信息根据告警过滤器中的过滤条件进行计算处理,将处理结果组合成Python脚本, 由告警监控服务器中运行的脚本解析引擎做出是否符合该告警过滤器中的过滤条件的判 断,经过这一系列内存缓存数据、多线程处理、告警信息过滤等过程,最后将符合过滤条件 的告警信息根据告警过滤器ID及告警监控客户端唯一标识匹配,将过滤的告警信息发送 到告警监控客户端进行呈现。通过Python增强了告警过滤器的逻辑处理能力和灵活性,用 户可以通过Python语言,配置非常复杂的告警过滤器。 此外,告警监控客户端通过心跳机制,实时判断网络连接情况,在网络连接出现异常恢复后,自动从告警数据库中同步网络连接异常时间段内的告警信息。告警监控服务器 还加入了告警缓存机制,将过滤后的告警信息缓存到其内存中,根据告警监控客户端的处 理能力,以设定时间间隔向客户端唯一标识指向的告警监控客户端发送过滤后的告警信 息,防止同一时刻涌向客户端的告警信息量过大,造成客户端死机和系统崩溃的问题。
举例说明首先,需要通过系统配置界面配置告警过滤器,例如配置"拨测一二 级告警"过滤器,其中配置了三个条件,1、告警分类="拨测告警";2、告警级别="一级告 警";3、告警级别="二级告警",这三个属性的过滤方式本发明系统映射为对应的字符串 "SlAND(ft20Rft3)",这个字符串的实际含义为是"拨测告警"并且告警级别为"一级告警" 或"二级告警"的告警符合过滤条件,在告警监控服务器程序中,每条上来的告警针对这个 告警过滤器过滤时,系统会根据告警文本信息首先判断1、告警分类是否是"拨测告警",如 果是,则系统将字符串"#1AND(#20R#3)"中的"ftl"替换为"true",同理告警级别也做相应 的判断,字符串#2,#3会被替换为true或false,最终"ftlAND(#20R#3)"会被替换为"true and(falseor true)"这样的字符串,然后系统会用脚本引擎执行这段代码,获取返回结果 (true或false)。 在具体应用中,告警监控服务器进行告警信息过滤以及向告警监控客户端发送的 应用接口库中可提供三个主要函数GetAlarmFilter() 、 RuleFilter()、以及SendData()。 如图3所示为依照本发明一种实施方式的告警监控服务器将过滤后的告警信息向告警监 控客户端发送的应用接口库的流程,详述如下 在步骤D1中,应用程序调用GetAlarmFilter()函数,把由告警监控客户端发送的 告警过滤器ID作为输入参数,函数调用完成后,返回对应的告警过滤器ID的告警过滤器对 象,其包含了对应的告警过滤条件; 在步骤D2中,应用程序调用RuleFilter()函数,将告警过滤条件和告警信息作为
输入参数,函数调用完成后,返回当前告警信息是否符合告警过滤条件的布尔值; 在步骤D3中,应用程序调用SendData()函数,将告警信息作为输入参数,函数调
用完成后将符合告警过滤条件的告警信息发送到对应的告警监控客户端。 以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通
技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有
等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。
权利要求
一种基于服务器的告警过滤系统,该系统包括告警监控服务端、告警监控客户端、以及告警数据库,其特征在于告警监控客户端,用于向告警监控服务端发送连接请求、告警过滤器ID以及告警监控客户端唯一标识,并接收告警监控服务端发送的过滤后的告警信息;告警数据库,用于存储告警信息以及告警过滤器信息;所述告警监控服务端包括告警采集服务器,用于采集设定范围内所有网元生成的告警信息,并对采集到的告警信息进行持久化处理,存储到告警数据库及消息队列中;告警监控服务器,用于实时从所述消息队列获取告警信息,建立与所述告警监控客户端的连接,并根据所述告警监控客户端发送的告警过滤器ID及告警监控客户端唯一标识,按照对应的告警过滤器的过滤条件对告警信息进行过滤,将过滤后的告警信息发送至对应的告警监控客户端;所述告警过滤器,配置有过滤条件,且每个告警过滤器对应一个唯一标识,即所述告警过滤器ID。
2. —种基于权利要求1所述系统的告警过滤方法,其特征在于,该方法包括步骤`51. 告警监控服务器建立与告警采集服务器消息队列的连接,实时获取并存储告警信息;`52. 告警监控客户端向所述告警监控服务器发送连接请求、告警过滤器ID以及告警监 控客户端唯一标识;`53. 告警监控服务器建立与所述告警监控客户端的连接,根据所述告警过滤器ID及告 警监控客户端唯一标识,按照对应的告警过滤器的过滤条件对告警信息进行过滤,并将过 滤后的告警信息发送至对应的告警监控客户端。
3. 如权利要求2所述的告警过滤方法,其特征在于,在步骤S3中,所述告警过滤服务器 判断缓存中是否存在与所述告警过滤器ID对应的告警过滤器,若存在,从缓存中获取所述 告警过滤器,否则,根据所述告警过滤器ID从告警数据库中获取告警过滤器,并将其缓存。
4. 如权利要求2所述的告警过滤方法,其特征在于,在步骤S3中,所述告警监控服务器 按照所述告警过滤器的告警过滤条件对告警信息进行过滤的方法为将每条告警信息根据 所述告警过滤条件进行计算处理,将处理结果组合成Python脚本再进行过滤。
5. 如权利要求2所述的告警过滤方法,其特征在于,在步骤S3中,所述告警监控服务器 将过滤后的告警信息缓存到其内存中,根据所述告警监控客户端的处理能力,以设定时间 间隔向所述告警监控客户端发送所述过滤后的告警信息。
6. 如权利要求2-5任一项所述的告警过滤方法,其特征在于,所述告警监控客户端通 过心跳机制实时判断与所述告警监控服务器的连接情况,在连接出现异常恢复后,自动从 所述告警数据库中同步网络连接异常时间段内的告警信息。
全文摘要
本发明涉及一种基于服务器的告警过滤系统及方法,该系统由告警监控服务器实时从告警采集服务器的消息队列获取告警信息,建立与告警监控客户端的连接,并根据告警监控客户端发送的告警过滤器ID及告警监控客户端唯一标识,按照告警过滤器的过滤条件对告警信息进行过滤,将过滤后的告警信息发送至对应的告警监控客户端。本发明的系统及方法通过在服务器端进行有效的告警信息过滤,摒除无用信息的网络传输,降低了网络资源占用率,客户端只需要进行告警信息的呈现运算处理,有效的增强了客户端的稳定性和可用性,解决了告警延时的问题。
文档编号H04L12/24GK101741615SQ20091024189
公开日2010年6月16日 申请日期2009年12月14日 优先权日2009年12月14日
发明者员海 申请人:北京神州泰岳软件股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1