一种双重过滤的数据中心监控系统故障告警方法

文档序号:7823238阅读:227来源:国知局
一种双重过滤的数据中心监控系统故障告警方法
【专利摘要】本发明公开了一种双重过滤的数据中心监控系统故障告警方法,结合故障告警多种故障状态、多种通知方式和多个系统管理员的关联关系,采用以资源监控模块为基础,配合资源故障告警过滤器和告警通知方式过滤器的双重过滤设计方法,实现以通知处理引擎为连接点的双重过滤体系,由通知处理引擎产生告警通知,再通过由不同告警级别、不同告警方式及不同类型管理员构建的立体通知策略的过滤。该一种双重过滤的数据中心监控系统故障告警方法与现有技术相比,实现以通知处理引擎为连接点的双重过滤体系,大大提高了监控系统故障告警的合理性和准确性,避免了因告警产生不合理、通知发送不准确和管理员权限分配受限制等的问题,实用性强。
【专利说明】一种双重过滤的数据中心监控系统故障告警方法

【技术领域】
[0001]本发明涉及数据中心监控告警【技术领域】,具体地说是一种实用性强、双重过滤的数据中心监控系统故障告警方法。

【背景技术】
[0002]随着数据中心的飞速发展,现代化的数据中心越来越庞大、容纳的设备资源越来越复杂、规模也越来越大。在数据中心的监控过程中,当产生故障告警时的通知策略则显得尤其重要,传统的故障告警方式如附图1所示,只是单一的将某种故障告警以不同的告警方式将通知发送给所有的系统管理员,其告警通知的合理性和准确性都存在很大的问题。例如,一个具有十万资源的现代化数据中心的监控,用传统的故障告警策略进行告警通知,会将一个普通的故障告警不分级别和严重程度,以所能支持的几种告警方式,同时发送给当前可以接收通知的各种角色的管理员,浪费告警资源的同时,也不同角色管理员之间的权限分配无法真正实现,往往造成有了故障不知道该哪些管理员去确认、去处理,严重影响了监控系统的可用性。以上挑战为大规模数据中心的故障告警级别划分、告警方式选择和管理员权限分配等均带了极大的局限性,严重影响大规模数据中心监控系统的发展,基于此,现提供一种可有效解决上述难题的双重过滤的数据中心监控系统故障告警方法。


【发明内容】

[0003]本发明的技术任务是针对以上不足之处,提供一种实用性强、双重过滤的数据中心监控系统故障告警方法。
[0004]一种双重过滤的数据中心监控系统故障告警方法,其具体实现过程为:
设计资源监控模块、资源故障告警过滤器、告警通知方式过滤器、通知处理引擎模块,基于上述四种模块,其具体告警过程为:
资源监控模块根据监测参数,经过细粒度的划分,生成以监测参数为单位的监测项,并以此监测项为单位进行数据采集,产生各自的故障告警状态并选择各自的告警方式;
然后,资源故障告警过滤器和告警通知方式过滤器模块根据资源下属各监测项进行轮询数据采集时的故障状态,将故障告警状态、故障告警方式组合生成的第一层过滤器,基于该第一层过滤器产生的故障推送到通知处理引擎模块进入下一层过滤;
最后,通知处理引擎模块接收到经过第一层过滤器过滤的故障告警,生成告警通知后,再经由以资源故障告警状态、故障告警方式和系统管理员的选择组合为依据的第二层过滤器,将故障告警通知发送到负责处理故障的管理员处。
[0005]所述故障告警状态包括故障恢复、一级警告、二级警告和无法连通四种,告警方式包括邮件、短信、窗口和声音四种;
相对应的,第一层过滤器的生成过程为:
以资源故障级别为依据的故障恢复、一级警告、二级警告和无法连通四种级别自由组合的告警策略,以告警方式为依据的邮件、短信、窗口和声音四种告警方式自由组合的告警策略,将两种告警策略进行组合后生成上述第一层过滤器。
[0006]所述系统管理员包括多种角色,该系统管理员包括数据库管理员、网络设备管理员和机房环境管理;相对应的,所述第二层过滤器则以上述四种资源故障告警状态、四种故障告警方式和多种系统管理员自由组合而成。本发明的一种双重过滤的数据中心监控系统故障告警方法,具有以下优点:
该发明的一种双重过滤的数据中心监控系统故障告警方法采用资源故障告警过滤器和告警通知方式过滤器的双重过滤器设计方法,实现以通知处理引擎为连接点的双重过滤体系,大大提高了监控系统故障告警的合理性和准确性,避免了因告警产生不合理、通知发送不准确和管理员权限分配受限制等的问题,实用性强,适用范围广泛,易于推广。

【专利附图】

【附图说明】
[0007]附图1为传统的数据中心监控系统故障告警策略原理示意图。
[0008]附图2为资源故障告警过滤器与告警通知方式过滤器原理示意图。
[0009]附图3为通知处理引擎模块示意图。
[0010]附图4为双重过滤的数据中心监控系统故障告警策略原理示意图。

【具体实施方式】
[0011]下面结合附图和具体实施例对本发明作进一步说明。
[0012]本发明提出一种双重过滤的数据中心监控系统故障告警方法,该方法充分发挥双重过滤机制在数据中心监控系统故障告警时的优势,考虑故障告警时多种故障状态、多种通知方式和多个系统管理员之间非常复杂的关联关系的特点,采用以资源监控模块为基础,配合资源故障告警过滤器和告警通知方式过滤器的双重过滤设计方法,实现以通知处理引擎为连接点的双重过滤体系,资源发生故障时可以触发由不同告警级别、不同告警方式组成的告警策略,经由通知处理引擎产生告警通知对象,再通过由不同告警级别、不同告警方式及各种类型管理员构建的立体通知策略的过滤,最终达到当一个资源产生告警后可以迅速地、准确地将告警通知发送到负责处理此故障的管理员处,从而大大提高了监控系统故障告警的合理性和准确性,避免了因告警产生不合理、通知发送不准确和管理员权限分配受限制等的问题。如附图2、图3、图4所示,其具体实现过程为:
设计资源监控模块、资源故障告警过滤器、告警通知方式过滤器、通知处理引擎模块,基于上述四种模块,其具体告警过程为:
资源监控模块设计按不同的监测参数,经过细粒度的划分,生成以每种监测参数为单位的监测项(如Windows操作系统的CPU利用率、Linux操作系统的CPU负载等),并以此监测项为单位进行数据采集,产生各自的故障告警状态(故障恢复、一级警告、二级警告和无法连通共四种),选择各自的告警方式(邮件、短信、窗口和声音共四种)。
[0013]资源故障告警过滤器和告警通知方式过滤器根据资源下属各监测项进行轮询数据采集时的故障状态,设计以资源故障级别为依据的故障恢复、一级警告、二级警告和无法连通四种级别自由组合的告警策略,设计以告警方式为依据的邮件、短信、窗口和声音四种告警方式自由组合的告警策略,并将两种告警策略再进行组合后生成第一层过滤器,基于此将产生的故障告警推送到通知处理引擎模块进入下一层过滤。
[0014]通知处理引擎模块接收到上述的经过第一层过滤器过滤的故障告警,启动通知处理引擎将故障告警转化为告警通知。告警通知生成后,开始进入第二层过滤器进行第二次过滤。其中,第二层过滤器在以四种资源故障级别为依据和以四种告警方式为依据的前提下,又增加了多种角色的系统管理员的选择和组合,也就是说,第二层过滤器是由四种资源故障级别(故障恢复、一级警告、二级警告和无法连通)、四种告警方式(邮件、短信、窗口和声音)和η种角色的系统管理员(如数据库管理员、网络设备管理员和机房环境管理等)自由组合而成。
[0015]实施例:
如附图4所示,所述Windows服务器资源共设置三个监测项,分别为服务器内存状态、服务器所在机房运行环境情况和服务器网卡状态,每个监测项进行各自的轮询数据采集,将采集到的数据与预设告警阀值对比后,产生各自的监测状态,当出现故障恢复、一级警告、二级警告或无法连通状态时则产生故障告警。例如,第一种情况服务器内存坏了,则需要通过双重过滤的故障告警策略进行过滤,当为一级警告或二级警告状态的故障告警时,以邮件、短信的方式将告警通知发送给负责服务器运行的管理员;当为无法连通状态的故障告警时,以声音或短信的方式将告警通知发送给负责服务器硬件维护的管理员。第二种情况服务器网卡出现故障时,当为一级警告或二级警告状态时,以邮件或窗口的方式将告警通知发送给负责服务器运行的管理员和负责网络运行的管理员;当为无法连通状态时,以短信、声音或窗口的方式将告警通知发送给负责服务器硬件维护的管理员、负责网络设备维护的管理员、负责网络运行的管理员等。
[0016]上述【具体实施方式】仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述【具体实施方式】,任何符合本发明的一种双重过滤的数据中心监控系统故障告警方法的权利要求书的且任何所述【技术领域】的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。
【权利要求】
1.一种双重过滤的数据中心监控系统故障告警方法,其特征在于,其具体实现过程为: 设计资源监控模块、资源故障告警过滤器、告警通知方式过滤器、通知处理引擎模块,基于上述四种模块,其具体告警过程为: 资源监控模块根据监测参数,经过细粒度的划分,生成以监测参数为单位的监测项,并以此监测项为单位进行数据采集,产生各自的故障告警状态并选择各自的告警方式; 然后,资源故障告警过滤器和告警通知方式过滤器模块根据资源下属各监测项进行轮询数据采集时的故障状态,将故障告警状态、故障告警方式组合生成的第一层过滤器,基于该第一层过滤器产生的故障推送到通知处理引擎模块进入下一层过滤; 最后,通知处理引擎模块接收到经过第一层过滤器过滤的故障告警,生成告警通知后,再经由以资源故障告警状态、故障告警方式和系统管理员的选择组合为依据的第二层过滤器,将故障告警通知发送到负责处理故障的管理员处。
2.根据权利要求1所述的一种双重过滤的数据中心监控系统故障告警方法,其特征在于,所述故障告警状态包括故障恢复、一级警告、二级警告和无法连通四种,告警方式包括邮件、短?目、窗口和声音四种; 相对应的,第一层过滤器的生成过程为: 以资源故障级别为依据的故障恢复、一级警告、二级警告和无法连通四种级别自由组合的告警策略,以告警方式为依据的邮件、短信、窗口和声音四种告警方式自由组合的告警策略,将两种告警策略进行组合后生成上述第一层过滤器。
3.根据权利要求2所述的一种双重过滤的数据中心监控系统故障告警方法,其特征在于,所述系统管理员包括多种角色,该系统管理员包括数据库管理员、网络设备管理员和机房环境管理;相对应的,所述第二层过滤器则以上述四种资源故障告警状态、四种故障告警方式和多种系统管理员自由组合而成。
【文档编号】H04L12/24GK104468224SQ201410785902
【公开日】2015年3月25日 申请日期:2014年12月18日 优先权日:2014年12月18日
【发明者】陆峰, 刘成平, 李锋 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1