一种基于NGINX服务器集群的监控系统及方法与流程

文档序号:12278859阅读:398来源:国知局
一种基于NGINX服务器集群的监控系统及方法与流程

本发明涉及IT、网络管理技术领域,尤其涉及一种基于NGINX服务器集群的监控系统及方法。



背景技术:

目前,基于NGINX+Keepalived组建高可用WEB被广泛使用,其中一种系统部署架构是通过NGINX的反向代理实现WEB服务器的负载均衡,通过Keepalived保障NGINX的双机主备。在实际运作中,需要对网管系统的WEB应用进行监控,及时发现故障进行处理,保障网管系统稳步运行。当前已有方案主要针对单台应用服务器设备和单个软件进行监控,通过对硬件性能、网络和软件运行状态等反映业务运行情况的指标采集,并设定阀值,超过阀值区间产生告警来判断单台服务器、单个软件是否正常运行。

当前技术主要对单台应用服务器的CPU、内存、磁盘、ping不通,以及单个软件的运行状态进行告警监控。但缺乏对关联应用服务器、关联软件的联合分析。



技术实现要素:

本发明的目的在于,解决现有的NGINX服务器集群的监控方案存在的上述问题,提供了一种基于NGINX服务器集群的监控系统及方法,通过告警关联分析、关联告警影响分析,在WEB应用的可用性受影响时生成关联告警,提升用户感知,便于用户及时发现故障进行处理。

为了实现上述目的,一方面,本发明提供了一种基于NGINX服务器集群的监控方法,该方法包括以下步骤:

采集WEB应用配置项的指标数据,WEB应用配置项的指标数据包括性能指标;根据WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息;接收监控信息,监控者通过监控信息查看WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。

另一方面,本发明提供一种基于NGINX服务器集群的监控系统,具体包括:

数据采集模块,用于采集WEB应用配置项的指标数据,WEB应用配置项的指标数据包括性能指标;

数据处理模块,用于根据WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息;

IT网管应用:用于接收监控信息,监控者通过监控信息查看WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。

进一步地,该监控系统还包括告警处理模块,用于根据WEB应用配置项及配置项的关联关系,制定告警策略以及关联分析规则,告警策略为将监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。

进一步地,该系统还包括配置项管理模块,配置项管理模块用于定义WEB应用配置项及配置项的关联关系。

进一步地,WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。

进一步地,WEB应用配置项包括应用服务器、应用软件和中间件。

本发明提供的一种基于NGINX服务器集群的监控系统及方法,通过告警关联分析、关联告警影响分析,在WEB应用的可用性受影响时生成关联告警,提升用户感知,便于用户及时发现故障进行处理。

附图说明

图1为本发明实施例提供的一种基于NGINX服务器集群的监控系结构示意图;

图2为本发明实施例提供的一种基于NGINX服务器集群的监控方法流程示意图。

具体实施方式

下面通过附图和实施例,对本发明的技术方案作进一步的详细描述。

图1为本发明实施例提供的一种基于NGINX服务器集群的监控系结构示意图。如图1所示,该系统包括:数据采集模块31、数据处理模块32和IT网管应用33。其中,数据采集模块31用于采集WEB应用配置项的指标数据,WEB应用配置项的指标数据包括性能指标。数据处理模块32根据WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息,WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。IT网管应用33接收监控信息,监控者通过监控信息查看WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。

优选地,该系统还包括告警处理模块34,告警处理模块34用于根据WEB应用配置项及配置项的关联关系,制定告警策略以及关联分析规则,告警策略为将所述监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。

优选地,该系统还包括配置项管理模块35,配置项管理模块35用于定义所述WEB应用配置项及配置项的关联关系。

WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。WEB应用配置项包括应用服务器、应用软件和中间件。

监控者通过配置项管理模块35定义WEB应用配置项及配置项的关联关系;数据处理模块32通过配置项管理模块35加载WEB应用配置项及配置项的关联关系。其中,WEB应用配置项包括应用服务器、应用软件和中间件。

监控者通过告警处理模块34制定告警策略以及关联分析规则;数据处理模块32通过告警处理模块34加载告警策略以及关联分析规则。其中,告警策略为将监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。

关联分析规则包括:①同个配置项不同事件分析,比如NGINX每秒请求数突变、NGINX服务器错误率突变;②同类配置项相关事件分析,比如主备Keepalived进程状态同时异常;③关联配置项相关事件分析,比如集群主备切换;④影响业务的事件关联分析,比如ping不通VIP地址则表明WEB应用不可达,主用Keepalived、备用NGINX进程状态同时异常时WEB应用不可用。

图2为本发明实施例提供的一种基于NGINX服务器集群的监控方法流程示意图。如图2所示,该方法包括步骤201-203:

步骤201,采集WEB应用配置项的指标数据,WEB应用配置项的指标数据包括性能指标。

步骤202,根据WEB应用配置项的指标数据、告警策略以及关联分析规则,生成WEB应用配置项的监控信息。其中,WEB应用配置项的监控信息包括关联分析的监控信息和单个配置项的监控信息。

步骤203,接收监控信息,监控者通过监控信息查看WEB应用的架构拓扑的总体情况,以及根据需求对所述WEB应用配置项的运行情况进行查询。

优选地,步骤201之前,还可以包括步骤101和/或步骤102。

步骤101,监控者通过配置项管理模块35定义WEB应用配置项及配置项的关联关系;数据处理模块32通过配置项管理模块35加载WEB应用配置项及配置项的关联关系。其中,WEB应用配置项包括应用服务器、应用软件和中间件。

步骤102,监控者通过告警处理模块34制定告警策略以及关联分析规则;数据处理模块32通过告警处理模块34加载告警策略以及关联分析规则。其中,告警策略为将监控指标数据与设定的阀值区间进行比较,超出阀值时产生警告。

关联分析规则包括:①同个配置项不同事件分析,比如NGINX每秒请求数突变、NGINX服务器错误率突变;②同类配置项相关事件分析,比如主备Keepalived进程状态同时异常;③关联配置项相关事件分析,比如集群主备切换;④影响业务的事件关联分析,比如ping不通VIP地址则表明WEB应用不可达,主用Keepalived、备用NGINX进程状态同时异常时WEB应用不可用。

本发明实施例提供的一种基于NGINX服务器集群的监控系统及方法,通过告警关联分析、关联告警影响分析,在WEB应用的可用性受影响时生成关联告警,提升用户感知,便于用户及时发现故障进行处理。

以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1