一种Linux平台组件统一监控的方法与流程

文档序号:12550535阅读:289来源:国知局

本发明涉及生产环境监控技术,尤其涉及一种Linux平台组件统一监控的方法。



背景技术:

随着信息化水平的发展,各类系统层出不穷,伴随着消费者复杂多变的需求,产品部署所需的技术组件也日益增多,如何保证生产环境产品的安全、稳定运行也逐步成为企业关注的重点。



技术实现要素:

面对各类层出不穷的软件产品,为了保障产品的安全、稳定运行,本发明提出了一种Linux平台组件统一监控的方法,定义统一的健康检查规范,对于系统运行所需的核心组件,可以按照规范,自定义针对组件的yaml格式配置,无论是单机还是集群组件,均可对运行状况进行监控,保证系统的健康运行。

本发明的目的是对Linux平台下组件健康状态进行实时统一监控管理,保证产品的稳定运行。

本发明的技术方案是:

一种Linux平台组件统一监控的方法,

监控服务启动成功后,会读取指定目录中的配置文件,根据组件配置的健康探测类型和方法,监控进程实时调用确认组件运行状态,并对失败的状态进行记录,如果达到特定次数,则系统认为该组件无法正常提供服务,将按照配置的脚本进行服务重启。

健康监控服务启动时可以指定监控配置的路径,监控服务会遍历该路径下的所有yaml配置文件。

配置文件模板如下:

针对每个组件,监控服务会首先对按照detect配置其进行探测,检测进程pid文件是否存在,除了pid方式外,监控服务支持file方式,指定组件探测文件,服务会自动进行调用,并按照返回值来判定执行结果以及组件的可用状态,对于监测失败的组件,服务会自动对失败次数进行计数,若失败次数到达detect定义的retry数,则对该服务进行重启。

配置中start、stop、restart分别对应组件的启动、停止、重启命令,type支持standard和file方式,standard标识该服务为系统标准的服务,运行标准服务的启停命令来进行操作;针对非标准的服务,定义为file的方式,定义自己的操作脚本。

本发明的有益效果是

对Linux平台组件的运行状况进行有效的监测,有效保障了系统运行的稳定性。

附图说明

图1是健康监测示意图。

具体实施方式

下面对本发明的内容进行更加详细的阐述:

健康监控服务启动时可以指定监控配置的路径,监控服务会遍历该路径下的所有yaml配置文件,配置文件模板如下:

针对每个组件,监控服务会首先对按照detect配置其进行探测,最常见的方式为检测进程pid文件是否存在,除了pid方式外,监控服务支持file方式,指定组件探测文件,服务会自动进行调用,并按照返回值来判定执行结果以及组件的可用状态,对于监测失败的组件,服务会自动对失败次数进行计数,若失败次数到达detect定义的retry数,则对该服务进行重启。

配置中start、stop、restart分别对应组件的启动、停止、重启命令,type支持standard和file方式,standard标识该服务为系统标准的服务,运行标准服务的启停命令来进行操作,比如sshd服务在CentOS7下对应为:

systemctl start sshd.service

针对非标准的服务,比如Tomcat,可以定义为file的方式,定义自己的操作脚本。

cluster配置该组件是单节点还是集群部署,若为单节点则直接按照detect等配置进行操作,对于集群部署的组件,若没有管理节点,则启停或检测会涉及多个节点,需要配置节点ip地址以及各节点操作顺序,当然也可以指定文件,各节点的操作均在文件中指定。

此外,不同组件之间可能存在功能依赖,比如NFS组件依赖于rpcbind组件,则可以在NFS的配置中配置dependency,多个组件按照依赖顺序检测。

另外,为了满足个性化的需求,也可针对特定服务进行相应的拓展,定义相应的名单。

本发明是一种对Linux平台下组件健康状态进行实时统一监控管理的方法,基于该方法,对于安装在系统中的组件,只需要按照支持的选项对组件进行配置,并统一放到特定路径下,即可将组件纳入统一健康监控管理。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1