一种运维系统故障自动诊断方法及系统与流程

文档序号:11154791阅读:来源:国知局

技术特征:

1.一种运维系统故障自动诊断方法,其特征在于,包括如下步骤:

步骤S1,获得运维系统正常运行的相关参数的运行信息;

步骤S2,建立运维系统运行故障时相关参数运行异常的判断依据;

步骤S3,采集运维系统运行中相关参数的运行信息;

步骤S4,对运维系统运行故障进行故障识别及关闭相关程序。

2.根据权利要求1所述的运维系统故障自动诊断方法,其特征在于,所述相关参数包括被监测的接口程序与采集服务之间的通讯协议连接的状态、被监测的接口程序的内存使用状态,以及操作系统的系统事件。

3.根据权利要求2所述的运维系统故障自动诊断方法,其特征在于,所述步骤S3包括并行采用的3种相关参数的采集方式,包括:

采用定时轮询的方式,采集被监测的接口程序与采集服务之间的通讯协议的连接状态,获取接口程序的通讯是否断开的信息;

实时采集被监测的接口程序的内存使用状态,以设定的时间为单位获取当前的内存使用量,将每一设定的时间的内存使用量和上一设定的时间的内存使用量进行对比,以获取接口程序是否卡死的信息;

采用定时轮询的方式,采集操作系统的系统事件,以获取接口程序是否存在报错事件的信息。

4.根据权利要求1所述的运维系统故障自动诊断方法,其特征在于,所述相关参数包括被监测的接口程序与采集服务之间的通讯协议连接的状态、被监测的接口程序的CPU利用率,以及操作系统的系统事件。

5.根据权利要求4所述的运维系统故障自动诊断方法,其特征在于,所述步骤S3包括并行采用的3种相关参数的采集方式,包括:

采用定时轮询的方式,采集被监测的接口程序与采集服务之间的通讯协议的连接状态,获取接口程序的通讯是否断开的信息;

实时采集被监测的接口程序的CPU利用率,以设定的时间为单位获取当前的CPU利用率,将每一设定的时间的CPU利用率和上一设定的时间的CPU利用率进行对比,以获取接口程序是否卡死的信息;

采用定时轮询的方式,采集操作系统的系统事件,以获取接口程序是否存在报错事件的信息。

6.根据权利要求3或5所述的运维系统故障自动诊断方法,其特征在于,所述定时轮询的流程包括定时读取任务数据和调用指令处理流程进行任务处理。

7.一种运维系统故障自动诊断系统,其特征在于,所述运维系统故障自动诊断系统采用权利要求1-6任一所述的运维系统故障自动诊断方法,包括:核心处理单元,与核心处理单元相连的设置单元、监听单元、判断单元和报警单元;其中

所述设置单元,用于设置要监听的运维系统正常运行的相关参数的运行信息;

所述监听单元,用于获取所述的运维系统运行的相关参数的运行信息;

所述判断单元,用于根据监听单元获取的运维系统运行的相关参数的运行信息,判断各相关参数的运行是否正常;以及

报警单元,当判断单元判断有相关参数的运行异常时发出报警信号;

程序启动单元,用于当运维系统运行状态异常时,重启接口程序;即

所述核心处理单元接收所述监听单元获取的运维系统运行的相关参数的运行信息后发送给判断单元以判断各相关参数的运行是否正常,判断单元将判断结果发送给核心处理单元,当判断单元判断有相关参数的运行异常时,核心处理单元对运行异常进行故障识别,并将识别的故障信号发送至报警单元,同时核心处理单元控制程序启动单元进行接口程序的重启。

8.根据权利要求7所述的运维系统故障自动诊断系统,其特征在于,所述核心处理单元还适于通过无线模块将报警信息发送至工作人员的智能终端。

9.根据权利要求8所述的运维系统故障自动诊断系统,其特征在于,所述相关参数包括被监测的接口程序与采集服务之间的通讯协议连接的状态、被监测的接口程序的内存使用状态和/或CPU利用率,以及操作系统的系统事件。

10.根据权利要求9所述的运维系统故障自动诊断系统,其特征在于,所述运维系统故障自动诊断系统还包括一轮询单元,用于根据监听策略启动定时器,并在计时结束时通知监听单元抓取数据。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1