一种云环境下网卡故障监控与自动恢复的系统及方法与流程

文档序号:20161960发布日期:2020-03-24 21:06阅读:来源:国知局

技术特征:

1.一种云环境下网卡故障监控与自动恢复的系统,其特征在于:包括数据采集代理模块、数据存储模块、异常检测模块、告警模块、异常处理模块和恢复检测模块,所述数据采集代理模块与数据存储模块相连接,数据存储模块与异常检测模块相连接,异常检测模块与告警模块相连接,异常处理模块与告警模块相通信,恢复检测模块与异常检测模块、异常处理模块分别连接。

2.根据权利要求1所述的云环境下网卡故障监控与自动恢复的系统,其特征在于:还包括日志模块,所述日志模块与异常检测模块、告警模块、异常处理模块、恢复检测模块分别连接。

3.根据权利要求2所述的云环境下网卡故障监控与自动恢复的系统,其特征在于:所数据采集代理模块运行在计算节点上,用于从计算节点上获取网卡状态信息、日志信息及操作系统网络特征信息,并将获得的信息发送至数据存储模块。

4.根据权利要求3所述的云环境下网卡故障监控与自动恢复的系统,其特征在于:所述告警模块与异常处理模块通过hook触发连接。

5.根据权利要求4所述的云环境下网卡故障监控与自动恢复的系统,其特征在于:所述数据存储模块为时序数据库,发送到数据存储模块中的信息以时序的方式进行存储。

6.一种云环境下网卡故障监控与自动恢复的方法,其特征在于:该方法基于权利要求1-5所述的云环境下网卡故障监控与自动恢复的系统实现,具体包括以下步骤:

s1、待监控计算节点运行数据采集代理模块;

s2、数据采集代理模块动态采集计算节点的网卡状态信息、日志信息及操作系统网络特征信息;

s3、数据采集代理模块将采集到的信息发送至数据存储模块,数据存储模块对信息进行处理后采样并保存;

s4、异常检测模块对数据存储模块的数据进行特征提取,通过对特征比对检测网卡状态是否正常,若异常则定位到具体的故障原因;

s5、异常检测模块检测到异常将异常信息发送至告警模块;

s6、告警模块接收到告警请求发送至异常处理模块,异常处理模块接收到请求后进行异常处理;

s7、恢复检测模块检测异常是否恢复,并将状态同步至异常检测模块。

7.根据权利要求6所述的云环境下网卡故障监控与自动恢复的方法,其特征在于:还包括以下步骤:s8、日志模块记录所有异常及恢复操作过程。

8.根据权利要求7所述的云环境下网卡故障监控与自动恢复的方法,其特征在于:步骤s3中数据存储模块为时序数据库,使用存储后端保存信息,信息以时序的方式进行存储。

9.根据权利要求8所述的云环境下网卡故障监控与自动恢复的方法,其特征在于:步骤s6中使用hook机制,通过发送http请求的方式发送告警信息至异常处理模块。

10.根据权利要求9所述的云环境下网卡故障监控与自动恢复的方法,其特征在于:步骤s8中日志模块记录所有异常及恢复操作过程时,日志分级记录,且可自定义日志级别。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1