本发明涉及信息系统运维监控,特别是涉及一种系统服务监测方法及装置、存储介质、终端。
背景技术:
1、k8s是一个最初由google开发的,用于自动化部署、扩展和管理容器化应用的开源容器编排器技术。k8s使部署和管理微服务架构应用程序变得很简单。例如,现有的很多电网服务应用均是基于k8s容器调度平台搭建的,其提供了一个可弹性运行分布式系统的框架,满足了用户的应用扩展、故障转移、自我修复等需求,大大提高了服务的可用性。
2、但由于k8s在故障转移、自我修复的过程中,会销毁和重启pod节点,致使pod运行数据丢失。导致系统服务异常容易被忽略,且大大增加了服务异常问题的排查难度,导致系统服务的运维效率较低。
技术实现思路
1、有鉴于此,本发明提供一种系统服务监测方法及装置、存储介质、终端,主要目的在于解决现有系统服务的运维效率较低的问题。
2、依据本发明一个方面,提供了一种系统服务监测方法,包括:
3、获取目标系统中资源对象的运行数据及配置参数;
4、依据所述运行数据及所述配置参数确定所述资源对象的资源运行状态;
5、若任一所述资源对象的资源运行状态为异常,则依据异常资源对象的异常信息及所述目标系统的系统拓扑关系,生成包含异常级别的异常提示信息,所述系统拓扑关系包括所述目标系统下各个功能服务与至少一级资源对象之间的关联关系;
6、将所述异常提示信息发送至目标终端。
7、进一步地,所述依据异常资源对象的异常信息及所述目标系统的系统拓扑关系,生成包含异常级别的异常提示信息,包括:
8、从所述系统拓扑关系中识别出与所述异常资源对象关联的至少一个功能服务;
9、依据所述功能服务的权重系数、及所述功能服务的数量计算得到异常系数,并基于所述异常系数确定异常级别;
10、依据所述异常级别、所述异常资源对象、以及所述异常信息生成异常提示信息。
11、进一步地,所述从所述系统拓扑关系中识别出与所述异常资源对象关联的至少一个功能服务之前,所述方法还包括:
12、获取所述目标系统中的至少一项功能服务;
13、通过解析所述功能服务的资源配置信息,得到各项所述功能服务对应的deployment对象、及pod对象;
14、依据所述功能服务、所述deployment对象、及所述pod对象之间的关联关系构建系统拓扑关系,其中,所述deployment对象与所述功能服务的对应关系不唯一。
15、进一步地,所述资源对象包括deployment对象、及pod对象,所述运行数据包括pod运行状态,所述依据所述运行数据及所述配置参数确定所述资源对象的资源运行状态,包括:
16、若所述pod运行状态为异常,则将所述pod对象的上级deployment对象的资源运行状态确定为异常;
17、若所述pod运行状态为正常,则依据所述运行数据及所述配置参数确定所述资源对象的资源运行状态。
18、进一步地,所述运行数据包括所述pod对象的第一运行数据、及所述pod对象的上级deployment对象的第二运行数据,所述配置参数为deployment对象的配置参数,所述依据所述运行数据及所述配置参数确定所述资源对象的资源运行状态,包括:
19、依据所述第一运行数据、及所述配置参数计算得到第一cpu使用率和第一内存使用率;
20、依据所述第二运行数据、及所述配置参数计算得到第二cpu使用率和第二内存使用率;
21、若所述第一cpu使用率、所述第一内存使用率、所述第二cpu使用率、所述第二内存使用率中的任一一个未满足对应的使用率阈值,则确定所述资源对象的所述资源运行状态为异常。
22、进一步地,所述将所述异常提示信息发送至目标终端之后,所述方法还包括:
23、获取所述目标系统在预设历史时间段内的历史资源使用曲线,并从所述历史资源使用曲线中提取得到资源需求信息;
24、将所述资源需求信息、及所述异常提示信息发送至所述目标终端。
25、进一步地,所述获取目标系统中资源对象的运行数据及配置参数之后,所述方法还包括:
26、将所述运行数据及配置参数存储至目标存储空间,并获取所述目标存储空间的访问路径信息;
27、建立所述访问路径信息与所述资源对象的映射关系;
28、所述将所述异常提示信息发送至目标终端之后,所述方法还包括:
29、调取所述异常资源对象的访问路径信息,并将所述访问路径信息发送至所述目标终端。
30、依据本发明另一个方面,提供了一种系统服务监测装置,包括:
31、获取模块,用于获取目标系统中资源对象的运行数据及配置参数;
32、确定模块,用于依据所述运行数据及所述配置参数确定所述资源对象的资源运行状态;
33、生成模块,用于若任一所述资源对象的资源运行状态为异常,则依据异常资源对象的异常信息及所述目标系统的系统拓扑关系,生成包含异常级别的异常提示信息,所述系统拓扑关系包括所述目标系统下各个功能服务与至少一级资源对象之间的关联关系;
34、发送模块,用于将所述异常提示信息发送至目标终端。
35、进一步地,所述生成模块,包括:
36、识别单元,用于从所述系统拓扑关系中识别出与所述异常资源对象关联的至少一个功能服务;
37、计算单元,用于依据所述功能服务的权重系数、及所述功能服务的数量计算得到异常系数,并基于所述异常系数确定异常级别;
38、生成单元,用于依据所述异常级别、所述异常资源对象、以及所述异常信息生成异常提示信息。
39、进一步地,所述装置还包括:
40、所述获取模块,还用于获取所述目标系统中的至少一项功能服务;
41、解析模块,用于通过解析所述功能服务的资源配置信息,得到各项所述功能服务对应的deployment对象、及pod对象;
42、构建模块,用于依据所述功能服务、所述deployment对象、及所述pod对象之间的关联关系构建系统拓扑关系,其中,所述deployment对象与所述功能服务的对应关系不唯一。
43、进一步地,所述确定模块,包括:
44、第一确定单元,用于若所述pod运行状态为异常,则将所述pod对象的上级deployment对象的资源运行状态确定为异常;
45、第二确定单元,用于若所述pod运行状态为正常,则依据所述运行数据及所述配置参数确定所述资源对象的资源运行状态。
46、进一步地,在具体应用场景中,所述第二确定单元,具体用于依据所述第一运行数据、及所述配置参数计算得到第一cpu使用率和第一内存使用率;依据所述第二运行数据、及所述配置参数计算得到第二cpu使用率和第二内存使用率;若所述第一cpu使用率、所述第一内存使用率、所述第二cpu使用率、所述第二内存使用率中的任一一个未满足对应的使用率阈值,则确定所述资源对象的所述资源运行状态为异常。
47、进一步地,所述装置还包括:
48、提取模块,用于获取所述目标系统在预设历史时间段内的历史资源使用曲线,并从所述历史资源使用曲线中提取得到资源需求信息;
49、所述发送模块,还用于将所述资源需求信息、及所述异常提示信息发送至所述目标终端。
50、进一步地,所述装置还包括:
51、存储模块,用于将所述运行数据及配置参数存储至目标存储空间,并获取所述目标存储空间的访问路径信息;
52、映射关系建立模块,用于建立所述访问路径信息与所述资源对象的映射关系;
53、所述发送模块,还用于调取所述异常资源对象的访问路径信息,并将所述访问路径信息发送至所述目标终端。
54、根据本发明的又一方面,提供了一种存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述系统服务监测方法对应的操作。
55、根据本发明的再一方面,提供了一种终端,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
56、所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述系统服务监测方法对应的操作。
57、借由上述技术方案,本发明实施例提供的技术方案至少具有下列优点:
58、本发明提供了一种系统服务监测方法及装置、存储介质、终端,本发明实施例通过获取目标系统中资源对象的运行数据及配置参数;依据所述运行数据及所述配置参数确定所述资源对象的资源运行状态;若任一所述资源对象的资源运行状态为异常,则依据异常资源对象的异常信息及所述目标系统的系统拓扑关系,生成包含异常级别的异常提示信息,所述系统拓扑关系包括所述目标系统下各个功能服务与至少一级资源对象之间的关联关系;将所述异常提示信息发送至目标终端,大大减少了异常资源对象的排查时间,降低了系统服务异常的排查难度,同时,又确保了异常判定的精确度,从而大大提高系统服务故障运维的效率。
59、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。