本发明属于计算机领域,具体涉及一种云平台运行维护方法、系统、设备及介质。
背景技术:
1、云管平台提供全方位的云资源供给、运维和运营管理能力,具备一体化管控、自动化运维、智能化分析以及个性化扩展等核心竞争力,能够为客户快速构建云数据中心,提供包含服务器、计算虚拟化、存储虚拟化、网络虚拟化等产品,简化it提升运维效率,加速企业数字化转型,扩大客户数字化转型收益。随着云计算技术的发展,越来越多的云平台和服务类型出现,如vm、kvm、openstack、kubernetes等,如何有效的监控以及保障各个服务的正常平稳运行是目前云管平台建设过程中遇到的一个问题。
2、传统的云平台的状态维护方法中,均需要对云平台的运行状态进行监控,监控的方式多种多样,例如收集多种运行状态数据通过人工智能模型进行判断。
3、但传统的方式无论采用人工智能模型还是采用预设的策略都是以有效对突发的情况进行判断,导致对云平台状态的判断不够准确。
技术实现思路
1、为解决上述问题,本发明提出一种云平台运行维护方法,包括:
2、获取目标服务不同维度的状态数据;
3、基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断;
4、响应于所述判断为异常,获取与所述异常匹配的修复方案,并通过所述修复方案对所述目标服务进行修复。
5、在本发明的一些实施方式中,基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤包括:
6、将多种维度的可量化数据根据时间关系计算量化比例;
7、响应于在多个维度的判断结果不一致,对比用于多个维度对应的量化数据的量化比例是否一致,并判断量化比例的对比结果是否与所述多个维度的判断结果一致;
8、响应于所述量化比例的对比结果与所述多个维度的判断结果一致,则将所述多个维度的判断结果为异常的维度的判断结果设定为误判;
9、响应于所述量化比例的对比结果与所述多个维度的判断结果不一致,则将所述多个维度的判断结果为异常的维度的判断结果设定为正确,且将所述目标服务设定为异常。
10、在本发明的一些实施方式中,基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤包括:
11、从所述不同维度的状态数据解析出所述目标服务所在的计算机的资源状态数据,并判断所述资源状态数据使用率是否超过预设的参考阈值;
12、响应于所述资源状态数据的使用率超过所述参考阈值,则将所述目标服务器的运行状态设定为异常;
13、响应于所述资源状态数据的使用率不超过所述参考阈值,则将所述目标服务器的运行状态设定为正常。
14、在本发明的一些实施方式中,基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤还包括:
15、从所述不同维度的状态数据解析出所述目标服务所处理的业务数据,判断所述业务数据的执行状态是否异常,并统计执行异常次数;
16、响应于所述执行异常次数超过预设值,则将所述目标服务器的运行状态设定为异常;
17、响应于所述执行异常次数不超过预设值,则将所述目标服务器的运行状态设定为正常。
18、在本发明的一些实施方式中,基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤还包括:
19、从所述不同维度的状态数据解析出所述目标服务输出的任务日志,并判断所述输出任务日志的时间是否超时,并统计超时次数;
20、响应于所述目标服务的超时次数超过预定值,则将所述目标服务器的运行状态设定为异常;
21、响应于所述目标服务的超时次数不超过预定值,则将所述目标服务器的运行状态设定为正常。
22、在本发明的一些实施方式中,基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤还包括:
23、获取多个维度的判断结果,分别统计不同结果的次数,将次数最多的结果作为所述目标服务的状态。
24、在本发明的一些实施方式中,响应于所述判断为异常,获取与所述异常匹配的修复方案,并通过所述修复方案对所述目标服务进行修复的步骤包括:
25、响应于产生异常,记录所述目标服务异常时对所述目标服务的操作以及所述目标服务所在的计算机的所有操作及操作结果;
26、根据所述操作结果判断在所述计算机上的所有操作是否有效,并将有效的操作作为对应异常的修复方案。
27、本发明的另一方面还提出一种云平台运行维护系统,包括:
28、数据获取模块,所述数据获取模块配置用于获取目标服务不同维度的状态数据;
29、状态判断模块,所述状态判断模块配置用于基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断;
30、状态修复模块,所述状态修复模块配置用于响应于所述判断为异常,获取与所述异常匹配的修复方案,并通过所述修复方案对所述目标服务进行修复。
31、本发明的又一方面还提出一种计算机设备,包括:
32、至少一个处理器;以及
33、存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现上述实施方式中任意一项所述方法的步骤。
34、本发明的再一方面还提出一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述实施方式中任意一项所述方法的步骤。
35、通过本发明提出的一种云平台运行维护方法,从多个维度对云平台的目标服务的运行状态进行评估,当基于多个维度的评估结果均为异常后,获取解决该异常的方案对云平台进行自动维护。
36、进一步,将不同维度的评估数据中可量化的数据进行关联,当多个维度的评估机制不统一时根据可量化数据的关系,确定可量化的数据是否匹配,如果可量化数据匹配则说明数据关系上没有错,可能是评估机制存在缺陷,则可将评估结果为异常的维度的结果进行忽略。
1.一种云平台运行维护方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤包括:
4.根据权利要求1所述的方法,其特征在于,所述基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤还包括:
5.根据权利要求1所述的方法,其特征在于,所述基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤还包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述不同维度的状态数据从多个维度对所述目标服务的状态进行判断的步骤还包括:
7.根据权利要求1所述的方法,其特征在于,所述响应于所述判断为异常,获取与所述异常匹配的修复方案,并通过所述修复方案对所述目标服务进行修复的步骤包括:
8.一种云平台运行维护系统,其特征在于,包括:
9.一种计算机设备,其特征在于,包括:
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任意一项所述方法的步骤。