一种虚拟化云平台故障修复方法、装置、设备及介质与流程

文档序号:35516859发布日期:2023-09-20 22:52阅读:43来源:国知局
一种虚拟化云平台故障修复方法、装置、设备及介质与流程

本申请涉及虚拟化,特别涉及一种虚拟化云平台故障修复方法、装置、设备及介质。


背景技术:

1、虚拟化云平台能够在多台物理主机上整合计算、存储、网络等资源,并管理着各个物理主机上派生出的各种虚拟化资源,如虚拟机、虚拟磁盘、sds(software definedstorage,软件定义存储)存储、sdn(software defined network,软件定义网络)网络等。

2、需要指出的是,虚拟化云平台在部署完成后需要对其进行运维,目前大部分运维工具仅提供了巡检功能,即使能够排查出问题并提供修复建议,但后续的故障修复工作仍需人工介入,且虚拟化云平台管理的分布式集群规模较大,存在几十甚至上百个节点,且分布式组件之间存在依赖,故日常运维的复杂度高,而故障排查及恢复操作需要综合判断,因此耗费了大量的人力成本和时间成本。另外,在对虚拟化云平台进行运维的过程中存在一个难点,在于当一个资源出现故障时,修复步骤往往是有顺序依赖的,一旦手动运维时操作失误,可能对虚拟化云平台的系统造成不可逆的损坏,导致故障修复变得更加复杂,因此如何对虚拟化云平台进行故障识别,并对识别出的故障进行修复是本领域目前还有待进一步解决的问题。


技术实现思路

1、有鉴于此,本申请的目的在于提供一种虚拟化云平台故障修复方法、装置、设备及存储介质,能够大大提升虚拟化云平台中故障识别的效率,缩短虚拟化云平台的故障时间,降低人工对资源的误操作,实现故障修复的智能化,有效地保证虚拟化云平台资源的有效性及虚拟化云平台的高效且健壮运行。其具体方案如下:

2、第一方面,本申请公开了一种虚拟化云平台故障修复方法,包括:

3、按照预设的资源划分规则对虚拟化云平台的各项资源进行检测,得到资源检测结果;

4、根据所述资源检测结果判断所述虚拟化云平台的各项资源中是否存在故障资源;

5、若所述虚拟化云平台的各项资源中存在故障资源,则确定所述故障资源的故障类型;

6、若所述故障资源的故障类型为不可修复的物理类故障,则将所述故障资源从所述虚拟化云平台管理的所有物理主机构成的虚拟化集群中移除,并生成相应的修复建议,以对移除后的所述故障资源进行人工修复;

7、若所述故障资源的故障类型为可修复的软件类故障,则使用相应的修复软件对所述故障资源进行自动修复。

8、可选的,所述按照预设的资源划分规则对虚拟化云平台的各项资源进行检测,得到资源检测结果,包括:

9、对虚拟化云平台的总体运行资源、计算资源、网络资源和存储资源进行检测,得到相应的总体运行资源检测结果、计算资源检测结果、网络资源检测结果和存储资源检测结果;

10、相应的,所述根据所述资源检测结果判断所述虚拟化云平台的各项资源中是否存在故障资源,包括:

11、根据所述总体运行资源检测结果、所述计算资源检测结果、所述网络资源检测结果和所述存储资源检测结果判断所述虚拟化云平台的各项资源中是否存在故障资源。

12、可选的,所述总体运行资源包括主机状态检测、主机名称一致性检测、服务状态检测、许可证检测、系统告警检测、资源使用超分配检测、软件版本检测及出厂预装节点检测。

13、可选的,所述计算资源包括cpu资源使用检测、内存资源使用检测、虚拟机快照检测、虚拟机备份检测、虚拟机资源检测及虚拟机计划任务检测。

14、可选的,所述网络资源包括物理网卡检测、链路聚合检测、重复ip地址检测、网络检测。

15、可选的,所述存储资源包括硬盘检测、服务状态检测、副本一致性检测、硬件检测、cache使用率检测、适配器检测、多路径检测、空间检测、存储挂载状态检测。

16、可选的,所述确定所述故障资源的故障类型,包括:

17、利用faq检索系统确定所述故障资源的故障类型。

18、第二方面,本申请公开了一种虚拟化云平台故障修复装置,包括:

19、资源检测模块,用于按照预设的资源划分规则对虚拟化云平台的各项资源进行检测,得到资源检测结果;

20、故障资源判断模块,用于根据所述资源检测结果判断所述虚拟化云平台是否存在故障资源;

21、故障类型确定模块,用于如果所述虚拟化云平台存在故障资源,则确定所述故障资源的故障类型;

22、故障资源移除模块,用于如果所述故障资源的故障类型为不可修复的物理类故障,则将所述故障资源从所述虚拟化云平台管理的所有物理主机构成的虚拟化集群中移除,并生成相应的修复建议,以对移除后的所述故障资源进行人工修复;

23、故障资源修复模块,用于如果所述故障资源的故障类型为可修复的软件类故障,则使用相应的修复软件对所述故障资源进行自动修复。

24、第三方面,本申请公开了一种电子设备,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的计算机程序时实现前述的虚拟化云平台故障修复方法。

25、第四方面,本申请公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述的虚拟化云平台故障修复方法。

26、可见,本申请先按照预设的资源划分规则对虚拟化云平台的各项资源进行检测得到资源检测结果,然后根据所述资源检测结果判断所述虚拟化云平台的各项资源中是否存在故障资源,如果所述虚拟化云平台的各项资源中存在故障资源,则确定所述故障资源的故障类型;若所述故障资源的故障类型为不可修复的物理类故障,则将所述故障资源从所述虚拟化云平台管理的所有物理主机构成的虚拟化集群中移除,并生成相应的修复建议,以对移除后的所述故障资源进行人工修复;若所述故障资源的故障类型为可修复的软件类故障,则使用相应的修复软件对所述故障资源进行自动修复。由上可见,本申请通过预设的资源划分规则对虚拟化云平台的各种运行资源进行巡检,然后通过检测结果确定出故障资源,再利用修复软件对软件类故障进行自动修复,对物理类故障进行移除并生成相应的修复建议,以便通过人工的方式对故障资源进行修复。本申请通过预设的资源划分规则能够大大提升虚拟化云平台中故障识别的效率,通过检测策略与修复策略相结合,能够缩短虚拟化云平台的故障时间,降低人工对资源的误操作,实现故障修复的智能化,有效地保证了虚拟化云平台资源的有效性及虚拟化云平台的高效且健壮运行。



技术特征:

1.一种虚拟化云平台故障修复方法,其特征在于,包括:

2.根据权利要求1所述的虚拟化云平台故障修复方法,其特征在于,所述按照预设的资源划分规则对虚拟化云平台的各项资源进行检测,得到资源检测结果,包括:

3.根据权利要求2所述的虚拟化云平台故障修复方法,其特征在于,所述总体运行资源包括主机状态检测、主机名称一致性检测、服务状态检测、许可证检测、系统告警检测、资源使用超分配检测、软件版本检测及出厂预装节点检测。

4.根据权利要求2所述的虚拟化云平台故障修复方法,其特征在于,所述计算资源包括cpu资源使用检测、内存资源使用检测、虚拟机快照检测、虚拟机备份检测、虚拟机资源检测及虚拟机计划任务检测。

5.根据权利要求2所述的虚拟化云平台故障修复方法,其特征在于,所述网络资源包括物理网卡检测、链路聚合检测、重复ip地址检测、网络检测。

6.根据权利要求2所述的虚拟化云平台故障修复方法,其特征在于,所述存储资源包括硬盘检测、服务状态检测、副本一致性检测、硬件检测、cache使用率检测、适配器检测、多路径检测、空间检测、存储挂载状态检测。

7.根据权利要求1至6任一项所述的虚拟化云平台故障修复方法,其特征在于,所述确定所述故障资源的故障类型,包括:

8.一种虚拟化云平台故障修复装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括处理器和存储器;其中,所述处理器执行所述存储器中保存的计算机程序时实现如权利要求1至7任一项所述的虚拟化云平台故障修复方法。

10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的虚拟化云平台故障修复方法。


技术总结
本申请公开了一种虚拟化云平台故障修复方法、装置、设备及介质,涉及虚拟化技术领域,包括:按照预设的资源划分规则对虚拟化云平台的各项资源进行检测;根据资源检测结果判断虚拟化云平台的各项资源中是否存在故障资源;若存在故障资源,则确定故障资源的故障类型;若故障类型为不可修复的物理类故障,则将故障资源从虚拟化云平台管理的所有物理主机构成的虚拟化集群中移除并生成相应的修复建议,以对移除后的故障资源进行人工修复;若故障类型为可修复的软件类故障,则使用修复软件对故障资源进行自动修复。本申请能够提升虚拟化云平台中故障识别的效率,实现故障修复的智能化,有效保证了资源的有效性及虚拟化云平台的高效且健壮运行。

技术研发人员:涂小萌,马怀旭
受保护的技术使用者:济南浪潮数据技术有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1