一种基于openstack的虚拟机故障管理方法与流程

文档序号:17159850发布日期:2019-03-20 00:31阅读:164来源:国知局
一种基于openstack的虚拟机故障管理方法与流程

本发明涉及的是一种基于openstack的虚拟机故障管理方法。



背景技术:

在现有技术中,公知的技术是随着信息爆炸式的增长,云平台得到了越来越多的关注,openstack作为一款开源的云计算管理平台,得到很多公司的青睐,在虚拟机的使用过程中,如果虚拟机损坏或者出现了比较严重的故障,管理员可以在界面上查看并处理,但如果用户在使用过程中遇到的问题,但是horizon页面,虚拟机的状态依旧正常,管理员是没有办法去发现这样的问题的,因此需要一种故障管理方法,能快速处理虚拟机故障,并能通知管理员。这是现有技术所存在的不足之处。



技术实现要素:

本发明的目的就是针对现有技术所存在的不足,而提供一种基于openstack的虚拟机故障管理方法,该方法允许可以在使用中遇到故障时,及时反馈给管理员并解决,这样不仅可以提高用户的使用感受,也可以较快的发现、定位并预防一些问题,提高整个环境的易用性,也可以对环境中遇到的问题有一个清晰地记录。

本方案是通过如下技术措施来实现的:一种基于openstack的虚拟机故障管理方法,包括如下步骤:1)对虚拟机进行故障监控;2)在监听到虚拟机故障时,查看虚拟机所在物理主机的状态,如果物理主机状态正常,则进入步骤3),如果物理主机异常,则向管理员发出报警;3)检测虚拟机的心跳信息,根据心跳信息判断虚拟机是否故障,如果虚拟机故障,则重启虚拟机。这样首先判断物理主机是否故障,而不是直接重启虚拟机,这样可以给用户更好的体验,避免无故重启虚拟机。

所述的步骤2)中查看虚拟机所在物理主机的状态时,判断虚拟机所在物理主机的当前资源使用情况,如果cpu或内存使用率为100%,则物理主机异常,如果cpu使用率*0.5+内存使用率*0.5大于设定值,所述的设定值为90%,则物理主机异常。这样可以判断出虚拟机是否异常,便于管理员处理。

物理主机异常时,重启虚拟机,并重新查看物理主机状态,如果依然物理主机异常,则重新重启虚拟机,当重启次数达到n次时,关闭虚拟主机,并向管理员发出报警并记录故障,其中n≤5。这样可以判断出是否是虚拟机影响物理主机的运行,并且设定重启次数,避免无限制的重启,提高用户的使用体验。

所述的步骤1)中在对虚拟机进行故障监控时,实时对虚拟机进行镜像并进行存储。这样避免故障时,数据丢失的情况,并且镜像后,可以直接投入使用。

在检测虚拟机心跳信息时,设定周期t,如果在周期t内为监听到虚拟机用于更新的心跳信息时,则判断虚拟机故障。步骤3)中,重启虚拟机后,重复步骤3)如果虚拟机重启次数超过n,则通知管理员,并创建新的虚拟机,新的虚拟机采用步骤3)中第一次重启前的原虚拟机的镜像。这样能够确认是否是虚拟机自身的故障,而不会无限次数的重启,节省了资源。创建新的虚拟机后,将原虚拟机挂载的数据盘进行格式化。既可以避免数据丢失,也可以使得物理主机的数据盘不会受之前使用者的影响。

由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。

附图说明

图1为本发明具体实施方式的流程图。

具体实施方式

为能清楚说明本方案的技术特点,下面通过一个具体实施方式,并结合其附图,对本方案进行阐述。

通过附图可以看出,本方案的基于openstack的虚拟机故障管理方法,包括如下步骤:1)对虚拟机进行故障监控;实时对虚拟机进行镜像并进行存储;2)在监听到虚拟机故障时,查看虚拟机所在物理主机的状态,如果物理主机状态正常,则进入步骤3),如果物理主机异常,则向管理员发出报警;3)检测虚拟机的心跳信息,根据心跳信息判断虚拟机是否故障,如果虚拟机故障,则重启虚拟机,在检测虚拟机心跳信息时,设定周期t,如果在周期t内为监听到虚拟机用于更新的心跳信息时,则判断虚拟机故障。

步骤2)中查看虚拟机所在物理主机的状态时,判断虚拟机所在物理主机的当前资源使用情况,如果cpu或内存使用率为100%,则物理主机异常,如果cpu使用率*0.5+内存使用率*0.5大于设定值,设定值为90%,则物理主机异常。物理主机异常时,重启虚拟机,并重新查看物理主机状态,如果依然物理主机异常,则重新重启虚拟机,当重启次数达到n次时,关闭虚拟主机,并向管理员发出报警并记录故障,其中n≤5。

步骤3)中,重启虚拟机后,重复步骤3)如果虚拟机重启次数超过n,则通知管理员,并创建新的虚拟机,新的虚拟机采用步骤3)中第一次重启前的原虚拟机的镜像,创建新的虚拟机后,将原虚拟机挂载的数据盘进行格式化。

本发明并不仅限于上述具体实施方式,本领域普通技术人员在本发明的实质范围内做出的变化、改型、添加或替换,也应属于本发明的保护范围。



技术特征:

技术总结
本发明提供了一种基于openstack的虚拟机故障管理方法,其特征是包括如下步骤:1)对虚拟机进行故障监控;2)在监听到虚拟机故障时,查看虚拟机所在物理主机的状态,如果物理主机状态正常,则进入步骤3),如果物理主机异常,则向管理员发出报警;3)检测虚拟机的心跳信息,根据心跳信息判断虚拟机是否故障,如果虚拟机故障,则重启虚拟机。该方法允许可以在使用中遇到故障时,及时反馈给管理员并解决,这样不仅可以提高用户的使用感受,也可以较快的发现、定位并预防一些问题,提高整个环境的易用性,也可以对环境中遇到的问题有一个清晰地记录。

技术研发人员:赵程程;谢永志
受保护的技术使用者:郑州云海信息技术有限公司
技术研发日:2018.11.20
技术公布日:2019.03.19
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1