虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法_3

文档序号:9306584阅读:来源:国知局
将虚拟机I正常重启或关闭作为虚拟机I故障的误报情形。
[0059]结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机储存器、内存、只读存储器、电可编程R0M、电可擦除可编程R0M、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其他形式的存储介质中。
[0060]可以理解的是,对于本领域的普通技术人员来说,可以根据本发明的技术构思做出其它各种相应的改变与变形,而所有这些改变与变形都应属于本发明权利要求的保护范围。
【主权项】
1.一种虚拟机故障检测和恢复的系统,其特征在于,其包括至少一台虚拟机以及一台虚拟机管理器;虚拟机运行在虚拟机管理器之上; 虚拟机内设置虚拟机故障检测前端,虚拟机故障检测前端用于检测虚拟机的心跳信息,并将心跳信息发送至虚拟机管理器; 虚拟机管理器包括虚拟机故障检测配置模块、域间共享存储系统、与虚拟机故障检测前端对应的虚拟机故障检测后端、虚拟机故障检测管理模块; 虚拟机故障检测配置模块用于接收并存储用户指定的虚拟机故障检测配置信息; 域间共享存储系统用于接收并存储虚拟机管理发送的心跳信息; 虚拟机故障检测管理模块用于读取虚拟机故障检测配置信息,并根据虚拟机故障检测配置信息向虚拟机故障检测后端发送检测启动指令;虚拟机故障检测管理模块还用于在虚拟机发生故障时,关闭发生故障的虚拟机以及发生故障的虚拟机对应的故障检测后端,并重新启动发生故障的虚拟机以及发生故障的虚拟机对应的故障检测后端; 虚拟机故障检测后端用于根据检测启动指令,从域间共享存储系统中读取心跳信息,并根据心跳信息判断虚拟机是否发生故障,将检测结果发送至虚拟机故障检测管理模块。2.如权利要求1所述的虚拟机故障检测和恢复的系统,其特征在于, 虚拟机故障检测管理模块还用于判断心跳信息是否为关机心跳信息,在心跳信息为关机心跳信息时,关闭虚拟机故障检测后端后,再执行虚拟机关闭或者重启。3.如权利要求1所述的虚拟机故障检测和恢复的系统,其特征在于, 虚拟机故障检测配置信息包括虚拟机故障检测恢复使能标识、用户指定的心跳丢失判断时间间隔和允许最大自动恢复次数,其中:虚拟机故障检测恢复使能标识用于表示相应虚拟机启动时VMM是否对其进行故障检测,心跳丢失判断时间间隔用于表示如果在指定时间间隔内没有接收到心跳那么判断相应虚拟机发生故障,允许最大自动恢复次数用于表示预设时间内自动恢复虚拟机的最大次数。4.一种虚拟机故障检测和恢复的方法,其特征在于,其通过权利要求1至3任一项所述的虚拟机故障检测和恢复的系统实现,包括如下步骤: S1、虚拟机故障检测配置模块接收用户指定的虚拟机故障检测配置信息; S2、虚拟机故障检测管理模块从虚拟机故障检测模块中读取虚拟机故障检测配置信息,并根据虚拟机故障检测配置信息向虚拟机故障检测后端发送检测启动指令;根据检测启动指令启动虚拟机故障检测后端,虚拟机故障检测后端与设置在虚拟机内的虚拟机故障检测前端通过域间共享存储系统传递检测虚拟机的心跳信息;虚拟机故障检测后端根据心跳信息判断虚拟机是否发生故障并将结果发送至虚拟机故障检测管理模块。5.如权利要求4所述的虚拟机故障检测和恢复的方法,其特征在于,在步骤S2之后,还包括: S3、虚拟机故障检测管理模块在虚拟机发生故障时,关闭发生故障的虚拟机以及发生故障的虚拟机对应的故障检测后端,并重新启动发生故障的虚拟机以及发生故障的虚拟机对应的故障检测后端。6.如权利要求4所述的虚拟机故障检测和恢复的方法,其特征在于,所述步骤S2包括如下子步骤: S21、在指定虚拟机启动之前,虚拟机故障检测管理模块读取虚拟机故障检测配置信息,根据虚拟机故障检测配置信息中的使能标识启动虚拟机故障检测启动指令,在相应虚拟机的检测启动指令执行之后启动虚拟机故障检测后端的功能,并将心跳丢失判断时间间隔作为启动参数; S22、虚拟机故障检测后端在域间共享存储系统中指定虚拟机对应的目录下建立用于存储心跳信息的关键字,并开始监听该关键字; S23、虚拟机故障检测前端在虚拟机系统中开机自运行,并且以预设频率向相应关键字覆盖写入心跳计数值; S24、在第一次检测到心跳之后,虚拟机故障检测后端开启计时器,计时周期为心跳丢失判断时间间隔;在一个计时周期内监听到相应关键字有更新时,则立即重新开始一个新的计时周期;在一个计时周期内没有监听到相应关键字的更新时,则判断虚拟机出现故障,并将检测结果发送至虚拟机故障检测管理模块。7.如权利要求5所述的虚拟机故障检测和恢复的方法,其特征在于,所述步骤S3包括如下子步骤: S31、在指定虚拟机发生故障时,虚拟机故障检测管理模块关闭发生故障的虚拟机对应的故障检测后端,然后强制关闭发生故障的虚拟机; S32、根据已经读取的虚拟机故障检测配置信息中允许最大自动恢复次数和当前虚拟机自动恢复次数,判断是否自动恢复当前虚拟机的故障;如果当前虚拟机自动恢复次数超过允许最大自动恢复次数,则放弃自动恢复虚拟机,并等待管理员手动处理虚拟机故障;如果当前虚拟机自动恢复次数未超过允许最大自动恢复次数,则选择自动恢复当前虚拟机并将当前虚拟机恢复次数加1,在相应虚拟机启动命令执行之后,虚拟机故障检测管理模块启动发生故障的虚拟机对应的故障检测后端,并将已经读取的心跳丢失判断时间间隔作为启动参数; S33、跳转到步骤S21,重复依次执行步骤S21至步骤S24。8.—种虚拟机启动的方法,其特征在于,其通过权利要求1至3任一项所述的虚拟机故障检测和恢复的系统实现,包括如下步骤: S01、当虚拟机使用者关闭或者重启虚拟机内操作系统时,关机或者重启操作将首先触发该虚拟机对应的虚拟机故障检测如端向域间共孚存储系统的相应心跳关键字中与入关机心跳值; S02、虚拟机故障检测后端从域间共享存储系统中读取关机心跳值,并将关机心跳值传递给虚拟机故障检测管理模块; S03、虚拟机故障检测管理模块关闭该虚拟机对应的虚拟机故障检测后端后,再执行虚拟机关闭或者重启。
【专利摘要】一种虚拟机故障检测和恢复的系统,其包括至少一台虚拟机以及一台虚拟机管理器;通过虚拟机管理器中虚拟机故障检测前端检测虚拟机的心跳信息,并将心跳信息发送至虚拟机管理器;虚拟机管理器包括虚拟机故障检测配置模块、域间共享存储系统、与虚拟机故障检测前端对应的虚拟机故障检测后端、虚拟机故障检测管理模块,通过虚拟机故障检测管理模块启动虚拟机故障检测后端,虚拟机故障检测后端与虚拟机故障检测前端通过树状的域间共享存储系统传递心跳信息。根据心跳信息,虚拟机故障检测后端判断本地虚拟机是否发生故障并将结果报告给虚拟机故障检测管理模块,由虚拟机故障检测管理模块对故障虚拟机进行关闭和恢复。
【IPC分类】H04L29/08, H04L12/26, G06F9/455, G06F11/30
【公开号】CN105024879
【申请号】CN201510416209
【发明人】徐士伟, 江昌庆, 胡哲琨, 代征, 戴新发
【申请人】中国船舶重工集团公司第七0九研究所
【公开日】2015年11月4日
【申请日】2015年7月15日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1