虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法

文档序号:9306584阅读:747来源:国知局
虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法
【技术领域】
[0001]本发明涉及虚拟化高可用技术领域,特别涉及一种虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法。
【背景技术】
[0002]随着信息技术的发展和人们对计算机资源不断提高的要求,云计算已经成为当前计算机技术研究的热点。云计算使用虚拟化技术对底层计算、网络和存储资源进行封装,通过建立虚拟机并在其中运行操作系统和应用程序的形式,将这些资源提供给远程用户。因此,虚拟机作为用户直接使用的环境,其稳定性和可用性直接关系到用户的使用体验。
[0003]在云计算虚拟化平台上,虚拟机管理器(Virtual Machine Monitor, VMM)是整个系统的核心部件。在通常情况下,VMM直接运行在硬件平台之上,以软件方式模拟物理硬件的核心功能,建立多个虚拟机(Virtual Machine, VM),并且为运行在这些虚拟机之上的操作系统和应用程序提供与访问物理硬件相同的访问接口。与普通计算机相同,虚拟机的系统在运行过程中会出现故障(例如:死机和蓝屏等),当虚拟机系统发生故障时,用户程序和业务将无法运行。这样,为了保证业务处理功能的正常实现,需要能够检测和恢复虚拟机系统故障的方法。
[0004]为了解决虚拟机系统故障检测的问题,已有研究人员借鉴计算机集群的高可用方案,在虚拟环境下引入心跳检测机制,利用网络连接传递虚拟机和VMM之间的心跳信息,通过让虚拟机和VMM之间保持心跳的方式,检测虚拟机是否发生故障。但是网络环境复杂并且充满了不可预期的因素,这降低了虚拟机和VMM之间心跳的稳定性,增加了虚拟机故障的漏报和误报的概率。

【发明内容】

[0005]有鉴于此,本发明提供一种虚拟机故障检测、恢复系统及其检测、恢复、启动方法。
[0006]一种虚拟机故障检测和恢复的系统,其包括至少一台虚拟机以及一台虚拟机管理器;虚拟机运行在虚拟机管理器之上;
[0007]虚拟机内设置虚拟机故障检测前端(Fault-detect1n Front End, FDFE),虚拟机故障检测前端用于检测虚拟机的心跳信息,并将心跳信息发送至虚拟机管理器;
[0008]虚拟机管理器包括虚拟机故障检测配置模块(Fault-detect1n Configurat1nModule, FDCM)、域间共享存储系统(Domain-shared Storage System, DS3)、与虚拟机故障检测前端对应的虚拟机故障检测后端(Fault-detect1n Back End, FDBE)、虚拟机故障检测管理模块(Fault-detect1n Management Module, FDMM);
[0009]虚拟机故障检测配置模块用于接收并存储用户指定的虚拟机故障检测配置信息;
[0010]域间共享存储系统用于接收并存储虚拟机管理发送的心跳信息;
[0011]虚拟机故障检测管理模块用于读取虚拟机故障检测配置信息,并根据虚拟机故障检测配置信息向虚拟机故障检测后端发送检测启动指令;虚拟机故障检测管理模块还用于在虚拟机发生故障时,关闭发生故障的虚拟机以及发生故障的虚拟机对应的故障检测后端,并重新启动发生故障的虚拟机以及发生故障的虚拟机对应的故障检测后端;
[0012]虚拟机故障检测后端用于根据检测启动指令从域间共享存储系统中读取心跳信息,并根据心跳信息判断虚拟机是否发生故障,并将检测结果发送至虚拟机故障检测管理丰旲块。
[0013]—种虚拟机故障检测和恢复的方法,其通过上述虚拟机故障检测和恢复的系统实现,包括如下步骤:
[0014]S1、虚拟机故障检测配置模块接收用户指定的虚拟机故障检测配置信息;
[0015]S2、虚拟机故障检测管理模块从虚拟机故障检测模块中读取虚拟机故障检测配置信息,并根据虚拟机故障检测配置信息向虚拟机故障检测后端发送检测启动指令;根据检测启动指令启动虚拟机故障检测后端,虚拟机故障检测后端与设置在虚拟机内的虚拟机故障检测前端通过域间共享存储系统传递检测虚拟机的心跳信息;虚拟机故障检测后端根据心跳信息判断虚拟机是否发生故障并将结果发送至虚拟机故障检测管理模块。
[0016]—种虚拟机启动的方法,其通过上述虚拟机故障检测和恢复的系统实现,包括如下步骤:
[0017]S01、当虚拟机使用者关闭或者重启虚拟机内操作系统时,关机或者重启操作将首先触发该虚拟机对应的虚拟机故障检测如端向域间共孚存储系统的相应心跳关键字中与入关机心跳值;
[0018]S02、虚拟机故障检测后端从域间共享存储系统中读取关机心跳值,并将关机心跳值传递给虚拟机故障检测管理模块;
[0019]S03、虚拟机故障检测管理模块关闭该虚拟机对应的虚拟机故障检测后端后,再执行虚拟机关闭或者重启。
[0020]本发明提供的虚拟机故障检测、恢复系统及其检测、恢复、启动方法,相比于通过网络连接传递虚拟机故障检测心跳而言,使用域间共享存储系统传递心跳信息,不仅能够避免网络连接中存在的大量不可预期因素,保证心跳信息传递的稳定性;而且域间共享存储系统的读写速度高于网络传输速度,读写延时低于网络延时,这有利于提高虚拟机故障检测的准确性和速度。并且通过读取关机心跳值来判断正常关闭或重启虚拟机,避免了虚拟机故障的误报。
【附图说明】
[0021]图1为本发明实施例的虚拟机故障检测、恢复系统的结构框图;
[0022]图2为本发明实施例的第一种虚拟机故障检测、恢复方法流程图;
[0023]图3为本发明实施例的第二种虚拟机故障检测、恢复方法流程图;
[0024]图4为图2中步骤S2的子流程图;
[0025]图5为图3中步骤S3的子流程图;
[0026]图6为本发明实施例的虚拟机启动的方法流程图。
【具体实施方式】
[0027]如图1所示,一种虚拟机I故障检测和恢复的系统,其主要基于域间共享存储系统22,包括至少一台虚拟机I以及一台虚拟机管理器2 ;虚拟机I均与虚拟机管理器2相连。实施例中,一台虚拟机管理器2可以管理多台虚拟机I。
[0028]虚拟机I内设置虚拟机故障检测前端11,虚拟机故障检测前端11用于检测虚拟机I的心跳信息,并将心跳信息发送至虚拟机管理器2。
[0029]虚拟机管理器2包括虚拟机故障检测配置模块21、域间共享存储系统22、与虚拟机故障检测前端11对应的虚拟机故障检测后端23、虚拟机故障检测管理模块24。
[0030]虚拟机故障检测配置模块21用于接收并存储用户指定的虚拟机故障检测配置信息。
[0031]可选地,虚拟机故障检测配置模块21可以B/S模式提供界面操作和配置功能,用户通过网络和浏览器连接并通过输入用户名和口令登录虚拟机故障检测配置模块21进行配置工作,虚拟机故障检测配置模块21在接收到用户的配置信息后,形成相关虚拟机故障检测配置信息文件,并存储在本地磁盘上以供虚拟机I故障检测过程中使用。B/S模式是一种浏览器/服务器模式,远程用户机3可
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1