一种实现虚拟化管理平台高可用的系统和方法_3

文档序号:9547043阅读:来源:国知局
外服务的IP地址与备机MAC地址的映射关系,则来自虚拟化管理平台高可用系统外部的服务请求将被转发到虚拟化管理平台备机处理; 5)当虚拟化管理平台主机的故障修复后,执行主机加入高可用系统的流程,虚拟化管理平台备机上的文件同步服务首先将备机上的服务和数据文件同步到虚拟化管理平台主机,然后备机上的高可用管理服务修改IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与主机MAC地址的映射关系,则来自虚拟化管理平台外部的服务请求将被转发到虚拟化管理平台主机处理。3.如权利要求1所述的虚拟化管理平台高可用系统的搭建方法,其特征在于,包括以下内容: 1)准备两台具有相同硬件配置的工业标准服务器作为虚拟化管理平台高可用系统的主机和备机;在主机和备机上各安装两块双网口网卡,通过已实现冗余的网络交换设备实现互连互通;主机和备机均配备支持RAID功能的硬盘阵列; 2)在主机和备机的本地硬盘上安装操作系统、用于保存虚拟化基础架构中各组成对象信息的数据库、虚拟化管理平台以及高可用管理软件。4.如权利要求1所述的虚拟化管理平台高可用系统的初始化过程,其特征在于,包括以下内容: 1)分别启动虚拟化管理平台的主机和备机,并在各自的系统配置文件(该文件提供了主、备机的硬件描述、网络信息以及相关服务、任务的定义等参数)中对虚拟化管理平台高可用系统初始化信息进行配置,包括以下内容: ①将当前服务器在高可用系统中的角色分别配置为主机和备机; ②配置高可用管理服务发送主、备机状态查询消息的时间间隔参数; ③配置触发备机切换步骤的因失败导致的主机未响应查询次数参数; ④配置主机和备机的第一网卡的第一网口作为状态查询消息和反馈消息的传输通道; ⑤配置主机和备机的第二网卡的第一网口作为各种操作和控制指令的传输通道; ⑥配置IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与主机MAC地址的映射关系; ⑦配置开机自动启动的服务以及心跳监控服务需要监控的服务名称和进程名称,如数据库服务、虚拟化管理服务、高可用管理服务、心跳监控服务、文件同步服务等; 2)分别重新启动虚拟化管理平台的主机和备机,使配置生效,高可用系统进入正常工作状态。5.如权利要求1所述的由心跳监控服务反馈给高可用管理服务的主机和备机运行状态的消息格式,其特征在于: 1)在一条消息内包含了多项系统状态信息,如文件同步服务、虚拟化管理服务、网络服务、数据库服务等的状态信息; 2)对于每一个监控项的状态信息存在多个预定义的不同状态以及对应的数字编码; 3)多个监控项的状态编码按照预定义的顺序排列并封装后通过网络反馈给高可用管理服务。6.如权利要求1所述的虚拟化管理平台高可用系统,其特征在于,在主机和备机之间存在一个故障检测机制,包括以下内容: 1)高可用管理服务按照预设的时间间隔向虚拟化管理平台主机和备机上的心跳监控服务发送系统运行状态查询消息; 2)主机和备机的心跳监控服务实时获取系统中相关服务的状态信息并反馈给高可用管理服务; 3)如果主机和备机的运行状态均正常,则高可用管理服务在预设的时间间隔后再次执行步骤1); 4)如果主机正常,备机异常,则高可用管理服务启动备机恢复流程; 5)如果主机异常,备机正常,则高可用管理服务启动备机切换流程,备机切换流程结束后高可用管理服务将启动主机恢复流程。7.如权利要求6所述的在主机或备机的故障恢复阶段的网络故障处理流程,其特征在于,包括以下内容: 1)心跳监控服务接收到高可用管理服务的系统状态查询消息后将虚拟化管理平台高可用系统中的主机和备机的网卡、网口的运行状态消息反馈给高可用管理服务进行后续处理,缺省情况下主机和备机上启用的网络设备包括:主机的第一网卡的第一网口、备机的第一网卡的第一网口、主机的第二网卡的第一网口、备机的第二网卡的第一网口 ; 2)若主机的第一网卡的第一网口出现故障,则: ①启用主机第一网卡的第二网口; ②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信号的通道设为主机第一网卡的第二网口; 3)若主机的第二网卡的第一网口出现故障,则: ①启用主机第一网卡的第二网口; ②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第二网卡的第二网口 ; 4)若主机的第一网卡出现故障,则: ①启用第二网卡的第二网口; ②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信息的通道设为主机第二网卡的第二网口; 5)若主机的第二网卡出现故障,则: ①启用第一网卡的第二网口; ②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第一网卡的第二网口; 6)若主机的第一网卡和第二网卡均出现故障,则启动备机切换流程,由备机接管虚拟化管理平台服务; 7)若备机的第一网卡的第一网口出现故障,则: ①启用备机第一网卡的第二网口; ②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信号的通道设为主机第一网卡的第二网口; 8)若备机的第二网卡的第一网口出现故障,则: ①启用备机第一网卡的第二网口; ②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第二网卡的第二网口; 9)若备机的第一网卡出现故障,则: ①启用备机第二网卡的第二网口; ②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收心跳监控信息的通道设为主机第二网卡的第二网口; 10)若备机的第二网卡出现故障,则: ①启用备机第一网卡的第二网口; ②修改虚拟化管理平台高可用系统主机和备机上的配置文件,将主机发送和接收控制指令的通道设为主机第一网卡的第二网口; 11)若备机的第一网卡和第二网卡均出现故障,则启动备机恢复流程,待备机网络故障解决后再重新将备机加入虚拟化管理平台高可用系统。8.如权利要求6所述的虚拟化管理平台主机出现故障后备机切换的流程,其特征在于,包括以下内容: 1)当虚拟化管理平台主机出现故障后,备机的高可用管理服务接管高可用系统的控制权,检查并启动备机上所有必要的服务; 2)备机上的高可用管理服务修改IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与备机MAC地址的映射关系,则来自虚拟化管理平台高可用系统的外部服务请求将被转发到虚拟化管理平台备机处理。9.如权利要求6所述的虚拟化管理平台备机的恢复流程,其特征在于,包括以下内容: 1)主机上的高可用管理服务根据备机上的心跳监控服务反馈回来的运行状态消息进行相应的处置; 2)若故障为虚拟化管理等相关服务的失败,则主机上的高可用管理服务协调备机上的高可用管理服务重启备机上的相应服务; 3)若故障为备机部件的物理问题,则可在更换新的部件后重启虚拟化管理平台备机; 4)虚拟化管理平台备机向虚拟化管理平台主机发送故障修复消息; 5)主机的高可用管理服务将主机上的相关数据和服务同步到备机,使高可用系统重新进入正常运行状态。10.如权利要求6所述的虚拟化管理平台主机的恢复流程,其特征在于,包括以下内容: 1)主机的高可用管理服务根据主机心跳监控服务反馈回来的消息内容进行相应的处置; 2)若故障为虚拟化管理等相关服务的失败,则主机的高可用管理服务重启相应的服务; 3)若故障为主机部件的物理问题,则可在更换新的部件后启动虚拟化管理平台主机; 4)虚拟化管理平台主机向虚拟化管理平台备机发送故障修复消息; 5)虚拟化管理平台备机将备机上的相关数据和服务同步到主机; 6)备机上的高可用管理服务修改IP地址和MAC地址映射表,建立虚拟化管理平台对外服务的IP地址与主机MAC地址的映射关系,则来自虚拟化管理平台高可用系统的外部服务请求将被转发到虚拟化管理平台主机处理; 7)主机的高可用管理服务得到控制权,高可用系统重新进入正常运行状态。
【专利摘要】本发明公开了一种实现虚拟化管理平台高可用的系统和方法。该系统由配备双网卡、本地存储的虚拟化管理平台主机和备机以及网络交换设备构成。虚拟化管理平台主机和备机均安装相同的操作系统、本地数据库,并启动多个与高可用相关的服务。本发明提出的高可用解决方案无需额外的共享存储设备,而是采用普通的本地磁盘并利用分布式块设备技术实现数据库中数据的实时备份。同时,由于把此管理平台用到的所有的服务资源看作一个整体,故从根本上保证了虚拟化管理平台主机上的所有实例异常都能被检测到,并能够在最短的时间内切换到虚拟化管理平台备机上并启动所有依赖的服务。本发明以最少的成本和技术实现了一个保护范围广以及恢复效率高的完整高可用方案。
【IPC分类】G06F11/07, G06F11/14, G06F9/455
【公开号】CN105302661
【申请号】CN201410242890
【发明人】王力, 张征宇
【申请人】北京云端时代科技有限公司
【公开日】2016年2月3日
【申请日】2014年6月4日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1