集群系统的恢复方法

文档序号:7902236阅读:349来源:国知局
专利名称:集群系统的恢复方法
技术领域
本发明涉及通信系统,更具体地来说,涉及集群系统的恢复方法。
背景技术
集群系统是利用标准的网络将各种普通的服务器或者PC机连接起来,通过特定的方法,向用户提供更高的系统计算性能、存储性能、以及管理性能。集群系统具有高性价比、可扩展性、可管理性、系统鲁棒性、很多国产厂商支持集群系统等,因此,集群系统得到了广泛应用,同时集群系统中节点(即,计算机)众多,系统崩溃的概率也随之大大增加。系统崩溃会给集群系统带来严重后果,轻则服务进程切换,重则作业停止。系统崩溃之后的修复尤为重要,在最短的时间内进行系统恢复成为亟待解决的首要问题。通常在计算机系统崩溃之后作业停止,需要此节点隔离,待该节点恢复后继续作业。该节点隔离修复期间,降低了节点利用率,并且该节点作业停止时间太长,影响作业效率。在现有技术中,提供了一种提高集群可靠性的方法,该集群包括两个或多个节点, 其中所述两个或多个节点通过选择产生主节点,其中所述两个或多个节点中至少还包括一个第一替补从节点,其特征在于,所述方法包括第一替补从节点检测当前主节点是否发生故障,若故障,所述第一替补从节点主动将其自身设置为当前主节点,以避免重新选举当前主节点。在该集群系统中,节点系统崩溃时,备份机可以迅速接替该节点对外提供服务。从而在一定程度上保证了集群系统的可靠性。然而,这些系统崩溃计算机都需要管理人员手动重新安装系统。集群系统提供各种服务,这些服务需要修改很多的配置文件,重新安装系统需要配置的文件太多,修改任务繁琐并且容易出现问题,同时集群节点众多,用户应用导致系统崩溃的风险较大,所以为了维护集群系统的稳定,需要对系统崩溃的计算机逐一进行安装系统维护,工作任务繁重,工作效率低,容易出错。

发明内容
针对集群节点众多,需要对崩溃节点逐一重新安装系统的缺陷,本发明提出了一种集群系统一键恢复的技术方案,从而解决了能够简单、迅速、自动恢复集群系统中的节点,确保集群安全稳定运行的技术问题。本发明提供了一种集群系统的恢复方法,包括步骤Sl 服务器从客户机接收客户机的文件;以及步骤S2 服务器通过将文件发送到其他客户机来恢复其他客户机的运行。优选地,集群系统的恢复方法进一步包括在步骤Sl之前服务器向客户机发送备份请求;以及客户机接收备份请求并向服务器发送备份确认响应。优选地,步骤Sl包括如果服务器检测到其存储空间足够存储文件,则从客户机接收客户机的文件。
优选地,在步骤Sl之后,服务器标识文件信息。优选地,服务器标识文件信息的步骤包括服务器通过重命名标识文件信息。优选地,文件信息包括文件的创建时间、文件所来自的客户机的编号。优选地,步骤S2包括当其他客户机包括多个客户机时,服务器利用P2P协议同时将文件发送到多个客户机的相应位置。优选地,步骤S2包括服务器将文件存储在其他客户机的硬盘上,以覆盖其他客户机中的相应文件。优选地,客户机和其他客户机的配置相同。优选地,集群系统的恢复方法适用于Unix系统以及Linux系统。利用本发明的集群系统的恢复方法,在系统发生崩溃时,或者是由于应用原因导致系统更换时,不需要用户进行手工干预,被恢复系统和备份系统一致,不需要进行环境变量的配置,从而在保证了集群安全稳定运行同时,提高了工作效率,节省了大量人力物力资源。


附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中图1为根据本发明的实施例的集群系统的恢复方法的流程图;图2为根据本发明的实施例的集群系统的恢复方法的原理示意图;以及图3为根据本发明的另一实施例的集群系统的恢复方法的流程图。
具体实施例方式以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。图1为根据本发明的实施例的集群系统的恢复方法的流程图。在图1中步骤SlOO 服务器从客户机接收客户机的文件。其中,服务器所接收的文件为流数据,流数据是一组顺序、大量、快速、连续到达的数据序列,数据流可被视为一个随时间延续而无限增长的动态数据集合。此外,流数据数据具有实时到达、数据规模宏大等特点。步骤S102 服务器通过将文件发送到其他客户机来恢复其他客户机的运行。通过本发明的实施例的集群系统的恢复方法,使得用户能够不必重新装机,通过简单操作就可以恢复崩溃节点的系统或者更换节点的系统。此外,该在服务器和客户机之间传送的是流数据,使该传送过程在十分钟左右完成,从而能够保证集群的稳定性。下文中,结合图2和图3进一步详细描述了集群系统的恢复方法的一个具体实施例。图2为根据本发明的实施例的集群系统的恢复方法的原理示意图。集群200包括 服务器202和客户机206、208、210、以及212,其中,各个客户机均相同。服务器202具有存储器204。另外,在其他实施例,集群不仅限于四台客户机,可以为任意多台客户机。此外, 在其他实施例中,集群不仅限于一台服务器,可以为任意多台服务器。下文中,描述了用于图2所示集群的集群系统的恢复方法。
图3为根据本发明的另一实施例的集群系统的恢复方法的流程图。如图2和图3 所示,当集群200中具有系统崩溃的客户机或者需要更换系统的客户机时,服务器202向客户机发送备份请求(步骤S300)。其中,将系统崩溃的客户机或者需要更换系统的客户机作为目标客户机,目标客户机可以为一台或者多台,将正常工作客户机中的一个作为模板客户机。在本实施例中,将客户机206作为模板客户机,并且将客户机208、210、以及212作为目标客户机。当客户机206接收到由服务器202所发送的备份请求时,该客户机向服务器发送备份确认响应(步骤S302),同时启动代理服务,准备向服务器发送系统文件(即,系统模板镜像)。服务器202在接收到来自客户机206的备份确认响应时,检测到其存储空间足够存储客户机206的系统文件,则从客户机206接收该客户机的系统文件(步骤S304)。服务器202在接收到该系统文件以后,标识文件信息(步骤S306)。其中,服务器标识文件信息的步骤包括服务器通过重命名来标识文件信息。该文件信息包括文件的创建时间、文件来自的客户机的编号。然后,服务器202将所述文件发送到客户机的相应位置(步骤S308)。其中,当客户机包括多个客户机时,服务器利用P2P(点对点)协议同时将标识的系统文件发送到多个客户机的相应位置,该实施例中,发送到客户机208、210、以及212。当客户机包括一个客户机时,服务器直接将所标识的系统文件发送到该客户机上。服务器将文件储存在接收所标识的系统文件的客户机(一个或多个客户机)的硬盘上,以覆盖客户机上的系统文件,来完成系统恢复。该集群系统的恢复方法适用于Unix系统以及Linux系统。根据本发明的实施例, 该集群系统的恢复方法具备可以将集群中的任意一个客户机(节点)转化为模板客户机, 将该节点系统转化为模板进行保存,即用来构建集群系统中要求恢复系统的节点的模板; 可以指定恢复在特定时间进行备份的系统;恢复过程可以多节点并行,运用P2P协议进行多个节点同时恢复;恢复过程对于用户透明,不需要用户进行手工干预,被恢复系统和备份系统一致,不需要进行环境变量的配置的优点。以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种集群系统的恢复方法,包括步骤Sl 服务器从客户机接收所述客户机的文件;以及步骤S2 所述服务器通过将所述文件发送到其他客户机来恢复所述其他客户机的运行。
2.根据权利要求1所述的集群系统的恢复方法,进一步包括在所述步骤Sl之前 服务器向客户机发送备份请求;以及所述客户机接收所述备份请求并向所述服务器发送备份确认响应。
3.根据权利要求2所述的集群系统的恢复方法,其特征在于,所述步骤Sl包括如果服务器检测到其存储空间足够存储所述文件,则从客户机接收所述客户机的文件。
4.根据权利要求3所述的集群系统的恢复方法,其特征在于,在所述步骤Sl之后,所述服务器标识文件信息。
5.根据权利要求4所述的集群系统的恢复方法,其特征在于,所述服务器标识文件信息的步骤包括所述服务器通过重命名标识文件信息。
6.根据权利要求5所述的集群系统的恢复方法,其特征在于,所述文件信息包括所述文件的创建时间、所述文件所来自的客户机的编号。
7.根据权利要求1所述的集群系统的恢复方法,其特征在于,所述步骤S2包括 当所述其他客户机包括多个客户机时,所述服务器利用P2P协议同时将所述文件发送到所述多个客户机的相应位置。
8.根据权利要求1或7所述的集群系统的恢复方法,其特征在于,所述步骤S2包括 所述服务器将所述文件存储在其他客户机的硬盘上,以覆盖所述其他客户机中的相应文件。
9.根据权利要求1所述的集群系统的恢复方法,其特征在于,所述客户机和其他客户机的配置相同。
10.根据权利要求1所述的集群系统的恢复方法,其特征在于,所集群系统的恢复方法适用于Unix系统以及Linux系统。
全文摘要
本发明提供了一种集群系统的恢复方法,包括步骤S1服务器从客户机接收客户机的文件;以及步骤S2服务器通过将文件发送到其他客户机来恢复其他客户机的运行。利用该集群系统的恢复方法,可以是该集群系统具备可以将集群中的任意一个客户机(节点)转化为模板客户机,将该节点系统转化为模板进行保存,即用来构建集群系统中要求恢复系统的节点的模板;可以指定恢复在特定时间进行备份的系统;恢复过程可以多节点并行,运用P2P协议进行多个节点同时恢复;恢复过程对于用户透明,不需要用户进行手工干预,被恢复系统和备份系统一致,不需要进行环境变量的配置的优点。
文档编号H04L12/24GK102281159SQ20111026256
公开日2011年12月14日 申请日期2011年9月6日 优先权日2011年9月6日
发明者戴荣, 李程, 温鑫, 王璟, 许涛, 骆起昕 申请人:曙光信息产业(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1