一种在集群中用于辅助备份复制计算机系统的方法

文档序号:6535114阅读:324来源:国知局
一种在集群中用于辅助备份复制计算机系统的方法
【专利摘要】本发明提供一种在集群中用于辅助备份复制计算机系统的方法,其具体实现过程为:在集群中设置备份副本系统,该系统中有至少一个客户端、至少有一个节点、一个主副本、次要副本和一个二次备份副本;分配层次结构中的每一个初级和二次备份副本;当其中一个副本的故障被检测到时,与下一层替换发生故障的副本;再生复制具有受影响的最低层次的副本,重建主副本、辅助副本和二次备份副本。该一种在集群中用于辅助备份复制计算机系统的方法和现有技术相比,改善环境的关键任务和实时应用,实用性强,适用范围广泛,易于推广。
【专利说明】一种在集群中用于辅助备份复制计算机系统的方法
【技术领域】
[0001]本发明涉及群集计算机系统技术,更具体地说是集群中用于辅助备份复制计算机系统的方法。
【背景技术】
[0002]在集群系统中固有的一个主要问题是他们失败的潜在漏洞。当集群中的崩溃,对整个系统的可用的一个单一的节点可能会受到影响。冗余,以增加系统的可靠性,通常引入到系统中,由复制的组件。复制在分布式系统中的服务或进程需要的服务,每个副本保持一致的状态。确保这种一致性是由一个特定的复制协议。有不同的方法,组织流程的副本和一般区分有源,无源和半有源复制。
[0003]在活跃的复制技术,也被称为状态机的方法,每个副本处理请求从客户端接收和发送应答。独立副本的行为和技术包括确保所有副本收到请求以相同的顺序。崩溃的情况下,该技术具有低的响应时间。然而,因为所有副本并行处理所有的请求,产生一个显着的运行时的开销,从而使商业应用的高可用性解决方案是一个不切实际的选择。
[0004]与被动的复制技术,也被称为主、备份,其中一个副本,称为主,接收来自客户端的请求,并返回响应。备份与主接收状态更新消息。如果主服务器发生故障,备份接管。不像复制活跃,比复制活跃,它需要较少的处理能力和处理请求的决定不作任何假设。然而,有显着增加的响应时间,在失败的情况下,使得它不适合于对时间要求严格的应用程序的上下文。
[0005]半主动复制技术复制活跃,规避不确定性问题,在时间关键型应用程序的背景下。该技术是基于活跃复制和扩展的领导者和追随者的概念。虽然实际处理的请求进行的所有副本,它是执行非确定性零件的加工,并告知追随者的领导者的责任。这种技术是对主动复制的,非确定性的处理是可能的差异。然而,显着的恢复时间开销是一个失败的主副本的情况下产生的。

【发明内容】

[0006]本发明的技术任务是解决现有技术的不足,提供一种在集群中用于辅助备份复制计算机系统的方法。
[0007]本发明的技术方案是按以下方式实现的,该一种在集群中用于辅助备份复制计算机系统的方法,其具体实现过程为:
在集群中设置备份副本系统,该系统中有至少一个客户端、至少有一个节点、一个主副本、次要副本和一个二次备份副本;
分配层次结构中的每一个初级和二次备份副本;
当其中一个副本的故障被检测到时,与下一层替换发生故障的副本;
再生复制具有受影响的最低层次的副本,重建主副本、辅助副本和二次备份副本。
[0008]所述发生故障的副本是次要副本,则新的辅助副本促进二次备份副本,并重新配置,开始一个新的二次备份副本。
所述发生故障的副本是二次备份副本,则克隆本身形成一个新的二次备份副本的副本辅助副本。
所述复制的副本是一个单一的操作系统,即AIX或Linux操作系统的形象。
[0009]本发明与现有技术相比所产生的有益效果是:
本发明的一种在集群中用于辅助备份复制计算机系统的方法采用半主动复制的安排,这里采用的主要和次要复本之间二次备份的关系,而在集群系统能够快速恢复或故障恢复,确保较低的运行时间开销和瞬时的故障转移能力。复制这样的过程或系统的集群,持续可用性可以保证,而在失败的情况下,响应和恢复时间明显减少,改善环境的关键任务和实时应用,实用性强,易于推广。
【专利附图】

【附图说明】
[0010]附图1是本发明的实施例结构示意图。
[0011]附图2是本发明实施例中示出一个节点、客户端和通信信道的集群的计算机系统示意图。
[0012]附图3是本发明的实施例故障图的主副本过程流程图。
[0013]附图4是本发明的实施例中当前的辅助图的复制品失败的流程图。
[0014]
【具体实施方式】
[0015]下面结合附图对本发明的一种在集群中用于辅助备份复制计算机系统的方法作以下详细说明。
[0016]本发明的主要目的是复制计划,即完成“二次备份复制”处理请求,在同一时间同时降低运行时间和恢复时间开销的确定性不作任何假设,因此使得它适合关键任务和时间关键应用的高可用性和容错管理。
[0017]本发明的另一个目的是集群计算机系统中简称为“辅助备份”复制一个新的复制技术。在这种技术中,一个过程或一个计算机集群中的节点被复制到一组的三个副本或克隆的三个进程副本,参与二次备份协议与角色的经典的“初级”和“次级”,除了介绍了这种技术的一个新的角色中,简称为“二次备份”或“备份”。二次备份是作为一个热备份到辅助副本的进程组的进程或系统的副本之一。主要和次要复本参加半主动复制协议,而存在类似被动复制关系,二级和二次备份之间。
[0018]本发明的另一个目的是引入的第三副本和低开销的协议之间的辅助副本和第三副本。此外,还有永远只有一个“跟随者”参与计划,这里采用半主动复制。
[0019]本发明提供一种在集群中用于辅助备份复制计算机系统的方法,其具体实现过程为:
在集群中设置备份副本系统,该系统中有至少一个客户端、至少有一个节点、一个主副本、次要副本和一个二次备份副本;
分配层次结构中的每一个初级和二次备份副本;
当其中一个副本的故障被检测到时,与下一层替换发生故障的副本;
再生复制具有受影响的最低层次的副本,重建主副本、辅助副本和二次备份副本。[0020]所述发生故障的副本是次要副本,则新的辅助副本促进二次备份副本,并重新配置,开始一个新的二次备份副本。
所述发生故障的副本是二次备份副本,则克隆本身形成一个新的二次备份副本的副本辅助副本。
所复制的副本是一个单一的操作系统,即AIX或Linux操作系统的形象。
实施例。
[0021]如附图1所示的例子:该群集的计算机系统具有一个或多个客户端12a—一12N,一种通信系统13和14,节点16a——16η,磁盘总线18,和一个或多个共享磁盘20a一一20η。本发明可以使用的其他簇可能看起来非常不同是取决于处理器的数量,使用的网络和磁盘技术的选择,等等。它会被理解的是,客户端12是一个处理器可以访问该节点16通过局域网络,如13或14所示的专用局域网(LAN)所示的公用LAN。客户12每运行一个“前端”或客户端应用程序查询服务器应用程序运行在群集节点上16。它也将被理解的是,在系统中的图。如图1所示,每个节点16有一个或多个共享外部磁盘设备20的访问。每个磁盘设备20可以在物理上连接到多个节点。共享磁盘存储任务关键型数据通常被配置为数据冗余。节点16形成的集群系统10的核心。节点16是一个处理器,运行的高可用性和容错管理软件和应用软件。
[0022]一种新的复制管理技术,辅助备份复制,披露管理高可用性的分布式系统的过程中副本一组。在辅助备份过程中,一个副本作为辅助副本,而不是主副本的备份是通常的主备份的方法,其中第二副本备份主副本的情况。
[0023]附图2示出了群集的备份二次复制装置,由客户端I和三个副本4,5,和14。每个副本可以被认为是作为一个单一的工艺或容器上运行在单个计算机系统或LPAR图像。一个副本,也可以代表一个单一的,如AIX或Linux操作系统映像。所有三个副本4,5,6,也可以看作是三个独立的进程运行在一台计算机系统。主副本4和辅助副本5过程中的所有客户端的请求,但只有主副本4是负责处理所有非确定性的操作。辅助副本5,然后被迫做出相同的决定,由主副本4、辅助副本5定期更新的二次备份,其中包括点检查其状态更改为二次备份副本6的状态,从而最大限度地减少二次备份副本6影响运行时开销集群。
[0024]通常情况下,一个组中的一个副本失败改变组的组成,挑起了看法变化。根据假设失败的副本的作用的一个副本在系统中的故障或数据丢失的处理方式不同。由于二次备份副本6不参与任何超出组互动,它的失败是完全透明的,此副本的组织。
[0025]附图3是一个流程图的一种方法,其中被检测到的主副本4的失败。在步骤9中,检测到故障的主副本。在进行步骤10时检测失败的主副本4、辅助副本5瞬间接管,并继续计算,考虑对主副本4的作用。在客户端12,辅助副本5做的第一件事是重放任何悬而未决的事件,它已经收到了从失败的主副本4本身带来最新的主副本4的最后一个已知状态。辅助副本5将继续执行,并自行同步与二次备份副本6,加工后的所有等待事件。通信系统13或二次备份然后晋升到新的辅助作用,辅助副本6。
[0026]附图4是一个过程的流程图,所述故障被检测到的当前辅助副本5。如果当前辅助副本5发生故障,在检测到故障14。在步骤15中,二次备份副本6促进本身的次要角色。存在额外的资源,在3辅助副本4启动重新配置组开始一个新的副本将二次备份副本6的作用,恢复原来的复制程度。[0027]所述故障被检测到的二次备份副本6的一个过程。二次备份副本6的故障不影响集群状态,因为它不参与请求和响应的处理。在18处,辅助副本的4个克隆,建立一个新的二次备份6如果可能的话。
[0028]以上所述仅为本发明的实施例而已,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种在集群中用于辅助备份复制计算机系统的方法,其特征在于其具体实现过程为: 在集群中设置备份副本系统,该系统中有至少一个客户端、至少有一个节点、一个主副本、次要副本和一个二次备份副本; 分配层次结构中的每一个初级和二次备份副本; 当其中一个副本的故障被检测到时,与下一层替换发生故障的副本; 再生复制具有受影响的最低层次的副本,重建主副本、辅助副本和二次备份副本。
2.根据权利要求1所述的一种在集群中用于辅助备份复制计算机系统的方法,其特征在于:所述发生故障的副本是次要副本,则新的辅助副本促进二次备份副本,并重新配置,开始一个新的二次备份副本。
3.根据权利要求1所述的一种在集群中用于辅助备份复制计算机系统的方法,其特征在于:所述发生故障的副本是二次备份副本,则克隆本身形成一个新的二次备份副本的副本辅助副本。
4.根据权利要求2或3所述的一种在集群中用于辅助备份复制计算机系统的方法,其特征在于:所述复制的副本是一个单一的操作系统,即AIX或Linux操作系统的形象。
【文档编号】G06F11/14GK103793296SQ201410006210
【公开日】2014年5月14日 申请日期:2014年1月7日 优先权日:2014年1月7日
【发明者】聂磊 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1