一种存储系统的容灾方法、存储系统和相关装置与流程

文档序号:16390268发布日期:2018-12-22 11:20阅读:165来源:国知局
一种存储系统的容灾方法、存储系统和相关装置与流程

本申请涉及存储领域,特别涉及一种存储系统的容灾方法,一种存储系统和一种计算机可读存储介质。

背景技术

随着信息化技术的飞速发展,信息系统在各种行业的关键业务中扮演着越来越重要的角色。在通讯、金融、医疗、电子商务、物流、政府等领域,信息系统业务中断会导致巨大经济损失、影响品牌形象并可能导致重要数据丢失。因此,保证业务连续性是信息系统建设的关键。

近年来,大范围自然灾害时常发生,为保障业务连续性,同城灾备中心结合异地灾备中心的“两地三中心”容灾解决方案越来越受到业界重视和认可。

而现有的“两地三中心”容灾解决方案中,mcs软件inmetro双活是基于同步复制实现的,且mcs远程复制不支持级联,即同一卷只能在唯一一个远程复制关系中,使得现有的容灾方法实现多中心的数据同步时同步效率低,直接导致容灾能力差。

因此如何提高存储系统的容灾能力是本领域技术人员亟需解决的问题。

申请内容

本申请的目的是提供一种存储系统的容灾方法,一种存储系统和一种计算机可读存储介质,解决现有的容灾方案数据同步效率低,容灾能力差的问题。

为解决上述技术问题,本申请提供一种存储系统的容灾方法,所述存储系统包括生产站点、第一容灾站点和第二容灾站点,具体技术方案如下:

所述第一容灾站点复制所述生产站点的数据,以同时保存两份最新数据;

当所述生产站点或所述第一容灾站点出现增量数据时,利用增量快照记录所述增量数据;

将所述增量快照的增量快照卷发送至所述第二容灾站点,以使所述第二容灾站点更新所述增量数据;

当所述生产站点不可用时,所述第一容灾站点替代所述生产站点;当所述生产站点和所述第一容灾站点均不可用时,所述第二容灾站点替代所述生产站点。

其中,所述第二容灾站点更新所述增量数据,包括:

所述第二容灾站点根据预设策略更新所述增量数据;其中,所述预设策略具体为:

根据所述生产站点的生产卷,或所述第一容灾站点的第一容灾卷的增量数据生成增量快照,同时生成保护快照;

远程复制所述增量快照;

判断远程复制所述增量快照是否成功;

若是,则停止生成所述增量快照和所述保护快照;

若否,利用所述保护快照对所述第二容灾站点的第二容灾卷执行回滚操作。

其中,所述第二容灾站点根据预设策略更新所述增量数据,包括:

所述第二容灾站点周期性地根据预设策略更新所述增量数据。

其中,当所述生产站点和所述第一容灾站点均不可用时,还包括:

判断远程复制是否一致停止;

若是,则停止所述预设策略,并删除所述预设策略、所述增量快照、所述保护快照和远程复制的数据;

若否,判断是否需要远程复制完成;

若不要需要远程复制完成,停止所述预设策略,停止远程复制并删除远程复制的数据,将所述第二容灾站点回滚至一致性保护快照。

其中,当所述生产站点和所述第一容灾站点任一不可用时,还包括:

当远程复制没有同步且一致停止时,对所述第二容灾卷打快照;

当远程复制在同步且不需要等待远程复制完成,或远程复制不在同步且远程复制没有一致停止时,对第二容灾卷的变更卷打快照。

其中,所述第一容灾站点复制所述生产站点的数据包括:

所述第一容灾站点同步复制或异步复制所述生产站点的数据。

本申请还提供一种存储系统,包括:

生产站点、第一容灾站点和第二容灾站点;

所述第一容灾站点用于复制所述生产站点的数据,并当所述生产站点不可用时,替代所述生产站点;

所述第二容灾站点用于更新所述生产站点或所述第一容灾站点的增量数据,并当所述生产站点和所述第一容灾站点均不可用时,替代所述生产站点。

本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的容灾方法的步骤。

本申请所提供的一种存储系统的容灾方法,所述存储系统包括生产站点、第一容灾站点和第二容灾站点,所述容灾方法包括:所述第一容灾站点复制所述生产站点的数据,以同时保存两份最新数据;当所述生产站点或所述第一容灾站点出现增量数据时,利用增量快照记录所述增量数据;将所述增量快照的增量快照卷发送至所述第二容灾站点,以使所述第二容灾站点更新所述增量数据;当所述生产站点不可用时,所述第一容灾站点替代所述生产站点;当所述生产站点和所述第一容灾站点均不可用时,所述第二容灾站点替代所述生产站点。

本申请通过对存储系统实现三站点的数据保护,利用第二容灾站点仅进行生产站点或第一容灾站点的增量数据更新,无需像现有的“两地三中心”容灾解决方案中先进行站点间数据比对,再进行站点间的数据同步。降低远程复制不支持级联的影响,最大化提高站点间数据同步的效率,有效提高了整个存储系统的容灾能力。本申请还提供一种存储系统和一种计算机可读存储介质,具有上述有益效果,此处不再赘述。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1为本申请实施例所提供的一种存储系统的容灾方法的流程图;

图2为本申请实施例所提供的第一种生产站点、第一容灾站点和第二容灾站点之间的关系示意图;

图3为本申请实施例所提供的第二种生产站点、第一容灾站点和第二容灾站点之间的关系示意图;

图4为本申请实施例提供的预设策略流程图;

图5为本申请实施例所提供的启动第三副本的流程图;

图6为本申请实施例所提供的创建第三副本快照的流程图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

请参考图1,图1为本申请实施例所提供的一种存储系统的容灾方法的流程图,存储系统包括生产站点、第一容灾站点和第二容灾站点,该容灾方法包括:

s101:所述第一容灾站点复制所述生产站点的数据,以同时保存两份最新数据;

本申请中,该存储系统除生产站点外,还包括两个容灾站点。通常至少一个容灾站点需要与生产站点保持数据同步的关系,即生产站点和一个容灾站点同时保留有实时最新数据,这样保证随时存在两份最新数据,一旦生产站点发生意外,包括由于自然灾害导致的意外,或者设备发生故障,可以由容灾站点替代生产站点,保证整个存储系统的业务连续性。此外,通常与生产站点保持数据同步关系的容灾站点与生产站点位于同城,但一旦发生自然灾害时,一整片区域内的存储设备往往同时瘫痪,此时需要利用位于异地的第二容灾站点,保证生产站点所在区域的存储系统不发生业务中断。

在此对于第一容灾站点如何复制生产站点数据不作限定,可以为同步复制或是异步复制,还可以为周期异步复制或采用双活数据中心的方法等等。当然本申请并不限定生产站点与第一容灾站点是否同城,只需二者保持数据同步的关系即可。

生产站点对应的数据可以称之为生产卷prod_disk,而第一容灾站点对应的数据可以称为第一容灾卷primary_dr_disk,用于保存rpo为0的生产卷,也可以称为生产卷的副本。第二容灾站点对应的数据为第二容灾卷secondary_dr_disk,也即生产卷的第三副本。这样形成了本申请提出“三站点三副本”的容灾方案。需要说明的是,下文生产站点与生产卷、第一容灾站点和第一容灾卷以及第二容灾站点和第二容灾卷在含义上可通用。rpo指的是恢复点的等级,简单而言,rpo为0,意味着生产卷prod_disk和第一容灾卷primary_dr_disk不存在差异。而若rpo不为0,说明生产卷prod_disk和第一容灾卷primary_dr_disk存在差异,差异等级即为rpo的值。

s102:当所述生产站点或所述第一容灾站点出现增量数据时,利用增量快照记录所述增量数据;

本步骤旨在当生产站点或第一容灾站点出现增量数据时,通过增量快照记录增量数据。需要说明的是,虽然生产站点和第一容灾站点的数据在正常情况下同步的,但是第二容灾站点只会与二者中的一个相连,因此只要出现增量数据,即需要利用增量快照记录增量数据。无论是生产站点还是第一容灾站点,均可利用增量快照记录增量数据。但需要说明的是,仅与第二容灾站点相连的站点才需要利用增量快照记录增量数据。

s103:将所述增量快照的增量快照卷发送至所述第二容灾站点,以使所述第二容灾站点更新所述增量数据;

之所以第二容灾站点只能更新生产站点或第一容灾站点的增量,是因为第二容灾站点只能与二者中的一个相连。参见图2和图3,图2为本申请实施例所提供的第一种生产站点、第一容灾站点和第二容灾站点之间的关系示意图;图3为本申请实施例所提供的第二种生产站点、第一容灾站点和第二容灾站点之间的关系示意图,图2和图3中,椭圆代表各站点的卷,即生产站点的生产卷、第一容灾站点的第一容灾卷和第二容灾站点的第二容灾卷,具体的,存在两种连接方式:

并联1+2:顾名思义,第一容灾站点和第二容灾站点均与生产站点相连,即如图所示,第一容灾卷、第二容灾卷分别与生产卷相连。

串联1+1+1:这种连接方式中,生产站点、第一容灾站点、第二容灾站点依次相连。

也就是说,在生产站点和第一容灾站点保持连接的前提下,第二容灾站点可以任选二者中的任意一个相连。因为生产站点和第一容灾站点之间的数据均相同,所以第二容灾站点更新增量数据时不会存在数据上的变化。但需要说明是,若第二容灾站点与生产站点相连,则增量数据对应的增量快照存在与生产站点上。若第二容灾站点与第一容灾站点相连,则增量数据对应的增量快照存在与第一容灾站点上。

本步骤仅对生产站点或第一容灾站点上的增量数据进行更新,意即是指不必生成此时生产站点或第一容灾站点所有数据的快照,仅生成增量快照即可。当然,可以理解的是,为保证第二容灾卷的一致性,第二容灾站点在接收增量快照之前,生成自身的一致性保护快照。

s104:当所述生产站点不可用时,所述第一容灾站点替代所述生产站点;当所述生产站点和所述第一容灾站点均不可用时,所述第二容灾站点替代所述生产站点。

本申请对于导致生产站点不可用的具体原因不作限定,例如可以是自然灾害或者设备故障等原因,此时先利用第一容灾站点替代生产站点。

若生产站点和第一容灾站点均不可用时,此时启动第二容灾站点替代生产站点。

本实施例通过对存储系统实现三站点(生产站点、第一容灾站点和第二容灾站点)的数据保护,利用第二容灾站点仅进行生产站点或第一容灾站点的增量数据更新,无需像现有的“两地三中心”容灾解决方案中先进行站点间数据比对,再进行站点间的数据同步。降低远程复制不支持级联的影响,最大化提高站点间数据同步的效率,有效提高了整个存储系统的容灾能力。

基于上述实施例,作为优选的实施例,第二容灾站点更新生产站点或第一容灾站点的增量数据,可以具体为:

第二容灾站点根据预设策略更新生产站点或第一容灾站点的增量数据;其中,预设策略具体为:

根据生产站点的生产卷,或第一容灾站点的容灾卷的增量数据生成增量快照,同时生成保护快照;

远程复制增量快照;

判断远程复制增量快照是否成功;

若是,则停止生成增量快照和保护快照;

若否,利用保护快照对第二容灾站点的第二容灾卷执行回滚操作。

用lcx表示增量快照,lcy表示保护快照,rcy表示远程复制过程,则上述过程可以参见图4,图4为本申请实施例提供的预设策略流程图。

本实施例默认在第二容灾站点更新前存在判断生产卷是否处于一致性状态的检测,并只有在一致性状态检测通过时进行增量快照的远程复制,也即第二容灾站点更新增量数据的过程。之所以为远程复制,是因为各站点之间通常相距较远,因此采用远程复制。生产卷的一致性状态检测指的是生产卷与生产卷的副本(即第一容灾卷)保持数据的一致性。而通常情况下,这个条件是满足的。当不满足生产卷的一致性时,第二容灾站点无法更新增量数据。

当满足生产卷的一致性时,依次启动增量快照lcx、保护快照lcy、远程复制rcy。保护快照lcy用于保护第二容灾卷的数据一致性。

当增量快照lcx和远程复制rcy均完成时,停止保护快照lcy,也停止远程复制rcy,代表此时第二容灾卷已经更新增量快照。

当然,如图4所示,上述过程可以为循环过程,即第二容灾站点周期性地根据预设策略更新生产站点或第一容灾站点的增量数据。换句话说,当存在增量数据且生产卷满足一致性状态时,可以不断的将增量数据远程复制到第二容灾卷。此时,rpo的值可以由用户通过设置周期决定,举例而言,若每天更新一次,则一个单位的rpo代表一天。通常rpo小于合理周期的两倍,而周期的的下限由各站点间的链路带宽决定。合理周期为本领域技术人员所公知的不定常数值。

而一旦远程复制过程失败,可以重启远程复制,若实在无法进行远程复制,此时可以通过保护快照lcy将第二容灾卷回滚至上一个一致性时间点。

本实施例基于增量快照和远程复制相结合,实现三站点三副本的数据保护,利用远程复制避免mcs不支持级联带来的数据同步低效率影响。

基于上述实施例,作为优选的实施例,参见图5,图5为本申请实施例所提供的启动第三副本的流程图,当生产站点和第一容灾站点均不可用时,还包括:

判断远程复制是否一致停止;

若是,则停止预设策略,并删除预设策略、增量快照、保护快照和远程复制的数据;

若否,判断是否需要远程复制完成;

若不要需要远程复制完成,停止预设策略,停止远程复制并删除远程复制的数据,将第二容灾站点回滚至一致性保护快照。

一旦生产站点和第一容灾站点均不可用时,此时将启动第二容灾站点,即开启第二容灾站点的读写权限。

当启动第二容灾站点时,先判断远程复制过程是否一致停止,也即需要确定是否所有远程复制过程均已停止。若远程复制一致停止,则停止预设策略,并删除预设策略、增量快照lcx、保护快照lcy和远程复制的数据,除此之外,还可以包括lcy2,lc_target,其中lcy2为lcy的回滚快照关系,也即一致性保护快照;lc_target为生产卷的增量快照卷,用于向secondary_dr_disk也即第二容灾卷传输生产卷增量的变化;change_disk为第二容灾卷的变更卷,用于保护周期异步复制过程中第二容灾卷的数据一致性。

若远程复制没有一致停止,且无需远程复制完成,此时终止预设策略,并直接终止远程复制,删除远程复制的数据,将第二容灾卷secondary_dr_disk回滚至一致性保护快照。最后删除增量快照lcx、lc_target(若远程复制为异步复制则需要等待回滚至lcy2完成后,再删除lcy、lcy2、change_disk)。

删除增量快照lcx、保护快照lcy以及预设策略等的目的是将第二容灾站点作为生产站点使用时,需要重新配置策略。因为第二容灾站点无法将其后续的增量数据反向同步至原来的生产站点或第一容灾站点。

参见图6,图6为本申请实施例所提供的创建第三副本快照的流程图,基于上述实施例,作为优选的实施例,当生产站点和第一容灾站点任一不可用时,还包括:

当远程复制没有同步且一致停止时,对第二容灾卷打快照;

当远程复制在同步且不需要等待远程复制完成时,对第二容灾卷的变更卷打快照。

其中,第一容灾站点复制生产站点的数据包括:

第一容灾站点同步复制或异步复制生产站点的数据。

本实施例旨在当生产站点和第一容灾站点任一不可用时,此时无需启动第二容灾卷(指的是开启读写权限),只需对第二容灾卷进行观察验证操作,因此此时只需创建第三副本的快照即可。具体的,当远程复制没有同步且一致停止时,对第二容灾卷打快照。意即是指,此时需要对整个第二容灾站点的数据打快照。需要说明的是,打快照是为了方便查看容灾卷的数据。

当远程复制在同步且不需要等待远程复制完成,或远程复制不在同步且远程复制没有一致停止时,对第二容灾卷的变更卷打快照,也即对change_disk打快照。

参见图2和图3,本申请还提供一种存储系统,包括:

生产站点、第一容灾站点和第二容灾站点;

第一容灾站点用于复制生产站点的数据,并当生产站点不可用时,替代生产站点;

第二容灾站点用于更新生产站点或第一容灾站点的增量数据,并当生产站点和第一容灾站点均不可用时,替代生产站点。

当然,生产站点和第一容灾站点还可用于在出现增量数据时,利用增量快照记录数据,并将增量快照的增量快照卷发送至第二容灾站点。

图2和图3中生产卷对应生产站点,第一容灾卷对应第一容灾站点,第二容灾卷对应第二容灾站点。图2和图3为本申请提供的存储系统所包括的两种不同的连接方式。

本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例提供的系统而言,由于其与实施例提供的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1