一种不会产生连环数据复制的数据容灾方法

文档序号:7942437阅读:253来源:国知局
专利名称:一种不会产生连环数据复制的数据容灾方法
技术领域
本发明涉及数据容灾技术,特别涉及一种不会产生连环数据复制的数据容灾方法。
背景技术
当今,电信业务比以往任何时候都更加依赖于计算机系统,计算机系统在为电信业务迅猛发展提供技术基础架构的同时,由于电信业务支撑系统的需要,用户信息和业务处理的高度集中,以及不可预见的故障和灾难,导致电信业务支撑系统存在很多灾难性破坏的隐患,有可能成为整体系统中的单故障点。因此,业务的拓展与灾难的防范是所有电信用户都必须同步重视的问题。计算机业务系统的灾难,通常的定义是指采用计算机系统处理的重要电子数据丢失至不可恢复或由此导致电信业务中断以至于延长到不可接受的时间。
数据灾难是指数据处理过程中出现了大范围的中断,不能在可接受的预定时间内解决,而需要另一套计算机系统来进行恢复的情况。明显的例子有火灾、爆炸事件、地震、水灾等自然原因,以及电源故障、人为因素等非自然原因引起的灾难。
根据统计,几种引起数据灾难的常见原因及所占的比重为断电/电源故障占50%,人为原因占17%,硬件、软件网络等故障占11%,火灾、雷电、爆炸、地震等灾害占18%,其它原因占4%。
目前,数据容灾在国内的一些银行,电信计费系统已经有一些应用,但应用还较少。随着近年来中国电信业务的飞速发展,计算机系统基础架构的建设、特别是计算机容灾系统的设计与建设正逐渐被中国各电信运营企业所重视。不言而喻,如果电信业务支撑系统有一套完备的灾难备份/恢复体系,当突发性灾难发生后,电信业务支撑系统关键业务数据的损失将减至最小。特别是中国加入WTO后,行业竞争越来越激烈,完善的灾难备份/恢复体系在不远的将来将是中国电信发展的可靠保障。
对于移动智能网来说,充值中心VC保存和管理智能业务充值卡的业务数据。由于智能网的业务特点和智能网在网络上的重要地位,为了提高可靠性而且节省投资,只实现数据容灾,暂不考虑业务接管。由于设备全部损坏的情况发生的可能非常小,当灾难发生后,由于所有重要业务数据都有实时的备份,根据设备的损失情况,通过重新组织设备,业务也可以在较短时间内恢复,这是一种经济有效的方法。
循环备份的方案适用于VC(充值中心)这种节点少、数据需要容灾的情况。由于没有解决循环备份会产生连环数据复制的问题,循环备份的容灾实施方案没有得到应用。

发明内容
本发明提供一种不会产生连环数据复制的数据容灾方法,以解决循环备份中数据连环复制的问题。
本发明包括步骤在系统的每一节点建立用于本节点生产系统的非容灾卷组和用于备份异地数据的容灾卷组,将非容灾卷组分为用于存放本节点业务数据的容灾卷和用于存放灾难点业务数据的非容灾卷;所述节点通过容灾链路接收上一个节点传送来的数据,将该数据备份于本节点的容灾卷组上,并将本节点非容灾卷组的容灾卷上产生的增量数据经容灾链路传送给下一个节点;以及在所述节点发生灾难后,由接管点将备份数据从容灾卷组上导入到非容灾卷组的非容灾卷上,以接管灾难点生产中心的业务。
根据上述方案每一节点采用主机系统和备机系统组成。
当从主机系统切换到备机系统后,容灾复制暂停,业务请求所产生的新的增量数据存储于该备机系统中,并以日志方式记录。
其中一台机器作为备份中心,在备份中心上分别安装两套数据库系统,一套为本地生产库,建立在非容灾卷组上,管理容灾卷和非容灾卷;一套为异地备份库,建立在容灾卷组上。
接管灾难节点业务包括步骤a、将灾难节点的备份数据从容灾卷组上导入到非容灾卷组的非容灾卷上;b、修改所有指向灾难节点生产中心的配置数据,使其指向该接管点的生产中心;c、接管点的生产中心接管灾难点业务,灾难点的业务产生的增量数据存储于非容灾卷组的非容灾卷中,不会复制到下一备份中心。
灾难点的恢复包括步骤d、将接管点的非容灾卷组的非容灾卷上的数据导入到容灾卷组上,并将所述非容灾卷上的数据删除;e、将接管点的容灾卷组上的数据复制到原灾难节点;f、恢复已修改的原灾难节点生产中心的配置数据,使其重新指向该节点的生产中心。
本发明利用数据库依数据的不同可以分卷存储的特点,将每个节点分为容灾卷组和非容灾卷组,非容灾卷组又划分为容灾卷和非容灾卷。容灾卷用于本地生产系统,非容灾卷用于灾难发生后接管灾难点的业务。容灾复制时只复制容灾卷,非容灾卷不会复制到下级节点,巧妙的解决了循环备份可能造成的数据连环复制的问题。因而具有下述优点(1)容灾和业务系统的完全独立,对业务系统影响最小业务正常运行过程中,容灾部分只实现数据复制,与业务系统没有任何关系。只是在容灾切换时才将非容灾卷Attach到数据库中,将数据合并,进行业务接管。
(2)本发明的应用不需对现有网络做任何更改,最大限度的保证了应用的稳定性业务接管后,两个节点数据合并到了一个数据库中,应用环境没有做任何改变,所以VC应用不用做任何更改,最大限度的保证了VC应用的稳定性。
(3)数据分盘存储,使容灾对存储的影响最小本地业务数据和异地复制过来的数据存储于不同的物理磁盘,大大减少了存储对业务系统的影响。
(4)采用同步、异步自适应的工作模式,使数据的丢失减少到最少如果网络情况良好以及机器处理能力足够,数据复制可以达到设定的响应时间时,采用同步处理方式。如果不能达到设定的要求时采用异步处理方式。最大限度的保证了数据的一致性以及可靠性,使数据的丢失减少到最少。
(5)系统容灾软件设计和复制任务无关联性,独立于各种容灾产品采用迭加方案,系统容灾软件设计和复制任务无关联性,复制任务独立由第三方软件实现。可以选用不同的容灾产品和不同的硬件平台,针对不同的应用需求可以选用不同的产品。如Veritas、IBM HAGEO、HP XP512等。


图1为本发明循环备份容灾方案图;图2为容灾的硬件解决方案示意图;图3为由纯软件提供的OS/IO/卷复制解决方案;图4为本地双机容错结构图;图5为正常情况下的增量复制示意图;图6为双机切换后的增量复制示意图;图7为备份中心接收远程数据示意图;图8为灾难发生后数据导入示意图;图9为灾难恢复后数据导出示意图。
具体实施例方式
本发明采用循环备份方式,系统中的每一节点既作为备份中心,备份上级业务点的生产数据,也作为生产中心,其生产数据传送给下一级节点备份,即系统中多个节点的生产中心(简称VC)间循环作备份。如图1所示甲地生产中心的数据复制到乙地,乙地生产中心的数据复制到丙地,丙地生产中心的数据复制到甲地。
对相互间距离较远的节点,通过E1或更高速率的线路相连。数据复制技术可采用两种产品基于硬件存储设备复制的产品,如HP XP512系列容灾产品,其结构如图2所示;基于软件复制的产品,如VERITAS的VVR/VxVM/VCS系列容灾产品,其结构如图3所示。
复制方式均采用异步复制方式(VERITAS可以采用同步/异步自适应模式),灾难发生后,灾难点的业务负荷将由其下级业务点(即其备份点)承担。
本实施例以本地双机容错结构为例对本发明进行详细说明本实施中的容灾方法既提供远程容灾的功能,同时支持对本地容错的处理,使系统既保持高度的可用性,又具有业务的抗灾能力。
生产中心由主机系统和备机系统组成,采用双机运行机制。主机系统和备机系统间采用数据库DR方式完成数据复制。双机切换时间小于10秒,保证系统的高可用性,如图4所示。
一、容灾系统的建立首先对节点进行数据卷规划。每个节点划分两类卷组容灾卷组和非容灾卷组,非容灾卷组又划分为容灾卷和非容灾卷。非容灾卷组的容灾卷用于本地生产系统,如本地操作系统、VC应用等;非容灾卷组的非容灾卷用于灾难发生后存放灾难点的数据,以便接管灾难点业务。其中只有容灾卷才需要复制到下一节点(或称备份节点)的容灾卷组上。容灾卷组用于生产中心(上一节点)的容灾复制,包括数据库、需要复制到备份中心的文件等。
然后进行数据库规划。每个节点安装两套数据库系统,一套为本地生产库,建立在非容灾卷组上,管理容灾卷和非容灾卷;一套为异地备份库,建立在容灾卷组上。将复制模式设定为异步模式(VERITAS设为同步/异步自适应模式)。
在数据库建立后,进行数据基线建立。数据基线的建立是指容灾主备双方建立彼此一致的基准数据。在容灾系统正式工作之前,可以通过两种途径建立数据基线(1)通过容灾备份线路将生产中心的数据完全传至备份中心,此种情况比较适合于基线数据量的较小的情况。对于一条2M的E1线路(线路占用率最高取0.8),若允许数据传输的时间在24小时,则基线的数据量大小在2Mbits/s*24小时*0.8=16.8GBytes以内,即当基线数据在16.8GB以内,可采用线路传输的方式建立数据基线。
(2)通过磁带等介质传输基线数据此种情况适合于大数据量的基线建立。方法是将生产中心的数据导出至磁带等介质上,然后将磁带运送到备份中心,再将磁带上的数据导入到备份中心。
二、系统工作时,上下节点间进行数据增量复制,参阅图5。
增量复制是指数据基线建立后,上一节点的本地生产中心新发生的增量数据向下一节点备份中心复制的过程。由于生产中心采用双机系统,故下面阐述基于双机系统的容灾增量备份。
正常情况下的增量复制如图5所示,容灾链路与双机中的其中一台(如主机)固定相连的。生产中心的业务请求由主机完成,由此产生容灾卷的增量数据,此增量数据将由容灾软件复制到下一节点(即本节点的备份中心)的容灾卷组上。数据复制过程如下生产中心(的主机)每发生一个IO操作,均由容灾软件记录并缓存,然后通过容灾链路复制到备份中心,备份中心重做此IO即可完成数据复制。
主机系统和备机系统切换后的情况当双机中的主机由于故障而停机时,双机系统将切换到备机上,备机成为新的主机,业务请求也将由新主机处理。此时容灾复制将暂停。切换后,业务请求所导致的新的数据增量将被写入到新主机的数据库中,并以日志的方式被记录。根据系统实际运行情况,双机系统允许在双机中某一台机器出现故障后,可以在24小时内恢复而不丢失数据(该机恢复后即可由HDR来完成主备机数据同步)。双机系统中某一机器出现故障后,系统将发出告警,以提醒维护人员尽快处理。容灾复制的暂停并不影响生产中心的业务处理。
双机恢复如图6所示,当双机中故障机恢复后,即可通过人机交互重新启动容灾系统,然后启动双机系统,这使原主机变为备机,新备机就与新主机建立了双机关系。这样,在故障期间新主机上发生的增量数据将由DR复制当前的备机(即原来的主机系统)上,这些增量数据将产生IO操作,容灾软件即可将这些IO复制到备份中心,从而完成在故障期间产生的增量数据同步,恢复过程完成后,即进入正常的增量同步过程。而容灾卷组继续接受上一节点的IO复制。
如图7所示,本地节点的备份中心通过容灾链路接受上一节点生产中心传送的远程数据。在本实施例中,每个备份中心同是也是生产中心,每个生产中心也是备份中心,即备份中心与生产中心合设。本地生产中心产生的增量数据由容灾链路发出。而备份中心实际是由容灾卷组(其上有异地备份库)及一个固定的备份服务器(由双机中的一台,如备机兼任)组成。
当异地生产中心来的增量数据(IO操作)由入容灾链路传至备份中心后,容灾系统即在备份服务器上的容灾卷组上重做这些IO操作,从而完成增量数据的备份工作。由于容灾复制是基于IO/卷复制的,故备份中心接受的数据既可以是文件、也可以是数据库等。
由于备份中心的容灾卷组是单独划分的,故容灾复制对本地生产中心的双机系统并不产生任何影响。当备份服务器出现故障时,容灾复制将暂停,但远程生产中心的容灾系统会将其要复制的数据缓存起来,所以并不会导致容灾复制数据的丢失。
当本地双机系统发生切换,即备份服务器在双机中的主备地位发生切换时,容灾复制也能照常进行,因为容灾卷组是单独划分的,不受双机影响。
三、灾难切换参阅图8,当异地节点的生产中心发生灾难时,要求该异地节点的备份中心(即下一节点)能接管生产中心的业务,主要的切换过程如下(1)备份中心上的数据导入至本地生产库。
当异地生产中心发生灾难后,必须将灾难点的数据导入到本地生产中心(即本地非容灾卷组)的非容灾卷中,才能由本地生产中心接管异地生产中心(即灾难点)业务。数据导入到本地库的方法启动容灾卷组上的Informix实例,利用Informix的工具或编写一个脚本,均可将备份中心数据库的数据导入到位于本地数据库的非容灾卷中,这部分数据产生的IO是不参与容灾复制。
当灾难发生后,灾难点的数据被导入到接管点生产库中的非容灾卷,以防止这部分数据被进一步复制到下一节点(即本节点的备份中心)。因为在灾难发生后只有本地节点非容灾卷组的容灾卷才需要容灾备份。
(2)数据配置在灾难发生后,需要修改所有指向灾难点的配置数据,使之指向接管点的生产中心。
(3)按管点生产中心开始接管灾难点业务上述步骤完成后,接管点的本地生产中心即可开始接管灾难点的业务。在此期间,备份中心(本地生产中心)上新增的增量数据包括两部分本地数据库产生的增量数据和灾难点(异地)产生的增量数据。前者将落入到非容灾卷组的容灾卷上,后者将落入到非容灾卷组的非容灾卷上。只有容灾卷里的本地数据卷IO才会复制到下一备份点。
四、灾难节点的恢复参阅图9,灾难节点的恢复包括如下过程备份中心到灾难点的数据反向同步或灾难点数据基线重建、灾难点的业务恢复。
(1)数据导出数据导出是指将位于接管点非容灾卷组的非容灾卷的数据导出到(备份中心的)备份库(即容灾卷组上),这可以通地编写一个导出脚本来实现。在生产库中的本地数据和异地数据的标识可以通过充值卡号来识别。
在异地数据从生产库中全部导出后,应将生产库的的异地数据删除。并将生产库中的非容灾卷从生产库中分离(Detach)。
(2)备份数据恢复(增量恢复或基线重线)
备份数据恢复是指将接管点上的数据复制到原生产中心(即灾难点)的过程,可有两种方式增量恢复和基线重建。增量恢复指仅复制灾难期间的增量数据,基线重建指重新建立数据基线。对于基线重建,当数据量不大的情况,可考虑通过线路(容灾链路)进行,当数据量较大时,可考虑通过磁带等介质来进行基线重建。
有的容灾系统支持增量恢复,当灾难点破坏程度较轻,灾难点的设备及原有数据还存在时,容灾系统可以仅将灾难期间的增量数据复制回灾难点,从而达到数据同步的目的,此种方式数据复制量较少,恢复速度较快。此过程也称之为反向同步。
如果灾难点的原有数据不存在时,则数据恢复只能通过基线重建的方式进行,即采用前述的基线建立方法重建基线。
(3)配置数据恢复在备份数据完全恢复后,修改原灾难点VC的配置数据,使之重新指向灾难点VC,以便灾难点的业务恢复正常。
当上述步骤完成后,灾难点即可恢复正常,开始提供业务服务。此时开启容灾系统的正向同步(即从生产中心到备份中心的同步),即可完全恢复灾难点的生产中心。
软件方式以及硬件方式的数据复制均适用于本发明的技术方案。本发明也可适用于智能网以外的其他领域。
权利要求
1.一种不会产生连环数据复制的数据容灾方法,其特征在于包含下述步骤在系统的每一节点建立用于本节点生产系统的非容灾卷组和用于备份异地数据的容灾卷组,将非容灾卷组分为用于存放本节点业务数据的容灾卷和用于存放灾难点业务数据的非容灾卷;所述节点通过容灾链路接收上一个节点传送来的数据,将该数据备份于本节点的容灾卷组上,并将本节点非容灾卷组的容灾卷上产生的增量数据经容灾链路传送给下一个节点;以及在所述节点发生灾难后,由接管点将备份数据从容灾卷组上导入到非容灾卷组的非容灾卷上,以接管灾难点生产中心的业务。
2.如权利要求1所述的方法,其特征在于每一节点采用主机系统和备机系统组成。
3.如权利要求2所述的方法,其特征在于当从主机系统切换到备机系统后,容灾复制暂停,业务请求所产生的新的增量数据存储于该备机系统中,并以日志方式记录。
4.如权利要求2所述的方法,其特征在于其中一台机器作为备份中心,在备份中心上分别安装两套数据库系统,一套为本地生产库,建立在非容灾卷组上,管理容灾卷和非容灾卷;一套为异地备份库,建立在容灾卷组上。
5.如权利要求1所述的方法,其特征在于接管灾难节点的业务包括步骤a、将灾难节点的备份数据从容灾卷组上导入到非容灾卷组的非容灾卷上;b、修改所有指向灾难节点生产中心的配置数据,使其指向该接管点的生产中心;c、接管点的生产中心接管灾难点业务,将本地业务的增量数据存储于非容灾卷组的容灾卷上,将灾难点业务的增量数据存储在非容灾卷组的非容灾卷上。
6.如权利要求1或5所述的方法,其特征在于还包括对灾难点的恢复步骤d、将接管点非容灾卷组的非容灾卷上的增量数据导入到容灾卷组上,并将所述非容灾卷上的数据删除;e、将接管点的容灾卷组上的数据复制到原灾难节点;f、恢复已修改的原灾难节点生产中心的配置数据,使其重新指向该节点的生产中心。
全文摘要
本发明公开了一种数据容灾的方法,包含步骤系统中的每一节点通过容灾链路接收上一个节点传送来的增量数据,将该增量数据备份于本节点的容灾卷组上,并将本节点非容灾卷组的容灾卷上产生的增量数据经容灾链路传送给下一个节点;以及接管灾难节点的业务时将该灾难节点的备份数据从容灾卷组上导入到非容灾卷组的非容灾卷上。该方法利用数据库依数据的不同可以分卷存储的特点,创造性的将每个节点的存储分为容灾卷和非容灾卷,容灾卷(需要容灾)用于存储正常业务数据,非容灾卷用于存储异地复制过来的数据。复制时只复制容灾卷,非容灾卷不会复制到下级节点,巧妙的解决了循环备份可能造成的数据连环复制的问题。
文档编号H04L1/22GK1505315SQ0215397
公开日2004年6月16日 申请日期2002年12月5日 优先权日2002年12月5日
发明者陈胜平 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1