一种远程复制系统及其方法

文档序号:7762924阅读:344来源:国知局
专利名称:一种远程复制系统及其方法
技术领域
本发明涉及一种计算机应用技术领域,尤其涉及一种远程复制系统及其方法。
背景技术
数据的快速增长及数据的高可用性、安全性的要求刺激了存储技术的发展,存储技术已成为IT基础架构的一个关键因素,存储网络为海量存储数据和共 享数据提供了一个有效的硬件基础。面对海量数据,数据的保护和灾难恢复也越来越 重要,而原有的数据保护方法,如磁带备份,存在备份窗口大、恢复时间长、实时响应 差、影响正常业务等弊端,已经无法满足当前的需求。使用磁盘的在线远程复制和数据 冗余成为流行的数据保护技术。将数据在另外的地方实时产生一份可用的副本,此副本的使用不需要做数据恢 复,可以将副本立即投入使用。数据复制的最大好处是副本数据立即可用,没有数据恢 复时间,恢复时间目标(Recovery Time Object,简称RTO)非常好,同时因为是实时复 制,RPO (Recovery Point Time,简称RTO)也非常好,几乎不会丢失数据。其中,RTO
是指信息系统从灾难状态恢复到可运行状态所需的时间,用来衡量容灾系统的业务恢复 能力;RPO是指业务系统所允许的在灾难过程中的最大数据丢失量,用来衡量容灾系统 的数据冗余备份能力。缺点是费用远比数据备份要高,不仅仅是数据复制系统价格高, 还需要另外的硬盘存储空间和主机系统,甚至建立另外的远程机房,考虑网络布线,这 些都将带来成本大大增加,所以数据复制的建设和维护费用远远大于数据备份。数据远程复制目前有如下实现方式(1)基于主机基于主机的数据复制技术,可以不考虑存储系统的同构问题, 只要保持主机是相同的操作系统即可,而目前也存在支持异构主机之间的数据复制软 件,如BakBone NetVault Replicator就可以支持异构服务器之间的数据复制,可以支持跨
越广域网的远程实时复制。缺点是需要占用一点主机资源。(2)基于存储系统利用存储系统提供的数据复制软件,复制的数据流通过存 储系统之间传递,和主机无关。这种方式的优势是数据复制不占用主机资源,不足之处 是需要灾备中心的存储系统和生产中心的存储系统有严格的兼容性要求,一般需要来自 同一个厂家的存储系统,这样对用户的灾备中心的存储系统的选型带来了限制。(3)基于光纤交换机这项技术正在发展中,利用光纤交换机的新功能,或者 利用管理软件控制光纤交换机,对存储系统进行虚拟化,然后管理软件对管理的虚拟 存储池进行卷管理、卷复制、卷镜像等技术,来实现数据的远程复制。比较典型的有 Storag-age,Falcon 等。在远程复制过程中,保证有效数据复制的高效是提供网络传输和保护的重要方 法,现有的方法一般上源卷上有什么数据变化同时要传输到远程的磁盘上。这样必然导 致有很多无效的数据传输,例如,8K的数据中只有IByte数据的变化,但现有的远程复 制技术往往需要将整个8K进行传输,而不是只传输变化的IByte数据。
因此如何提供一种方法,在数据传输上使用差量算法对数据进行差异传输,尽 可能的传输最少的数据达到远程复制的目的,有效的利用网络带宽节约存储资源是目前 数据急剧增加面临的挑战。

发明内容
本发明要解决的技术问题是,提供一种远程复制系统及其方法,能够大幅减少 远程复制过程中网络传输的数据,实现传输的精简高效。为了解决上述技术问题,本发明提供了一种远程复制方法,包括远程复制发送端在向远程复制接收端发送备份数据时,仅将所述远程复制发送 端在当前复制传输的时间点相对于其在上一次复制传输的时间点发生变化的日志数据发 送至所述远程复制接收端;所述远程复制接收端根据所述发生变化的日志数据及其上一次计算出的所述远 程复制发送端的日志数据计算出所述远程复制发送端在当前复制传输的时间点的日志数 据,并据以重建元数据。进一步地,上述方法还可具有以下特点所述远程复制发送端还将用以存储所述日志数据的源数据区划分为若干个原子 数据块;所述远程复制发送端发送所述发生变化的日志数据包括将其在当前复制传输 的时间点的日志数据与其在上一次复制传输的时间点的日志数据进行异或运算,根据异 或结果判断出发生变化的原子数据块,将所述发生变化的原子数据块的异或结果,以及 所述发生变化的原子数据块的索引信息发送至所述远程复制接收端;所述索引信息包括 所述发生变化的原子数据的块号和发生变化的时间点;所述远程复制接收端计算所述远程复制发送端在当前复制传输的时间点的日志 数据包括根据所述发生变化的原子数据块的索引信息,找出其上一次计算出的所述远 程复制发送端的日志数据中对应的原子数据块,并将其与所述发生变化的原子数据块的 异或结果进行异或运算,恢复出所述发生变化的原子数据块,然后再根据所述发生变化 的原子数据块和所述上一次计算出的所述远程复制发送端的日志数据得到所述远程复制 发送端在当前复制传输的时间点的日志数据。进一步地,上述方法还可具有以下特点所述远程复制发送端在得到所述发生变化的原子数据块的异或结果后,还对所 述发生变化的原子数据块的异或结果进行压缩处理,然后再将其发送至所述远程复制接 收端;所述远程复制接收端在接收到所述发生变化的原子数据块的异或结果后,先进 行解压缩处理,以得到所述发生变化的原子数据块的异或结果。进一步地,上述方法还可具有以下特点所述远程复制发送端在向远程复制接收端发 送备份数据时,还记录已经发送出 的备份数据的块地址,以及如果传输出现异常,则再次传输时,从当前记录的块地址开 始传输备份数据。进一步地,上述方法还可具有以下特点
所述远程复制发送端在向远程复制接收端发送备份数据时,如果本地存储有快 照数据,则向所述远程复制接收端发送所述快照数据对应的快照时间点;所述远程复制接收端根据所述快照数据对应的快照时间点以及所述远程复制发 送端在当前复制传输的时间点的日志数据计算并保存快照数据。为了解决上述技术问题,本发明还提供了一种远程复制系统,包括远程复制发 送端和远程复制接收端,其中远程复制发送端在向远程复制接收端发送备份数据时,仅将所述远程复制发送 端在当前复制传输的时间点相对于其在上一次复制传输的时间点发生变化的日志数据发 送至所述远程复制接收端;所述远程复制接收端根据所述发生变化的日志数据及其上一次计算出的所述远程复制发送端的日志数据计算出所述远程复制发送端在当前复制传输的时间点的日志数 据,并据以重建元数据。进一步地,上述系统还可具有以下特点所述远程复制发送端还将用以存储所述日志数据的源数据区划分为若干个原子 数据块;所述远程复制发送端发送所述发生变化的日志数据包括将其在当前复制传输 的时间点的日志数据与其在上一次复制传输的时间点的日志数据进行异或运算,根据异 或结果判断出发生变化的原子数据块,将所述发生变化的原子数据块的异或结果,以及 所述发生变化的原子数据块的索引信息发送至所述远程复制接收端;所述索引信息包括 所述发生变化的原子数据的块号和发生变化的时间点;所述远程复制接收端计算所述远程复制发送端在当前复制传输的时间点的日志 数据包括根据所述发生变化的原子数据块的索引信息,找出其上一次计算出的所述远 程复制发送端的日志数据中对应的原子数据块,并将其与所述发生变化的原子数据块的 异或结果进行异或运算,恢复出所述发生变化的原子数据块,然后再根据所述发生变化 的原子数据块和所述上一次计算出的所述远程复制发送端的日志数据得到所述远程复制 发送端在当前复制传输的时间点的日志数据。进一步地,上述系统还可具有以下特点所述远程复制发送端在得到所述发生变化的原子数据块的异或结果后,还对所 述发生变化的原子数据块的异或结果进行压缩处理,然后再将其发送至所述远程复制接 收端;所述远程复制接收端在接收到所述发生变化的原子数据块的异或结果后,先进 行解压缩处理,以得到所述发生变化的原子数据块的异或结果。进一步地,上述系统还可具有以下特点所述远程复制发送端在向远程复制接收端发送备份数据时,还记录已经发送出 的备份数据的块地址,以及如果传输出现异常,则再次传输时,从当前记录的块地址开 始传输备份数据。进一步地,上述系统还可具有以下特点所述远程复制发送端在向远程复制接收端发送备份数据时,如果本地存储有快 照数据,则向所述远程复制接收端发送所述快照数据对应的快照时间点;
所述远程复制接收端根据所述快照数据对应的快照时间点以及所述远程复制发 送端在当前复制传输的时间点的日志数据计算并保存快照数据。本发明供的一种远程复制系统及其方法,能够大幅减少远程复制过程中网络传 输的数据,实现传输的精简高效。


图1是本发明实施 例一种远程复制方法流程图;图2是本发明实施例一种远程复制传输过程示意图;图3是本发明实施例一种远程复制发送端计算发生变化的日志数据的方法示意 图;图4是本发明应用实例一种远程复制传输过程示意图。
具体实施例方式下面将结合附图对本发明实施方案做进一步详细描述。参见图1,该图示出了本发明实施例一种远程复制方法,包括步骤步骤SlOl 远程复制发送端在向远程复制接收端发送备份数据时,仅将所述远 程复制发送端在当前复制传输的时间点Tl相对于其在上一次复制传输的时间点TO发生变 化的日志数据发送至所述远程复制接收端;步骤S102 所述远程复制接收端根据所述发生变化的日志数据及其上一次计算 出的所述远程复制发送端的日志数据(即所述远程复制发送端在时间点TO的日志数据) 计算出所述远程复制发送端在当前复制传输的时间点Tl的日志数据,并据以重建元数 据。采用上述方式远程传输备份数据时,仅传输日志数据,不传输元数据,且所传 输的日志数据只是发生变化的那部分数据,而由远程复制接收端根据变化的日志数据恢 复出远程复制发送端在时间点Tl的日志数据,以及根据恢复出的在时间点Tl的日志数据 重建元数据,巧妙地从网络数据传输和元数据重建两个方面有效地减少了远程复制的网 络传输开销,如图2所示。本发明实施例在此还提供了一种远程复制发送端计算发生变化的日志数据的方 法,包括所述远程复制发送端将用以存储所述日志数据的源数据区划分为若干个原子数 据块。所述远程复制发送端通过将其在当前复制传输的时间点的日志数据与其在上一 次复制传输的时间点的日志数据进行异或运算,根据异或结果判断出发生变化的原子数 据块,将所述发生变化的原子数据块的异或结果,以及所述发生变化的原子数据块的索 引信息发送至所述远程复制接收端的方式向所述远程复制接收端发送发生变化的日志数 据。其中,所述索引信息包括所述发生变化的原子数据的块号和发生变化的时间点。参 见图3,进行异或运算后,如果未发生变化,则异或运算结果为0,如果发生变化,则异 或运算结果为1,从而能够判断出哪些原子数据块发生了变化。所述远程复制接收端根据所述发生变化的原子数据块的索引信息,找出其上一次计算出的所述远程复制发送端的日志数据中对应的原子数据块,并将其与所述发生变 化的原子数据块的异或结果进行异或运算,从而恢复出所述发生变化的原子数据块。之 后,所述远程复制接收端即可根据所述发生变化的原子数据块和所述上一次计算出的所 述远程复制发送端的日志数据计算出所述远程复制发送端在当前复制传输的时间点的日 志数据。以及所述远程复制接收端将根据所述发生变化的原子数据块的索引信息自动重 建元数据。 为了进一步减少传输的数据,较佳地,所述远程复制发送端还可以在得到所述 发生变化的原子数据块的异或结果后,还对所述发生变化的原子数据块的异或结果进行 压缩处理,然后再将其发送至所述远程复制接收端。可以采用通用的数据压缩方法比如 gzip、7zip等等。尤其对于发生变化的数据块内仅有较少的比特发生变化的情况,采用异 或操作后,会生成大量的0,而执行压缩操作将会有效地减少这些0的传输,进而节约网 络传输资源。相应地,所述远程复制接收端在接收到所述发生变化的原子数据块的异或 结果后,需要先进行解压缩处理,以得到所述发生变化的原子数据块的异或结果。在远程复制的过程中主要需要考虑异常处理,主要考虑两种情况一种是客户 端和远程主机异常;一种是网络异常。因此,较佳地,所述远程复制发送端在向远程复 制接收端发送备份数据时,还可以记录已经发送出的备份数据的块地址,以及如果传输 出现异常,则再次传输时,从当前记录的块地址开始传输备份数据。考虑远程复制发送端可能具有快照功能,则在执行远程复制时,还需要将快照 数据备份至远程复制接收端。为了有效减少需要传输的快照数据,较佳地,所述远程复 制发送端可以在向远程复制接收端发送备份数据时,如果本地存储有快照数据,则向所 述远程复制接收端发送所述快照数据对应的快照时间点。所述远程复制接收端根据所述 快照数据对应的快照时间点以及所述远程复制发送端在当前复制传输的时间点的日志数 据计算并保存快照数据,从而有效地节约网络传输资源。本发明可以应用于远程复制客户端向远程复制服务器备份数据,也可以应用于 连续数据保护服务器之间进行数据备份。即,所述远程复制发送端是远程复制客户端, 所述远程复制接收端是远程复制服务器。或者,所述远程复制发送端和所述远程复制接 收端均为连续数据保护系统。出于兼容性考虑,较佳地,本发明实施例中所述远程复制 接收端执行元数据重建时,包括重建发生变化的日志数据的索引,可以采用与持续数据 保护的元数据组织管理方式相同的方式。为了进一步说明本发明方法的优势,下面以一应用实例进行说明。应用实例如图4所示,远程复制发送端在时间点Tl的日志数据相对于其在时间点TO的日 志数据发生变化的是原子数据块2、6、7,采用本发明方案,只需要将发生变化的数据, 即原子数据块2、6、7,发送至远程复制接收端,而由所述远程复制接收端根据所述发生 变化的数据以及所述远程复制接收端上一次计算出的所述远程复制发送端复制备份来的 数据,即时间点TO的日志数据,恢复出时间点Tl的日志数据,并自动重建元数据。整 个复制备份过程中,只需要在网络侧传输发生变化的数据,大大节省了网络传输资源。以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术 人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应 包含在本发明的保护范围之内。
权利要求
1.一种远程复制方法,其特征在于远程复制发送端在向远程复制接收端发送备份数据时,仅将所述远程复制发送端在 当前复制传输的时间点相对于其在上一次复制传输的时间点发生变化的日志数据发送至 所述远程复制接收端;所述远程复制接收端根据所述发生变化的日志数据及其上一次计算出的所述远程复 制发送端的日志数据计算出所述远程复制发送端在当前复制传输的时间点的日志数据, 并据以重建元数据。
2.如权利要求1所述的方法,其特征在于所述远程复制发送端还将用以存储所述日志数据的源数据区划分为若干个原子数据块;所述远程复制发送端发送所述发生变化的日志数据包括将其在当前复制传输的时 间点的日志数据与其在上一次复制传输的时间点的日志数据进行异或运算,根据异或结 果判断出发生变化的原子数据块,将所述发生变化的原子数据块的异或结果,以及所述 发生变化的原子数据块的索引信息发送至所述远程复制接收端;所述索引信息包括所述 发生变化的原子数据的块号和发生变化的时间点;所述远程复制接收端计算所述远程复制发送端在当前复制传输的时间点的日志数据 包括根据所述发生变化的原子数据块的索引信息,找出其上一次计算出的所述远程复 制发送端的日志数据中对应的原子数据块,并将其与所述发生变化的原子数据块的异或 结果进行异或运算,恢复出所述发生变化的原子数据块,然后再根据所述发生变化的原 子数据块和所述上一次计算出的所述远程复制发送端的日志数据得到所述远程复制发送 端在当前复制传输的时间点的日志数据。
3.如权利要求2所述的方法,其特征在于所述远程复制发送端在得到所述发生变化的原子数据块的异或结果后,还对所述 发生变化的原子数据块的异或结果进行压缩处理,然后再将其发送至所述远程复制接收 端;所述远程复制接收端在接收到所述发生变化的原子数据块的异或结果后,先进行解 压缩处理,以得到所述发生变化的原子数据块的异或结果。
4.如权利要求1-3中任何一项所述的方法,其特征在于所述远程复制发送端在向远程复制接收端发送备份数据时,还记录已经发送出的备 份数据的块地址,以及如果传输出现异常,则再次传输时,从当前记录的块地址开始传 输备份数据。
5.如权利要求1-3中任何一项所述的方法,其特征在于所述远程复制发送端在向远程复制接收端发送备份数据时,如果本地存储有快照数 据,则向所述远程复制接收端发送所述快照数据对应的快照时间点;所述远程复制接收端根据所述快照数据对应的快照时间点以及所述远程复制发送端 在当前复制传输的时间点的日志数据计算并保存快照数据。
6.一种远程复制系统,包括远程复制发送端和远程复制接收端,其特征在于 远程复制发送端在向远程复制接收端发送备份数据时,仅将所述远程复制发送端在当前复制传输的时间点相对于其在上一次复制传输的时间点发生变化的日志数据发送至所述远程复制接收端;所述远程复制接收端根据所述发生变化的日志数据及其上一次计算出的所述远程复 制发送端的日志数据计算出所述远程复制发送端在当前复制传输的时间点的日志数据, 并据以重建元数据。
7.如权利要求6所述的系统,其特征在于所述远程复制发送端还将用以存储所述日志数据的源数据区划分为若干个原子数据块;所述远程复制发送端发送所述发生变化的日志数据包括将其在当前复制传输的时 间点的日志数据与其在上一次复制传输的时间点的日志数据进行异或运算,根据异或结 果判断出发生变化的原子数据块,将所述发生变化的原子数据块的异或结果,以及所述 发生变化的原子数据块的索引信息发送至所述远程复制接收端;所述索引信息包括所述 发生变化的原子数据的块号和发生变化的时间点;所述远程复制接收端计算所述远程复制发送端在当前复制传输的时间点的日志数据 包括根据所述发生变化的原子数据块的索引信息,找出其上一次计算出的所述远程复 制发送端的日志数据中对应的原子数据块,并将其与所述发生变化的原子数据块的异或 结果进行异或运算,恢复出所述发生变化的原子数据块,然后再根据所述发生变化的原 子数据块和所述上一次计算出的所述远程复制发送端的日志数据得到所述远程复制发送 端在当前复制传输的时间点的日志数据。
8.如权利要求7所述的系统,其特征在于所述远程复制发送端在得到所述发生变化的原子数据块的异或结果后,还对所述 发生变化的原子数据块的异或结果进行压缩处理,然后再将其发送至所述远程复制接收 端;所述远程复制接收端在接收到所述发生变化的原子数据块的异或结果后,先进行解 压缩处理,以得到所述发生变化的原子数据块的异或结果。
9.如权利要求6-8中任何一项所述的系统,其特征在于所述远程复制发送端在向远程复制接收端发送备份数据时,还记录已经发送出的备 份数据的块地址,以及如果传输出现异常,则再次传输时,从当前记录的块地址开始传 输备份数据。
10.如权利要求6-8中任何一项所述的系统,其特征在于所述远程复制发送端在向远程复制接收端发送备份数据时,如果本地存储有快照数 据,则向所述远程复制接收端发送所述快照数据对应的快照时间点;所述远程复制接收端根据所述快照数据对应的快照时间点以及所述远程复制发送端 在当前复制传输的时间点的日志数据计算并保存快照数据。
全文摘要
本发明提供了一种远程复制方法及系统,该方法包括远程复制发送端在向远程复制接收端发送备份数据时,仅将所述远程复制发送端在当前复制传输的时间点相对于其在上一次复制传输的时间点发生变化的日志数据发送至所述远程复制接收端;所述远程复制接收端根据所述发生变化的日志数据及其上一次计算出的所述远程复制发送端的日志数据计算出所述远程复制发送端在当前复制传输的时间点的日志数据,并据以重建元数据。该方法能够大幅减少远程复制过程中网络传输的数据,实现传输的精简高效。
文档编号H04L29/08GK102014152SQ20101051731
公开日2011年4月13日 申请日期2010年10月18日 优先权日2010年10月18日
发明者刘正伟, 王旭 申请人:浪潮(北京)电子信息产业有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1