数据级容灾方法、系统和生产中心节点的制作方法

文档序号:7928066阅读:380来源:国知局
专利名称:数据级容灾方法、系统和生产中心节点的制作方法
技术领域
本发明涉及网络通信中的容灾技术,尤其涉及一种数据级容灾方法、系统和生产
中心节点。
背景技术
容灾是指为了保证关键业务和应用在经历各种灾难后,仍然能够最大限度的提供 正常服务所进行的一系列系统计划和建设行为。常见的灾难事件包括如火灾、洪水、地震、 台风等自然灾难;也有如设备故障、软件错误、电信网络中断和电力故障等突发灾难;还有 如操作员错误、破坏、植入有害代码和恐怖袭击等人为因素造成的灾难。容灾行业的起源和 发展是计算机技术发展的必然产物,同时也反映了信息化系统及数据对个人、企业和国家 的重要性。容灾的实质是确保永不停顿的业务运营,容灾的最终建设目的是保证业务的连 续性。 容灾系统由生产中心节点和备份中心节点组成,容灾系统的工作原理为在正常 工作状态下,各生产中心节点将需要保护的数据传输到备份中心节点进行备份存储;当灾 难发生导致容灾系统出现故障时,从备份中心节点恢复生产中心节点之前传输到备份中心 节点的数据。可以看出,容灾的关注点在于数据本身,在生产中心节点和备份中心节点之间 需要保持数据的同步变化,在灾难发生之后要确保原有的数据不会丢失或者遭到破坏。
目前,业界常见的容灾系统包括两大类,第一类是基于存储层的容灾系统,第二类 是基于服务器层的容灾系统。第一类容灾系统在高端存储中占据主流地位,其主要是基于 磁盘阵列复制技术,通过存储系统内建的固件或操作系统,利用光纤通道等专用线路实现 物理存储设备之间的数据复制或镜像,可以支持数据的同步复制和异步复制。这类容灾系 统的缺点在于,不具备重复数据删除能力,生产中心节点和备份中心节点之间的数据传输 量极大,对网络带宽的要求很高;采用同步方式进行数据传输,对中心节点的业务处理性能 影响较大。 第二类容灾系统在中低端存储中占据主流地位,其通过安装在服务器上的数 据复制软件,或是应用程序提供的数据复制、灾难恢复工具,利用传输控制协议(TCP, Transmission Control Protocol)/网际协议(IP, Internet Protocol)网络实现数据复 制。生产中心节点和备份中心节点之间的传输距离不受限制,并且数据复制软件可以兼容 不同品牌的服务器和存储设备,投入成本较低。这类容灾系统的缺点在于,不具备重复数据 删除能力,生产中心节点和备份中心节点之间的数据传输量较大,对网络带宽的要求较高; 由于数据复制软件是安装在服务器上,因此对应用系统的性能影响较大,需要占用较多的 服务器资源,对中心节点的业务处理性能影响也较大。

发明内容
有鉴于此,本发明的主要目的在于提供一种数据级容灾方法、系统和生产中心节 点,以减少生产中心节点和备份中心节点之间传输的数据容量,降低网络带宽性能的需求,提高容灾系统的可靠性和可用性。 为达到上述目的,本发明的技术方案是这样实现的
本发明提供了一种数据级容灾方法,包括 对应用程序运行产生的数据执行快照处理,生成快照镜像数据; 对所述快照镜像数据执行本地重复数据删除,生成经过本地重复数据删除处理的
数据和相应的索引数据; 对所述经过本地重复数据删除处理的数据和索引数据执行全局重复数据删除,生 成经过全局重复数据删除处理的数据和相应的索引数据; 将所述经过全局重复数据删除处理的数据和索引数据发送给备份中心节点。 所述重复数据删除是采用基于扇区级别的重复数据删除策略,具体为 以扇区为单位,通过哈希Hash散列算法为每个数据单元产生一个特定的散列值;
将新写入的数据所对应的散列值与已有的散列值索引进行比较,如果所述散列值已经存在
于所述散列值索引中,则对所述数据进行删除;否则,对所述数据进行存储,并将所述数据
对应的散列值添加到所述散列值索引中。 所述对经过本地重复数据删除处理的数据和索引数据执行全局重复数据删除之 前,该方法还包括 检测是否存在其他生产中心节点,如果不存在,则将所述经过本地重复数据删除 处理的数据和索引数据直接发送给所述备份中心节点;如果存在,则对经过本地重复数据 删除处理的数据和索引数据执行全局重复数据删除。
所述检测是否存在其他生产中心节点,具体包括 向其他生产中心节点发出携带咨询其他生产中心节点信息的广播请求包,如果能 收到响应数据包,则判定存在其他生产中心节点;否则,判定不存在其他生产中心节点。
所述全局重复数据删除具体为 通过比较各个生产中心节点中经过本地重复数据删除处理的索引数据来分析是 否具备相同的冗余数据,如果存在相同的索引数据,则根据各个生产中心节点的优先级来 删除低优先级的冗余数据和相应的索引数据,只保留最高优先级的数据和索引数据。
本发明还提供了一种数据级容灾系统,包括通过外部网络相连的生产中心节点和 备份中心节点; 其中,所述生产中心节点,用于对应用程序运行产生的数据执行快照处理,生成快
照镜像数据,并对所述快照镜像数据依次执行本地重复数据删除和全局重复数据删除,将
经过全局重复数据删除处理的数据和索引数据发送给所述备份中心节点; 所述备份中心节点,用于对来自所述生产中心节点的数据和索引数据进行存储备份。 所述生产中心节点进一步包括 应用程序模块,用于执行应用程序,产生与业务相关的数据; 本地重复数据删除模块,用于执行本地重复数据删除,生成所述经过本地重复数 据删除处理后的数据和索引数据; 全局重复数据删除模块,用于执行全局重复数据删除,生成所述经过全局重复数 据删除处理后的数据和索引数据;
第一本地存储模块,用于对所述应用程序模块产生的数据、经过本地重复数据删 除处理后的数据和索引数据、经过全局重复数据删除处理后的数据和索引数据分别进行存 储; 数据发送模块,用于将所述第一本地存储模块中经过全局重复数据删除处理后的 数据和索引数据发送到所述备份中心节点; 第一管理模块,用于对所述应用程序模块产生的数据执行快照处理,将得到的快 照镜像数据存储到所述第一本地存储模块;用于管理所述第一本地存储模块中数据的正常 运行;还用于监控所属生产中心节点的磁阵状态,监控其他生产中心节点内的磁阵状态。
所述第一本地存储模块进一步包括 本地快照缓存子模块,用于存储执行快照处理所生成快照镜像数据; 本地第一缓存子模块,用于存储来自所述本地快照缓存子模块的经过本地重复数
据删除处理的数据和索引数据; 本地第二缓存子模块,用于存储来自所述本地第一缓存子模块的经过全局重复数
据删除处理的数据和索引数据。 所述备份中心节点进一步包括 数据接收模块,用于接收来自所述生产中心节点的数据;
第二本地存储模块,用于对所接收的数据进行存储; 第二管理模块,用于管理所述数据的正常运行,并监控管理所述备份中心节点内 的磁阵状态。 本发明还提供了一种生产中心节点,包括 应用程序模块,用于执行应用程序,产生与业务相关的数据; 本地重复数据删除模块,用于执行本地重复数据删除,生成经过本地重复数据删 除处理后的数据和索引数据; 全局重复数据删除模块,用于执行全局重复数据删除,生成经过全局重复数据删 除处理后的数据和索引数据; 第一本地存储模块,用于对所述应用程序模块产生的数据、经过本地重复数据删 除处理后的数据和索引数据、经过全局重复数据删除处理后的数据和索引数据分别进行存 储; 数据发送模块,用于将所述第一本地存储模块中经过全局重复数据删除处理后的 数据和索引数据发送到备份中心节点; 第一管理模块,用于对所述应用程序模块产生的数据执行快照处理,将得到的快 照镜像数据存储到所述第一本地存储模块;用于管理所述第一本地存储模块中数据的正常 运行;还用于监控所属生产中心节点的磁阵状态,监控其他生产中心节点内的磁阵状态。
所述第一本地存储模块进一步包括 本地快照缓存子模块,用于存储执行快照处理所生成快照镜像数据; 本地第一缓存子模块,用于存储来自所述本地快照缓存子模块的经过本地重复数
据删除处理的数据和索引数据; 本地第二缓存子模块,用于存储来自所述本地第一缓存子模块的经过全局重复数 据删除处理的数据和索引数据。
6
本发明所提供的数据级容灾方法、系统和生产中心节点,解决了目前容灾系统中 生产中心节点和备份中心节点之间需要高带宽网络资源的问题;通过执行本地重复数据 删除和全局重复数据删除技术,能够有效降低生产中心节点和备份中心节点之间传输的数 据容量;尤其是对于多个生产中心节点需要对同一备份中心节点进行数据备份的场景,能 够有效降低对带宽需求,大大加快数据级容灾的数据备份速度,显著提高数据级容灾的恢 复时间点目标(RPO, Recovery Point Objective)和恢复时间目标(RTO, Recovery Time Objective)指标,提高容灾系统的可靠性和可用性。 本发明采用基于扇区级别的重复数据删除技术,相比现有技术中基于文件级和块 级的重复数据删除技术,进一步细化了重复数据的检测粒度,能够更有效的降低整体的数 据容量。 本发明采用基于磁阵的异地传输方式,并采用快照功能对需要传输的数据进行备 份,再通过磁阵设备内嵌的本地和全局重复数据删除技术删除冗余数据,通过这种传输方 式能够大大降低对原有系统的性能影响。


图1为本发明一种数据级容灾系统的组成结构示意图;
图2为本发明一种数据级容灾系统方法的流程图;
图3为本发明实施例的三层数据结构处理机制的示意图。
具体实施例方式
下面结合附图和具体实施例对本发明的技术方案进一步详细阐述。
本发明提供了一种基于全局重复数据删除技术的数据级容灾系统,旨在解决现有 的容灾系统中生产中心节点和备份中心节点之间数据传输量大,带宽需求高的问题。
如图1所示,本发明所提供的数据级容灾系统包括通过外部网络连接的多个生 产中心节点和l个备份中心节点。其中,生产中心节点为负责运行业务应用程序的节点, 备份中心节点为负责保存备份数据的节点。外部网络可以是外部局域网(LAN,Local Area Network)或广域网(WAN, Wide Area Network)等等。外部网络又分为公网和私网,公网用 于提供用户访问服务的通道,私网用于提供各中心节点(包括生产中心节点和备份中心节 点)之间的数据复制和心跳信息传输。备份中心节点可以位于生产中心节点的近端,也可 以位于生产中心节点的远端。在容灾系统正常工作状态下,各生产中心节点将需要保护的 数据通过外部网络传输给备份中心节点进行复制备份;当灾难产生导致容灾系统故障时, 各生产中心节点需要从备份中心节点恢复之前传输到备份中心节点的数据。
图1中生产中心节点10、生产中心节点20和生产中心节点30的内部结构相同,下 面以生产中心节点10为例进行内部结构的说明。生产中心节点10包括一款磁阵设备,磁 阵设备的内部固件包括应用程序模块11、本地重复数据删除模块12、全局重复数据删除 模块13、第一本地存储模块14、数据发送模块15和第一管理模块16。 应用程序模块ll,用于运行业务的应用程序,并根据业务的运行生成与业务相关 的数据。 本地重复数据删除模块12,负责处理本地重复数据删除,生成经过本地重复数据
7删除处理后的数据和索引数据。 全局重复数据删除模块13,负责处理全局重复数据删除,生成经过全局重复数据 删除处理后的数据和索引数据。需要指出的是,本发明中的重复数据删除,包括本地重复数 据删除和全局重复数据删除,采用的是基于扇区级别的重复数据删除策略。关于扇区级别 的重复数据删除策略的具体实现,将在后续进行详细说明。 第一本地存储模块14,与应用程序模块11、本地重复数据删除模块12和全局重复 数据删除模块13分别相连,用于对应用程序模块11生成的数据、经过本地重复数据删除处 理后的数据和索引数据、经过全局重复数据删除处理后的数据和索引数据,分别进行存储。
其中,第一本地存储模块14包括本地快照缓存子模块141、本地第一缓存子模块 142和本地第二缓存子模块143。第一管理模块16定时对应用程序模块11产生的数据执行 快照处理,并将生成的快照镜像数据存放在本地快照缓存子模块141中。本地重复数据删 除模块12对本地快照缓存子模块141中存储的快照镜像数据执行本地重复数据删除操作, 生成经过本地重复数据删除处理后的数据和索引数据;本地第一缓存子模块142为经过本 地重复数据删除处理后的数据和索引数据提供存储空间。全局重复数据删除模块13对本 地第一缓存子模块142中的数据和索引数据执行全局重复数据删除操作,生成经过全局重 复数据删除处理后的数据和索引数据,本地第二缓存子模块143为经过全局重复数据删除 处理后的数据和索引数据提供存储空间。关于本地重复数据删除和全局重复数据删除的具 体操作,将在后续进行详细说明。 数据发送模块15,与第一本地存储模块14相连,用于将本地第二缓存子模块143 中存储的经过全局重复数据删除处理后的数据和索引数据发送到备份中心节点40。
第一管理模块16,负责定时对应用程序模块11产生的数据执行快照处理;负责检 测第一本地存储模块14中的各个缓存子模块的缓存空间是否为满;负责监控本生产中心 节点内的磁阵状态,以及监控其他生产中心节点的磁阵状态,决定是否执行全局重复数据 删除操作;在每个生产中心节点的第一管理模块内都会设置一个优先级,从而在执行全局 重复数据删除时,当不同生产中心节点之间存在相同的数据时,经过比较彼此生产中心节 点的优先级后,删除低优先级的冗余数据和索引数据,只保留最高优先级的数据和索引数 据,以保证数据的唯一性。所谓磁阵状态,即数据的运行状态。 备份中心节点40的内部结构比生产中心节点10简单,包括数据接收模块41、第
二本地存储模块42和第二管理模块43。 数据接收模块41,用于接收各个生产中心节点发送过来的经过全局重复数据删除 处理后的数据和索引数据。 第二本地存储模块42,连接数据接收模块41 ,用于对数据接收模块41所接收的数 据和索引数据进行存储。 第二管理模块43,连接第二本地存储模块42,用于管理数据的正常运行,并监控 管理本中心节点内的磁阵状态。 从上述对于本发明数据级容灾系统的描述中可知,本地重复数据删除模块对自身 所属生产中心节点中的数据执行重复数据删除操作,可以删除不必要的冗余数据,降低数 据的冗余量;全局重复数据删除模块对所有生产中心节点中的数据执行全局的重复数据删 除操作,保证数据在所有生产中心节点中存在的唯一性,可以进一步降低数据的冗余量,最终达到减少生产中心节点和备份中心节点之间传输的数据容量的目的。 由于数据删除等重要操作是在生产中心节点侧执行的,因此,生产中心节点在容 灾系统起着至关重要的作用。下面对生产中心节点在数据级容灾中所执行的具体操作进一 步详细阐述,如图2所示,主要包括以下步骤
步骤201 ,应用程序运行,产生与业务相关的数据。 步骤202,针对应用程序生成的数据,定时执行快照处理,生成快照镜像数据。
步骤203,检测本地快照缓存空间是否已满,如果是,则等待一定的时间,继续检 测;否则,执行步骤204。 所述的本地快照缓存空间,即对应第一本地存储模块14中的本地快照缓存子模
块141的存储空间。需要指出的是,本地快照缓存空间可以同时容纳多份快照影像数据,当
本地快照缓存空间中有数据而又没满时,可以继续向本地快照缓存空间中写数据。但需要
注意的是,在后续对快照影像数据执行本地重复数据删除操作前,需要检测当前有无本地
重复数据删除操作,如果有,则等待前一重复数据删除操作执行完之后,再执行本次重复数
据删除操作;如果没有,则可以直接执行本次重复数据删除操作。如此可以确保同一时刻最
多只运行单个本地重复数据删除操作,因为重复数据删除操作对系统内存需求很多,同时
运行多个重复数据删除操作会对整体系统的性能造成较大的影响。 步骤204,将生成的快照镜像数据存储到本地快照缓存空间中。 需要指出的是,本发明对快照镜像数据执行本地重复数据删除操作,而不是直接
对应用程序运行产生的原始数据进行操作,可以减小对原有系统的性能产生影响。 步骤205,从本地快照缓存空间中读取快照镜像数据,并对快照镜像数据执行本地
重复数据删除操作,生成经过本地重复数据删除处理后的数据和索引数据。 重复数据删除,是一种可以减小数据存储需求的手段。重复数据删除的处理过程
是通过删除冗余数据,确保实际上只有唯一的数据段被存储。而被删除的重复数据将由一
个指向原数据的指针所代替。这个指针是位于删除前数据的位置,以替换删除之前的数据,
通过重定向方式指向对应的唯一数据。例如原始数据为512K字节的大小,经过重复数据
删除后,用l个字节的指针在原始数据的位置代替原始数据,从而降低了数据的冗余量。另
外,在索引数据中也进行相应的记录,使得系统在恢复时能够根据该指针找到对应的数据,
最终恢复出原始的完整数据。 本发明采用的本地重复数据删除策略是基于扇区级别,即以每个扇区为单位,通 过哈希(Hash)散列算法,如信息-摘要算法(MD5,Message-digest Algorithm5)或安全散 列算法(SHA-1, Secure Hash Algorithm-1),为每个数据单元产生一个特定的散列值。将 新写入的数据所对应的散列值与已有的散列值索引进行比较,如果该散列值已经存在于散 列值索引中,则判定新写入的数据为重复的,不需要对该数据进行存储;否则,判定新写入 的数据为新数据,并将该数据对应的散列值添加到散列值索引中,该数据也被存储在本地 快照缓存空间中。 基于扇区级别的重复数据删除策略,相比现有技术中基于文件级和块级的重复数 据删除策略,其颗粒度更小,能够更有效的删除冗余数据,更有效降低需要传输的数据容 步骤206,检测本地第一缓存空间是否已满,如果是,则等待一定的时间,继续检测;否则,执行步骤207。 所述本地第一缓存空间,对应第一本地存储模块14中的本地第一缓存子模块141 的存储空间。需要指出的是,本地第一缓存空间可以同时容纳多份经过本地重复数据删除 处理后的数据和索引数据,当本地第一缓存空间中有数据而又没满,可以继续向本地第一 缓存空间中写数据。但需要注意的是,在后续对本地第一缓存空间中的数据执行全局重复 数据删除操作前,需要检测当前有无本地重复数据删除操作和全局重复数据删除操作,以 确保同一时刻最多只运行单个重复数据删除操作。 步骤207,将经过本地重复数据删除处理的数据和索引数据存储在本地第一缓存 空间中。 在将经过本地重复数据删除处理的数据和索引数据存储到本地第一缓存空间中 之后,相应的,删除本地快照缓存空间中的本次经过本地重复数据删除处理的数据和索引 数据。 步骤208,检测是否存在其他生产中心节点,如果不存在,则执行步骤209 ;如果存 在,则执行步骤210。 生产中心节点定时发出携带咨询其他生产中心节点信息的广播请求包,其他生
产中心节点接收到该广播请求包后,将自身的节点信息、优先级信息和是否完成本地重复
数据删除的标志位信息封装在响应数据包中,反馈给发出请求的生产中心节点。接收到响
应数据包的生产中心节点,将响应数据包中的节点信息、优先级信息和本地重复数据删除
的标志位信息提取出来,在本节点建立一个节点信息表,包括节点信息、优先级信息和本
地重复数据删除标志位信息。需要指出的是,当某个时间点,某个生产中心节点处于离线
(downtime)状态时,是无法响应其他生产中心节点发出的请求包的;此时,在其他生产中
心节点的节点信息表中,会将该downtime状态的生产中心节点的相关信息删除。 每个生产中心节点都通过这种方式检测其他生产中心节点的信息,当生产中心节
点在完成自身的本地重复数据删除后,会将对其他生产中心节点的响应包中的本地重复数
据删除标志位信息标识为已完成本地重复数据删除。从而,只有在生产中心节点的节点信
息表内所有节点都标记完成本地重复数据删除操作后,才能统一触发进行全局重复数据删
除操作;并在全局重复数据删除操作完毕之后,将节点信息表内记录的所有节点的本地重
复数据删除标志位清除,为下次重复数据删除做准备。 步骤209,将本地第一缓存空间中的经过本地重复数据删除处理的数据和索引数 据传输到备份中心节点,并结束整个流程。 容灾系统中的某个生产中心节点,在两种情况下会检测到不存在其他生产中心节 点,一种情况是容灾系统中只存在其单个生产中心节点;另一种情况是容灾系统中的其他 生产中心节点都处于downtime状态。在这两种情况下,也就没有必要再执行全局重复数 据删除操作,从而将经过本地重复数据删除处理的数据和索引数据直接传输到备份中心节 点,并结束整个流程。经过本地重复数据删除操作的数据和索引数据传输到备份中心节点 后,本地第一缓存空间中的相应数据和索引数据被删除。 步骤210,读取本地第一缓存空间中的数据和索引数据,执行全局重复数据删除操 作,生成经过全局重复数据删除处理后的数据和索引数据。 全局重复数据删除,是通过比较各个生产中心节点的第一缓存空间中的索引数据
10来分析是否具备相同的冗余数据,如果存在相同的索引数据,则根据各个生产中心节点的 优先级来删除低优先级的冗余数据和相应的索引数据,只保留最高优先级的数据和索引数 据,以保证数据的唯一性。本发明中的全局重复数据删除也是采用基于扇区级别的重复数 据删除策略,在此不再赘述。 步骤211 ,检测本地第二缓存空间是否已满,如果是,则等待一定的时间,继续检 测;否则,执行步骤212。 步骤212,将经过全局重复数据删除操作的数据和索引数据存储在本地第二缓存 空间中。 步骤213,将本地第二缓存空间中存储的经过全局重复数据删除操作的数据和索 引数据传输到备份中心节点,并结束整个流程。 经过全局重复数据删除操作的数据和索引数据传输到备份中心节点后,本地第二 缓存空间中的相应数据和索引数据被删除。备份中心节点对各个生产中心节点发送过来的 数据和索引数据进行存储,当灾难产生时,通过备份中心节点中存储的数据和索引数据,可 以将各个生产中心节点内的数据恢复到灾难产生前的状态。当然,备份中心节点内存储的 数据也可以进一步备份归档到磁带库或光盘等存储介质中。 以上仅以生产中心节点10为例,对数据级容灾的方法进行了描述,实际上,本领 域普通技术人员应该知道,在整个多节点的数据级容灾系统中,生产中心节点10、生产中心 节点20、生产中心节点30是同时进行类似容灾操作的,这样可以保证执行全局重复数据删 除操作。对于备份中心节点20、30的具体操作过程,与生产中心节点10的处理类似,此处 不再赘述。 此外,从前述的描述可以发现,本发明中生产中心节点的第一本地存储模块都是 采用一种三层数据存储结构,即包括本地快照缓存子模块,用于存储快照处理得到的快照 镜像数据;本地第一缓存子模块,用于存储经过本地重复数据删除处理的数据和索引数据; 本地第二缓存子模块,用于存储经过全局重复数据删除处理的数据和索引数据。在不同的 时刻,每层数据存储结构中的数据都是在发生变化的,但是这三层数据存储结构中所存储 的数据需要保证不重复;即本地快照缓存子模块中的数据传递到本地第一缓存子模块后, 本地快照缓存子模块中相应的原始数据需要立即删除,同样,本地第一缓存子模块中的数 据和数据索引传递到本地第二缓存子模块后,本地第一缓存子模块中相应的原始数据和数 据索引也需要立即删除。 下面举例进行说明,如图3所示,时刻1、时刻2和时刻3是数据级容灾系统中不同 的时间点,时刻1之后是时刻2,时刻2之后是时刻3。 以图3中的数据cl为例,在时刻1 ,对存储在本地快照缓存子模块中的快照镜像数 据cl执行本地重复数据删除操作;在时刻2,经过本地重复数据删除处理的cl被存储到本 地第一缓存子模块中,并执行全局重复数据删除操作,此时本地快照缓存子模块中已经不 再有cl ;在时刻3,经过全局重复数据删除处理的cl被存储到本地第二缓存子模块中,并发 送给备份中心节点,此时本地第一缓存子模块中已经不再有cl。当然,cl发送给备份中心 节点后,本地第二缓存子模块中的cl也将被删除。 下面再以时刻2为例,在时刻2之前,即时刻l,执行快照处理生成的快照镜像数 据dl存储到本地快照缓存子模块中;在时刻2,本地快照缓存子模块中的数据为dl,对dl执行本地重复数据删除操作。在时刻2之前,即时刻l,对本地快照缓存子模块中的数据cl 执行本地重复数据删除操作,生成经过本地重复数据删除处理的数据cl存储到本地第一 缓存子模块中;在时刻2,本地第一缓存子模块中的数据为cl,对cl执行全局重复数据删除 操作。在时刻2之前,即时刻l,对本地第一缓存子模块中的数据bl执行全局重复数据删除 操作,生成经过全局重复数据删除处理的数据bl存储到本地第二缓存子模块中;在时刻2, 本地第二缓存子模块中的数据为bl,对数据bl执行发送操作,发送到备份中心节点。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
权利要求
一种数据级容灾方法,其特征在于,包括对应用程序运行产生的数据执行快照处理,生成快照镜像数据;对所述快照镜像数据执行本地重复数据删除,生成经过本地重复数据删除处理的数据和相应的索引数据;对所述经过本地重复数据删除处理的数据和索引数据执行全局重复数据删除,生成经过全局重复数据删除处理的数据和相应的索引数据;将所述经过全局重复数据删除处理的数据和索引数据发送给备份中心节点。
2. 根据权利要求1所述数据级容灾方法,其特征在于,所述重复数据删除是采用基于 扇区级别的重复数据删除策略,具体为以扇区为单位,通过哈希Hash散列算法为每个数据单元产生一个特定的散列值;将新 写入的数据所对应的散列值与已有的散列值索引进行比较,如果所述散列值已经存在于所 述散列值索引中,则对所述数据进行删除;否则,对所述数据进行存储,并将所述数据对应 的散列值添加到所述散列值索引中。
3. 根据权利要求1或2所述数据级容灾方法,其特征在于,所述对经过本地重复数据删 除处理的数据和索引数据执行全局重复数据删除之前,该方法还包括检测是否存在其他生产中心节点,如果不存在,则将所述经过本地重复数据删除处理 的数据和索引数据直接发送给所述备份中心节点;如果存在,则对经过本地重复数据删除 处理的数据和索引数据执行全局重复数据删除。
4. 根据权利要求3所述数据级容灾方法,其特征在于,所述检测是否存在其他生产中 心节点,具体包括向其他生产中心节点发出携带咨询其他生产中心节点信息的广播请求包,如果能收到 响应数据包,则判定存在其他生产中心节点;否则,判定不存在其他生产中心节点。
5. 根据权利要求1所述数据级容灾方法,其特征在于,所述全局重复数据删除具体为 通过比较各个生产中心节点中经过本地重复数据删除处理的索引数据来分析是否具备相同的冗余数据,如果存在相同的索引数据,则根据各个生产中心节点的优先级来删除 低优先级的冗余数据和相应的索引数据,只保留最高优先级的数据和索引数据。
6. —种数据级容灾系统,其特征在于,包括通过外部网络相连的生产中心节点和备份 中心节点;其中,所述生产中心节点,用于对应用程序运行产生的数据执行快照处理,生成快照镜 像数据,并对所述快照镜像数据依次执行本地重复数据删除和全局重复数据删除,将经过 全局重复数据删除处理的数据和索引数据发送给所述备份中心节点;所述备份中心节点,用于对来自所述生产中心节点的数据和索引数据进行存储备份。
7. 根据权利要求6所述数据级容灾系统,其特征在于,所述生产中心节点进一步包括 应用程序模块,用于执行应用程序,产生与业务相关的数据;本地重复数据删除模块,用于执行本地重复数据删除,生成所述经过本地重复数据删 除处理后的数据和索引数据;全局重复数据删除模块,用于执行全局重复数据删除,生成所述经过全局重复数据删 除处理后的数据和索引数据;第一本地存储模块,用于对所述应用程序模块产生的数据、经过本地重复数据删除处理后的数据和索引数据、经过全局重复数据删除处理后的数据和索引数据分别进行存储;数据发送模块,用于将所述第一本地存储模块中经过全局重复数据删除处理后的数据和索引数据发送到所述备份中心节点;第一管理模块,用于对所述应用程序模块产生的数据执行快照处理,将得到的快照镜像数据存储到所述第一本地存储模块;用于管理所述第一本地存储模块中数据的正常运 行;还用于监控所属生产中心节点的磁阵状态,监控其他生产中心节点内的磁阵状态。
8. 根据权利要求7所述数据级容灾系统,其特征在于,所述第一本地存储模块进一步 包括本地快照缓存子模块,用于存储执行快照处理所生成快照镜像数据; 本地第一缓存子模块,用于存储来自所述本地快照缓存子模块的经过本地重复数据删除处理的数据和索引数据;本地第二缓存子模块,用于存储来自所述本地第一缓存子模块的经过全局重复数据删除处理的数据和索引数据。
9. 根据权利要求6、或7、或8所述数据级容灾系统,其特征在于,所述备份中心节点进 一步包括数据接收模块,用于接收来自所述生产中心节点的数据; 第二本地存储模块,用于对所接收的数据进行存储;第二管理模块,用于管理所述数据的正常运行,并监控管理所述备份中心节点内的磁 阵状态。
10. —种生产中心节点,其特征在于,包括 应用程序模块,用于执行应用程序,产生与业务相关的数据;本地重复数据删除模块,用于执行本地重复数据删除,生成经过本地重复数据删除处 理后的数据和索引数据;全局重复数据删除模块,用于执行全局重复数据删除,生成经过全局重复数据删除处 理后的数据和索引数据;第一本地存储模块,用于对所述应用程序模块产生的数据、经过本地重复数据删除处 理后的数据和索引数据、经过全局重复数据删除处理后的数据和索引数据分别进行存储;数据发送模块,用于将所述第一本地存储模块中经过全局重复数据删除处理后的数据和索引数据发送到备份中心节点;第一管理模块,用于对所述应用程序模块产生的数据执行快照处理,将得到的快照镜像数据存储到所述第一本地存储模块;用于管理所述第一本地存储模块中数据的正常运 行;还用于监控所属生产中心节点的磁阵状态,监控其他生产中心节点内的磁阵状态。
11. 根据权利要求io所述生产中心节点,其特征在于,所述第一本地存储模块进一步包括本地快照缓存子模块,用于存储执行快照处理所生成快照镜像数据; 本地第一缓存子模块,用于存储来自所述本地快照缓存子模块的经过本地重复数据删除处理的数据和索引数据;本地第二缓存子模块,用于存储来自所述本地第一缓存子模块的经过全局重复数据删除处理的数据和索引数据。
全文摘要
本发明公开了一种数据级容灾方法,包括对应用程序运行产生的数据执行快照处理,生成快照镜像数据;对快照镜像数据执行本地重复数据删除,生成经过本地重复数据删除处理的数据和相应的索引数据;对经过本地重复数据删除处理的数据和索引数据执行全局重复数据删除,生成经过全局重复数据删除处理的数据和相应的索引数据;将经过全局重复数据删除处理的数据和索引数据发送给备份中心节点。本发明还公开了一种数据级容灾系统和生产中心节点,能够减少生产中心节点和备份中心节点之间传输的数据容量,降低网络带宽性能的需求,以便更加快速有效的实现数据级容灾,提高容灾系统的可靠性和可用性。
文档编号H04B1/74GK101741536SQ20081022733
公开日2010年6月16日 申请日期2008年11月26日 优先权日2008年11月26日
发明者刘步荣 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1