一种备份数据实时恢复方法及系统与流程

文档序号:25543664发布日期:2021-06-18 20:40阅读:195来源:国知局
一种备份数据实时恢复方法及系统与流程

本发明涉及数据备份技术领域,具体而言,涉及一种备份数据实时恢复方法及系统。



背景技术:

随着计算机应用的普及,数据已经成为数据拥有者的重要财富,一旦发生数据丢失,将造成计算机使用者的巨大损失。如软件平台故障、操作系统的设计漏洞和系统的硬件故障等问题都会给系统的数据带来不可估量的损失,影响企业服务器的正常运作,进而给科研、生产造成较严重的损失。因此,在服务器管理软件维护过程中,系统管理员必须要在某个节点对当前系统中的配置信息和数据库信息等数据进行备份,以防止后续误操作带来不可估量的损失。

目前常见的数据备份实时恢复技术有cdp(连续数据保护),在目前数据备份领域的基于cdp来实现备份恢复的产品都是基于这个实现或者这个设计思想而实现的块级实时数据保护恢复方法。而这种cdp的连续数据保护,是通过恢复构造数据表、拷贝恢复的方式进行恢复,并不能实现实时恢复。



技术实现要素:

本发明的目的在于提供一种备份数据实时恢复方法及系统,用以改善现有技术中通过恢复构造数据表、拷贝恢复的方式进行恢复,并不能实现实时恢复的问题。

第一方面,本申请实施例提供一种备份数据实时恢复方法,其包括以下步骤:

实时获取待备份数据和当前时间戳;

将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;

根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;

根据当前时间戳的块位图和变化数据块集生成数据修改表;

根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;

根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。

上述实现过程中,通过实时获取待备份数据和当前时间戳,进而将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;再根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;变化数据块最新一次时间戳修改的块位图决定在数据恢复时,是需要提取变化数据块,还是直接从全量数据读取,当块位图中没有标记时,就可以直接读取全量数据,从而加快了数据恢复的速率;然后根据当前时间戳的块位图和变化数据块集生成数据修改表;数据修改表是一个基于数组、开链的方式实现的,用于对相同时间戳内修改的数据块进行存储的数据区域,并且按照块位号求模存放在相应位置,这样在数据恢复是可以快速检索到对应的数据,实现o(1)复杂度的恢复,降低了时空复杂度,从而提高了数据恢复速度;然后根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;时间地址表包括有时间戳地址表和时间堆数据结构表,最新一次修改的hash时间戳地址表是一个数组地址表,决定了这个数据块应该从哪个hash数组读取、数据变化块的hash数据修改表,数组求模存放变化数据块,并list链接、相同求模的块号排序,当需要数据恢复时,根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。时间堆数据结构表是基于毫秒的时间堆数据结构表,可以通过块位图、数据修改表、时间地址表实现实时的块数据变化追踪和记录,并且在数据恢复的过程动态检索。通过挂载初始的全量备份数据、连续变化的数据卷,实现在线的毫秒级的实时数据恢复。

基于第一方面,在本发明的一些实施例中,根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表的步骤包括以下步骤:

根据数据修改表和当前时间戳对预置的时间戳地址表进行更新,生成新的时间戳地址表;

根据新的时间戳地址表和当前时间戳对预置的时间堆数据表进行更新,生成新的时间堆数据结构表。

基于第一方面,在本发明的一些实施例中,根据当前时间戳的块位图和变化数据块集生成数据修改表的步骤包括以下步骤:

获取当前时间戳的块位图中标记的块位号;

根据标记的块位号将变化数据块进行排列,生成数据修改表。

基于第一方面,在本发明的一些实施例中,根据标记的块位号将变化数据块进行排列,生成数据修改表的步骤包括以下步骤:

对标记的块位号进行求模运算,生成多个位置号;

将变化数据块按照各个位置号进行排列,生成数据修改表。

基于第一方面,在本发明的一些实施例中,将变化数据块按照各个位置号进行排列,生成数据修改表的步骤包括以下步骤:

对变化数据块集进行筛选,得到位置号相同的变化数据块;

将位置号相同的变化数据块进行链表存储,生成数据修改表;

根据位置号相同的变化数据块对块位图进行标记,生新的块位图。

基于第一方面,在本发明的一些实施例中,根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图的步骤还包括以下步骤:

查询是否已存在旧的块位图,若有,则复制旧的块位图中最新的块位图并作为预置的块位图;若无,则获取新的块位图作为预置的块位图;

根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图。

基于第一方面,在本发明的一些实施例中,根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据的步骤包括以下步骤:

a1:获取恢复时间戳;

a2:提取并判断恢复时间戳的块位图是否有标记的块位,若不存在,则直接从预置的全量数据卷读取数据,得到实时恢复数据;若存在,则执行步骤a3;

a3:根据恢复时间戳在时间堆数据结构表中进行查询,得到对应恢复时间戳的时间戳地址表;

a4:根据恢复时间戳在对应恢复时间戳的时间戳地址表进行查询,得到对应的数据修改表;

a5:提取并根据对应的数据修改表中的变化数据块集对块位图进行修改,得到新的块位图;

a6:根据变化数据块集对预置的全量数据卷进行更新,生成实时恢复数据。

第二方面,本申请实施例提供一种备份数据实时恢复系统,包括:

数据获取模块,用于实时获取待备份数据和当前时间戳;

对比模块,用于将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;

标记模块,用于根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;

存储模块,用于根据当前时间戳的块位图和变化数据块集生成数据修改表;

更新模块,用于根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;

数据恢复模块,用于根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。

上述实现过程中,通过数据获取模块实时获取待备份数据和当前时间戳,进而对比模块将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;标记模块再根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;变化数据块最新一次时间戳修改的块位图决定在数据恢复时,是需要提取变化数据块,还是直接从全量数据读取,当块位图中没有标记时,就可以直接读取全量数据,从而加快了数据恢复的速率;然后存储模块根据当前时间戳的块位图和变化数据块集生成数据修改表;数据修改表是一个基于数组、开链的方式实现的,用于对相同时间戳内修改的数据块进行存储的数据区域,并且按照块位号求模存放在相应位置,这样在数据恢复是可以快速检索到对应的数据,实现o(1)复杂度的恢复,降低了时空复杂度,从而提高了数据恢复速度;然后更新模块根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;时间地址表包括有时间戳地址表和时间堆数据结构表,最新一次修改的hash时间戳地址表是一个数组地址表,决定了这个数据块应该从哪个hash数组读取、数据变化块的hash数据修改表,数组求模存放变化数据块,并list链接、相同求模的块号排序,当需要数据恢复时,数据恢复模块根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。时间堆数据结构表是基于毫秒的时间堆数据结构表,可以通过块位图、数据修改表、时间地址表实现实时的块数据变化追踪和记录,并且在数据恢复的过程动态检索。通过挂载初始的全量备份数据、连续变化的数据卷,实现在线的毫秒级的实时数据恢复。

第三方面,本申请实施例提供一种电子设备,其包括存储器,用于存储一个或多个程序;处理器。当一个或多个程序被处理器执行时,实现如上述第一方面中任一项的方法。

第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述第一方面中任一项的方法。

本发明实施例至少具有如下优点或有益效果:

本发明实施例提供一种备份数据实时恢复方法及系统,通过实时获取待备份数据和当前时间戳,进而将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;再根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;变化数据块最新一次时间戳修改的块位图决定在数据恢复时,是需要提取变化数据块,还是直接从全量数据读取,当块位图中没有标记时,就可以直接读取全量数据,从而加快了数据恢复的速率;然后根据当前时间戳的块位图和变化数据块集生成数据修改表;数据修改表是一个基于数组、开链的方式实现的,用于对相同时间戳内修改的数据块进行存储的数据区域,并且按照块位号求模存放在相应位置,这样在数据恢复是可以快速检索到对应的数据,实现o(1)复杂度的恢复,降低了时空复杂度,从而提高了数据恢复速度;然后根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;时间地址表包括有时间戳地址表和时间堆数据结构表,最新一次修改的hash时间戳地址表是一个数组地址表,决定了这个数据块应该从哪个hash数组读取、数据变化块的hash数据修改表,数组求模存放变化数据块,并list链接、相同求模的块号排序,当需要数据恢复时,根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。时间堆数据结构表是基于毫秒的时间堆数据结构表,可以通过块位图、数据修改表、时间地址表实现实时的块数据变化追踪和记录,并且在数据恢复的过程动态检索。通过挂载初始的全量备份数据、连续变化的数据卷,实现在线的毫秒级的实时数据恢复。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本发明实施例提供的一种备份数据实时恢复方法流程图;

图2为本发明实施例提供的一种备份数据实时恢复系统结构框图;

图3为本发明实施例提供的一种电子设备的结构框图。

图标:110-数据获取模块;120-对比模块;130-标记模块;140-存储模块;150-更新模块;160-数据恢复模块;101-存储器;102-处理器;103-通信接口。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。

因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

实施例

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的各个实施例及实施例中的各个特征可以相互组合。

请参看图1,图1为本发明实施例提供的一种备份数据实时恢复方法流程图。该备份数据实时恢复方法,包括以下步骤:

步骤s110:实时获取待备份数据和当前时间戳;在全量数据备份过程中,会存在新的数据写入和数据修改,可以实时获取待备份数据,当前时间戳是对数据产生的时间进行认证,从而验证这段数据在产生后是否经过篡改。

步骤s120:将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;预置的全量数据是采用驱动模块的写时复制快照能力,实现初次的全量数据备份,备份的全量数据放置在挂载的备份卷设备上。在这个过程中会存在新的数据写入,驱动模块在启动备份过程。将实时获取的待备份数据与预置的全量数据进行对比,可以得出哪些数据块进行了修改或是新的写入,同一个时间可以是多个数据块进行了修改或是新的写入,这些修改或是新的写入的数据块构成了变化数据块集。

步骤s130:根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;块位图记录了每一个时间戳内修改的数据块的位置并在位块图中进行标记,从而生成当前时间戳的块位图,同时位图具有递进关系,即最新一次的位图是拷贝上一次位图的基础上进行更新,当过期的时间戳位图销毁时,还需要位图进行消冗余操作。块位图中包括有各个数据块的块位号。

其中,根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图的步骤还包括以下步骤:

查询是否已存在旧的块位图,若有,则复制旧的块位图中最新的块位图并作为预置的块位图;若无,则获取新的块位图作为预置的块位图;如果是首次块位图则无需拷贝上一次块位图进行更新,否则拷贝上次块位图,在其基础上更新块位图。

根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图。变化数据块集中有多个变化数据块,将变化数据块标记在预置的块位图上,从而得到新的块位图作为当前时间戳的块位图。

步骤s140:根据当前时间戳的块位图和变化数据块集生成数据修改表;上述生成数据修改表包括以下步骤:

首先,获取当前时间戳的块位图中标记的块位号;

然后,根据标记的块位号将变化数据块进行排列,生成数据修改表。数据修改表是hash块数据修改表,是一个基于数组、开链的方式实现的,用于对相同时间戳内修改的块数据进行存储的数据区域,并且按照块号求模,进而按照求模的值存放在相应的位置,上述进行排列的步骤包括以下步骤:

第一步,对标记的块位号进行求模运算,生成多个位置号;首先获取变化数据块的块位号,获取预估数据容量值,将变化数据块的块位号与预估数据容量值进行求模运算,可以得到一个值,这个值作为该变化数据块的位置号。

第二步,将变化数据块按照各个位置号进行排列,生成数据修改表。多个变化数据块具有多个位置号,变化数据块根据位置号对应存储,从而得到数据修改表。例如,变化数据块有变化数据块a和变化数据块b,变化数据块a和变化数据块b的位置号分别为98和99,那么变化数据块a放置在位置号为98的单元格中,变化数据块b放置在位置号为99的单元格中,从而得到数据修改表。当位置号冲突时,即求出的位置号相同时,可以包括以下步骤:

首先,对变化数据块集进行筛选,得到位置号相同的变化数据块;将变化数据块集中的各个变化数据块的位置号进行对比,得到位置号相同的变化数据块。

然后,将位置号相同的变化数据块进行链表存储,生成数据修改表;将相同位置号的变化数据块进行链表存储,得到数据修改表。链表存储属于现有技术,在此不在赘述。

最后,根据位置号相同的变化数据块对块位图进行标记,生新的块位图。在块位图中将位置号相同的变化数据块进行标记,从而得到新的快位图。

步骤s150:根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;时间地址表用于存放数据修改表及时间堆数据结构,包括有时间戳地址表和时间堆数据结构表。上述更新包括以下步骤:

首先,根据数据修改表和当前时间戳对预置的时间戳地址表进行更新,生成新的时间戳地址表;时间戳地址表是hash基于时间戳的地址表,是将系统中会存在非常多的hash块数据修改表进行一次存储映射,当指定具体时间恢复的时候,可以检索到具体的块数据表地址,从而可以从数据表地址的hash表检索到对应的块数据,两次检索都是基于时间复杂度o(1)级别的。

然后,根据新的时间戳地址表和当前时间戳对预置的时间堆数据表进行更新,生成新的时间堆数据结构表。时间堆数据结构表是基于毫秒的时间堆数据结构表,通过这个时间堆数据结构表可以在对数级别内找到一组时间戳索引时间戳地址表。

步骤s160:根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。数据恢复过程就是挂载克隆的首次全量备份的数据卷、数据变化追踪的数据卷。对当前挂载的首次全量数据卷进行读写操作的过程包括以下步骤:

a1:获取恢复时间戳;恢复时间戳就是需要恢复哪个时间点的数据。由用户输入需要恢复的时间点,从而获取到恢复时间戳。

a2:提取并判断恢复时间戳的块位图是否有标记的块位,若不存在,则直接从预置的全量数据卷读取数据,得到实时恢复数据;根据获得的恢复时间戳在快位图中进行检索,从而检索出恢复时间戳的块位图;对检索出的恢复时间戳的块位图进行进一步检索,判断是否有数据块被标记过,如果数据块都未标记过,直接从全量数据卷读取数据块。若存在,则执行步骤a3。

a3:根据恢复时间戳在时间堆数据结构表中进行查询,得到对应恢复时间戳的时间戳地址表;时间堆数据结构表可以在对数级别内找到一组时间戳索引时间戳地址表。

a4:根据恢复时间戳在对应恢复时间戳的时间戳地址表进行查询,得到对应的数据修改表;每一个时间戳对应存放了对应时间戳的数据修改表,通过在时间戳地址表中查询恢复时间戳,可以得到对应恢复时间戳的数据修改表。

a5:提取并根据对应的数据修改表中的变化数据块集对块位图进行修改,得到新的块位图。按照位图标记修改的块和系统备份依赖时间戳的新旧关系,读取最新一次数据变化的hash块数据修改表中通过块号求模定位数据块,并返回给上层读取接口。

a6:根据变化数据块集对预置的全量数据卷进行更新,生成实时恢复数据。根据变化数据块集中的变化数据块更新当前预置的全量数据卷中的数据块,同时修改块位图,如此反复,直到位图的块均标记完成,则所有当前时间戳内的数据都已经动态恢复完毕,则后续数据块请求直接提交给备份卷。

上述实现过程中,通过实时获取待备份数据和当前时间戳,进而将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;再根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;变化数据块最新一次时间戳修改的块位图决定在数据恢复时,是需要提取变化数据块,还是直接从全量数据读取,当块位图中没有标记时,就可以直接读取全量数据,从而加快了数据恢复的速率;然后根据当前时间戳的块位图和变化数据块集生成数据修改表;数据修改表是一个基于数组、开链的方式实现的,用于对相同时间戳内修改的数据块进行存储的数据区域,并且按照块位号求模存放在相应位置,这样在数据恢复是可以快速检索到对应的数据,实现o(1)复杂度的恢复,降低了时空复杂度,从而提高了数据恢复速度;然后根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;时间地址表包括有时间戳地址表和时间堆数据结构表,最新一次修改的hash时间戳地址表是一个数组地址表,决定了这个数据块应该从哪个hash数组读取、数据变化块的hash数据修改表,数组求模存放变化数据块,并list链接、相同求模的块号排序,当需要数据恢复时,根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。时间堆数据结构表是基于毫秒的时间堆数据结构表,可以通过块位图、数据修改表、时间地址表实现实时的块数据变化追踪和记录,并且在数据恢复的过程动态检索。通过挂载初始的全量备份数据、连续变化的数据卷,实现在线的毫秒级的实时数据恢复。

基于同样的发明构思,本发明还提出一种备份数据实时恢复系统,请查看图2,图2为本发明实施例提供的一种备份数据实时恢复系统结构框图。该备份数据实时恢复系统包括:

数据获取模块110,用于实时获取待备份数据和当前时间戳;

对比模块120,用于将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;

标记模块130,用于根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;

存储模块140,用于根据当前时间戳的块位图和变化数据块集生成数据修改表;

更新模块150,用于根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;

数据恢复模块160,用于根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。

上述实现过程中,通过数据获取模块110实时获取待备份数据和当前时间戳,进而对比模块120将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;标记模块130再根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;变化数据块最新一次时间戳修改的块位图决定在数据恢复时,是需要提取变化数据块,还是直接从全量数据读取,当块位图中没有标记时,就可以直接读取全量数据,从而加快了数据恢复的速率;然后存储模块140根据当前时间戳的块位图和变化数据块集生成数据修改表;数据修改表是一个基于数组、开链的方式实现的,用于对相同时间戳内修改的数据块进行存储的数据区域,并且按照块位号求模存放在相应位置,这样在数据恢复是可以快速检索到对应的数据,实现o(1)复杂度的恢复,降低了时空复杂度,从而提高了数据恢复速度;然后更新模块150根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;时间地址表包括有时间戳地址表和时间堆数据结构表,最新一次修改的hash时间戳地址表是一个数组地址表,决定了这个数据块应该从哪个hash数组读取、数据变化块的hash数据修改表,数组求模存放变化数据块,并list链接、相同求模的块号排序,当需要数据恢复时,数据恢复模块160根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。时间堆数据结构表是基于毫秒的时间堆数据结构表,可以通过块位图、数据修改表、时间地址表实现实时的块数据变化追踪和记录,并且在数据恢复的过程动态检索。通过挂载初始的全量备份数据、连续变化的数据卷,实现在线的毫秒级的实时数据恢复。

请参阅图3,图3为本申请实施例提供的一种电子设备的一种示意性结构框图。该电子设备包括存储器101、处理器102和通信接口103,该存储器101、处理器102和通信接口103相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。存储器101可用于存储软件程序及模块,如本申请实施例所提供的备份数据实时恢复系统对应的程序指令/模块,处理器102通过执行存储在存储器101内的软件程序及模块,从而执行各种功能应用以及数据处理。该通信接口103可用于与其他节点设备进行信令或数据的通信。

其中,存储器101可以是但不限于,随机存取存储器(randomaccessmemory,ram),只读存储器(readonlymemory,rom),可编程只读存储器(programmableread-onlymemory,prom),可擦除只读存储器(erasableprogrammableread-onlymemory,eprom),电可擦除只读存储器(electricerasableprogrammableread-onlymemory,eeprom)等。

处理器102可以是一种集成电路芯片,具有信号处理能力。该处理器102可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

可以理解,图3所示的结构仅为示意,电子设备还可包括比图3中所示更多或者更少的组件,或者具有与图3所示不同的配置。图3中所示的各组件可以采用硬件、软件或其组合实现。

在本申请所提供的实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

综上所述,本申请实施例提供的一种数据备份方法及系统,该数据备份方法通过实时获取待备份数据和当前时间戳,进而将实时获取的待备份数据与预置的全量数据进行对比,得到变化数据块集;再根据变化数据块集对预置的块位图进行标记,生成当前时间戳的块位图;变化数据块最新一次时间戳修改的块位图决定在数据恢复时,是需要提取变化数据块,还是直接从全量数据读取,当块位图中没有标记时,就可以直接读取全量数据,从而加快了数据恢复的速率;然后根据当前时间戳的块位图和变化数据块集生成数据修改表;数据修改表是一个基于数组、开链的方式实现的,用于对相同时间戳内修改的数据块进行存储的数据区域,并且按照块位号求模存放在相应位置,这样在数据恢复是可以快速检索到对应的数据,实现o(1)复杂度的恢复,降低了时空复杂度,从而提高了数据恢复速度;然后根据当前时间戳和数据修改表对预置的时间地址表进行更新,生成新的时间地址表;时间地址表包括有时间戳地址表和时间堆数据结构表,最新一次修改的hash时间戳地址表是一个数组地址表,决定了这个数据块应该从哪个hash数组读取、数据变化块的hash数据修改表,数组求模存放变化数据块,并list链接、相同求模的块号排序,当需要数据恢复时,根据块位图、数据修改表、时间地址表对数据进行数据恢复,生成实时恢复数据。时间堆数据结构表是基于毫秒的时间堆数据结构表,可以通过块位图、数据修改表、时间地址表实现实时的块数据变化追踪和记录,并且在数据恢复的过程动态检索。通过挂载初始的全量备份数据、连续变化的数据卷,实现在线的毫秒级的实时数据恢复。

以上仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其它的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1