专利名称:一种循环备份的方法及装置的制作方法
技术领域:
本发明涉及数据备份及备份数据管理技术,特别涉及一种循环备份的方法及装置。
背景技术:
备份数据是防止数据丢失的一种重要保护措施,通常备份数据是将分布在数据源 的数据通过网络集中备份到介质服务器中。为了有效地利用介质服务器的存储空间,介质 服务器通常采用归档数据、合并数据及删除过期数据的方法对已备份于介质服务器的数据 集中进行处理。 归档数据的方法为介质服务器从其内部的存储介质中读取一些不使用或者不常 用的数据,将读取获得的不使用或者不常用的数据保存于归档介质中,以便随时对归档介 质进行数据查找或数据恢复。归档介质为磁盘库、磁带库或者光盘库等离线介质。合并数 据的方法为介质服务器将多个数据进行合并生成一个或有限几个数据集,介质服务器对在 合并过程中生成的过期数据以及无效的数据进行归档或者删除,节约其存储空间。删除数 据的方法为介质服务器根据设置的截止日期,从介质服务器内部的存储介质中删除备份的 截止日期之前备份的数据。 介质服务器需要进行数据备份和对已备份数据的管理,当介质服务器中备份的数 据量较大时,采用上述三种方法对已备份的数据进行处理会加大介质服务器的负荷,若同 时处理数据备份和已备份数据的管理可能会影响备份数据的效率。若采用上述三种方法处 理已备份的数据可能导致某些过期文件被移出用于备份的介质服务器或者被删除,此时一 些不常变化的数据在分析时将又从数据源备份到介质服务器中,这将导致同一数据在介质 服务器重复存储,浪费介质服务器的存储资源。若介质服务器在归档数据、合并数据或删除 数据时,数据源可能无法得到介质服务器的备份响应,甚至由于介质服务器承受的负荷过 大而导致服务器或客户端的备份请求被丢弃,增加了数据丢失的风险。 综上所述,现有的数据备份及管理方法存在数据备份效率较低、介质服务器要求 高,存储空间利用率较低和数据易丢失等问题。
发明内容
有鉴于此,本发明的目的在于提供一种循环备份的方法,该方法能够在对数据进 行有效备份的前提下,提高数据备份的效率及存储空间的利用率。 本发明的另一 目的在于提供一种循环备份的装置,该装置能够在对数据进行有效
备份的前提下,提高数据备份的效率及存储空间的利用率。 为达到上述目的,本发明的技术方案具体是这样实现的 —种循环备份的方法,该方法包括 A、获取待备份数据的信息、已备份数据的信息及已备份数据的版本数; 所述信息包括数据的基本信息和辅助信息;所述版本数为基本信息相同、辅助信
4息不同的数据版本的数目; B、判断已备份数据的信息中是否包含与待备份数据的基本信息和辅助信息都相 同的数据信息,如果是,不备份待备份数据;否则,执行步骤C ; C、判定与待备份数据的基本信息相同的已备份数据的版本数小于预设版本数,则 备份所述待备份数据及其信息,更新与待备份数据的基本信息相同的已备份数据的版本 数,判定与待备份数据的基本信息相同的已备份数据的版本数等于预设版本数,则更新与 待备份数据的基本信息相同的已备份数据及其信息。 上述方法中,所述基本信息包括数据的名称和属性;所述辅助信息包括数据的修 改时间。 上述方法中,步骤C所述备份所述待备份数据及其信息,更新与待备份数据的基 本信息相同的已备份数据的版本数包括 Cll、将所述待备份数据的信息添加到已备份数据的信息中,备份所述待备份数 据; C12、将与待备份数据的名称和属性相同的已备份数据的版本数加1。 上述方法中,步骤C所述更新与待备份数据的基本信息相同的已备份数据及其信
息包括 C31、获得与待备份数据的名称和属性相同修改时间不同的N个已备份数据信息; 所述N为预设版本数; C32、从所述与待备份数据的名称和属性相同修改时间不同的N个已备份数据的 信息中选取修改时间最接近当前时刻的N-l个数据的信息,删除未选取的信息;
C33、将待备份数据的名称、属性和修改时间备份于已备份数据的信息中,删除步 骤C32未选取的数据,备份所述待备份数据备。 上述方法中,所述选取的与待备份数据的名称和属性相同修改时间不同的N-l个 数据信息及待备份数据的信息以保存映像树的方式备份于已备份数据的信息中,所述删除 的未选取的信息以删除映像树的方式备份于存储设备中。
—种循环备份的装置,该装置包括 提取单元,从数据源获取待备份数据的信息并输出至控制单元; 参数单元,从存储设备获取已备份数据的信息、已备份数据的版本数及预设版本
数;将待备份数据的信息、更新后的与待备份数据的基本信息相同辅助信息不同的数据版
本数及更新后的已备份数据的信息输出至存储设备保存; 控制单元,从参数单元获取已备份数据的信息、已备份数据的版本数及预设版本 数;根据提取单元输出的待备份数据的信息及已备份数据的信息判断已备份数据的信息中 是否包含与待备份数据的基本信息相同辅助信息不同的数据信息,如果是则不备份待备份 数据;否则,判断确定与待备份数据基本信息相同辅助信息不同的数据的版本数小于预设 版本数,更新与待备份数据的基本信息相同辅助信息不同的数据版本数,将提取单元输出 的待备份数据的信息及更新后的与待备份数据的基本信息相同辅助信息不同的数据版本 数输出至参数单元,控制存储设备备份所述待备份数据;判断确定与待备份数据基本信息 相同辅助信息不同的数据的版本数等于预设版本数,则根据提取单元输出的待备份数据的 信息更新已备份数据的信息,将更新后的已备份数据的信息输出至参数单元,控制存储设备备份所述待备份数据。 上述装置中,所述基本信息包括数据的名称、属性;所述辅助信息包括数据的修改 时间。 上述装置中,所述控制单元包括 比较模块,根据提取单元输出的待备份数据的信息和从参数单元获取的已备份数 据的信息,判断已备份数据的信息中是否包含与待备份数据的名称、属性和修改时间都相 同的数据信息,如果是则不备份待备份数据;否则,判断确定从参数单元获取的与待备份数 据的名称和属性相同修改时间不同的已备份数据的版本数小于预设版本数,输出备份数据 指令至选取模块,并将提取单元输出的待备份数据的信息输出至选取模块;判断确定从参 数单元获取的与待备份数据的名称和属性相同修改时间不同的已备份数据的版本数等于 预设版本数,输出更新数据指令至选取模块,并将提取单元输出的待备份数据的信息输出 至选取模块,将参数单元输出的已备份数据的信息输出至选取模块; 选取模块,根据获得的备份指令,控制存储设备备份所述待备份数据,将与待备份 数据的名称和属性相同修改时间不同的数据版本数加1后,与待备份数据的信息一同输出 至参数单元;根据获得的更新数据指令,从已备份数据的信息中选取与待备份数据的名称 和属性相同修改时间不同的N个已备份数据的信息,根据修改时间从所述选取的N个已备 份数据的信息中选取修改时间最接近当前时刻的N-l个数据的信息,删除未选取的数据的 信息,控制存储设备备份所述待备份数据和删除未选取的数据,将选取修改时间最接近当 前时刻的N-l个数据的信息及待备份数据的信息作为更新后的已备份数据的信息至参数 单元; 所述N为预设版本数。 由上述的技术方案可见,本发明提供的循环备份的装置及方法中,通过对已备份 数据的信息中是否包含与待备份数据的名称、属性和修改时间都相同的数据信息的分析 来判断待备份数据是否已经备份,如果是则不备份待备份数据,否则,对待备份数据进行备 份,并对待备份数据进行进一步处理,也就是判断与待备份数据的名称和属性相同修改时 间不同的已备份数据的版本数是否达到预设版本数,如果未达到预设版本数则直接备份待 备份数据的信息及待备份数据,否则,更新已备份的数据及其信息。本发明采用基于版本数 的循环备份方法,对已备份的数据进行分析,将已备份数据按照修改时间的先后顺序排列, 将超过版本数的修改时间距离当前时刻最远的数据删除或归档,保存在版本数范围内的修 改时间距离当前时刻最近的数据版本,保证已备份的所有数据的版本数在一个可控的范围 内。采用本发明的装置和方法,在对数据进行有效备份的前提下,避免对相同数据重复备 份,节约了存储空间,提高了存储空间的利用率;且备份每一个数据时对该数据进行数据信 息和版本数的判断,省略了后续对大量已备份数据集中地进行归档、删除或合并等数据管 理,减小了存储设备的负荷,避免了集中地进行归档、删除或合并等数据管理与数据备份同 时发生造成的丢失待备份数据的问题,提高了数据备份的效率。
图1为本发明循环备份的方法流程图。
图2为本发明循环备份的装置的结构示意图。
具体实施例方式
为使本发明的目的、技术方案、及优点更加清楚明白,以下参照附图并举实施例, 对本发明进一步详细说明。 本发明提供了一种存储设备的循环备份的方法,该方法根据修改时间、名称和属 性判断已备份数据的信息中是否包含与待备份数据的修改时间、名称和属性都相同的待备 份数据的信息,如果是,表示已对待备份数据的当前版本进行了备份,则不对待备份数据进 行备份;否则,表示未对待备份数据的当前版本进行备份,对待备份数据进行备份,并进一 步判断与待备份数据的名称和属性相同、修改时间不同的已备份数据是否达到预设版本 数,通过版本数的判断进行数据的备份或更新,将超过版本数的最早备份的数据进行删除 或归档,使得所有已备份数据保持在版本数范围内,且在版本数范围内的已备份数据为修 改时间距离当前时刻最近的数据。 本发明提供了一种循环备份的装置,该装置包括提取单元、参数单元、控制单元, 控制单元根据提取单元从数据源获取的待备份数据的修改时间、名称和属性、参数单元从 存储设备获取的的已备份数据的修改时间、名称和属性,判断存储设备中是否已备份了待 备份数据的当前版本,如果是则控制存储设备不备份待备份数据,否则,进一步判断存储设 备中与待备份数据的名称和属性相同而修改时间不同的已备份数据是否达到预设版本数, 对未达到预设版本数的待备份数据直接进行备份,对已达到版本数的待备份数据进行进一 步分析,按照修改时间将超过版本数的最早备份的数据进行删除或归档,对待备份数据进 行备份,以对已备份数据的信息进行更新。 图1为本发明循环备份的方法流程图。现结合图l,对本发明循环备份的方法进行 说明,具体如下 步骤101 :获取待备份数据的信息; 从数据源获得待备份数据的信息;数据源可以是局域网或广域网中的服务器或客
户端。待备份数据的信息包括待备份数据的基本信息和辅助信息;其中,基本信息是表示数
据基本特征的信息,这些信息所包含的内容不会因版本的变化而变化,如基本信息包括数
据的名称、属性等;辅助信息也是表示待备份数据特征的信息,但这些信息的内容会随着版
本的变化而变化,如辅助信息包括数据的大小、修改时间、在数据源中的存储位置等。 由于数据的修改时间或大小的改变能够表明数据的内容发生改变,因此,待备份
数据的信息为待备份数据的名称、属性和大小,或者为待备份数据的名称、属性和修改时
间,或者为待备份数据的名称、属性、大小和修改时间。本发明循环备份的方法中仅以待备
份数据的名称、属性和修改时间作为待备份数据的信息为例进行说明。
步骤102 :获取已备份数据的信息及已备份数据的版本数; 从存储设备获取已备份数据的信息及已备份数据的版本数;也可从用于存储数据 的介质服务器或者数据中心获取已备份数据的信息及已备份数据的版本数;在本实施例中 将存储数据的介质统称为存储设备,以存储设备为例进行说明。 已备份数据的信息包括已备份数据的基本信息和辅助信息;其中,基本信息是表 示数据基本特征的信息,这些信息所包含的内容不会因版本的变化而变化,如基本信息包 括数据的名称、属性等;辅助信息是表示数据特征的信息,但这些信息的内容会随着版本的变化而变化,如辅助信息包括数据的大小、修改时间、在数据源中的存储位置等。为了便于 对数据进行有效备份,已备份数据的信息的内容与待备份数据的信息的内容相同。本发明 循环备份的方法中已备份数据的信息包含备份于存储设备中所有数据的名称、属性和修改 时间。 版本数为基本信息相同辅助信息不同的数据版本的数据,也就是相同名称和属
性、不同修改时间的数据版本的数目;已备份数据的版本数是表示备份于存储设备中的具
有相同名称和属性的数据在不同修改时间的版本对应的个数。获取已备份数据的版本数也
就是对已备份数据的基本信息进行分析,获得名称和属性相同修改时间不同的已备份数据
的个数即为该名称和属性的已备份文件的版本数。这里通过对不同修改时间的具有相同名
称和属性的多个数据进行保存,可有效地备份具有相同名称和属性的不同内容的数据,不
会对名称、属性和修改时间都相同的数据进行重复备份,节约了存储空间。 步骤103 :判断已备份数据的信息中是否包含待备份数据的信息,如果是执行步
骤107,否则执行步骤104; 判断待备份数据的信息中是否包含待备份数据的信息也就是判断已备份数据的 信息中是否包含与待备份数据的名称、属性和修改时间都相同的数据信息,如果是,则表示 存储设备中已备份了与待备份数据内容相同的数据,无需再对待备份数据的当前版本进行 备份,执行步骤107 ;否则,存储设备中未备份与待备份数据内容相同的数据,需要对待备 份数据的当前版本进行备份,执行步骤104。 步骤104 :判断已备份的与待备份数据的名称和属性相同、修改时间不同的数据
的版本数是否小于预设版本数,如果是,执行步骤105,否则执行步骤106 ; 在本步骤之前,预先设置一版本数,该预设版本数为N,N为大于等于1的整数。根
据预设版本数,可保存多个不同修改时间相同名称和属性的数据,也就是可对同一数据的
不同版本进行保存。相比现有的对已备份的大量数据进行集中地归档或合并处理,本发明
将对数据的归档或合并处理分散到每一次备份数据后进行,降低了存储设备的负荷,同时
也避免了对已备份的大量数据进行集中地处理造成的无法及时响应数据源的备份请求,提
高了备份效率;利用版本数对待备份数据的版本进行控制,避免了对相同内容的数据进行
重复备份,节约了存储空间。 从已备份数据的版本数中,获取与待备份数据的名称和属性相同修改时间不同的 已备份数据对应的版本数,也就是获得已经备份于存储设备中的与待备份数据的名称和属 性相同修改时间不同的数据版本的个数。 本发明基于版本数的循环备份方法,由于对已备份数据进行了版本数的限制,因 此,已备份的数据的版本数不可能大于预设版本数,仅存在小于版本数或等于版本数两种 情况。 判断已备份于存储设备中的与待备份数据的名称和属性相同修改时间不同的数 据版本的保存个数是否小于预设的版本数,如果是,则表示存储设备中已备份的与待备份 数据的名称和属性相同修改时间不同的数据未达到预设版本数,也就是与待备份数据的名 称和属性相同修改时间不同的数据的保存个数小于N,执行步骤105 ;否则,也就是已备份 的与待备份数据的名称和属性相同、修改时间不同的数据的版本数等于预设版本数,即与 待备份数据的名称和属性相同修改时间不同的数据的保存个数等于N,执行步骤106。
步骤105 :备份待备份数据及信息并更新与待备份数据的名称和属性相同修改时间不同的数据的版本数,之后执行步骤107 ; 将所述待备份数据备份于存储设备中,将已备份数据的版本数中与待备份数据的名称和属性相同修改时间不同的数据的版本数加1,将待备份数据的名称、属性和修改时间添加至已备份数据的信息中。 —个存储设备可能与多个数据源进行连接,每个数据源对各自处理的数据进行备份。每个数据源在存储设备内都具有与其对应的存储目录,每个数据源在进行数据备份时,将该数据源中待备份的数据备份于存储设备中与该数据源对应的存储目录下。较佳地,在存储设备中每个数据源对应的存储目录下包含多个与数据备份时间对应的目录,数据源可进一步依据备份数据的时间将待备份数据备份于存储设备中该数据源目录下与待备份数据的备份时间相同的目录下,也就是在存储设备的某个数据源的目录下的某个备份时间的目录下包含多个基本信息不同的数据。 步骤106 :更新与待备份数据的名称和属性相同修改时间不同的数据及其信息,之后执行步骤107 ; 由于存储设备中保存的与待备份数据的名称和属性相同修改时间不同的数据的个数已达到预设的版本数,因此,本步骤更新与待备份数据的名称和属性相同修改时间不同的数据及其信息的方法包括首先,根据待备份数据的名称和属性从已备份数据的信息中获得已备份的与待备份数据的名称和属性相同修改时间不同的数据信息,已备份的与待备份数据的名称和属性相同修改时间不同的数据信息的个数为N ;其次,根据修改时间,从N个与待备份数据的名称和属性相同修改时间不同的数据信息及中选取修改时间距离当前时刻最近的N-l个数据信息,删除未选取的数据信息;最后,保存待备份数据及其信息,删除未选取的数据,具体地,将待备份数据备份于存储设备中,将待备份数据的名称、属性和修改时间添加至已备份数据的信息中。 上述更新与待备份数据的名称和属性相同修改时间不同的数据及其信息的方法中,仅以待备份数据的一个版本为例进行了说明;若同一待备份数据的多个版本进行版本数分析时,需要更新与待备份数据的名称和属性相同修改时间不同的数据及其信息的方法包括首先,根据待备份数据的名称和属性从已备份数据的信息中获得已备份的与待备份数据的名称和属性相同修改时间不同的数据信息,已备份的与待备份数据的名称和属性相同修改时间不同的数据信息的个数为N ;其次,根据修改时间,从N个与待备份数据的名称和属性相同修改时间不同的数据信息及中选取修改时间距离当前时刻最近的N-m个数据信息,删除未选取的数据信息,N为预设版本数,m为同时备份的待备份数据的版本个数;最后,保存待备份数据及其信息,删除未选取的数据,具体地,将待备份数据备份于存储设备中,将待备份数据的名称、属性和修改时间添加至已备份数据的信息中。N可取值为大于等于1的整数,m可取值为大于等于1的整数。 —个存储设备可能与多个数据源进行连接,每个数据源对各自处理的数据进行备份。每个数据源在存储设备内都具有与其对应的存储目录,每个数据源在进行数据备份时,将该数据源中待备份的数据备份于存储设备中与该数据源对应的存储目录下。较佳地,在存储设备中每个数据源对应的存储目录下包含多个与数据备份时间对应的目录,数据源可进一步依据备份数据的时间将待备份数据备份于存储设备中该数据源目录下与待备份数据的备份时间相同的目录下,也就是在存储设备的某个数据源的目录下的某个备份时间的目录下包含多个基本信息不同的数据。
步骤107 :结束。 本发明的上述实施例中,仅以待备份数据的信息包含名称、属性和修改时间为例对存储设备的循环备份方法进行说明,为了便于后续将存储设备中备份的数据恢复至数据源,待备份数据的信息中的辅助信息可进一步包括在数据源的存储位置,相应地,已备份数据的信息中的辅助信息进一步包括已备份的数据在数据源中的存储位置。如果待备份数据的信息包含名称、属性、修改时间和在数据源中的存储位置,该方法与本发明的上述实施例仅在步骤105和步骤106不同,也就是数据源根据待备份数据的在数据源的存储位置,将待
备份数据备份于存储设备中该数据源的目录下,进一步将待备份数据备份于该数据源目录下与其备份时间相同的目录下,较佳地根据其在数据源的存储位置备份于与待备份数据的备份时间相同目录下的与其在数据源的存储位置相同的目录下。
本发明的上述方法中,可由除存储设备之外的设备执行上述循环备份方法,比如
由现有的多个数据源分散执行上述循环备份方法,则现有的用于备份的介质服务器只执行
数据备份,降低了对介质服务器的要求,提高了介质服务器的工作效率。
下面以一具体实施例对本发明循环备份的方法进行说明,具体如下 在该实施例中,文件为需要进行备份或删除的数据,元信息为文件的名称、属性、
修改时间、在数据源中的存储位置等表示文件特征的信息,介质服务器为用于备份的存储
设备,数据源为提供待备份文件的客户端或服务器。现有技术中,多个数据源将待备份文件
输出至介质服务器,介质服务器用于进行文件备份和对已备份的文件进行集中管理;与现
有技术不同,本发明的多个数据源分别判断待备份文件是否需要备份,且对需要备份的待
备份文件进行的版本数分析,介质服务器仅根据数据源的指令备份文件或删除文件,无需
再对已备份数据进行集中管理。在本发明中为了记录备份文件的信息,可以将已备份文件
的元信息保存于一个文件中,该文件可称为"元信息映像";在"元信息映像"中所有已备份
文件的元信息按照备份时间及文件在数据源中的存储位置保存成树形结构,称为"元信息
映像树",该结构中以每一备份时间为一根节点,以在数据源中的存储位置为每一根节点下
的子根节点。本实施例为先待备份文件进行备份条件的判断,然后对符合备份条件的待备
份文件及与待备份文件的名称和属性相同的已备份文件进行版本数分析处理,如本发明步
骤101至步骤107。 首先,从介质服务器上的"元信息映像树"获取已备份数据的元信息,也就是本发明的步骤102中获取已备份数据的信息。如果介质服务器上没有已备份数据的元信息,则表明这是一个新的任务,先在数据源产生一个空的映像;否则将元信息映像同步到数据源。在本实施例中,数据源对待备份文件进行备份及版本数分析,可直接获得待备份文件的元信息,也就是本发明的步骤101中获取待备份数据的信息。 其次,数据源根据介质服务器上的"元信息映像树"中已备份文件的元信息对待备份文件的元信息进行分析,以判断是否对待备份文件进行备份,也就是本发明的步骤103 ;具体地,数据源将待备份文件与从介质服务器获得的"元信息映像树"中的所有已备份文件的元信息进行比较,如果元信息映像树中包含与待备份文件的名称、属性和修改时间都相同的已备份文件的元信息,则不备份该文件;否则,备份该文件。假如备份文件属于新任务,
10也就是元信息映像为空,对于数据源中的每一个文件都将被备份,也就是加入到备份列表 中,从而来完成第一次的完全备份。 最后,根据"元信息映像树"对已备份文件进行版本分析,即根据"元信息映像树" 对待备份文件和与待备份文件的名称和属性相同修改时间不同的已备份文件进行版本数 分析,也就是本发明的步骤104 ;"元信息映像树"可分为两大类,一类是"保留映像树",一 类是"删除映像树",保留映像树中备份的是修改时间距离当前最近的所有文件的元信息形 成的映像树,删除映像树中保存的是被删除的文件的元信息形成的映像树。文件的元信息 包括基本信息和辅助信息;基本信息为表示文件基本特征的信息,比如名称、属性等;辅助 信息为表示文件辅助特征的信息,比如修改时间等。在本发明的实施例中,每个数据源的 已备份数据备份于该数据源目录中与其备份时间相同的目录下,且每个文件在备份时都会 判断其修改时间是否改变以判断文件的内容是否发生改变,由于每个数据源处理的文件首 先备份于于该数据源的目录下,因此,对于存储设备的某个数据源的目录,该数据源的目录 下的每个根节点下仅保存某个文件的一个版本,获得某一个文件的根节点数目也就是获得 某个文件的版本数。具体地,当获取待备份文件的基本信息和辅助信息后,统计"保留映像 树"中与待备份文件的基本信息相同辅助信息不同的某一文件根节点Rn,并与预设版本数 En相比较,如果Rn〈En,表明与待备份文件的基本信息相同辅助信息不同的已备份的文件 的版本数未超过给文件的预设版本数En,存储待备份文件并将待备份文件的基本信息和辅 助信息添加到保留映像树中,将该文件的版本数Rn加1 ;如果"保留映像树"中与待备份文 件的基本信息相同辅助信息不同的文件的版本数Rn = En,说明在"保留映像树"中与待备 份文件的基本信息相同辅助信息不同的已备份文件的个数达到预设版本数En,对"保留映 像树"中的该文件进行版本数分析,根据修改时间从该文件的Rn个元信息中选取修改时间 距离当前最近的En-l个文件的元信息,未选取的最早备份的该文件元信息从保留映像树 中删除,将未选取的最早备份的文件元信息添加至删除映像树中。"保留映像树"中的文件版本数都将满足版本数设置,"删除映像树"都是被剔除的 文件版本。数据源根据"删除映像树"控制存储设备对删除映像树中与元信息对应的文件 进行处理,或者删除,或者归档;数据源利用其生成的"保留映像树"替换介质服务器中的映 像,也就是将数据源的元信息同步到介质服务器上。 图2为本发明循环备份的装置的结构示意图。图2中的实线表示数据信号,虚线 表示控制信号。现结合图2,对本发明循环备份的装置的结构进行说明,具体如下
本发明循环备份的装置包括提取单元201、控制单元202、参数单元203。本发明 循环备份的装置可分别与数据源和存储设备连接;也可装设于各个数据源中,与存储设备 连接。 待备份数据的信息包含待备份数据的名称、属性和修改时间;已备份数据的信息 包含已备份数据的名称、属性和修改时间;同一数据的版本数为相同名称和属性不同修改 时间的数据版本的数目,已备份数据包含多个名称和/或属性不同的数据,对于每一个名 称和属性相同的数据来说,版本数为名称和属性相同修改时间不同的数据的版本数据。
提取单元201 ,将从数据源获取待备份数据的信息输出至控制单元202。提取单元 201可通过局域网或广域网与服务器和客户端连接。 参数单元203,从存储设备获取已备份数据的信息、已备份数据的版本数及预设版本数;将待备份数据的信息、更新后的与待备份数据的基本信息相同辅助信息不同的数据版本数及更新后的已备份数据的信息输出至存储设备保存。可将预先设置的版本数存储于参数单元203中。 控制单元202,从参数单元203获取已备份数据的信息、已备份数据的版本数及
预设版本数;根据提取单元201输出的待备份数据的信息及已备份数据的信息判断已备份
数据的信息中是否包含与待备份数据的名称和属性相同修改时间相同的数据信息,如果是
则不备份待备份数据;否则,判断确定与待备份数据名称和属性相同修改时间不同的数据
的版本数小于预设版本数,更新与待备份数据名称和属性相同修改时间不同的数据的版本
数,将提取单元201输出的待备份数据的信息及更新后的与待备份数据名称和属性相同修
改时间不同的数据的版本数输出至参数单元203,控制存储设备对待备份数据进行备份;
判断确定与待备份数据基本信息相同辅助信息不同的数据的版本数等于预设版本数,则根
据提取单元201输出的待备份数据的信息更新已备份数据的信息,将更新后的已备份数据
的信息输出至参数单元203,控制存储设备备份待备份数据。 控制单元202包括比较模块2021和选取模块2022。 比较模块2021,根据提取单元201输出的待备份数据的信息和从参数单元获取的
已备份数据的信息,判断已备份数据的信息中是否包含与待备份数据的名称、属性和修改时间都相同的数据信息,如果是则不备份待备份数据,否则,判断从参数单元203获取的与
待备份数据的名称和属性相同修改时间不同的已备份数据的版本数是否和预设版本数相等,如果不相等即小于,输出备份数据指令至选取模块2022,并将提取单元201输出的待备份数据的信息输出至选取模块2022 ;如果相等,输出更新数据指令至选取模块2022,并将提取单元201输出的待备份数据的信息输出至选取模块2022,将参数单元203输出的已备份数据的信息输出至选取模块2022。 选取模块2022,根据获得的备份指令,控制存储设备备份待备份数据,具体地,可将待备份数据保存于存储设备中数据源目录中与待备份数据的备份时间相同的目录下,将与待备份数据的名称和属性相同修改时间不同的版本数加1后,与待备份数据的信息一同输出至参数单元203 ;根据获得的更新数据指令,从已备份数据的信息中选取与待备份数据的名称和属性相同修改时间不同的N个已备份数据的信息,根据修改时间从选取的N个已备份数据的信息中选取修改时间最接近当前时刻的N-l个数据的信息,删除未选取的数据的信息,控制存储设备备份待备份数据和删除为选取的数据,具体地,控制存储设备将待备份数据备份于数据源目录的与待备份数据的备份时间相同的目录下,将选取的修改时间最接近当前时刻的N-l个数据的信息及待备份数据的信息作为更新后的已备份数据的信息至参数单元203。 N等于预设版本数。 如果同时对同一待备份数据的m个版本进行版本数分析(m为大于等于1的正整数),则选取单元2022根据获得的更新数据指令,从已备份数据的信息中选取与待备份数据的名称和属性相同修改时间不同的N个已备份数据的信息,根据修改时间从选取的N个已备份数据的信息中选取修改时间最接近当前时刻的N-m个数据的信息,删除未选取的数据的信息,控制存储设备备份待备份数据和删除为选取的数据,具体地,控制存储设备将待备份数据备份于数据源目录的与待备份数据的备份时间相同的目录下,将选取的修改时间最接近当前时刻的N-m个数据的信息及待备份数据的信息作为更新后的已备份数据的信
12息至参数单元203。 N等于预设版本数,其取值为大于等于1的整数。 当待备份数据的信息包含待备份数据的名称、属性、修改时间和在数据源的存储 位置;已备份数据的信息包括已备份数据的名称、属性、修改时间和在数据源的存储位置 时,该装置中仅选取模块的功能与上述实施例不同,具体地,选取模块将待备份数据保存于 存储设备的该数据源目录中与待备份数据的备份时间和在数据源的存储位置相同的目录 下。 本发明的上述实施例中,可进一步按照修改时间保存删除的数据及其信息,可采 用现有的归档、删除或合并等方法定时对保存的已删除的数据及其信息进行处理,在此不 再赘述。 上述循环备份的存储设备实施例中,各模块和单元所执行的操作和实现的功能可 以参考方法实施例中的具体实现方式,这里不再赘述。 本发明的上述实施例中,通过修改时间判断待备份数据的内容是否发生改变,能 够对数据进行有效保存;通过预设版本数和修改时间相结合来限制备份的数据个数,避免 了相同数据重复备份,节约了存储空间,提高了存储空间的利用率;本发明在备份每一个数 据时对待备份数据进行数据信息和版本数的判断,省略了后续对已备份数据的归档、删除 或合并等数据管理,减小了数据备份过程和对已备份数据的归档、删除或合并等数据管理 同时进行时,由于存储设备的负荷过大造成的数据丢失的问题,提高了数据备份的效率。
本发明的上述实施例中,可进一步将循环备份的装置装设除存储设备之外的其它 设备中,比如数据源中,由数据源分散执行上述循环备份的方法,降低了对用于备份的介 质服务器的要求,提高了用于备份的介质服务器的工作效率。 综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。 凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的 保护范围之内。
权利要求
一种循环备份的方法,其特征在于,该方法包括A、获取待备份数据的信息、已备份数据的信息及已备份数据的版本数;所述信息包括数据的基本信息和辅助信息;所述版本数为基本信息相同、辅助信息不同的数据版本的数目;B、判断已备份数据的信息中是否包含与待备份数据的基本信息和辅助信息都相同的数据信息,如果是,不备份待备份数据;否则,执行步骤C;C、判定与待备份数据的基本信息相同的已备份数据的版本数小于预设版本数,则备份所述待备份数据及其信息,更新与待备份数据的基本信息相同的已备份数据的版本数,判定与待备份数据的基本信息相同的已备份数据的版本数等于预设版本数,则更新与待备份数据的基本信息相同的已备份数据及其信息。
2. 根据权利要求1所述的方法,其特征在于,所述基本信息包括数据的名称和属性;所 述辅助信息包括数据的修改时间。
3. 根据权利要求2所述的方法,其特征在于,步骤C所述备份所述待备份数据及其信 息,更新与待备份数据的基本信息相同的已备份数据的版本数包括Cll、将所述待备份数据的信息添加到已备份数据的信息中,备份所述待备份数据; C12、将与待备份数据的名称和属性相同的已备份数据的版本数加1。
4. 根据权利要求2所述的方法,其特征在于,步骤C所述更新与待备份数据的基本信息 相同的已备份数据及其信息包括C31、获得与待备份数据的名称和属性相同修改时间不同的N个已备份数据信息;所述N为预设版本数;C32、从所述与待备份数据的名称和属性相同修改时间不同的N个已备份数据的信息中选取修改时间最接近当前时刻的N-l个数据的信息,删除未选取的信息;C33、将待备份数据的名称、属性和修改时间备份于已备份数据的信息中,删除步骤C32 未选取的数据,备份所述待备份数据备。
5. 根据权利要求4所述的方法,其特征在于,所述选取的与待备份数据的名称和属性 相同修改时间不同的N-l个数据信息及待备份数据的信息以保存映像树的方式备份于已 备份数据的信息中,所述删除的未选取的信息以删除映像树的方式备份于存储设备中。
6. —种循环备份的装置,其特征在于,该装置包括 提取单元,从数据源获取待备份数据的信息并输出至控制单元;参数单元,从存储设备获取已备份数据的信息、已备份数据的版本数及预设版本数;将 待备份数据的信息、更新后的与待备份数据的基本信息相同辅助信息不同的数据版本数及 更新后的已备份数据的信息输出至存储设备保存;控制单元,从参数单元获取已备份数据的信息、已备份数据的版本数及预设版本数;根 据提取单元输出的待备份数据的信息及已备份数据的信息判断已备份数据的信息中是否 包含与待备份数据的基本信息相同辅助信息不同的数据信息,如果是则不备份待备份数 据;否则,判断确定与待备份数据基本信息相同辅助信息不同的数据的版本数小于预设版 本数,更新与待备份数据的基本信息相同辅助信息不同的数据版本数,将提取单元输出的 待备份数据的信息及更新后的与待备份数据的基本信息相同辅助信息不同的数据版本数 输出至参数单元,控制存储设备备份所述待备份数据;判断确定与待备份数据基本信息相同辅助信息不同的数据的版本数等于预设版本数,则根据提取单元输出的待备份数据的信 息更新已备份数据的信息,将更新后的已备份数据的信息输出至参数单元,控制存储设备 备份所述待备份数据。
7. 根据权利要求6所述的装置,其特征在于,所述基本信息包括数据的名称、属性;所述辅助信息包括数据的修改时间。
8. 根据权利要求7所述的装置,其特征在于,所述控制单元包括比较模块,根据提取单元输出的待备份数据的信息和从参数单元获取的已备份数据的 信息,判断已备份数据的信息中是否包含与待备份数据的名称、属性和修改时间都相同的数据信息,如果是则不备份待备份数据;否则,判断确定从参数单元获取的与待备份数据的 名称和属性相同修改时间不同的已备份数据的版本数小于预设版本数,输出备份数据指令 至选取模块,并将提取单元输出的待备份数据的信息输出至选取模块;判断确定从参数单 元获取的与待备份数据的名称和属性相同修改时间不同的已备份数据的版本数等于预设 版本数,输出更新数据指令至选取模块,并将提取单元输出的待备份数据的信息输出至选 取模块,将参数单元输出的已备份数据的信息输出至选取模块;选取模块,根据获得的备份指令,控制存储设备备份所述待备份数据,将与待备份数 据的名称和属性相同修改时间不同的数据版本数加1后,与待备份数据的信息一同输出至 参数单元;根据获得的更新数据指令,从已备份数据的信息中选取与待备份数据的名称和 属性相同修改时间不同的N个已备份数据的信息,根据修改时间从所述选取的N个已备份 数据的信息中选取修改时间最接近当前时刻的N-l个数据的信息,删除未选取的数据的信 息,控制存储设备备份所述待备份数据和删除未选取的数据,将选取修改时间最接近当前 时刻的N-l个数据的信息及待备份数据的信息作为更新后的已备份数据的信息至参数单 元;所述N为预设版本数。
全文摘要
本发明提供了一种循环备份的方法,该方法从数据源获取待备份数据的信息,获取已备份数据的信息及已备份数据的版本数;信息包括数据的基本信息和辅助信息;版本数为基本信息相同辅助信息不同的数据版本的数目;判断已备份数据的信息中是否包含与待备份数据的基本信息和辅助信息都相同的数据信息,如果是则不备份,否则,判定与待备份数据的基本信息相同辅助信息不同的已备份数据的版本数小于预设版本数,则备份待备份数据及其信息,判定上述已备份数据的版本数等于预设版本数,更新与待备份数据的基本信息相同的已备份数据及其信息。本发明提供了一种循环备份的装置。本发明的方法及设备能够提高数据备份的效率及存储空间的利用率。
文档编号G06F17/30GK101739310SQ20091020105
公开日2010年6月16日 申请日期2009年12月10日 优先权日2009年12月10日
发明者叶佑群 申请人:上海爱数软件有限公司