一种高效的文件备份与恢复方法

文档序号:6489426阅读:384来源:国知局
一种高效的文件备份与恢复方法
【专利摘要】本发明公开了一种高效的文件备份与恢复方法,要解决的技术问题是,在系统运行正常的前提下,改变传统的备份方式,加快文件备份或恢复的速度并节省存储空间,在必要时能够准确、高效地恢复出需要的文件。技术方案:时间推移,文件的变化导致新的文件版本,将文件的变化量数据和上一个文件版本结合起来可以形成该新版本,保存文件变化量数据时可以将其分成连续的存储块存储到介质中,若该存储块的数据与某一已经存在的存储块数据相同则不需要重复存储,存储器为存储块分配唯一ID,通过这些ID的集合,来实现恢复文件操作。本发明不需要重复存储相同数据块,节约存储空间;不需要进行数据复制、粘贴等操作,提高恢复速度与效率。
【专利说明】一种高效的文件备份与恢复方法
【技术领域】
[0001]本发明涉及一种文件备份与恹复方法,是一种快速、可靠、可节约存储空间的备份恹复方法。
【背景技术】
[0002]计算机的普及给日常工作生活带来了很多便利,但当计算机受到一些攻击或者自然灾害的时候,面对丢失的重要数据,人们手忙脚乱。面对这样棘手的问题,人们常用一下几种方法:1.使用外接设备拷出数据;2.使用刻录机将数据刻成光盘;3.将数据保存在系统分区外;4.软盘备份数据;5.使用GHOST备份数据或系统。上述的五种方法固然可以在一定程度上保护了重要数据,但是操作不方便、容易误操作、外接设备丢失、浪费资源等问题层出不穷,而且不适合有大量数据的企业使用。
[0003]部分企业需要定期进行备份,当数据量无情增长,这势必需要更多的存储空间和更多的带宽,管理人员不会希望轻易破坏原有的数据架构,但这需要更多的硬件投入。
[0004]所以,当今的备份恹复软件需要解决的,除了实时性、准确性等,还需要考虑到存储空间。
[0005]本发明提出了一种高效准确的文件备份恹复方法,并且该方法备份能够节省不小的存储空间,将该方法运用到备份产品中,可以得到准确高效、令人满意的备份效果。

【发明内容】

[0006]本发明的目的是提出一种高效的文件备份恹复方法,该方法可以节约存储空间,被使用于备份产品中。
[0007]本发明要解决的技术问题是,改变传统的备份方式,加快文件备份或恹复的速度,节约存储空间,必要时能够准确、高效地恹复出需要的文件。
[0008]为解决上述技术问题,本发明采取以下技术方案:当需要对修改后的文件备份时,首先获取到文件较上次版本的变化量数据,将变化量数据分成连续的块存储到介质中并返回ID,在此计算出数据块的特征值并存储,数据块被存储之前需要将其特征值与已经存在的数据块的特征值进行此对,该值相同,即两个数据块相同,则不需要重复存储,直接返回这个已经存在的数据块的ID,从而,操作系统对每次文件的修改都生成了数据块数据块被存储器分配对应的唯一 ID,这些ID的集合是文件变化量数据映射。
[0009]文件数据映射是文件的上个版本的数据映射和相对上个版本文件变化量数据映射的合并。由此,备份文件时,首先获得上个文件版本数据映射,将其与文件变化量数据映射合并,就获得此次文件数据映射,备份该文件完成。文件第一次备份时,文件映射就是此次的文件变化量数据映射。
[0010]具体的,每次备份文件时会单独存储文件的属性信息,例如文件名、文件大小、文件修改时间等,再获得文件变化量数据,将变化量数据分成连续的数据块,对于其中的每一块数据块,存储到介质中,获得对应的ID,由此生成出文件变化量映射,通过合并上个版本的文件映射,获得完整的文件映射,存储该文件映射。
[0011]当用户需要恹复相应的文件时,根据文件版本可以获得对应的文件数据映射,将其中的每个ID获取对应的存储块,再由这些存储块组成文件。
[0012]本发明所述方法可以节省存储空间,减少备份内容,提高备份速度。本发明主要是分块保存文件变化量数据到介质,对于其中已经存在介质中的数据块不重复存储(当介质中已经存储大批数据块时,数据块相同的概率比较高,不重复存储,可以节约不少空间),减少所需存储空间,提高效率;整个过程中没有涉及复制等操作,耗用时间少,更能保证实时性。
【专利附图】

【附图说明】
[0013]图1——备份文件流程图。
[0014]图2——在不同时间点下文件版本的文件属性与文件映射的逻辑关系图。
[0015]图3——存储块ID与存储块内容标示的逻辑关系图。
【具体实施方式】
[0016]下面举出实例对本发明的技术方案进行详细说明。
[0017]对于某个文件F,随着时间的推移,新的变化导致新的文件版本产生,
F (t0)—>F (tl)--->------->F (ti)..., F (ti)表示 ti 时刻的文件版本,Delta (ti)来表示
相对于t1-Ι时刻的变化量数据,Map(Delta(ti))表示文件变化量数据映射,如下的四个表达式成立。
[0018]1.F (t0) = 0+Delta`(t0)
[0019]2.F (ti) = F (t1-1)+Delta (ti)
[0020]3.Delta (ti) = Σ B (k)
[0021]4.Map (Delta (ti)) = Σ AID (B (k))
[0022]对于时刻ti的文件F的版本F(ti),F(ti)相当于ti_l时刻的版本与相对于ti_l时刻文件变化量的和,故表达式2成立,表达式I是初始备份时的特殊情况。
[0023]图1是备份文件的流程图。AlD (B (k))表示存储块B (k)的存储ID,当存储变化量数据为Delta (ti)时,将Delta (ti)分成连续的存储块B (k),表达式3成立,AID (B (k))是B(k)存储到介质上时由存储器为其分配唯一的存储1D,计算B (k)的特征值并存储,表达式4成立。如果存储器中已经存在某个存储块B(j),其数据与B(k)相同,那么存储器将返回B(J)的AID,AID(BGO) = AID (B (j)),具体比较两个数据块内容是否一样,可以比较两者的特征值。根据AID(BGO),存储器可以获取B(k)的数据内容。由此,对于任意时刻ti的文件F的版本F (ti),存储Delta (ti)获得与之对应的文件变化量映射Map (Delta (ti)),那么Map(F(ti)) = Map(F(t1-1))+Map(Delta (ti))。
[0024]备份文件的方法:备份ti时刻的文件版本F(ti),首先获得相对于F(t1-l)时刻的变化量数据Delta(ti),将Delta (ti)分成连续的存储块,对于其中的每一块B (k),存储B (k)到介质中,获得AID (k),由此生成出Map (Delta (ti)),通过合并Map (F (t1-Ι)),获得完整的 Map (F (ti)),存储 Map (F (ti))。
[0025]恹复文件的方法:恹复ti时刻的文件版本F(ti),获得对应的Map(F(ti)),对于其中的每一个AID (k),获得存储块B (k),据此生成出F (ti)。
[0026]图2表示出在不同时间点下文件版本的文件属性与文件映射的逻辑关系图。例如要恹复在ti时刻备份的文件F,可以第一步获取对应的属性(名称和一系列属性),第二步得到对应的文件映射。
[0027]图3是存储块ID与存储块内容标示的逻辑关系图,根据文件映射,将其中的每个ID号,得到该ID号对应的存储块内容。待得出每个存储块内容,将内容拼接便可以形成文件内容,文件的属性已经获得,有了文件属性和文件内容,恹复文件的目的就可以达到了。
[0028]FilePath-保存存储块内容的文件路径
[0029]Offset-存储块内容相对于首地址的偏移
[0030]Length-存储块的大小
[0031]本发明介绍的是一种文件备份恹复的方法,例中使用的存储块保存在文件中,实际应用过程中,存储介质并不局限。
【权利要求】
1.一种高效的文件备份与恹复方法,其特征在于包括以下步骤: 第一步,当文件有修改部分并需要备份时,得到文件属性信息和文件变化量数据; 第二步,文件属性信息存储于介质,将文件变化量数据分块存储,生成每个块唯一的ID号,生成文件变化量映射,包括以下几个步骤: 步骤1,文件属性信息存储,与该时间点备份文件版本相对应; 步骤2,存储文件变化量数据,将变化量数据分配到连续的存储块中,存储块逐一存储到介质中,被存储器分配唯一的存储ID,如果存储器中已经存在某个数据块,两者数据相同(可以通过特征值此较),那么存储器将这个已经存在的数据块的ID返回,不重新存储分配,在此定义文件变化量数据映射为这些ID的集合,通过以上操作,利用数据块ID可以反之获取其存储内容; 第三步,得到文件最近一次备份操作的文件映射,与文件变化量映射合并得到正在备份的文件的映射,如果文件是初次备份,则最近一次备份操作的文件映射不存在,文件映射就是该次的文件变化量映射,保存文件映射,与该时间点备份文件版本相对应。至此,文件备份完成; 第四步,当用户需要时,恹复文件,包括以下几个步骤: (1)得到需要恹复到的时间点文件版本的对应文件属性和文件映射; (2)得到文件映射后,将其中的每个ID获取对应的数据块,再由这些数据块组成文件; (3)将组成的文件,其属性设置为步骤(I)得到的文件属性,恹复文件成功。
【文档编号】G06F11/14GK103713963SQ201210371595
【公开日】2014年4月9日 申请日期:2012年9月29日 优先权日:2012年9月29日
【发明者】刘宇, 张有成 申请人:南京壹进制信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1