一种逆向的文件增量归档方法

文档序号:6358413阅读:204来源:国知局
专利名称:一种逆向的文件增量归档方法
技术领域
本发明提出了一种逆向的文件增量归档方法,属于信息安全技术领域。
背景技术
文件归档在防止数据丢失、意外删除、病毒破坏和灾难的影响等方面应用广泛。文件归档问题关键在于如何以最小的存储空间和最高的效率来实现文件的归档和恢复,特别是当需要恢复归档文件时,应该能够快速地恢复出用户所需归档时间点的文件。现有的基于增量备份模型的文件归档方法中,如专利公开号CN101064730、CN1975683,服务器只保存了最近全备份点的文件和其余各归档时间点的差异数据。然而,当文件损坏或者丢失后, 人们通常会选择恢复最新归档时间点的文件,以减少由此带来的损失。因此,能否快速地恢复最新归档时间点文件非常重要。上述方法用于归档存在以下的不足
I)恢复最新归档时间点文件耗时长。在文件恢复至最新归档时间点时,需要根据最近全备份点文件和各归档时间点差异文件逐次重放出所需归档点文件,需要搜索、扫描和重放该文件最近全备份点至最新归档时间点之间的所有归档版本,耗费时间长。2)恢复文件至最新归档时间点需占用的资源多。由于恢复到最新归档时间点需要执行多次的重放操作,需要多次将旧版本文件和差异文件从磁盘读出,然后生成新版本文件再写入磁盘,这些步骤需要大量的磁盘操作,造成服务器性能的严重下降。本发明提出一种逆向的文件增量归档方法,该方法通过计算两个相邻时刻归档文件的正向及逆向差异和重构最新归档点文件来实现文件的增量归档,并在恢复归档文件时,根据逆向差异文件,对归档点文件进行重构、恢复。本发明具有以下优点
O恢复文件至最新归档时间点速度快。服务器保存文件最新归档,无需进行差异重放操作,直接将服务器保存的最新归档文件复制到客户端即可完成文件恢复操作。2)归档速度快。在客户端仅做一次新旧版本文件之间的比较,即可同时生成文件内容正向差异和文件内容逆向差异,前者用于客户端和归档服务器文件的同步,后者用于产生文件逆向差异并进行基于时间点逆向的文件增量恢复;
3)恢复次新归档时间点文件,服务器仅做一次逆向差异重放操作,文件恢复速度快。

发明内容
本发明提出了一种逆向的文件增量归档方法。其基本思想是本方法由归档文件备份和归档文件恢复两部分构成。在进行归档文件备份时,首先在客户端对一个文件的新旧版本进行一次扫描比较,计算出文件新旧版本之间的差异,同时生成基于时间点的文件内容正向差异和文件内容逆向差异;然后将以上文件差异通过网络传输到归档服务器,正向差异用于更新归档服务器文件,得到最新文件版本,逆向差异用于管理和重放各个归档点文件。在进行归档文件恢复时,若恢复最新归档时间点文件,服务器无需进行差异重放操作,直接将服务器保存的最新文件版本传至客户端即可完成文件恢复操作;若恢复次新归档时间点文件,服务器仅做一次差异重放操作,文件重放速度快,这样实现了归档文件的快速恢复。在详细阐述本发明前,先定义如下术语
(I)文件/,指需要归档的一个文件。(2) 指在第i个时间点文件/在归档服务器的备份,其中i为自然数,t 为最近归档时间点。为了便于描述,用JU来表示即将归档的客户端文件,其文件属性及文
,KHk
件内容完全与文件/相同。(3)文件状态七 <M> ,一个文件/在i时刻的状态,包括文件属性和文件内(4)文件属性>,其中f为文件长度,f为文件最后修改时间,#为文件内容散列值。(5)文件分块大小I指将文件/以A字节为单位分成一系列没有重叠的数据块, 如果最后一块不足A字节,则填充为A字节。(6)文件内容正向差异^j,指文件/从I时刻f变化到i>l时刻&所产生的差异,表示为=-I",运算“一”代表差异计算。文件/在i+i时刻内容可由i时刻内容和文件内容正向差异重放得到,表示为1C1=| ^4^,运算“+”代表差异重放。(7)匹配数据块,指同时存在于文件J;和/Λ中的数据块,即在和/Λ中,该数据块内容是相同的。(8)正向差异文件对记录文件/内容的正向差异,其中是差异指示文件,记录差异数据的长度和匹配数据块的序号,分别用正整数和负整数表示,‘.是正向差异数据文件,记录J;和两个文件之间的差异数据,是一个流文件。(9)文件内容逆向差异指文件/从i+l时刻I恢复到i时刻《^所产生的差异,表示为%|=#~·^。文件f在Y时刻内容可由时刻内容和文件内容逆向差异重放得到,表示为(10) 逆向差异匹配记录文件保存文件/在i和i+Ι时刻之间文件内容的逆向差异匹配记录<1,1>,其中J为匹配数据块在i时刻文件$中的偏移量,7为匹配数据块在i+\时刻文件&中的偏移量。(11)逆向差异文件对(^,0,记录文件/内容的逆向差异,其中I;是逆向差异指示文件,记录匹配数据块的偏移量和未匹配数据块的标示,分别用正整数和一 I表示,是逆向差异数据文件,记录和L两个文件之间的差异数据,是一个流文件。(12)差异集AShv=,由正向差异文件对和逆向差异匹配记录文件组成,表示文件/在i和i—I时刻之间的内容差异。
(13)结构体
权利要求
1.一种逆向的文件增量归档方法,其特征在于,所述方法包括以下步骤(1)归档文件增量备份的步骤,包括以下步骤1)判断归档文件内容是否发生变化的步骤;2)生成文件内容正向差异和逆向差异匹配记录文件的步骤,包括以下步骤a)归档服务器文件分块的步骤;b)归档服务器计算校验值并生成校验值文件的步骤; c)客户端通过网络获得校验值文件的步骤;d)客户端生成滚动校验值哈希表与索引表的步骤;e)客户端扫描搜索、生成正向差异文件对及逆向差异匹配记录文件的步骤;3)文件内容正向差异和逆向差异匹配记录文件传输的步骤;4)生成文件内容逆向差异的步骤,包括以下步骤a)扫描逆向差异匹配记录文件的步骤;b)数组排序的步骤;c)创建逆向差异对文件的步骤;d)保存最新归档文件描述信息的步骤;e)查找匹配数据块的步骤;f)记录匹配块信息的步骤;g)记录不能匹配块信息的步骤;h)文件内容逆向差异生成完毕的步骤5)文件内容正向差异重放的步骤;(2)指定归档点文件逆向增量恢复的步骤。
2.根据权利要求I所述的一种逆向的文件增量归档方法,其特征在于,所述的判断归档文件内容是否发生变化的步骤包括以下步骤(1)获取归档服务器文件属性的步骤;(2)比较文件长度的步骤;(3)比较文件最后修改时间的步骤;(4)比较文件散列值的步骤;(5)判定比较结束的步骤。
3.根据权利要求I所述的一种逆向的文件增量归档方法,其特征在于生成文件内容正向差异和逆向差异匹配记录文件的步骤中,客户端扫描搜索、生成正向差异文件对及逆向差异匹配记录文件的步骤包括以下步骤(1)记录文件描述信息的步骤;(2)查找哈希值匹配块的步骤;(3)记录正向差异数据的步骤;(4)验证匹配块散列值的步骤;(5)正向差异对文件和逆向差异匹配记录文件生成结束的步骤。
4.根据权利要求I所述的一种逆向的文件增量归档方法,其特征在于,所述的文件内容正向差异和逆向差异匹配记录文件传输的步骤包括以下步骤(1)客户端打开存放文件内容差异的文件的步骤;(2)发送文件差异内容的步骤;(3)归档服务器保存文件差异内容的步骤。
5.根据权利要求I所述的一种逆向的文件增量归档方法,其特征在于,所述的文件内容正向差异重放的步骤包括以下步骤(1)读取正向差异指示文件的步骤;(2)判定正向差异指示数据的步骤;(3)从正向差异数据文件中读取数据的步骤;(4)从上一归档点文件中读取数据的步骤;(5)正向差异重放操作完成的步骤。
6.根据权利要求I所述的一种逆向的文件增量归档方法,其特征在于,所述的指定归档点文件逆向增量恢复的步骤包括以下步骤(1)发送指定归档点文件恢复请求的步骤;(2)逆向差异重放的步骤,包括以下步骤1)获取上一时刻归档文件的描述信息的步骤;2)读取逆向差异指示文件的步骤;3)判定逆向差异指示数据的步骤;4)从逆向差异数据文件中读取数据的步骤;5)从本次归档点文件中读取数据的步骤;6)逆向差异重放操作完成的步骤;(3)发送所需归档时间点文件的步骤。
全文摘要
本发明提出了一种逆向的文件增量归档方法,属于信息安全技术领域。该方法在客户端对一个文件的新旧版本进行一次扫描比较,计算文件新旧版本之间的差异,同时生成文件内容正向差异和文件内容逆向差异,以上文件差异通过网络传输到归档服务器,正向差异用于更新归档服务器文件,逆向差异用于管理和重放各个归档点文件。恢复最新归档时间点文件时,服务器无需进行差异重放操作,直接将服务器保存的最新文件版本传至客户端即可完成文件恢复操作;恢复次新归档时间点文件时,服务器仅做一次差异重放操作。该方法具有差异计算快,差异重放快,恢复速度快等特征,提高了文件归档和恢复的效率,在灾难备份,文件归档等方面具有广阔的应用前景。
文档编号G06F17/30GK102609338SQ201210024269
公开日2012年7月25日 申请日期2012年2月5日 优先权日2012年2月5日
发明者李涛, 梁刚, 胡晓勤, 赵辉, 龚勋 申请人:四川大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1