一种数据恢复方法

文档序号:6425226阅读:153来源:国知局
专利名称:一种数据恢复方法
技术领域
本发明属于数据存储领域,具体涉及一种数据恢复方法,该方法可以提高备份系统所保护的关键数据的恢复效率。
背景技术
随着数据量以爆炸式的不断增长,信息对人类来说越来越重要。人类每天产生大量的数据如个人文档、电子邮件、企业财务报表、客户数据、市场调研数据、企业业务流程、 企业业务交易数据、项目设计方案等被存储在计算机系统中,这在很大程度上促进了企业的信息进程,提高了工作效率。但数据的存储安全的重要性也逐渐显现出来。丢失关键性业务数据会极大的影响工作效率,拖延项目进度,给企业带来严重的经济损失。根据IDC调查,在美国,上世纪九十年代中有过数据灾难的公司中,有一半以上的立即倒闭,另有不到30%的在随后两年内倒闭,其余生存下来的仅占总数的16%。对于通常来想非常安全的数据中心,每年也有五百分之一的概率要经历一次数据灾难。因此用户对存储在系统中的数据的有效保护的需求越来越高。能否及时的恢复关键性的数据已成为企业在数据灾难后能否再次运转的关键所在。一份来自美国明尼苏达大学的研究报告显示,如果无法在数据灾难发生后的二周内恢复企业的信息系统,则将会有近四分之三的企业会停业。在这些停业的企业中有接近一半的随后倒闭,有接近五分之一的企业在也会在随后的两年之内会破产。在现实应用中,数据恢复指标可以由两个参数来衡量恢复时间目标(RTO)和恢复点目标(RPO)。恢复点目标RPO指的是可以容忍的最大数据丢失量。比如,如果在t0时刻数据出现了差错,但是直到ti时刻才发现这个错误。最理想情况是可以把数据恢复到to时刻或者是尽可能的接近to时刻。但现在大多数企业基于成本或性能的考虑基本做不到恢复到to 时刻。如典型的现在一般企业所使用的日常备份方案是一天一备,即两次备份间的间隔是 M小时。最坏的情况,在马上要进行下次备份时系统出了问题,此时系统已经运行了对个小时没有备份。因下次备份还没有开始,此时企业能做的就是使系统恢复到之前的一个备份所在的时刻,这时企业将损失这M小时内的所有数据,此时他们的RPO就是M小时。所以RPO可以描述用户所能容忍的最大数据丢失数量。目前,比较热门的数据保护方式一连续数据保护(Continuous Data Protection, CDP)就是改变过去那种一天或几小时一备份的方式,转而连续不断的捕获和保存数据变化,并将变化后的数据独立于初始数据进行保存。利用连续数据保护,用户可以将数据恢复到过去任意一个时间点,这样就基本没有数据的丢失,所以它的RPO就到了 0,从而上极大地保护了用户数据。恢复时间目标RTO是可以接受最大恢复数据时长。其指的是当发现数据出错或丢失后开始恢复直到恢复完成所用的时间。以为上说的为例,如果从发现错误的时刻tl开始恢复,直到t2时刻完成恢复,则此RTO就是t2_tl。当数据灾难发生后,谁能在最短的时间内恢复系统的运行,谁就在竞争中抢占了先机。所以RTO是越小越好。
尽管现在已经有一些方法来减少关键数据的恢复时间,但这其中绝大多数都是假设已知恢复点(用户认定的过去系统数据正常的时刻)的情况下,通过各种方法加快数据恢复到那一点的速度,从而达到减少恢复时间RTO的目的。但这个恢复点是用户的经验值, 是用户所想的系统还正常的状态,但往往不是用户真正所期望的数据正确那个最佳的点。 还是用上面的例子,设t0是这个最佳的点,如果用户恢复到了 t0之前的时刻t3,他将丢失 t3到t0时刻间的有用数据。如果用户恢复到了 t0时刻之后的t4时刻,这时系统数据并不是一个正确的状态,恢复并不是有效的。无论是以上的哪种情况,这时用户都会选择继续向t0时刻恢复,以达到用户真正想要的正确的状态,这无形中就使恢复时间RTO大大的增加了。另有部分系统提供过去某些时间点的信息,来辅助管理员快速选择一个相对正确的时间点。这能起到一定的帮助用户正确选择to时刻的目的,但普遍的它们都以系统为中心的,仅仅是那个时候系统的一些状态和属性,并不是用户所关心的数据的内容,所以并不能真正有效的帮助定位那个数据正确最佳时刻。

发明内容
本发明的目的在于提供一种数据恢复方法,该方法能更快更准确的确定系统恢复时间点,有效的减少系统的恢复时间,提高恢复效率,减少损失。本发明提供了一种数据恢复方法,包括以下步骤(1)列出所有能够恢复的文件;(2)选择一个或多个文件作为关键文件;(3)对关键文件按照设定的时间间隔进行恢复,得到多个版本的关键文件;(4)从多个版本的关键文件中选择一个或多个文件,作为中心文件;(5)以中心文件所在的时间点为中心,向前向后按照设定的版本数目进行恢复,得到多个版本的中心文件;(6)判断多个版本的中心文件中是否存在最接近文件,若存在,进入步骤(7),若不存在,转入步骤⑷;(7)确定恢复时间点为最接近文件所在的时间点;(8)以恢复时间点为基准对系统进行恢复。进一步的,步骤(6)中如果最接近文件为一个文件,则确定恢复时间点为该文件所在的时间点,如果最接近文件为多个文件,则确定恢复时间点为多个文件中最新的一个文件所在的时间点。进一步的,步骤(6)中所述的最接近文件的内容与设定的文件内容一致,或者所述的最接近文件的属性与设定的文件属性一致。本发明是一种以用户为中心的数据恢复方法,根据对用户恢复行为的研究,发现用户判断系统恢复成功与否,依据的仅是恢复后的系统中的其认为的关键文件内容正确与否。这些关键文件数量是非常少的,往往只有几个。因此,为判断系统是否恢复到一个想要的正确时间并不需要对整个文件系统中的所有文件进行恢复,仅需要对部分用户关心的文件进行恢复,得到多个其过去的版本,帮助用户准确定位恢复点。这样可以减少因恢复时间点定位不准确而对整个系统再次进行恢复的时间。由于预恢复仅恢复用户指定的一个或多个文件过去的部分版本,一改过去对整个文件系统中所有的文件进行恢复然后再判断的方式,可以有效减少因恢复不准确而对整个系统再次进行恢复而浪费的时间。所以,较现有方法,可以有效减少恢复时间。


图1为文件恢复过程的示意图;图2为有两个关键文件的间隔恢复视图;图3为对一个文件的连续恢复视图。
具体实施例方式本发明所述的数据恢复是在已经对数据实现保护的基础之上进行的。可恢复的文件的各种版本均是由保护系统来提供。本发明所述的数据恢复方法不涉及到数据保护的具体实现。在用户的角度上看,他们所关心的数据在计算机内都是以文件的形式组织的,所以用户判断恢复时间点正确与否是看某些用户认定的关键性的文件内容是否正确。本发明在恢复数据时首先提供可恢复的文件分类表,由用户选定一个或多个文件作为判断恢复正确与否的关键性文件。系统依据选定,对这些文件进行第一次预恢复。此次恢复不是恢复它们过去的所有版本,只是对这些文件过去版本的间隔性恢复。不同的文件类型在连续数据保护中的表现是不一样的,有些文件类型的改动少,所以他们的版本少, 用他们来确定精确恢复点则粒度不够。有些文件经常被修改,选择这种文件来确定恢复点这样粒度就会更小且更加精确。用户依据以上预恢复出的文件确定一个或多个中心版本。系统以选定的中心版本为中心,向前向后恢复一定数量的连续的版本。例如,如果用户觉得第5个版本最有可能是他想要的,他就预选定第5个版本。系统以第5个版本为中心,向前恢复出2,3,4三个版本, 向后恢复出6,7,8三个版本。用户再在这些版本中确定一个精确的版本,即与预先设定的内容或属性相一致的最接近的文件版本,以此版本为全系统的恢复点进行全系统的完整恢
Μ. ο如果用户选定的多个关键性文件的最终时间点不一致,以他们中离当前时间最远的那个为准。本发明提供具体恢复步骤由(Cl) (C8)组成(Cl)恢复系统开始工作,分析其中所有可以恢复的文件,并按文件类型分类列出, 这些文件类型可以以打开方式分为音频文件,图片文件,视频文件,文本文件,可执行文件以及压缩包文件等,也可以按照在系统中的读写次数简单地分为普通文件,日志文件,不可读写文件,核心文件等。(C2)用户选定(Cl)中所列出文件的一个或多个作为关键文件,用于确定最终的恢复时间点。由于日志文件记录着每次的操作,粒度最小,一般选用日志文件,用户也可以根据自己的生产环境,选择写次数最多的或生产系统最核心的几个文件作为关键文件。(C3)系统依据(以)中用户的选定,对这些文件按照版本间隔进行恢复,所述的版本间隔可由系统设定。版本间隔由用户在系统配置时确定,并不依赖于特定的系统,其取值可为1 N/2 (N为文件版本总数),若N/2不是整数,则取其整数部分。若一个文件过去有 10个版本,设定其版本间隔为1,则此次恢复可仅恢复这个文件的第1,3,5,7,9五个版本, 即每隔系统总版本数的20%恢复一个版本供用户查看。(C4)将(C3)中恢复出的各个文件按版本的时间顺序列在时间轴上,如图2所示, 在时间轴上的显示可以是按钮形式,也可以是对文件内容的缩略图形式。(C5)用户通过点击(C4)中所列的各个版本,查看文件的内容和属性,确定一个中心版本。(C6)以这个中心版本为中心,向前(过去)向后(将来)连续恢复出多个版本, 连续恢复出的多个版本的版本数目为版本间隔的2倍(不足2倍则取实际最大值),如图3 所示,如果用户以第R个版本为中心版本,版本间隔为1,则系统以第R个版本为中心,向前恢复出R-l、R-2两个版本,向后恢复出R+l、R+2两个版本。(C7)通过对恢复后的各个版本的内容与属性的检索匹配,对比各个版本的内容或属性数据与预先设定的想要恢复的文件内容或属性是否一致,所述属性可以是文件的最后一次读写操作的时间,所述内容可以是用户最近更新的内容,通过对比就可以确定有没有想要的版本,即有没有需要恢复的最接近文件,如果有,进入(C8),如果没有,说明在(C5) 中所确定的中心版本不合适,转入(C5),重新确定一个中心版本。(C8)如果最接近文件只有一个文件,则以此文件所在的时间点为恢复时间点,如果最接近文件有多个文件,以最早的一个文件的时间为恢复时间点。(C9)按(C8)中确定的恢复时间点进行系统恢复。(ClO)恢复结束。本发明不仅局限于上述具体实施方式
,本领域一般技术人员根据本发明公开的内容,可以采用其它多种具体实施方式
实施本发明,因此,凡是采用本发明的设计结构和思路,做一些简单的变化或更改的设计,都落入本发明保护的范围。
权利要求
1.一种数据恢复方法,包括以下步骤(1)列出所有能够恢复的文件;(2)选择一个或多个文件作为关键文件;(3)对关键文件按照设定的时间间隔进行恢复,得到多个版本的关键文件;(4)从多个版本的关键文件中选择一个或多个文件,作为中心文件;(5)以中心文件所在的时间点为中心,向前向后按照设定的版本数目进行恢复,得到多个版本的中心文件;(6)判断多个版本的中心文件中是否存在最接近文件,若存在,进入步骤(7),若不存在,转入步骤⑷;(7)确定恢复时间点为最接近文件所在的时间点;(8)以恢复时间点为基准对系统进行恢复。
2.根据权利要求1所述的数据恢复方法,其特征在于,步骤(6)中如果最接近文件为一个文件,则确定恢复时间点为该文件所在的时间点,如果最接近文件为多个文件,则确定恢复时间点为多个文件中最新的一个文件所在的时间点。
3.根据权利要求1所述的数据恢复方法,其特征在于,步骤(6)中所述的最接近文件的内容与设定的文件内容一致,或者所述的最接近文件的属性与设定的文件属性一致。
全文摘要
本发明提供了一种数据恢复方法,该方法首先对文件进行一次预恢复,即只对文件过去版本的间隔性恢复,用户依据预恢复出的文件确定一个或多个中心版本,系统以选定的中心版本为中心,向前向后恢复一定数量的连续的版本,再在这些版本中确定一个精确的版本,即与预先设定的内容或属性相一致的最接近的文件版本,以此版本为全系统的恢复点进行全系统的完整恢复。该方法能使管理员更快更准确的确定系统恢复时间点,有效的减少系统的恢复时间,提高恢复效率,减少损失。
文档编号G06F11/14GK102193845SQ20111014268
公开日2011年9月21日 申请日期2011年5月30日 优先权日2011年5月30日
发明者叶松, 曹强, 杨靖, 谢长生, 黄建忠 申请人:华中科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1