高效的计算机文件备份系统和方法

文档序号:6426043阅读:118来源:国知局
专利名称:高效的计算机文件备份系统和方法
技术领域
本发明一般地涉及一种用于备份和恢复在计算机系统上的数据文件和程序的方法,更具体来讲,本发明涉及一种高效的方法,用于确定先前是否已经备份了一文件或者程序,或者如果存在该文件的一份备份副本,则然后仅仅备份那些先前没有被备份的、并且没有备份副本的程序。因此,该系统和方法使得能够为本地或者远程备份计算机和/或计算机系统的文件而高效地利用带宽。
传统的用于备份计算机程序和数据文件的方法常常使用大量昂贵的网络带宽和过量的处理器(CPU)处理时间。当前,许多备份过程对计算机或者计算机系统的整个程序和数据储存库进行备份,这引起备份文件和程序的重复,并且要求大量网络带宽和过量的存储介质(例如磁带或者光盘(CD))。
许多组织的网络常常包括数据中心(“服务器群组(server farms)”),用于存储和管理大量的因特网可存取数据。数据中心常常包括几个计算机系统,例如因特网服务器,雇员工作站(employee workstations),文件服务器,等等。常常,这样的数据中心具有使用传统备份系统的可扩缩性问题。所要求的带宽和存储器不足以执行数据中心环境的大规模备份。可扩缩的并且能够随着组织的壮大而发展的系统将是很有益的。
能够通过增量备份方法实现一些带宽和存储介质的节省,该方法仅仅对已经改变的或者已经更新的文件进行备份。然而,这些方法没有解决这样的问题重复在一个网络、乃至不同网络上的不同计算机上驻留的文件,常常仍以重复的形式获得备份,耗尽大量存储介质。
例如,在许多人之间常常共享数据文件,并且重复的副本驻留在许多不同计算机上,这引起跨越一个或者多个计算机网络的、文件的许多多重副本。进一步来讲,计算机常常使用重复的程序和数据文件,用于运行操作系统和应用程序。例如,在运行Microsoft Windows的网络中,每一计算机可能具有重复的操作系统文件和程序。使用传统方法对整个网络进行备份可能导致那些文件和程序的许多多重备份,引起存储介质的过度浪费。除去备份文件和程序的重复的装置将是合乎需要的,可能的好处导致对于存储介质、处理时间和网络带宽的更加高效的利用。
进一步来讲,通过组织实现的传统的备份方法常常使用许多计算机服务器来执行该备份,常常备份到磁带介质,这引起数据备份的分布式存储,此外还在介质和处理器时间两方面都引起重复和浪费。
再进一步来讲,分布式的备份过程通常引起对于存储许多备份磁带、或者其他类似备份介质的需要,并且要求一种追踪多个介质的方法。这样一种系统常常是很难恢复的,特别是如果使用了增量备份过程。正确的存储介质必须被定位,并且必须被以正确的顺序加载。磁带恢复是一种冗长的、费时的过程。常常,恢复过程是如此低效率和易出错,以致它是无效的,导致数据损失甚至生产率的损失,因为必须重新安装程序,并且必须重建数据。引起更加有效的和更容易实现的恢复过程的、更加高效易用的备份系统将有益于使用计算机系统的组织。
本发明涉及在备份技术方面的改进,更具体来讲,本发明创建了一种解决方案,用于在因特网数据中心和企业数据中心环境中进行大规模服务器备份,并结果产生了一种用于灾难恢复和数据保护的解决方案。
本发明是一种使用文件内容的散列密钥的改进系统和方法,用于更加高效的和更加有效备份计算机文件和计算机程序。
该过程中的第一步骤是扫描目标机(待备份的计算机系统)上的文件系统,并且创建散列密钥,为每一个待备份的文件创建一个唯一的数字代码。在优选实施例中,为了减少处理时间,仅仅为具有修改日期属性的、也就是比上次备份更新近的文件创建散列密钥。
作为结果的散列密钥被存储在本地数据库——目标计算机上的数据库——中,例如供在当前、以及将来的备份会话中作进一步的比较。所述本地数据库还包括每一备份文件的完整路径。
对照在本地数据库中的先前的散列密钥项目,对所存储的散列密钥进行校验。以这种方式,所述散列密钥被用于校验每一本地文件,以便确定先前是否在目标系统中对其进行了备份。没有在本地数据库密钥列表中查找到的散列密钥被用于该过程的下一步骤。
对照在中央存储服务器上存储的文件的散列密钥,对没有在本地的散列密钥数据库中查找到的散列密钥进行校验。这一校验用于确定是否已经在中央存储服务器上存在特定文件。该文件可以作为来自另一服务器或者系统的备份、或者来自先前备份操作的结果来存在。
例如,逐文件地、而不是逐块地执行是否进行备份的判定。这强有力地减少了比较次数和本地数据库的尺寸,并且极其适用于群组服务器,在所述群组服务器中,不仅数据块、而且常常是完整的文件在多个服务器之间被重复。
附图的简短说明

图1是显示根据本发明的一方面的备份过程的主要步骤的方框图;图2是显示根据本发明的一方面的备份决策进行过程的方框图;图3是显示依据本发明、用于实现本发明的方法的系统的一种实现方式的方框图;图4是显示本发明的备份子系统的更加详细的实现方式的方框图;传统上,无论是否执行计算机、服务器或者系统的增量或者全部备份,备份解决方案都极大地增加了网络通信量,并且能够使用巨大的存储容量。本发明使用内容散列密钥来做出是否备份某些数据的智能决策,并且使用中央存储器容量来提供更加高效的和更加有效的备份存储和恢复活动。
本发明是一种使用文件内容的散列密钥的系统和方法,用于更加高效的和更加有效的备份计算机文件和计算机程序。在本说明中,术语“文件”、“程序”、“计算机文件”、“计算机程序”、“数据文件”和“数据”是可交换地使用的,并且依据使用的上下文,任何一个的使用都可能暗示了另一个术语。
本发明利用了一种使用散列机制的过程,用于检验一个文件在备份系统中是否是唯一的。仅仅唯一的、并且还未备份的文件才将被存储在中央存储系统上,这在使用网络带宽和存储介质时产生了效率。该过程利用将新创建的内容密钥与所有先前产生的散列密钥(使用本地化的和/或中央化的列表)相匹配、以产生备份判定,产生执行备份的整体分析,并且更加有效地和更少麻烦地完成恢复功能。作为结果的方法通过减少网络通信量和备份文件存储器两方面的重复,具有最小的带宽消耗和最小的存储容量使用。这对于备份操作系统文件和常用的应用程序特别有用。
图1提供了对于依据本发明的备份过程的一种实现方式的方法的概观。由框10示出的该过程中的第一步骤是对目标计算机/系统(待备份的单独计算机或者计算机系统)上的文件系统进行扫描,并且例如如框12所示,以32或者64字节模式创建一个内容散列密钥。所述散列密钥对于每一个待备份文件来讲,是唯一的数字代码。对于每一个唯一的文件来讲,所述散列密钥是唯一的。进一步来讲,对于文件的相同副本来讲,所述散列密钥是相同的。以这种方式,对于该文件和任何相同的复制来讲,所述散列密钥成为一个唯一标识符。因此,如果两个文件具有相同的散列代码,则它们是相同的,并且,能够而且将会被同样地处理。能够使用工业散列过程,MD5。
作为结果的散列密钥被存储在本地数据库404(图3)中,供在当前、以及将来的备份会话中作进一步的比较。这由图1中的框14表示。对应于所述散列密钥的该文件的路径和/或文件名与所述散列密钥一起被存储。
对这一过程的改进可以是将所述散列密钥追加到计算机文件自身。以这种方式,已经进行了散列处理的文件能够被所述散列过程旁路掉,这在计算机处理方面提供了进一步的节省。然而,并不能够对所有的文件进行这样的追加,所以这一改进对于所有计算机文件类型可能是不可行的。
对照本地数据库404中的先前的散列密钥项目,对所存储的散列密钥进行校验,如图1中的框16所示。以这种方式,所述散列密钥被用于校验是否每一本地文件都曾在以前、在目标系统中进行了备份。没有在本地数据库中查找到的散列密钥被用于该过程的下一步骤。因为只有那些没有由于被最近备份、或者至少最近处理过而被记录的文件才需经历进一步的处理。这使得可以有效利用计算机资源。
现在对照中央数据库408中存储的文件,对没有在本地散列密钥数据库中查找到的散列密钥进行校验,如图1中的框18所示。对应于每一散列密钥的文件的路径和/或文件名与存储在本地数据库中的每一散列密钥一起被存储。所述散列密钥被用于确定是否已经在所述中央存储服务器400上存在所述对应的文件,并因此不需要对其进行备份。所述文件可能作为来自不同的目标计算机300乃至不同的目标网络的一次备份而存在。原理是不管有多少不同的目标计算机可能包含该相同,且完全相同的文件,都在中央存储系统内存储每一个唯一文件的单一副本。
如果在中央数据库中不存在与给定的散列密钥的匹配,则该散列密钥被添加到所述中央数据库408,并且将所对应的文件上载(图1中的框20)到所述中央存储系统400(框22),所述中央存储系统400管理所述文件和散列密钥列表。能够由所述服务器保存所述过程的记录(参见日志存档框22a)。如果期望的话,为了安全原因,对待存档的文件进行加密(框24),并且对所述文件进行压缩,以便减少存储介质需求(框28)。举例来说,可以通过使用所述散列密钥产生加密密钥,并通过已知的、但是安全的算法对其进行变换。
最后,接着执行调度过程(图1中的框30)。基于所述散列密钥,所述调度过程将决定所述文件需要被调度到哪一位置中,并且它应该被存储在哪一存储设备(32a,32b,32c,32d…32n)上。所述存储设备可能被集中地放置,以便增加效率,但是本发明也能够使用分布式的、乃至远程放置的设备。散列密钥可被用于将文件调度到存储网络中的不同位置中。
在优选实施例中,使用所述散列密钥作为文件名对所存储的文件进行重命名。这可使文件的检索变得简单、并且更加快速。当恢复的时候,将通过将所述散列密钥与被恢复机器上的文件名和/或文件路径交叉参照,来恢复原始文件名。
图2中的流程图更详细地示出了进行所述文件备份决策过程。通过框100中的步骤示出了本地扫描。在步骤102中扫描文件,并且通过步骤104形成散列密钥。在优选实施例中,仅仅为具有修改或者创建日期属性的、也就是比上次备份日期更新近的文件计算散列密钥。每一散列密钥与本地数据库404中的本地存储的散列密钥列表相比较。本地数据库404为先前已经备份的每一文件包含一个记录,该记录包括散列密钥和该文件的完整路径和名称(步骤106)。那些具有匹配的文件将不被备份(步骤110),而那些具有与本地列表不匹配的散列密钥的文件(步骤106)需要进一步处理(框200中的步骤)。至少对于每一非匹配文件来讲,在本地数据库中存储一个新记录,该新记录包括该散列密钥和该文件的完整路径和名称。用于非匹配文件的散列密钥被收集、以供转发(步骤108),并且被转发出去,以便与中央存储的(中央数据库408)密钥列表相比较(步骤202)。如果密钥与先前中央存储的散列密钥匹配(步骤204),则不备份该文件(步骤210)。然而,只有当没有匹配时(步骤204),才备份该文件。所述散列密钥将被存储在中央数据库408中,并且该文件在被备份或者存档到存储器中之前,可以经受如上所述的处理(即,加密和压缩)。
能够通过保存文件的历史副本、以及散列列表404、408的历史副本实现对上述过程的进一步改进,以致能够将任何单独机器恢复到它在过去某一给定时刻的文件系统状态。显然,实现这一改进需要中央存储系统400中的额外存储介质,以便在适宜的时机保存这些“快照”。对于人们能够倒退存档文件系统多远的的唯一限制是专用于该任务的存储量。因此,如果对于一种具体的实现方式来讲,计算机文件系统的历史快照不是令人想要的,则人们能够通过不实现本发明的这一特征来节省资本费用。
依据系统恢复文件基本上是通过将过程反向来实施的。因为每一目标计算机300或者系统都具有本地数据库404,该本地数据库404包括已处理文件的散列密钥的记录,所以本地数据库上的那些散列密钥可用于将目标计算机300上的需要被恢复的文件标识为该记录中指示的路径。本地数据库的备份副本还应该被存储在不同的机器上、乃至中央地备份,以便可获得散列密钥的列表和对应的路径来重建毁坏机器中的文件系统。
该系统通过恢复在本地计算机的数据库404上列出的每一文件来恢复该毁坏机器的文件系统,存储在中央存储系统400中文件对应于它们的散列密钥。进一步来讲,可在中央存储系统400中存储本地数据库404本身、以便保留计算机文件系统状态记录,或者在该中央存储系统400中备份这一本地数据库。
类似地,如果打算实现这一特征,将计算机系统恢复到先前的历史文件系统状态,则仅仅需要为该时刻获取该本地数据库,然后依据所述历史的本地数据库恢复文件系统文件。能够本地地、中央地、或者最好是同时在两个位置中存储所述历史的本地数据库。
所述散列码本身可用于在备份和恢复过程期间确保文件的完整性。通过对被备份的和/或被恢复的文件运行所述散列过程,产生了可与原始散列码相比较的散列码。如果所述密钥不是完全相同的,则产生文件误差,并且不能保证文件的完整性。如果是完全相同的,则确保了文件的完整性。
图3示出了用于实践依据本发明方法的一种系统的实现方式的可能的高层概观。目标计算机或者目标系统300是待备份的系统。备份代理402能够被运行或许在目标系统上、或者在所述目标系统是它的一个客户端的服务器上。此外,所述备份代理能够远程地被运行。所述备份代理402实现在上文中论及的文件扫描和散列功能。所述备份代理402还使用了包含有用于先前已被备份的每一文件的记录的本地数据库404,并且实现本地的比较操作(图2中的框100),以便确定所述目标300上的文件先前是否已经被备份。
为了更高的效率或者为了避免目标计算机上的消耗,所述备份代理402能够在专用服务器上运行,并为这一功能而进行优化。所述备份代理402也可以包括恢复功能,或者一个单独的模块能够实现所述恢复功能。所述备份代理402和/或所述恢复代理能够使用万维网(web)界面,来允许经由诸如因特网的广域网(WAN),或者在本地经由局域网(LAN)或者其他网络对所述目标系统的文件备份进行远程管理。替换地或者并行地,还可以经由相同的或者类似的web界面对下文中将论及的备份服务器406进行管理。这能够允许所述备份和/或恢复操作被远程控制,而无论可能是从何处提供了对于所述代理402和/或所述服务器406的访问。
利用了中央存储系统400来实现集中式备份功能,包括图2中的框200中的集中式比较操作。尽管是作为集中式系统来描述的,但是将理解的是,针对这种集中式系统描述的所述功能和/或部件远程地被分布或者放置,取决于本发明的期望实现方式。
备份和恢复服务器406被用于指导所述集中式备份操作。所述服务器406从代理402接收表示未在本地密钥列表中列出的文件的散列密钥列表。然后服务器406将所述失配的密钥列表与中央散列密钥数据库408中存储的(先前备份文件的)密钥列表相比较。将理解的是,如果期望的话,这一数据库能够被存储到下文中论及的一个或多个存储设备414里。如果当前在所述中央设备414中没有备份该文件,则将不存在与中央密钥数据库408中包含的散列密钥的匹配。这意味着需要备份对应的文件。在该情况下,所述服务器406从代理402获取对应的文件,或者替换地,所述服务器可以获取所述文件自身,并将其重命名为它的散列密钥,将重命名地文件转发到加密和压缩模块410(如果要求加密和/或压缩),这实现了上述的加密和压缩步骤。将理解的是,如果期望的话,能够在服务器406上,或者通过单独的计算机/服务器运行所述加密和/或压缩模块。
然后,将所述加密和压缩文件转发到到文件调度器412,所述文件调度器412基于所述散列密钥或者关于所述文件应该被存储在哪里的其它指示符,将所述文件引导到适当的存储设备414a、414b……414n。依照希望,这些数据库414n可以被中央地或者分布地放置。
为了恢复唯一的文件,所述目标服务器300从本地数据库(在目标服务器上)、为该文件请求散列密钥,并且使用该名称、从中央存储服务器406检索该文件。
可能的是相对于所述目标系统300,远程地或者在本地放置所述集中式备份系统400。可以由服务供应商使用ASP或者XSP商业模型远程提供所述备份系统400,其中所述中央系统被提供给运行该目标系统300的付费客户端。这样一种系统能够使用诸如因特网之类的公众WAN,以便在中央系统和目标客户端之间提供网络连接性。替换地,专用网(WAN或者LAN,等等)能够连接这两个系统。还可以利用公共网络上的虚拟专用网络(VPN)。此外,客户端可能希望本地地实现这样一种系统,以便确保本地控制和自治,特别是在待存储的信息可能是特别敏感的、有价值的和/或是私人所有的情况下。然而,如果此类考虑不是优先的话,能够将更加成本有效的服务市场化,在这种服务中,由服务供应商提供所述中央系统。在该情况下,因特网连接性可能是合算的,并且如上所述,基于web的管理系统也会是有用的,并且依据本发明被容易地适应。
可能使用自助模型实现利用本发明的系统,这使得客户网络管理员能够备份和恢复客户端系统。在该情况下,网络管理员会经由诸如上述基于web的实现方式之类的界面访问该服务。替换地,可以实现集中管理,来卸载客户端的备份职责。对于IDC服务器群组、以及对于与DataCenter技术的操作系统相结合来讲,这样的系统会是很有用的。此外,所述系统可以利用众多其它开放标准,诸如XML/SOAP,HTTP,和FTP。
图4示出了在图3中给出的系统概述中的备份子系统的更详细的潜在实现方式,其示出了客户端和系统服务器的各种部件。这一附图对应于本发明方法的一种潜在实现方式的更详细的描述(在下文中给出)。
依据所述系统的更详细的潜在实现方式,用户会访问GUI,以便使用附加的进度表配置备份作业。这一备份作业会包含待备份文件/目录、OS具体备份选项和进度表选项的选择。当备份被人工执行、或者被所述进度表引起的时候(I)文件系统扫描产生目标服务器300上现有的、并且将被作为“当前_备份”表存储在本地数据库404中的文件。为这一表中的每一文件,存储所述文件的位置、属性和最后修改时间。
(II)接下来,将所述表“当前_备份”与存储有先前备份历史的、数据库404中的表“先前_备份”相比较。比较结果会是已经改变了最后修改时间的文件。
(III)产生所述改变文件的内容校验和、并将其存储在本地数据库404中的“当前_备份”表中。
(IV)然后对照在中央存储服务器400上的中央数据库408中物理地驻留的、校验和的全局库,校验这些校验和。这一校验的结果集合是遗漏的校验和的列表。
(V)这些遗留的校验和代表需要被传输给中央存储服务器400的文件。具有遗漏的校验和的每一文件将有一个备份过程,所述备份过程包括与存储服务器的数据同步、其内容的物理传输、压缩、加密以及在所述不同阶段期间的完整性校验,以便保证文件的成功接收。
(VI)当已经成功地备份所述文件的时候,所述文件将被标记为在本地数据库404中成功地备份。
(VII)在所述备份过程之后,客户端和存储服务器400之间的数据同步为所有目标服务器(客户端)产生中央备份历史。
基于所述备份历史被存储的不同位置,可以以多种方式执行所述恢复过程。作为默认,从本地数据库404中存储的历史执行恢复。由操作员选择文件的先前备份集合的子集。这一列表为每一文件包含原始位置,内容密钥,和文件属性。基于这一信息,代理可以从库中获得该文件,对该内容进行解压缩和解密,将所述文件恢复到其原始位置,继之以恢复关于所述恢复文件的属性。
恢复文件的第二种方式是从快照文件获得备份历史。这是一个纯文本文件,在备份过程期间被创建,并且包含一个文件列表。在备份期间,紧挨着每一文件的原始位置存储了内容密钥和文件属性。当我们将这样一种文件提供给客户端计算机上的代理的时候,所述代理能够基于上述说明恢复这些文件。
还可以从存储在中央数据库408中的备份历史创建快照文件,其驻留在中央存储服务器400上。
权利要求
1.一种用于判定目标计算机(300)上的特定文件是否应该被备份到中央存储系统(400)的方法,所述方法包括步骤根据所述特定文件的内容计算特定散列密钥;验证所述特定散列密钥是否已经存在于本地数据库(404)中,其中,所述本地数据库为所述目标计算机(300)上的、先前已经被备份的每一计算机文件包括一个记录,所述记录包括根据所述计算机文件计算的文件散列密钥;以及在所述目标计算机中的、所述计算机文件应该被恢复到那里的本地文件路径,所述文件路径与所述文件散列密钥相关联;如果所述特定散列密钥没有存在于所述本地数据库中,则通过执行以下步骤对所述特定文件进行备份A.创建备份文件,所述备份文件是所述特定文件的复制;B.将所述备份文件重命名为所述特定散列密钥;C.将所述重命名的备份文件存储在所述中央存储系统(400)中;以及D.在所述本地数据库(404)中存储一个新记录,该新记录包括所述特定散列密钥和在所述目标计算机(300)中的、所述特定文件应该被恢复到那里的特定路径;以及如果所述特定散列密钥存在于所述本地数据库(404)中,则不将所述特定文件备份到所述中央存储系统(400)中。
2.如权利要求1所述的方法,进一步包括步骤验证所述特定散列密钥是否已经存在于根据已经被备份在所述中央存储系统(400)中的计算机文件所导出的文件散列密钥的至少一个中央数据库(408)中;以及当且仅当所述特定散列密钥没有存在于所述中央存储系统(400)的所述至少一个中央数据库(408)中,才对所述特定文件进行备份。
3.如权利要求2所述的方法,其中所述目标计算机(300)与LAN连接,并且进一步来讲,其中所述中央存储系统(400)通过WAN与所述LAN连接。
4.如权利要求1至3之一所述的方法,其中多个目标计算机(300)与所述中央存储系统(400)连接,并且进一步来讲,其中如果作为从任一目标计算机进行的一次备份的结果,所述特定文件已经存在于所述中央存储系统中,则不备份所述特定文件。
5.如权利要求4所述的方法,其中所述重命名的备份文件在所述中央存储系统(400)中的位置取决于所述特定散列密钥。
6.如权利要求5所述的方法,其中所述中央存储系统包括多个存储设备(414a,414b,414n)。
7.一种用于将特定文件恢复到目标计算机(300)的方法,所述方法包括步骤从为每一已备份的计算机文件存储一个先前计算的散列密钥的本地数据库(404)中请求对应于所述特定文件的特定散列密钥;从所述本地数据库(404)请求与所述特定散列密钥相关联的特定路径位置;使用所述特定散列密钥从中央存储服务器(400)中检索备份文件,所述备份文件是所述特定文件的复制;以及将所述备份文件保存到所述目标计算机(300)上的所述特定路径位置。
8.如权利要求7所述的方法,其中在所述中央存储服务器中已经存储了所述备份文件的位置取决于所述散列密钥。
9.如权利要求8所述的方法,其中所述备份文件已经在所述中央存储服务器中被存储在其下的名称取决于所述散列密钥。
10.一种用于备份目标计算机(300)上的特定文件的系统,包括用于根据所述特定文件的内容计算特定散列密钥的装置;用于验证所述特定散列密钥是否已经存在于本地数据库(404)中的装置,其中,所述本地数据库为所述目标计算机(300)上的、先前已经被备份的每一计算机文件包括一个记录,所述记录包括根据所述计算机文件计算的文件散列密钥;以及在所述目标计算机中的、所述计算机文件应该被恢复到那里的本地文件路径,所述文件路径与所述文件散列密钥相关联;用于在所述特定散列密钥没有存在于所述本地数据库中的情况下对所述特定文件进行备份的装置,所述备份包括以下步骤A.创建备份文件,所述备份文件是所述特定文件的复制;B.将所述备份文件重命名为所述特定散列密钥;C.将所述重命名的备份文件存储在所述中央存储系统(400)中;以及D.在所述本地数据库(404)中存储一个新记录,该新记录包括所述特定散列密钥和在所述目标服务器中的、所述特定文件应该被恢复到那里的特定路径;其中,如果所述特定散列密钥存在于所述本地数据库(404)中,则不备份所述特定文件。
11.如权利要求10所述的系统,是一个中央存储系统,并且进一步包括用于验证所述特定散列密钥是否已经存在于所述中央存储系统(400)的至少一个中央数据库(408)中的装置,所述中央数据库(408)包括根据已经被备份在所述中央存储系统中的计算机文件所导出的文件散列密钥,其中仅当所述特定散列密钥没有存在于所述至少一个中央数据库中时,才执行所述用于备份的装置。
12.如权利要求11所述的系统,其特征在于所述目标计算机与LAN连接,并且进一步来讲,其中所述中央存储系统通过WAN与所述LAN连接。
13.如权利要求10至12之一所述的中央存储系统,其中多个目标计算机与所述中央存储系统连接,并且进一步来讲,其中如果作为从任一目标计算机进行的一次备份的结果,所述特定文件已经存在于所述中央存储系统中,则不备份所述特定文件。
14.如权利要求13所述的中央存储系统,其中所述重命名的备份文件在所述中央存储系统(400)中的位置取决于所述特定散列密钥。
15.如权利要求10至12之一所述的中央存储系统,进一步包括用于将所述特定文件从所述中央存储系统(400)恢复到所述目标计算机(300)的装置,包括用于从所述中央数据库请求对应于所述特定文件的特定散列密钥的装置;用于从所述本地数据库和所述中央数据库之一请求与所述特定散列密钥相关联的特定路径位置的装置;用于使用所述特定散列密钥从所述系统检索所述备份文件的装置;以及用于将在所述目标计算机上的所述备份文件保存到所述特定路径位置的装置。
16.如权利要求15所述的系统,其中在所述备份期间,如果所述特定散列密钥没有存在于所述本地数据库(404)中,则在将所述备份文件存储到所述中央存储系统中之前,将所述备份文件重命名为所述特定散列密钥,并且进一步来讲,其中在所述恢复期间,在将所述备份文件保存到所述目标计算机之前,将所述备份文件重命名为所述特定文件的名称。
17.一种存储在计算机可用介质上的计算机程序产品,包括计算机可读程序装置,用于令所述计算机执行权利要求1至9之一中的步骤。
全文摘要
一种用于高效地把计算机文件备份和恢复到中央存储系统的系统和方法。为要备份到目标计算机上的每一文件计算散列密钥。该散列密钥与本地存储的散列密钥列表相比较,看看先前是否已经备份了该本地文件。如果没有在本地列出该散列密钥,则将该散列密钥与中央备份文件的散列密钥列表相比较。只有当在本地和中央列表中不存在该散列密钥时,才对该文件进行备份。为了进一步的效率,可以根据文件的散列密钥对备份文件进行重命名。
文档编号G06F12/00GK1543617SQ02816197
公开日2004年11月3日 申请日期2002年3月8日 优先权日2001年8月20日
发明者K·德斯皮格莱尔, K 德斯皮格莱尔 申请人:信息中心科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1