计算环境中按优先顺序排列要备份的数据项的方法和系统的制作方法

文档序号:6434581阅读:154来源:国知局
专利名称:计算环境中按优先顺序排列要备份的数据项的方法和系统的制作方法
技术领域
本发明涉及能够执行备份操作的计算环境。
背景技术
所有计算机通常都执行诸如读写操作之类的数据操作。此外,数据操作可以被组合以执行诸如数据备份之类的专门数据操作。具体地说,持续数据保护(CDP)指通过立即自动保存对数据所做的每一更改的副本来备份计算机数据,而不是安排定期备份。安装诸如⑶P之类的备份产品时,将执行完全备份。一旦完成完全备份,⑶P产品就执行对数据所做的任何增量更改的备份。通常,备份产品同时部署到企业内的大量用户以及企业内共享同一备份目标存储位置的所有用户。因此,在完全备份过程中,网络可能变得过载。当网络变得过载时,完全备份过程会延长一段时间(例如,数周)才能完成。对企业最重要的数据通常是最近被存取和/或更改的数据。因此,在完全备份过程中,只有在漫长的完全备份过程完成之后,才会备份对这些最重要数据所做的任何更改。

发明内容
描述了在计算环境中按优先顺序排列要备份的数据项的本发明的实施例。所述计算环境包括多个客户机,所述客户机通过网络与备份系统耦合以备份客户机上本地存储的项。每个客户机均包括持续数据保护(CDP)模块,所述CDP模块根据策略按优先顺序排列传输到备份系统以存储在一个或多个存储设备上的文件的顺序。所述CDP模块构建初始备份列表和CDP备份列表。所述初始备份列表包括任何满足初始备份简档的准则的项。所述 CDP备份列表包括自初始备份过程开始以来已被修改的项。对用户最重要的数据通常是最近修改的数据。因此,所述CDP模块对CDP备份列表上的项优先执行备份。例如,用于在具有至少一个与备份系统相连的客户机的计算环境中按优先顺序排列备份过程的计算机实现的方法的一个实施例包括在执行第一客户机的初始备份列表的初始备份过程期间,判定所述第一客户机的持续数据保护(CDP)列表是否包括至少一个要备份的CDP项,其中所述初始备份列表包括至少一个初始备份项。所述方法在判定持续数据保护(CDP)列表包括至少一个要备份的CDP项的情况下,使所述初始备份列表的所述初始备份过程节流并执行所述CDP列表上的所述至少一个CDP项的备份。使所述初始备份过程节流包括暂停所述初始备份过程或使所述初始备份过程减慢到预定(preliminary)备份速度以下。在一个实施例中,所述初始备份项和所述CDP项为文件。所述方法还在判定所述第一客户机的所述CDP列表不包括至少一个要备份的CDP 项的情况下,恢复所述第一客户机中包括至少一个初始备份项的所述初始备份列表的所述初始备份过程的执行。此外,所述方法将所述初始备份项的备份系统时间戳与所述初始备份项的客户机时间戳相比较以及仅当所述客户机时间戳比所述备份系统时间戳的时间更近时,才将要备份的所述初始备份项传输到所述备份系统。在一个实施例中,所述CDP备份列表包括多个CDP项。根据策略对所述CDP备份列表上的所述多个CDP项进行排序,以便根据所述排序优先备份所述CDP项。进而,所述策略可以要求根据所述CDP项的最后修改时间对所述CDP备份列表上的所述CDP项进行排序, 以便首先备份最近修改的CDP项。此外,所述策略可以要求对所述CDP备份列表上的所述 CDP项进行排序,以便在先前未被去重复的CDP项之前备份先前已被去重复的CDP项。在一个实施例中,所述初始备份列表包括多个初始备份项。对所述初始备份列表上的所述多个初始备份项进行排序。在一个实施例中,所述初始备份项的顺序基于策略,以便在先前未被去重复的初始备份项之前备份先前已被去重复的初始备份项。最后,在一个实施例中,所述方法包括判定备份系统的处理器利用率是否小于处理器利用率阈值以及判定客户机和所述备份系统之间的网络利用率是否大于网络利用率阈值,在该实施例中,如果判定所述备份系统的处理器利用率小于所述处理器利用率阈值以及所述客户机和所述备份系统之间的网络利用率大于所述网络利用率阈值,则对所选择的项执行压缩。在包括内含计算机可读程序的计算机可用介质的计算机程序产品的一个实施例中,所述计算机可读程序当在计算机上执行时,将导致所述计算机执行包括至少一个初始备份文件的初始备份列表的初始备份过程。所述计算机还被导致在执行所述初始备份列表的所述初始备份过程期间,判定CDP列表是否包括至少一个要备份的CDP项。如果判定所述CDP列表包括至少一个要备份的CDP项,则所述计算机还被导致使所述初始备份列表的所述初始备份过程节流。在计算环境的另一实施例中,所述环境包括与处理器耦合的存储器。所述存储器包括由所述处理器实现以在执行包括至少一个初始备份的初始备份列表的初始备份过程期间,判定持续数据保护(⑶P)列表是否包括至少一个要备份的⑶P文件的指令。此外,所述处理器响应于判定CDP列表包括至少一个要备份的CDP文件,使包括至少一个初始备份文件的所述初始备份列表的所述初始备份过程节流并执行所述CDP列表上的所述至少一个⑶P文件的备份。


通过参考在下面提供的附图中的图形可以理解本发明的各实施例,这些附图是图1示出根据本发明的一个实施例的执行数据操作的计算环境;图2示出根据本发明的一个实施例的计算环境中的客户机的详细视图;图3是根据本发明的一个实施例的用于构建初始备份列表的操作的流程图;图4是根据本发明的一个实施例的用于构建CDP列表的操作的流程图;图5A是示出根据本发明的一个实施例的备份过程的一部分的流程图;图5B是示出根据本发明的一个实施例的备份过程的一部分的流程图;图6A是示出根据本发明的一个实施例的计算环境的执行的示意图;图6B是根据本发明的一个实施例的备份过程的示例性时间线;以及图7示出可以根据特定实施例使用的计算系统。根据一个或多个实施例,在不同的图形中,相同标号所指示的本发明的特征、元素和方面表示相同的、等价的或类似的特征、元素或方面。
具体实施例方式描述了在计算环境中按优先顺序排列要备份的数据项的本发明的实施例。计算环境包括多个客户机,所述客户机通过网络与备份系统耦合以备份客户机上本地存储的项。 每个客户机包括持续数据保护(CDP)模块,所述CDP模块根据策略按优先顺序排列传输到备份系统以存储在一个或多个存储设备上的文件的顺序。所述CDP模块构建初始备份列表和CDP备份列表。所述初始备份列表包括任何满足初始备份简档的准则的项。所述CDP备份列表包括自初始备份过程开始以来已修改的项。对用户最重要的数据通常是最近修改的数据。因此,所述CDP模块对CDP备份列表上的项优先执行备份。此外,所述CDP模块根据策略对所述初始备份列表进行排序。例如,所述CDP模块备份所述初始备份列表,使得具有最近访问的初始备份项的项目被首先备份。在一个其他实施例中,所述CDP模块优先备份所述初始备份列表上已被去重复的项。此外,所述CDP模块根据策略对所述CDP备份列表进行排序。例如,所述CDP模块备份所述CDP备份列表,使得具有最近修改的CDP备份项的项目被首先备份。在一个其他实施例中,所述CDP模块优先备份所述CDP备份列表上已被去重复的项。但是,对于本领域的技术人员将显而易见的是,本发明的各实施例可以在没有上述部分或全部特定细节的情况下实现。在其他实例中,未详细描述公知的过程操作以防止模糊此处描述的本发明的各实施例。根据一个实施例,图1是示出执行诸如读取操作、写入操作、备份操作之类的数据操作的计算环境10的示意图。计算环境10包括诸如备份系统110和客户机120a、 120b. . . 120η之类的计算系统。备份系统110和客户机120a、120b. .. 120η通过网络150相互通信。在一个实施例中,例如,备份系统110可以是文件服务器、IBM TiVOli Storage Manager(TSM)服务器、Web应用服务器或网络连接存储(NAQ。备份系统110还可以是存储区域网络(SAN)网络的一部分。备份系统110可以包括能够执行程序代码的处理器102。每个客户机120a、120b. · · 120η可以分别包括本地存储设备140a、140b. · · 140η。 在实际中,本地存储设备140可以是磁盘驱动器或诸如闪存之类的固态存储设备。此外,每个客户机120a、120b. · · 120η可以分别包括持续数据保护(CDP)模块130a、130b. · · 130η。 应理解,⑶P模块130a、130b. . . 130η可以是使用此处所述的发明概念实现数据备份的软件模块、固件模块或软件/固件模块组合。应该理解,所述计算系统(多个)可以是任何能够处理数据的设备,例如服务器、 大型机、个人计算机、膝上型计算机或包括智能手机等的移动设备。本领域的技术人员应该理解,所述计算系统可以包括其他组件,例如至少一个由操作系统管理的处理器、存储器、 网络适配器和天线。此外,所述计算设备可包括允许用户输入的用户接口,例如键盘、触摸屏或指点设备。最后,所述计算设备可包括显示图形用户接口(⑶I)或诸如命令行接口(CLI)之类的基于文本的接口的用户可视屏幕。存在许多管理所述计算系统的组件的通用或专用操作系统,例如Limix或其他 Unix类操作系统以及Microsoft Windows式操作系统。操作系统可以使用“文件系统”组织数据,所述“文件系统”为文件的数据存储库。在一个实施例中,如图1所示,诸如存储阵列之类的存储设备可包括盘阵列160a/160b、磁带阵列160c和固态设备阵列160d,可以在廉价/独立磁盘冗余阵列(RAID) 级别下组织这些阵列。盘阵列160a可包括磁盘170,盘阵列160b可包括光盘175。相比之下,磁带阵列160c可包括磁带180,固态设备阵列160d可包括固态设备(SSD) 190。应理解, 可以在单个阵列上组合磁盘、光盘、磁带以及SSD。网络150可包括任何数量的交换机、路由器和其他在计算环境10的计算系统之间提供数据传输服务的专用网络计算设备。因此,备份系统Iio可以与客户机120a、 120b. . . 120η进行双向数据通信。具体地说,客户机120a、120b. . . 120η可通过在网络150 上交换数据分组来请求备份系统110的服务。客户机120a、120b. . . 120η可以使用基于文件的访问协议或基于块的访问协议发出数据分组。这些协议为公共协议且包括通用网际文件系统OHFS)协议、网络文件系统(NFS)协议、传输控制协议/网际协议(TCP/IP)、通过 TCP封装的小型计算机系统接口(SCSI)协议(iSCSI)以及通过光纤通道封装的SCSI协议 (FCP)。应该理解,任何计算系统都可以以此方式与计算环境10的任何其他计算系统进行
ififn。作为执行数据备份操作的另一实例,来自客户机120a、120b. . . 120η的源信息可以由备份系统110进行组织以在备份系统110可访问的一个或多个存储设备160a、160b、 160c和160d上存储备份。为了使能在存储设备160a、160b、160c和/或160d上存储数据, 备份系统110可以将物理存储设备的逻辑表示作为“卷”提供给客户机120a、120b. . . 120η。 卷(或数据存储库)表示物理盘、磁带或SSD的任何逻辑组合并可由备份系统110选择以便存储备份数据。通过在诸如图1中所示的计算环境10上使能数据操作,计算环境10可以是分布式存储管理系统。应理解,此处为了简洁并且在不进一步限制本发明的情况下,客户机120a、 120b... 120η可以与客户机120互换地使用。类似地,持续数据保护(⑶P)模块130a、 130b... 130η将与持续数据保护(⑶P)模块130互换地使用。此外,本地存储设备140a、 140b. . . 140η将与本地存储设备140互换地使用。最后,存储设备160a、160b、160c和160d 可以与存储设备160互换地使用。图2示出根据本发明的一个实施例的示例性客户机120。如上所述,客户机120包括⑶P模块130和本地存储设备140。⑶P模块包括初始备份列表构建模块210、⑶P备份列表构建模块220、节流模块230、在下文中被称为策略的CDP策略M0、初始备份列表250 以及CDP备份列表沈0。策略240例如可以由用户、信息技术(IT)管理员或其他管理员创建,或者备选地,它可以由制造商预先配置。⑶P模块130将本地存储设备140上存储的项传输到备份系统110。备份系统110 接收传输的项并将项存储在一个或多个存储设备160上。初始备份列表构建模块210构建根据策略240要在初始备份过程中进行备份的所有项的列表(初始备份列表250),如下面参考图3所述。类似地,CDP备份列表构建模块220构建在初始备份过程中被修改的项的列表(CDP备份列表沈0),如下面参考图4所述。如上所述,对用户最重要的数据通常是最近被修改的数据。因此,⑶P模块130优先对⑶P备份列表260上的项执行备份。节流模块230使初始备份列表250的处理节流,以便可以优先备份CDP备份列表沈0,如下面参考图5A和5B所述。图3是用于创建⑶P模块130的初始备份列表250的操作的流程图。在步骤320,初始备份构建模块210获取客户机120的初始备份简档。所述初始备份简档包括一系列确定应备份本地存储设备140中的哪些项的准则。在一个实施例中,要备份的项是文件。在一个实施例中,策略240包括初始备份简档。可以使用配置程序或向导创建初始备份简档。 备选地,可以按照上述创建策略MO的方式创建初始备份简档。在一个实例中,用户可能希望备份诸如电子邮件文件夹或“我的文档”文件夹之类的特定文件夹或子文件夹中的任何项。因此,在该实例中,用户将添加所有电子邮件文件夹和“我的文档”文件夹作为在初始备份简档中备份的准则的一部分。本领域的技术人员将理解,可以使用备选准则或附加准则创建初始备份简档。例如,附加准则可以包括文件创建日期、最后访问日期或文件大小。一旦初始备份列表构建模块210获取了客户机120的初始备份简档,过程便流向步骤330。在步骤330,初始备份构建模块210根据初始备份简档扫描本地存储设备140上存储的本地项。例如,初始备份构建模块210扫描本地存储设备140上存储的每个本地项, 并将每个项与策略240的初始备份简档中的准则相比较。在一个实施例中,例如,如果用户将初始备份简档中的准则配置为备份电子邮件文件夹中的任何文件,则初始备份构建模块 210将扫描本地存储设备140上存储的每个本地文件并判断文件是否满足位于电子邮件文件夹中的准则。在步骤340,初始备份列表构建模块210使用扫描结果填充初始备份列表250。如果项满足初始备份简档的准则,则初始备份构建模块210将该项添加到初始备份列表250。 本领域的技术人员将理解,初始备份列表构建模块210可以根据初始备份简档在所有本地项扫描完成时填充初始备份列表250,或者备选地,初始备份列表构建模块210可以在遇到符合初始备份简档的项时“在运行中(on the fly)”填充初始备份列表250。构建初始备份列表250的过程在步骤340之后停止。可以根据策略240以任意数量的方式排序初始备份列表250上的项。例如,可以使用散列表或树结构或本领域中公知的任何其他数据结构来排序初始备份列表250上的项。 在一个实施例中,初始备份列表250上的项的顺序可以为步骤330中执行的系统扫描中发现项的顺序。在其他实施例中,可以按照创建初始备份简档时输入的准则排序初始备份列表250上的项。例如,用户可能希望根据项或文件的大小、项的最后修改日期或项文件夹类型等对列表进行排序。在另一实施例中,初始备份列表250可以根据项的最后访问日期进行排序,以便首先列出具有最近访问日期的项。因此,CDP模块130优先地对初始备份列表 250上最近访问的项执行备份,然后再对访问时间较早的项执行备份。如上所述,对用户最重要的数据通常是最近修改和/或访问的数据。因此,⑶P模块130确保优先备份对用户最重要的数据。在一个实施例中,初始备份列表250可以由初始备份列表构建模块210 —次构建以确保完全备份所有初始备份项。在再一实施例中,可以多次构建初始备份列表250。例如,可以修改策略MO的初始备份简档的准则,以便将附加项包括在初始备份列表250中。 因此,在一个实施例中,根据需要重复图3中所述的构建初始备份列表250的步骤,从而反映对策略MO的更改。图4是用于创建⑶P备份列表沈0的操作的流程图。在步骤420,⑶P模块130获取一个或多个项被修改的通知。作为响应,CDP备份列表构建模块220使用一个或多个修改后的项填充CDP备份列表沈0。可以根据策略MO以任意数量的方式排序CDP备份列表 260上的项。例如,可以使用散列表或树结构或本领域中公知的任何其他数据结构排序CDP 备份列表260上的项。在一个实施例中,可以设置策略M0,使得CDP备份列表260上的项按照它们的最后修改顺序排序。例如,在一个实施例中,可以根据策略240排序CDP备份列表260上的项,以便最近修改的项首先出现在⑶P备份列表260上。图5A是根据本发明的一个实施例的用于对客户机120的本地存储设备140上存储的项执行部分备份过程的流程图。在步骤504,CDP模块130判定CDP备份列表是否为空(即,⑶P备份列表不包括至少一个⑶P项)。如果⑶P备份列表沈0为空,则⑶P模块 130在步骤506以预定备份速度处理初始备份列表250。所述预定备份速度部分地基于网络150的带宽和处理器102的处理速度。下面参考图5B进一步描述处理初始备份列表250 的操作。如果⑶P备份列表包括至少一个要备份的⑶P项,则过程流向步骤508。在步骤 508,如果初始备份过程已发生,则CDP模块130的节流模块230使初始备份过程节流。在一个实施例中,使初始备份过程节流包括使初始备份列表250的处理减慢到预定备份速度以下。使初始备份过程节流允许使用多数备份资源(例如,网络150的带宽和处理器102的利用率)处理⑶P备份列表沈0。在另一实施例中,使初始备份过程节流包括暂停初始备份列表250的处理,以便资源可专用于备份CDP备份列表沈0。因此,在上述两个实施例中,⑶P模块130优先地对⑶P备份列表260上的项执行备份。一旦节流模块 230使初始备份过程节流,⑶P模块130就在步骤510处理⑶P备份列表沈0。在节流包括减慢初始备份列表250的处理的实施例中,CDP模块130同时处理CDP备份列表260和初始备份列表250。但是在该实施例中,CDP模块130通过使用多数备份资源处理CDP备份列表260而优先处理⑶P备份列表沈0。⑶P模块130通过在网络150上将⑶P备份列表260上的第一个项传输到备份系统Iio来处理⑶P备份列表沈0。备份系统110接收⑶P备份列表260上的第一个项的传输并将该第一个项存储在一个或多个存储设备160中。如上参考图4所述,可以根据策略MO以任意数量的方式排序⑶P备份列表沈0。 因此,在一个实施例中,这样排序CDP备份列表沈0,使得最近修改的项首先出现在CDP备份列表沈0中。因此,⑶P模块130通过网络150将最近修改的项传输到备份系统110以存储在一个或多个存储设备160中。如上所述,通常最重要的数据是最近修改的数据。因此, 通过这种方式,CDP模块130确保首先备份最近修改的,因此也就是最重要的数据。在步骤512,⑶P模块130从备份系统110接收与步骤510中传输的⑶P备份列表 260上的项的备份有关的确认。在步骤514,CDP模块130根据步骤512中传输的确认判定备份过程是否已成功完成。例如,所述CDP模块可以接收包含0 (指示成功执行备份,即,没有任何错误)的返回码。另一方面,所述返回码可以包括错误码,指示未成功执行备份。如果CDP模块130在步骤514判定未成功完成备份过程,则过程流向步骤516。在步骤516, CDP模块130将步骤510中传输的项再次传输到备份系统110,然后过程流回步骤512。另一方面,如果CDP模块130在步骤514判定成功完成备份过程,则过程流向步骤518。在步骤518,⑶P模块130判定⑶P备份列表260是否为空,如果⑶P模块130判定⑶P备份列表260不为空(即,⑶P备份列表包括至少一个要备份的⑶P项),则过程返回步骤510。在步骤510,⑶P模块130通过如上所述传输列表中要备份的下一项来继续处理⑶P备份列表沈0。另一方面,如果⑶P模块130判定⑶P备份列表260为空,则过程流向步骤506。在步骤506,⑶P模块130处理初始备份列表250。在一个实施例中,处理初始备份列表250包括以预定备份速度开始处理或恢复处理初始备份列表250。图5B是步骤506的处理初始备份列表250的操作的流程图。处理初始备份列表 250的过程从步骤522开始。在步骤522,⑶P模块130从初始备份列表250选择下一项。在步骤524,CDP模块从备份系统110获取选定项的时间戳(即,备份系统时间戳)。在步骤526,CDP模块130从客户机120获取选定项的时间戳(即,客户机时间戳)。 项的备份系统时间戳指示在备份系统110中最近保存该项的时间和日期。类似地,项的客户机时间戳指示在客户机120中最近保存该项的时间和日期。在步骤528,CDP模块130将来自备份系统110的时间戳与来自客户机120的时间戳相比较。如果来自客户机120的项的时间戳更近,则来自备份系统110的项的时间戳指示备份系统110没有该项的最新版本。 因此,该项应被传输到备份系统110以备份在一个或多个存储设备160上。另一方面,如果来自备份系统110的项的时间戳比来自客户机120的项的时间戳更近或这两个时间戳的时间和日期相同,则表明备份系统110具有该项的最新版本。因此,该项无需被传输到备份系统110进行备份。此外,在某些尚未在备份系统110中保存项的情况下,备份系统110将没有时间戳。如果备份系统110没有时间戳,则表明备份系统110没有该项的最新版本。因此,该项应被传输到备份系统110以在一个或多个存储设备160上备份。因此,在步骤528,如果⑶P模块130判定客户机时间戳比备份系统时间戳更近,则过程流向步骤530。备选地,在尚未在备份系统110中保存项并且没有在步骤5 的比较中使用的备份系统时间戳的情况下,过程流向步骤530。在步骤530,所述项通过网络150传输到备份系统110。备份系统110接收传输的项,并且作为响应,将所述项存储在一个或多个存储设备160上。如以上参考图3所述,可以根据策略MO以任意数量的方式排序初始备份列表 250。在一个实施例中,这样排序初始备份列表250,使得最近访问的项首先出现在初始备份列表250中。因此,⑶P模块130通过网络150将最近访问的项传输到备份系统110以存储在一个或多个存储设备160上。如上所述,通常最重要的数据是最近访问的数据。因此, 通过这种方式,CDP模块130确保首先备份初始备份列表250上最近访问的数据,并且因而首先备份初始备份列表上最重要的数据。尽管未示出,但是步骤530中所示的备份过程也可以包含与针对图5A的⑶P备份列表备份所述的步骤(例如,步骤512、513和516)类似的一个或多个确认步骤。具体地说, 步骤530可包括附加步骤,以便当初始备份列表250上传输的项的备份未成功完成时,该项将被再次传输进行备份,直到备份成功完成为止。一旦项被成功地传输到备份系统进行备份,过程便流向步骤532。返回步骤528,如果CDP模块判定客户机时间戳没有备份系统时间戳近,则过程流向步骤532。在步骤532,⑶P模块130判定⑶P备份列表是否为空。如果⑶P模块130判定CDP备份列表260不为空,则过程流向步骤534。步骤534使过程返回步骤508。在步骤 508,CDP模块130的节流模块230使初始备份过程节流。如上所述,在一个实施例中,使初始备份过程节流包括使初始备份列表250的处理减慢到预定备份速度以下。在另一实施例中,使初始备份过程节流包括暂停初始备份列表250的处理。因此,CDP模块130不选择初始备份列表250中的下一项,而是执行CDP备份列表沈0中的下一项的备份。一旦节流模块230使初始备份过程节流,CDP模块130便如上所述通过传输CDP备份列表260中的下一项进行备份来处理CDP备份列表沈0。另一方面,如果CDP模块130判定CDP备份列表260 为空,则过程流向步骤536。在步骤536,⑶P模块130继续移至初始备份列表250中的下一项,直到节流模块230使初始备份过程节流为止。如上所述,一旦选择初始备份列表250 中的下一项,过程便流向步骤524。在一些实施例中,在将数据传输到其存储位置之前处理数据。数据压缩和数据去重复是可用于减少诸如存储空间和传输带宽之类的昂贵资源消耗的数据管理技术。数据压缩是使用比未编码表示所用的位数更少的位对信息进行编码的过程。数据去重复通常指从数据对象去除冗余的子文件(例如,块、组块(chunk)或区块(extent))。数据压缩和数据去重复在下文中将分别简称为去重复和压缩。在一个附加实施例中,计算环境10执行诸如压缩之类的附加数据操作。因此,图 3、4、5A和5B的备份过程可以被进一步修改以产生额外效率。本领域的技术人员将理解,压缩是处理器密集型数据操作。因此,当备份系统的处理器利用率较低时在备份系统110处执行压缩是有利的,以免使备份系统110的处理器102进一步过载。此外,⑶P模块130可以被同时部署到计算环境10内的多个客户机120a、 120b. · · 120η以及计算环境10内共享同一备份系统110的所有客户机120a、120b. · · 120η。 因此,大量客户机120a、120b. . . 120与备份系统110之间的网络150可能在备份过程中变得过载。进而,如上所述,客户机120a、120b...l20n可能全部同时执行备份。因此,网络 150的网络利用率会变得非常高并造成备份过程的瓶颈。因此,在这些高网络利用率期间, 对要备份的选定项执行压缩是有利的。相应地,在一个附加实施例中,⑶P模块130判定处理器利用率是否较低以及网络 150的网络利用率是否较高,以便在处理CDP备份列表260和初始备份列表250时提高效率。返回图5A,其中⑶P模块处理⑶P备份列表,并且可以实现附加实施例以在⑶P备份列表沈0的备份过程中产生效率。具体地说,在步骤510,当选择要备份的下一项时,CDP 模块130判定备份系统110中的处理器102的处理器利用率是否低于处理器利用率阈值。 处理器利用率是备份系统处理器完整容量的百分比的度量。可以预先定义处理器利用率阈值。在一个实施例中,处理器利用率阈值可以是备份系统处理器完整容量的50-75%。在一个实施例中,策略240包括处理器利用率阈值。如果处理器利用率不低于处理器利用率阈值,则过程流向以上参考图5A所述的步骤510。但是,如果处理器利用率阈值低于处理器利用率,则⑶P模块130判定备份系统 110和客户机120之间的网络利用率是否大于网络利用率阈值。网络利用率是备份系统110 和客户机120之间的网络150的完整容量的百分比的度量。可以预先定义网络利用率阈值。 在一个实施例中,网络利用率阈值可以是网络完整容量的50-75%。在一个实施例中,策略 240包括网络利用率阈值。如果网络利用率不大于网络利用率阈值,则过程流向以上所述的步骤510。但是,如果网络利用率大于网络利用率阈值,则备份系统110对要备份的选定项执行压缩。一旦执行压缩,过程便流向以上所述的步骤510。
类似地,返回图5B,其中⑶P模块130处理初始备份列表250,可以实现附加实施例以在初始备份列表250的备份过程中产生效率。具体地说,在步骤528,当判定客户机时间戳比备份系统时间戳更近时,或者备选地,在备份系统110中没有所述项的时间戳时, ⑶P模块130判定备份系统110的处理器102的处理器利用率是否低于处理器利用率阈值。 如果处理器利用率不低于处理器利用率阈值,则过程流向以上参考图5B所述的步骤530。但是,如果处理器利用率阈值低于处理器利用率,则CDP模块130判定备份系统 110和客户机120之间的网络利用率是否大于网络利用率阈值。如果网络利用率不大于网络利用率阈值,则过程流向以上所述的步骤530。但是,如果网络利用率大于网络利用率阈值,则备份系统110对要备份的选定项执行压缩。一旦执行压缩,过程便流向以上所述的步骤 530。在一个实施例中,计算环境10执行诸如去重复之类的附加数据操作。相应地,图 3、4、5A和5B的备份过程可以进一步被修改以产生额外效率。更具体地说,在一个实施例中,⑶P模块130包括确保客户机120上的选定数据被去重复的源侧去重复。在该实施例中,为了执行去重复,⑶P模块130将数据组织成组块(chunk)或块(block)并比较数据组块以检测重复。如果检测到重复的组块或块,则使用指向数据的唯一副本的链接、引用或指针替换重复的组块。如果稍后修改重复的组块之一,则仅创建更改后的块的备份并将其存储在一个或多个存储设备160中。返回图3的步骤330,在一个实施例中,除了初始备份构建模块210根据初始备份简档扫描本地存储设备140上存储的本地项以外,初始备份构建模块210还扫描本地存储设备140上存储的项以判定项的块或组块是否已在备份系统110上被去重复。在一个实施例中,如果判定项的块或组块已被备份系统110去重复并存储在一个或多个存储设备160 上,则初始备份列表构建模块210优先地对该项执行备份。在一个实施例中,可以根据策略 240排序初始备份列表250。因此,已被备份系统110去重复并存储在一个或多个存储设备 160上的项被这样排序它们首先出现在初始备份列表250上。因此,在图5A和5B的操作期间,在先前未被去重复的初始备份项之前备份先前已被去重复的初始备份项。在一个备选实施例中,可以设置策略240,使得已由备份系统110去重复并存储在一个或多个存储设备160上的项可以在图3的步骤330的扫描项步骤期间立即被传输到备份系统110。相应地,不将该项添加到初始备份列表250。返回图4的步骤420,在一个实施例中,在⑶P模块130获取一个或多个项被修改的通知之后,CDP备份构建模块220扫描本地存储设备140上存储的本地项以判定该项的块或组块是否已在备份系统110上去重复。在一个实施例中,如果判定项的块或组块已被备份系统110去重复并存储在一个或多个存储设备160上,则CDP备份列表构建模块220优先对该项执行备份。在一个实施例中,可以根据策略240排序CDP备份列表沈0。因此,这样排序已被备份系统110去重复且存储在一个或多个存储设备160上的项它们首先出现在⑶P备份列表260上。因此,在图5A和5B的操作期间,在先前未被去重复的⑶P项之前备份先前已被去重复的CDP项。在一个附加实施例中,可以设置策略M0,使得已被备份系统110去重复且存储在一个或多个存储设备160上的项可以在上述扫描步骤期间被立即传输到备份系统110。因此,不将该项添加到CDP备份列表沈0。图6A是示出根据本发明的一个实施例的在备份过程期间计算环境10的执行的示意图。图6B示出根据本发明的一个实施例的图6A中所示的备份过程的示例性时间线。为了简化说明,将参考其中使初始备份列表250节流包括暂停初始备份列表250的处理的实施例说明图6A和6B。但是,本领域的技术人员应该理解,此处的描述也适用于本发明的其他实施例。参考图6A,计算环境10包括通过网络150与备份系统110相连以备份存储在本地存储设备140上的项的客户机120。例如,本地存储设备140将项A、B、C和C’存储在一个或多个磁盘上。备份系统110与一个或多个存储设备160a、160b、160c和160d相连。客户机120包括根据策略240按优先顺序排列传输到备份系统110以存储在一个或多个存储设备160上的项的顺序的持续数据保护(CDP)模块。对用户最重要的数据通常是最近修改的数据。因此,⑶P模块130优先对最近修改的项目上的项执行备份。在本发明的一个实施例的一个实例中,计算环境10能够识别根据策略240应在初始备份过程中备份的所有项。将应在初始备份过程中备份的项添加到初始备份列表250。 进而,计算环境10能够识别任何在初始备份过程中修改的项。将初始备份过程中被修改的项添加到CDP备份列表沈0。此外,⑶P模块130能够根据策略240对初始备份列表250上的项进行排序。类似地,CDP模块130能够根据策略240对CDP备份列表260上的项进行排序。例如,在图6A 和6B所示的实施例中,CDP模块130对初始备份列表250进行排序以便首先列出最近访问的项。转到图6B,从时间O(Ttl)开始,初始备份列表250包括项A、B和C,并且⑶P备份列表 260不包括任何要备份的CDP项。项A是客户机上最近访问的项,因此,首先列出项A。类似地,访问项B的时间较访问项C的时间近,因此在初始备份列表中先于项C列出项B。因此,在下面进一步描述的备份过程中,在项B和项C之前备份最近访问的项,即,项A。根据图5A和5B中描述的操作,⑶P模块130判定⑶P备份列表260是否列出需要备份的项。如图6B所示,在Ttl处,⑶P列表不包括需要备份的项。因此,如图6A所示,⑶P 模块130从初始备份列表250选择下一项。在该实例中,初始备份列表250中的下一项是项A。CDP模块130从备份系统110获取项A的时间戳,从客户机120获取项A的时间戳并将这两个时间戳相比较。在该实例中,客户机时间戳比备份系统时间戳更近,表明项A的最新版本存储在客户机上。因此,⑶P模块130通过网络150将项A传输到备份系统110。如上所述,备份系统110接收项A的传输,并且作为响应,将项A存储在一个或多个存储设备 160上。例如,在该实施例中,项A存储在盘阵列160a上。一旦项A存储在盘阵列160a上,⑶P模块130就判定⑶P备份列表260是否列出需要备份的项。在该实例中,在Ttl之后的时间I(T1)处,初始备份列表250包括项B和项C。 此外,⑶P备份列表260包括项C’,其中项C’是修改后的项C。因此,判定⑶P备份列表260 不为空,并且节流模块230暂停初始备份列表250的初始备份过程,如图6A所示。接下来, ⑶P模块通过网络150将项C’传输到备份系统110。如上所述,备份系统110接收项C’的传输,并且作为响应,将项C’存储在一个或多个存储设备160上。例如,在该实施例中,项 C’存储在磁带阵列160c上。一旦项C’被存储在磁带阵列160c上,⑶P模块130便判定⑶P备份列表260是否列出需要备份的项。如图6B所示,在1\之后的时间2(T2)处,⑶P列表不包括需要备份的项。但是初始备份列表250包括要备份的项B和项C。因此,如图6A所示,⑶P模块130从初始备份列表250选择下一项。在该实例中,初始备份列表250中的下一项是项B。CDP 模块130从备份系统110获取项B的时间戳,从客户机120获取项B的时间戳并将这两个时间戳相比较。在该实例中,客户机时间戳比备份系统时间戳更近,表明项B的最新版本存储在客户机上。因此,⑶P模块130通过网络150将项B传输到备份系统110。如上所述, 备份系统110接收项B的传输,并且作为响应,将项B存储在一个或多个存储设备160上。 例如,在该实施例中,项B存储在盘阵列160b上。将项B存储在盘阵列160b上之后,⑶P模块130判定⑶P备份列表260是否列出需要备份的项。如图6B所示,在1~2之后的时间3(T3)处,⑶P列表不包括需要备份的项。 但是初始备份列表250包括要备份的项C。因此,如图6A所示,CDP模块130从初始备份列表250选择下一项。在该实例中,初始备份列表250中的下一项是项C。CDP模块130从备份系统110获取项C的时间戳,从客户机120获取项C的时间戳并将这两个时间戳相比较。 在当前实例中,当项C被修改并被备份为C’时,来自备份系统的项C的时间戳位于T2。因此,客户机时间戳早于备份系统时间戳。因此,不会将项C传输到备份系统110进行备份。 如图6Β所示,不执行任何操作。过程继之以⑶P模块130判定⑶P备份列表260是否列出需要备份的项。随着项被添加到初始备份列表250和/或⑶P备份列表沈0,此过程可无限地继续,如图5Α和5Β 所示。根据需要,较之初始备份列表250中列出的项,CDP模块130优先备份CDP备份列表 260中的项。应理解,此类操作可以体现为实现为算法的方法,所述算法具有由计算系统实现的软件模块。此外,所述方法可以体现为任何计算机可读介质上的软件、专用固件或软件和固件的组合等。本领域的技术人员将理解,本发明的各方面可以体现为系统、方法或计算机程序产品。因此,本发明的各方面可以采取完全硬件实施例、完全软件实施例(包括固件、驻留软件、微代码等)或组合了在此通常被称为“电路”、“模块”或“系统”的软件和硬件方面的实施例的形式。此外,本发明的各方面可以采取体现在一个或多个计算机可读介质(在介质中具有计算机可用程序代码)中的计算机程序产品的形式。可以使用一个或多个计算机可读介质的任意组合。所述计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是(例如但不限于) 电、磁、光、电磁、红外线或半导体系统、装置、设备或它们的任何适当组合。计算机可读存储介质的更具体实例(非穷举列表)将包括以下项具有一条或多条线的电连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦写可编程只读存储器(EPR0M 或闪存)、光纤、便携式光盘只读存储器(CD-ROM)、光存储设备、磁存储设备或它们的任何适当组合。在本文档的上下文中,计算机可读存储介质可以是任何能够包含或存储由指令执行系统、装置或设备使用或与所述指令执行系统、装置或设备结合的程序的有形介质。可以使用任何适当的介质(包括但不限于无线、有线、光缆、RF等或它们的任何适当组合)来传输计算机可读介质中包含的程序代码。用于执行本发明的各方面的操作的计算机程序代码可以使用包含一种或多种编程语言的任何组合来编写,所述编程语言包括诸如Java、Smalltalk、C++或类似语言之类的面向对象的编程语言以及诸如“C”编程语言或类似的编程语言之类的常规过程编程语言。所述程序代码可以完全地在用户计算机上执行,部分地在用户计算机上执行、作为独立的软件包、部分地在用户计算机上并部分地在远程计算机上执行,或者完全地在远程计算机或服务器上执行。在后者的情况中,远程计算机可以通过包括局域网(LAN)或广域网(WAN)的任何类型网络与用户的计算机相连,也可以与外部计算机进行连接(例如,使用因特网服务提供商通过因特网连接)。
上面参考根据本发明的实施例的方法、装置(系统)和计算机程序产品的流程图和/或方块图对本发明的各方面进行描述。将理解,所述流程图和/或方块图的每个方块以及所述流程图和/或方块图中的方块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器以产生机器,以便通过所述计算机或其他可编程数据处理装置的处理器执行的指令产生用于实现在一个或多个流程图和/或方块图方块中指定的功能/操作的装置。
这些计算机程序指令也可以被存储在可引导计算机、其他可编程数据处理装置或其他设备以特定方式执行功能的计算机可读介质中,以便存储在所述计算机可读介质中的指令产生一件包括实现在所述一个或多个流程图和/或方块图方块中指定的功能/操作的指令的制品。所述计算机程序指令还可被加载到计算机、其他可编程数据处理装置或其他设备,以导致在所述计算机、其他可编程装置或其他设备上执行一系列操作步骤以产生计算机实现的过程,从而在所述计算机或其他可编程装置上执行的指令提供用于实现在一个或多个流程图和/或方块图方块中指定的功能/操作的过程。上述附图中的流程图和方块图示出了根据本发明的各种实施例的系统、方法和计算机程序产品的可能实施方式的架构、功能和操作。在此方面,所述流程图或方块图中的每个方块都可以表示代码的模块、段或部分,所述代码包括用于实现指定的逻辑功能(多个) 的一个或多个可执行指令。还应指出,在某些备选实施方式中,在方块中说明的功能可以不按图中说明的顺序发生。例如,示为连续的两个方块可以实际上被基本同时地执行,或者某些时候,取决于所涉及的功能,可以以相反的顺序执行所述方块。还应指出,所述方块图和 /或流程图的每个方块以及所述方块图和/或流程图中的方块的组合可以由执行指定功能或操作的基于专用硬件的系统或专用硬件和计算机指令的组合来实现。术语“逻辑”可以包括(作为实例)软件、硬件、固件和/或软件和硬件的组合。图7示出了可根据特定实施例使用的计算系统700。客户机120和/或备份系统 110可以实现计算系统700。计算系统700适合于存储和/或执行程序代码并包括至少一个直接或通过系统总线(未示出)间接连接到存储元件704的处理器702。存储元件704 可以包括在程序代码的实际执行期间采用的本地存储器、大容量存储装置以及提供至少某些程序代码的临时存储以减少必须在执行期间从大容量存储装置检索代码的次数的高速缓冲存储器。存储元件704包括操作系统和一个或多个计算机程序(未示出)。输入/输出(I/O)设备712、714(包括但不限于键盘、显示器、指点设备等)可以直接或通过中间I/O控制器710与系统相连。网络适配器708也可以被连接到系统以使所述数据处理系统能够通过中间专用或公共网络变得与其他数据处理系统或远程打印机或存储设备相连。调制解调器、电缆调制解调器和以太网卡只是几种当前可用类型的网络适配器708。计算系统700可以耦合到存储设备716 (例如,诸如磁盘驱动器、光盘驱动器、磁带驱动器、固态存储设备之类的非易失性存储区域)。存储设备716可以包括内置存储设备或附接的或可通过网络访问的存储设备。存储设备716中的计算机程序可以以本领域公知的方式被加载到存储元件704中并由处理器702执行。计算系统700可以包括少于所示数量的组件、此处未示出的附加组件,或所示组件和附加组件的某种组合。计算系统700可以包括本领域中公知的任何计算设备,例如大型机、服务器、个人计算机、工作站、膝上型计算机、手持式计算机、电话设备、网络电器、虚拟化设备、存储控制器、移动设备(例如,个人数字助理(PDA)或移动电话等)。出于说明和描述目的给出了对本发明的各实施例的上述描述。所述描述并非旨在是穷举的或是将各实施例限于所公开的精确形式。根据上述教导,许多修改和变型都是可能的。实施例的范围并非旨在由该详细描述进行限制,而是由随后所附的权利要求进行限制。上述说明、实例和数据详细地描述了各实施例的组件的生成和使用。由于可以在不偏离各实施例的精神和范围的情况下做出许多实施例,因此各实施例存在于下文所附的权利要求或任何后续提交的权利要求及其等同物中。
权利要求
1.一种用于在具有至少一个与备份系统相连的客户机的计算环境中按优先顺序排列备份过程的计算机实现的方法,所述方法包括在执行第一客户机的初始备份列表的初始备份过程期间,判定所述第一客户机的持续数据保护CDP列表是否包括至少一个要备份的CDP项,其中所述初始备份列表包括至少一个初始备份项;以及响应于判定所述CDP列表包括至少一个要备份的CDP项,使所述第一客户机的所述初始备份列表的所述初始备份过程节流并执行所述第一客户机的所述CDP列表上的所述至少一个⑶P项的备份。
2.如权利要求1中所述的计算机实现的方法,其中使所述初始备份过程节流包括暂停所述初始备份过程或使所述初始备份过程减慢到预定备份速度以下。
3.如权利要求1中所述的计算机实现的方法,其中所述至少一个初始备份项和所述至少一个CDP项分别为初始备份文件和CDP文件。
4.如权利要求1中所述的计算机实现的方法,还包括响应于判定所述第一客户机的所述CDP列表不包括至少一个要备份的CDP项,恢复所述第一客户机的所述初始备份列表的所述初始备份过程的执行。
5.如权利要求1中所述的计算机实现的方法,还包括将所述至少一个初始备份项的备份系统时间戳与所述至少一个初始备份项的客户机时间戳相比较;以及只有在所述客户机时间戳比所述备份系统时间戳的时间更近时,才将要备份的所述至少一个初始备份项传输到所述备份系统。
6.如权利要求1中所述的计算机实现的方法,还包括其中CDP备份列表包括多个CDP 项,根据策略对所述CDP备份列表上的所述多个CDP项进行排序,以便根据所述排序优先备份所述⑶P项。
7.如权利要求5中所述的计算机实现的方法,其中所述策略根据所述CDP项的最后修改时间对所述CDP备份列表上的所述多个CDP项进行排序,以便首先备份最近修改的CDP项。
8.如权利要求5中所述的计算机实现的方法,其中所述策略对所述CDP备份列表上的所述多个CDP项进行排序,以便在先前未被去重复的CDP项之前备份先前已被去重复的CDP项。
9.如权利要求1中所述的计算机实现的方法,还包括其中所述初始备份列表包括多个初始备份项,根据策略对所述初始备份列表上的所述多个初始备份项进行排序,以便在先前未被去重复的初始备份项之前备份先前已被去重复的初始备份项。
10.如权利要求1中所述的计算机实现的方法,还包括从CDP备份列表和所述第一客户机的所述初始备份列表中的一个选择一个项; 判定所述备份系统的处理器利用率是否小于处理器利用率阈值; 判定所述第一客户机和所述备份系统之间的网络利用率是否大于网络利用率阈值;以及响应于所述备份系统的处理器利用率小于所述处理器利用率阈值以及所述第一客户机和所述备份系统之间的网络利用率大于所述网络利用率阈值,对所选择的项执行压缩。
11.一种用于在具有至少一个与备份系统相连的客户机的计算环境中按优先顺序排列备份过程的系统,所述系统包括用于在执行第一客户机的初始备份列表的初始备份过程期间,判定所述第一客户机的持续数据保护CDP列表是否包括至少一个要备份的CDP项的装置,其中所述初始备份列表包括至少一个初始备份项;以及用于响应于判定所述CDP列表包括至少一个要备份的CDP项,使所述第一客户机的所述初始备份列表的所述初始备份过程节流并执行所述第一客户机的所述CDP列表上的所述至少一个⑶P项的备份的装置。
12.如权利要求11中所述的系统,其中使所述初始备份过程节流的装置包括用于暂停所述初始备份过程或使所述初始备份过程减慢到预定备份速度以下的装置。
13.如权利要求11中所述的系统,还包括用于响应于判定所述第一客户机的所述CDP 列表不包括至少一个要备份的CDP项,恢复所述第一客户机的所述初始备份列表的所述初始备份过程的执行的装置。
14.如权利要求11中所述的系统,还包括用于将所述至少一个初始备份项的备份系统时间戳与所述至少一个初始备份项的客户机时间戳相比较的装置;以及用于只有在所述客户机时间戳比所述备份系统时间戳的时间更近时,才将要备份的所述至少一个初始备份项传输到所述备份系统的装置。
15.如权利要求11中所述的系统,还包括用于根据策略对所述CDP备份列表上的多个 CDP项进行排序,以便根据所述排序优先备份所述CDP项的装置。
16.如权利要求14中所述的系统,还包括用于根据所述CDP项的最后修改时间对所述 CDP备份列表上的所述多个CDP项进行排序,以便首先备份最近修改的CDP项的装置。
17.如权利要求14中所述的系统,还包括用于对所述CDP备份列表上的所述多个CDP 项进行排序,以便在先前未被去重复的CDP项之前备份先前已被去重复的CDP项的装置。
18.如权利要求11中所述的系统,还包括用于根据策略对所述初始备份列表上的多个初始备份项进行排序,以便在先前未被去重复的初始备份项之前备份先前已被去重复的初始备份项的装置。
19.如权利要求11中所述的系统,还包括用于从CDP备份列表和所述第一客户机的所述初始备份列表中的一个选择一个项的装置;用于判定所述备份系统的处理器利用率是否小于处理器利用率阈值的装置;用于判定所述第一客户机和所述备份系统之间的网络利用率是否大于网络利用率阈值的装置;以及用于响应于所述备份系统的处理器利用率小于所述处理器利用率阈值以及所述第一客户机和所述备份系统之间的网络利用率大于所述网络利用率阈值,对所选择的项执行压缩的装置。
20.一种计算环境,包括至少一个与备份系统相连的客户机,其中所述至少一个客户机包括第一客户机,并且所述第一客户机包括处理器和与所述处理器相连的存储器;所述存储器包括由所述处理器实现以执行以下操作的计算机可读指令在执行第一客户机的初始备份列表的初始备份过程期间,判定所述第一客户机的持续数据保护CDP列表是否包括至少一个要备份的CDP文件,其中所述初始备份列表包括至少一个初始备份文件;以及响应于判定所述CDP列表包括至少一个要备份的CDP文件,使所述初始备份列表的所述初始备份过程节流并执行所述第一客户机的所述CDP列表上的所述至少一个CDP文件的备份。
21.如权利要求20中所述的计算环境,其中使所述初始备份过程节流包括暂停所述初始备份过程或使所述初始备份过程减慢到预定备份速度以下。
22.如权利要求20中所述的计算环境,还包括由所述处理器实现以执行以下操作的计算机可读指令响应于判定所述第一客户机的所述CDP列表不包括至少一个要备份的CDP文件,恢复所述第一客户机的所述初始备份列表的所述初始备份过程的执行。
23.如权利要求20中所述的计算环境,还包括由所述处理器实现以执行以下操作的计算机可读指令将所述至少一个初始备份文件的备份系统时间戳与所述至少一个初始备份文件的客户机时间戳相比较;以及只有在所述客户机时间戳比所述备份系统时间戳的时间更近时,才将要备份的所述至少一个初始备份文件传输到所述备份系统。
24.如权利要求20中所述的计算环境,还包括由所述处理器实现以根据策略对所述 CDP备份列表上的多个CDP文件进行排序,以便根据所述排序优先备份所述CDP文件的计算机可读指令。
25.如权利要求23中所述的计算环境,还包括由所述处理器实现以根据所述CDP文件的最后修改时间对所述CDP备份列表上的所述多个CDP文件进行排序,以便首先备份最近修改的CDP文件的计算机可读指令。
26.如权利要求23中所述的计算环境,还包括由所述处理器实现以对所述CDP备份列表上的所述多个CDP文件进行排序,以便在先前未被去重复的CDP文件之前备份先前已被去重复的CDP文件的计算机可读指令。
27.如权利要求21中所述的计算环境,还包括由所述处理器实现以根据策略对所述初始备份列表上的多个初始备份文件进行排序,以便在先前未被去重复的初始备份文件之前备份先前已被去重复的初始备份文件的计算机可读指令。
28.如权利要求23中所述的计算环境,还包括由所述处理器实现以执行以下操作的计算机可读指令从CDP备份列表和所述第一客户机的所述初始备份列表中的一个选择一个文件;判定所述备份系统的处理器利用率是否小于处理器利用率阈值;判定所述第一客户机和所述备份系统之间的网络利用率是否大于网络利用率阈值;以及响应于所述备份系统的处理器利用率小于所述处理器利用率阈值以及所述第一客户机和所述备份系统之间的网络利用率大于所述网络利用率阈值,对所选择的文件执行压缩。
全文摘要
本发明涉及一种计算环境中按优先顺序排列要备份的数据项的方法和系统。描述了在计算环境中按优先顺序排列要备份的数据项的本发明的实施例。计算环境包括多个客户机,所述客户机通过网络与备份系统耦合以备份客户机上本地存储的项。每个客户机包括持续数据保护(CDP)模块,所述CDP模块根据策略按优先顺序排列传输到备份系统以存储在一个或多个存储设备上的文件的顺序。所述CDP模块构建初始备份列表和CDP备份列表。所述初始备份列表包括任何满足初始备份简档的准则的项。所述CDP备份列表包括自初始备份过程开始以来已修改的项。对用户最重要的数据通常是最近修改的数据。因此,所述CDP模块对CDP备份列表上的项优先执行备份。
文档编号G06F11/14GK102567138SQ20111029684
公开日2012年7月11日 申请日期2011年9月27日 优先权日2010年9月28日
发明者D·G·范希瑟, W·R·哈塞尔顿 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1