可搜索备份的制作方法

文档序号:6568596阅读:141来源:国知局
专利名称:可搜索备份的制作方法
可搜索备份背景技术典型地,当前从备份数据恢复特定的文件、目录或其它对象需要确 定适当的备份源(例如,具有所需文件的特定备份磁带),使用所述备份 源恢复相关联的数据集(例如,就像在执行与所述备份源相关联的备份 操作时存在的一组产生数据),并且进行搜索或浏览来确定所需的文件或 其它对象是否存在于所恢复的数据集中。这种基于恢复的过程可能是低 效率和耗时的,尤其是存在多个备份源和/或不止一种类型的备份源的情 况下。因此,存在从备份数据源有效地搜索和恢复文件的需要。


以下的详细说明和附图中公开了本发明的各个实施例。 图1是图示能够搜索的备份恢复环境的实施例的框图。图2是图示能够搜索的备份恢复环境的实施例中的数据流的框图。 图3 A是图示用于搜索和恢复备份数据的方法的实施例的流程图。 图3B是图示用于为搜索准备备份数据的方法的实施例的流程图。 图3C是图示用于执行备份数据搜索的方法的实施例的流程图。 图3D是图示用于从备份数据获取数据的方法的实施例的流程图。
具体实施方式
本发明能够以各种方式实现,包括作为方法、装置、系统、物质的 组合物、计算机可读介质,诸如计算机可读存储介质或者其中在光或电 通信链接上传送程序指令的计算机网络。在该说明书中,这些实施方式 或本发明所能采取的任意其它形式均可被称为技术。所描述的被配置成 执行任务的诸如处理器或存储器之类的部件包括被临时配置成在给定时 间执行所述任务的通用部件,或者被制造成执行所述任务的特定部件。 一般而言,所描述方法的步骤顺序可以在本发明的范围内进行变化。以下连同图示本发明原理的附图提供对于本发明的一个或多个实施 例的详细描述。本发明结合这些实施例进行描述,但是本发明并不局限 于任何实施例。本发明的范围仅由权利要求来限定,并且本发明包含多 种变化、修改和等同物。以下描述中所给出的多个特定细节是为了提供 对于本发明的完全理解。这些细节是出于示例的目的所提供的,并且本楚的目的,没有对本发明相关技术领域中已知的技术要素进行详细描述, 从而不会对本发明造成不必要的混淆。公开了使得备份数据能够被搜索,而无需访问所述备份数据或者首 先使用其恢复相关的产生数据集。在一些实施例中,对备份数据进行索 引以便进行有效的搜索。在一些实施例中,索引包括生成能够被用来确 定感兴趣的数据是否存在于备份数据集中和/或感兴趣的数据位于备份 数据集内的哪个位置的数据。在一些实施例中,用于多个备份数据集的 索引与备份位置标识符一起被集成和/或保存,该备份位置标识符指示用 于每个文件或其它对象的相关联的数据在备份数据中的位置(例如,标 识相关联的备份数据集和对象在该数据集中的位置)。在一些实施例中, 备份数据索引被搜索以便定位所需要的文件或其它对象。在一些实施例 中,搜索结果被提供并且包括用于在索引中找到对象的每一时刻或发生 时的备份位置标识符。使用该标识符,可以在备份数据中定位所需要的 数据和恢复该数据。图1是图示能够搜索的备份恢复环境的实施例的框图。生成存储器102连接到应用主机/客户端104。备份介质110连接到备份服务器108。 索引存储器114连接到索引和搜索服务器112。应用主机/客户端104、 备份服务器108以及索引和搜索服务器112通过网络106连接在一起。 可以存在任意数目的生成存储器102 (production storage),应用主^/L /客户端104、备份服务器108、备份介质110、索引和搜索服务器112 和索引存储器1H。生成存储器102、备份介质110和索引存储器114可 以是一个或多个存储介质,包括硬盘驱动器、文件系统分区、备份磁带、 NAS (网络附加存储)、SAN (存储区域网络)、任意光和磁存储介质以及 任意固定、可移动或联网存储器。在一些实施例中,备份介质110包含要恢复到生成存储器102中的 备份数据。在多个可选实施例中,备份介质110经由网络106连接到备 份服务器108和/或应用主机/客户端104;例如,经由直接或存储区域网 络连接而包括在和/或本地连接到应用主才几/客户端104;和/或包括在或 连接到与备份服务器110和/或应用主机/客户端104相关联的存储节点 或代理客户端。在一些实施例中,备份介质110包含与一个或多个由备 份服务器108执行或处于其控制或管理下的备份操作相关联的数据,诸如为一个或多个包括一组备份数据的对象中的每一个指示所述对象在该 备份数据集内的位置的数据。在所示的例子中,应用主机/客户端104接纳应用程序并在生成存储 器102中存储相关的应用数据。在一些实施例中,生成存储器102存储 要备份到备份介质110中的数据。在一些实施例中,应用主机/客户端104 被配置成至少部分地执行备份操作,在生成存储器102中存储的应用数 据在所述备份操作中进行备份。在一些实施例中,安装在应用主机/客户 端104上的代理程序执行或参与执行在生成存储器102中存储的应用数 据的备份。生成存储器102可以是与个人计算机相关联的硬盘驱动器。 应用主机/客户端104可以包括与个人计算机相关联的处理器。应用主机 /客户端1 04和生成存储器102可以包括个人计算机。备份服务器108促进连接到网络106的备份介质110和设备之间的 通信。备份服务器108可以执行诸如备份协同和压缩的处理。在一些实 施例中,备份服务器108是运行能够从马萨诸塞州的Hopkinton的EMC 公司获得的EMC Legato NetWorker备份和恢复软件的服务器。在一些实 施例中,备份服务器108包括和/或直接连接或经由网络106连接到一个 或多个存储节点和/或通用代理客户端,所述存储节点包括对备份流进行 多路复用/分解的能力,所述通用代理客户端^L行多种备份处理,例如从 诸如应用主机/客户端104之类的应用服务器卸载诸如备份、数据移动等 之类的任务。在一些实施例中,备份介质110可以包括备份快照数据、 压缩备份数据、生成备份数据、连续镜像和/或备份的数据以及处于可移 动存储格式的备份数据。索引存储器114存储与备份介质110和/或生成 存储器102相关联的搜索数据(例如,索引数据)。索引和搜索服务器112 可以产生、保存、搜索、传送和处理与索引存储器114相关联的数据。 网络106可以是任意的公共或私有网络和/或其组合,包括以太网、串行 /并行总线、内联网、互联网、NAS、 SAN、 LAN、 WAN以及将多个系统和或 系统组连接在一起的其它形式,但并不局限于此。在一些实施例中,生 成存储器102、备份介质110和/或索引存储器114通过其它数据路由路 径连接到网络106和/或连接到一个或多个其它系统。在一些实施例中,在应用主4几/客户端104或一些其它主才几上运行的 搜索/恢复应用程序、代理或接口向索引和搜索服务器112发送搜索查询。 服务器112基于所接收的查询搜索索引存储器114中存储的索引并且返回搜索结果,该搜索结果包括用于满足查询的一个或多个对象中的每一 个的备份位置标识符,其指示这些对象在与所述索引相关联的一组备份 数据内的对应位置。在一些实施例中,提供了链接、按钮或其它界面以 使得能够获取搜索结杲中所标识的一个或多个对象。在一些实施例中, 自动获取响应对象,而没有进一步的请求或指示。所述搜索/恢复应用程 序将要被恢复的数据的(多个)位置标识符发送到备份服务器。备份服务器使用所述(多个)位置标识符从备份介质110获取要恢复的数据, 并且将所获取的数据发送到搜索/恢复应用程序以便在生成存储器102中 进行恢复,在此之后,其能够用于被应用主机/客户端104上运行的应用 程序访问和使用。图2是图示能够搜索的备份恢复环境的实施例中的数据流的框图。 在所示的例子中,备份数据202包括能够被用来将数据恢复到恢复目的 地212的备份数据。备份数据202可包括由备份应用程序所生成的备份 流,和/或存储在以下的一个或多个中的备份数据硬盘驱动器、备份磁 带、NAS (网络附加存储)、SAN (存储区域网络)、任意光和磁存储介质 以及任意固定、可移动或联网存储器。备份数据202可包括一种或多种 任意类型的备份数据,包括备份流、备份到磁盘(backup-to-disk )、备 份到磁带(backup-to-tape)、快照、生成的备份和/或备份流。内容生 成器204处理包括和/或与备份数据202相关联的数据,用于由索引器 (indexer )和搜索引擎206进行索引。内容生成器204可以将包括和/ 或与备份数据202相关联的数据解压缩、转换、翻译和/或转变为与索引 器和搜索引擎206相关联的格式。内容生成器204可以在指定的基础上 处理来自备份数据202的数据是周期性地进行和/或与相关联的备份过程 所进行的备份数据202中数据的存储和/或备份数据202的生成基本同时 地进行。例如,在备份系统上预先存在的备份数据可以被用来生成用于 索引器和搜索引擎206的内容。对于要被索引的新数据可以周期性地检 查备份数据202。随着新备份的执行,这些新数据可以被传送到内容生成 器204以及备份数据存储单元。索引器和搜索引擎206从内容生成器204 接收内容,并且对数据进行索引和准备以便进行搜索。索引包括用于对 数据进行处理以便进行搜索和获取的任何方法。能够使用诸如能够从马 萨诸塞州的Needham的FAST获得的FAST InStream的索引和搜索软件。 在一些实施例中,在索引存储器208中生成和存储与索引和搜索相关联的数据。在一些实施例中,索引存储器208中的数据包括与备份数据202 相关联的指示相关数据位置的备份位置标识符,所述相关数据例如是备 份数据202中的一个或多个特定对象,诸如文件、目录或者在备份数据 与文件系统备份相关联的情况下的其它文件系统对象。例如,索引存储 器208中的数据入口包括关键词以及与备份数据202中的文件或其它对 象相关联的唯一标识符。使用所生成的索引数据,索引器和搜索引擎接 受来自搜索和恢复模块210的搜索查询。由引擎206使用索引存储器208 中存储的索引数据执行与查询相关联的搜索,并且将查询结果连同与备 份数据202的(多个)响应部分相关联的备份位置标识符一起返回到模 块210。在一些实施例中,搜索和恢复模块210协调和/或促进引擎206、 备份数据202和恢复目的地212之间的交互作用。使用在搜索结果中所 接收的标识符,模块210将与要恢复的所需数据相关联的一个或多个标 识符传送到备份数据202。备份数据202获取与这些标识符相关联的数据 并且将所需数据返回到模块210以用于将数据恢复到目的地212中。这 些数据在恢复到目的地212之前被解压缩、转换、修改和/或合并。在一 些实施例中,索引存储器208和备份数据202存在于相同的物理存储单 元中。在一些实施例中,恢复目的地是图1的生成存储器102。在一些实 施例中,备份数据202和恢复目的地212是相同的物理存储单元。图3A是图示用于搜索和恢复备份数据的方法的实施例的流程图。在 302,为搜索准备与备份相关联的数据。该准备可以包括索引、转换、解 压缩、翻译和/或转变数据。准备用于搜索的备份数据可以在指定的基础 上周期性地进行和/或与新备份数据的生成(例如,连同备份操作)基本 上同时进行。在304,使用与诸如索引之类的备份搜索准备相关联的数据 执行搜索。 一旦已经通过搜索定位了需要被恢复的数据,在306就从备 份数据获取与 一个或多个搜索结杲相关联的数据。困3B是图示用于为搜索准备备份数据的方法的实施例的流程图。在 一些实施例中,图3B的过程包括在图3A的302中。在308,生成与备份 数据相关联的内容。该内容生成包括解压缩、转换、翻译和/或转变至少 一部分备份数据以便为搜索处理准备数据。在310,处理所生成的内容以 用于进行搜索。在一些实施例中,为搜索进行处理包括生成数据的可搜 索索引。在一些实施例中,所述可搜索索引包括能够被用来确定感兴趣 的数据是否存在于一组备份数据中和/或感兴趣的数据位于一组备份数据中的哪个位置的数据。在一些实施例中,所述可搜索索引被用来确定 特定的感兴趣数据位于 一组备份数据的哪个位置,而不对实际的备份数 据和/或使用备份数据已经恢复的生成数据进行访问或搜索。可以使用所 述内容来生成关键词并且将这些关键词与指示特定数据在备份数据内的位置的标识符相关联。位置标识符可以包括备份数据内的文件路径;备 份介质上的文件或其它对象的位置;备份介质路径、巻标或位置;或者 能够在后来被用于获取和恢复相关联数据和/或对象的任何其它位置数 据。在一些实施例中,所述位置标识符可以独立于任何物理和逻辑数据 位置,并且独立于备份数据的类型。例如,所述标识符可以是诸如统一 资源标识符(URI)之类的唯一标识数字。即使相关联的数据被重定位到 另一个物理或逻辑位置,或者即使所述数据被转换、翻译或压缩,对应 于该相关联数据的标识数字也是有效的。处理用于搜索的数据可以包括 任何搜索方法所需的任何处理准备。索引和关键词搜索方法仅仅是说明 性的示例。在312,存储在310中所生成的数据的至少一部分。在312 中所存储的数据可以与备份数据存储在一起,或者存储在分离的逻辑或 物理存储单元中。在一些实施例中,在312中所存储的数据没有存储在 存储单元中。其可以被临时存储在存储器中或者在每次执行搜索时生成。图3C是图示用于执行备份数据搜索的方法的实施例的流程图。在一 些实施例中,图3C的过程包括在图3A的304中。在一些实施例中,图 3C可以在图2的索引器和搜索引擎206中实现。在314,接收搜索查询。 所述搜索查询可以从备份搜索应用程序发送。所述备份搜索应用程序可 以是备份恢复应用程序的一部分。在一些实施例中,在接受搜索查询之 前需要进行安全认证。在316,执行与所述查询相关联的搜索。执行所述 搜索可以包括搜索与备份数据相关联的索引数据。可以使用诸如FAST Instream的搜索引擎。在318,所述搜索查询的结果连同指示特定数据 在备份数据中的位置的一个或多个标识符一起返回。返回所述查询结果 可以包括将多个中间搜索结杲编译在一起。在一些实施例中,这些结杲 被返回到备份搜索和恢复应用程序。图3D是图示用于从备份数据获取数据的方法的实施例的流程图。在 一些实施例中,图3D的过程包括在图3A的306中。在320,接收与要获 取的数据相关联的位置标识符。可以接收一个或多个标识符。标识符可 以与和所述备份数据相关联的一个或多个文件和/或目录相关联。在322,从备份源获取数据。所述备份源包括任意的物理或逻辑数据存储单元,包括硬盘驱动器、文件系统分区、备份磁带、NAS (网络附加存储)、SAN (存储区域网络)、任意光和磁存储介质以及任意的固定、可移动或联网 存储器。获取所述数据可以包括将所述标识符翻译为在备份数据内的位将输出数据提供给:复目的地。所述输出数据^r以是所获取的数据,或换、翻译或合并。在一些实施例中,所述输出数据在提供给恢复目的地 之前被提供给中间模块。虽然出于清楚理解的目的而在一定程度上详细描述了以上实施例, 但是本发明并不局限于所提供的细节。本发明有许多可选的实施方式。 所公开的实施例是说明性而不是限制性的。
权利要求
1.一种便于备份数据搜索的方法,包括接收与备份数据的至少一部分相关联的数据;和至少部分地基于所接收的数据生成备份数据的可搜索索引;其中所述可搜索索引包括索引数据,所述索引数据指示包括所述备份数据的对象在所述备份数据内的位置。
2. 如权利要求l所述的方法,其中接收与备份数据的至少一部分相 关联的数据包括用于接收包括所述备份数据的一个或多个对象的每一个 的与所述对象相关联的内容数据和指示所述对象在所述备份数据内的位 置的位置数据。
3. 如权利要求2所述的方法,其中至少部分地基于所述内容数据和 位置数据生成所述可搜索索引。
4. 如权利要求l所述的方法,进一步包括接收包括与所述对象相关 联的查询数据的搜索请求,和使用所述查询数据和所述可搜索索引来确 定所述对象在所述备份数据内的位置。
5. 如权利要求4所述的方法,进一步包括表示与所述对象相关联的 搜索结杲,并且响应 一 个请求而进行接收以便使用所述备份数据来恢复 所述对象。
6. 如权利要求5所述的方法,进一步包括使用所述备份数据来恢复 所述对象。
7. 如权利要求l所述的方法,进一步包括至少部分地基于所述备份 数据生成与所述备份数据的至少 一 部分相关联的所述数据。
8. 如权利要求l所述的方法,其中接收与所述备份数据的至少一部 分相关联的所述数据包括接收所述备份数据的内容数据部分,该接收是 与备份操作所进行的所述数据的生成为基本同时地进行。
9. 如权利要求l所述的方法,进一步包括使用所述可搜索索引来确 定所述对象在所述备份数据内的位置而不访问该备份数据。
10,如权利要求1所述的方法,进一步包括使用所述可搜索索引来 确定所述对象在所述备份数据内的位置,而不首先使用所述备份数据来 恢复与所述备份数据相关联的一组生成数据。
11.如权利要求1所述的方法,其中所述对象包括文件、目录或其 它文件系统对象。
12. 如权利要求1所述的方法,其中所述对象可以存在于所述备份 数据内的一个或多个位置。
13. 如权利要求1所述的方法,其中所述对象及其一个或多个变量 可以存在于所述备份数据内的各自不同的位置。
14. 如权利要求1所述的方法,其中所述对象是一组包括所述备份 数据的一个或多个对象之一。
15. 如权利要求1所述的方法,其中所述对象是一组包括所述备份 数据的一个或多个对象之一,并且所述可搜索索引包括对于所述一个或 多个对象的每一个指示该对象在所述备份数据内的位置的索引数据。
16. 如权利要求1所述的方法,其中所述备份数据包括连同在不同 时间执行的两个或更多备份操作所生成的数据。
17. 如权利要求1所述的方法,其中生成可搜索索引包括以下各项 中的一个或多个在指定的基础上,周期性地或与备份数据的添加、修 改和删除基本同时地进行解压缩备份数据、转换备份数据、翻译备份数 据、转变备份数据、索引备份数据、生成与备份数据相关联的关键词以 及数据搜索和获取所需的任何处理。
18. 如权利要求1所述的方法,其中所述备份数据包括以下各项中 的一个或多个备份到磁盘的数据、备份到磁带的数据、压缩数据、快 照数据、生成的备份数据和备份流数据。
19. 如权利要求1所述的方法,其中所述可搜索索引存储在以下各 项的一个或多个中硬盘驱动器、MS(网络附加存储)、SAN(存储区域 网络)、备份流、任何光和磁存储介质以及任何固定、可移动或联网存储 器。
20. 如权利要求1所述的方法,其中所述可搜索索引与所述备份数 据存储在一起。
21. 如权利要求l所述的方法,其中所述位置包括文件路径标识符。
22. 如权利要求1所述的方法,其中所述位置由标识符所指示,所 述标识符独立于任何物理或逻辑数据位置并且独立于备份数据的类型。
23. 如权利要求l所述的方法,其中所述对象可以被重定位、转换、 翻译或压缩而不改变所述索引数据。
24. 如权利要求1所述的方法,其中所述备份数据和请求所述对象 恢复到的目的地存在于相同的物理存储单元内。
25. 如权利要求1所述的方法,其中所述备份数据和请求所述对象 恢复到的目的地通过任何公共或私有网络或其组合连接在一起,该网络 包括以太网、串行/并行总线、内部网络、互联网、MS、 SAN、 LAN、 WAN 以及将多个系统和或系统组连接在一起的其它形式。
26. 如权利要求1所述的方法,进一步包括使用所述可搜索索引来 生成搜索结果,所述搜索结果包括将多个中间搜索结果编译在一起。
27. 如权利要求1所述的方法,进一步包括将所述对象恢复到目的 地存储器中,包括以下各项的一个或多个将所述索引数据翻译为所述 备份数据内的一个或多个位置、定位与所述索引数据相关联的数据、解 压缩数据、修改数据、转换数据、翻译数据和合并数据。
28. —种便于备份数据搜索的系统,包括通信接口 ,其;f皮配置成接收与备份数据的至少一部分相关联的数据;和处理器,其被配置成至少部分地基于所接收的数据生成所述备份数 据的可搜索索引;其中所述可搜索索引包括索引数据,所述索引数据指示包括所述备 份数据的对象在所述备份数据内的位置。
29. 如权利要求28所述的系统,其中所接收的数据包括与一个或多 个对象相关联的内容数据,所述对象包括所述备份数据的至少 一部分和 指示所述一个或多个对象在所述备份数据内的位置的位置数据。
30. 如权利要求28所述的系统,其中所述处理器进一步被配置成至 少部分地基于所述备份数据生成与所述备份数据的至少 一部分相关联的 所述数据。
31. 如权利要求28所述的系统,其中所述通信接口接收与所述备份 数据的至少一部分相关联的数据,该接收与由备份操作所进行的所述备 份数据的内容数据部分的数据生成基本同时地进行。
32. 如权利要求28所述的系统,其中所述可搜索索引被用来确定所 述对象在所述备份数据内的位置而不访问所述备份数据。
33. 如权利要求28所述的系统,其中所述可搜索索引被用来确定所 述对象在所述备份数据内的位置,而不首先使用所述备份数据来恢复与 所述备份数据相关联的一组生成数据。
34. —种用于促进备份数据搜索的计算机程序产品,所述计算机程序产品被记录于计算机可读介质中并且包括计算机指令,所述计算机指令用来接收与备份数据的至少一部分相关联的数据;和 至少部分地基于所接收的数据生成备份数据的可搜索索引; 其中所述可搜索索引包括索引数据,所述索引数据指示包括所述备 份数据的对象在所述备份数据内的位置。
全文摘要
公开了一种促进备份数据的搜索。接收与备份数据的至少一部分相关联的数据。至少部分地基于所接收的数据生成备份数据的可搜索索引。所述可搜索索引包括索引数据,所述索引数据指示包括备份数据的对象的备份数据内的位置。
文档编号G06F17/30GK101243447SQ200680029820
公开日2008年8月13日 申请日期2006年8月8日 优先权日2005年8月18日
发明者A·考施克, J·刑, R·苏尔亚纳拉亚南, S·佩里亚加拉姆 申请人:Emc公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1