数据对象搜索和检索的制作方法

文档序号:6568628阅读:318来源:国知局
专利名称:数据对象搜索和检索的制作方法
数据对象搜索和检索背景技术在数据产生和使用期间,数据对象和其它存储的数据,例如文件 系统中的文件,可以-波多次修改和重写。由于备份应用程序或系统可 以获取一组数据(例如文件)的状态(当在执行相关备份操作时,所述 一组数据存在的情况下),因此可以使用备份数据来获得在先前备份操 作期间获得的数据(例如文件)的先前版本。从相关备份数据获得文件 或其它数据的版本通常包括确定适当的备份源(例如,包括所要求的文 件版本的特定备份带),使用备份源来恢复相关的数据序列(例如,在 执行与备份源相关联的备份操作时存在的一组生产数据),以及搜索或 浏览以确定所要求的文件版本是否出现在恢复后的数据组中。如果不知道所要求的文件版本的具体位置,那么发现所要求的版 本会很困难。在一些情况下,有必要搜索多个个体备份源来定位所要 求的版本。例如,当搜索包含特定关键词的文件的所有版本时,除了例如使用产生搜索实用程序(例如,Microsoft Windows Explorer)来搜索 生产存储,所有可应用的可移动备份介质、备份硬件驱动器和包括备 份数据的网络存储单元可能必须如上文所述而^f皮单独恢复和搜索。一 旦所要求的文件^皮定位,文件之间的关系通常必须;波分别确定并且可 能有必要使用 一个或多个其它应用程序和/或实用程序来从可应用的 数据源中获得所要求的版本。因此,需要有效地在可包含一组或多组 备份数据的数据空间中定位数据对象或其它相关数据的 一个或多个 所要求版本。


下文的详细描述和附图公开了本发明的不同实施例。图l是结构图,图解说明了数据对象搜索启用环境的实施例。图2是结构图,图解说明了数据对象版本搜索启用环境的实施例 中的数据流程。图3 A是流程图,图解说明了用于搜索和检索数据对象版本程序 的实施例。图3 B是流程图,图解说明了用于准备供搜索的数据的过程的实 施例。图3 C是流程图,图解说明了用于执行数据对象版本搜索的过程 的实施例。图3 D是流程图,图解说明了通过数据标识符检索数据的过程的 实施例。图4是流程图,图解说明了用于返回搜索结果的过程的实施例。 图5图解说明了数据对象搜索结果显示的实施例,其中示出响应 的数据对象之间的关系。
具体实施方式
可以通过许多方式实现本发明,包括作为过程、设备、系统、物 质组成、计算机可读介质(如计算机可读存储介质)或其中通过光学或 电子通信链路发送程序指令的计算机网络。在本说明书中,这些实现, 或本发明可以采取的任何其它形式,可以称为技术。描述为配置成执 行任务的部件(如处理器或存储器)包括临时配置成在给定时间执行任 务的常规部件或制造成用于执行任务的特定部件。通常来说,公开的 过程的步骤的顺序可以在本发明的范围内进行改变。下文连同描述本发明原理的附图一起提供了本发明一个或多个 实施例的详细描述。本发明结合这样的实施例来描述,4旦是本发明不 限制于任何实施例。本发明的范围仅由权利要求限定并且本发明包括许多替换、修改和等同。为了提供对本发明的充分理解,下文描述中 提出了众多特定细节。这些细节提供的目的是举例说明,而本发明可清楚起见,没有详细描述与本发明有关的技术领域中已知的技术材 料,使得不会不必要地使本发明变得不清楚。公开了为相关数据(如文件或其它数据对象)的版本搜索备份数 据。如本文使用的,术语"数据对象"指由应用程序或者其它过程或 系统作为一组可识别相关数据来生成、存取、检索、修改或以其它方 式处理的任何一组可识别相关数据,包括但不限于存储在文件系统中 的文件或其它数据对象。在一些实施例中,如果一个数据对象是另一 个数据对象的后续版本,则认为两个数据对象有关。 一个数据对象可 以由另一个数据对象复制,修改,替换和/或得到。例如,如果第一数 据对象曾经与第二数据对象或与第二数据对象有关的另 一数据对象 共享7>共文件的名称和/或路径或其它标识符,则第一数据对象与第二 数据对象有关。在一些实施例中,备份数据可以包括一个或多个由生 产数据备份的数据对象,每一个数据对象以在执行相关备份操作时存 在于生产数据中的形式存储在备份数据中。如果数据对象之后(或之前) -波改变或删除,则作为存储在备^f分数据中的数据对象可以包括存在于 别处的相应数据对象的在先的(或后续)版本,如驻留在 一组相关的生 产数据中的当前版本,包含在 一组后续生成的备份数据中的后续版 本,或包含在一组在前产生的备份数据中的在前版本。 在一些实施例中,备份数据被编制索引以进行有效搜索。在一些实施 例中,生产数据被编制索引以进行有效搜索。在一些实施例中,编制 索引包括生成数据,所述数据能被用于判定感兴趣的数据是否出现在 一组备份或生产数据中和/或感兴趣的数据在一组备份或生产数据中 的位置。在一些实施例中,编制索引'包括将相关和/或相同文件或数据 的版本关联在一起。在一些实施例中,多组备份和生产数据的索引与 位置标识符综合和/或存储在一起,位置标识符为每一个文件或其它对象指示在备份或生产数据中相关的数据位置(如,标识相关数据组和 在该组中的对象位置)。在一些实施例中,搜索索引来定位所要求的文 件或其它对象。在一些实施例中,如果对搜索作出响应的第一数据对 象包括对搜索作出响应的一个或多个其它数据对象的版本,则搜索结 果包括指示第一数据对象包括对搜索作出响应的一个或多个其它数 据对象的版本的数据。在一些实施例中,搜索结果^f皮组织成分组,分同数据对象的时间上的多个"代(generation)"或版本(如果出现在搜索 的数据中)被包括在搜索结果中这拜的意义上,响应查询而识别、定位 和/或提供多个数据对象版本的搜索在本文中有时被称为"世代 (generational)"搜索。在一些实施例中,搜索结果包括索引中找到的 对象的各情况或事件的位置标识符。使用这些标识符,所要求的数据 可以在备份生产数据中^皮定位和检索。图1是结构图,图解说明了数据对象搜索启用环境的实施例。生 产存储102与应用主机/客户机相连。备份数据110与备份服务器108 相连。索引存储114与索引和搜索服务器112相连。应用主机/客户机 104、备份服务器108以及索引和搜索服务器112通过网络106连接 在一起。生产存储102、应用主机/客户机104、备份服务器108、备 份数据110、索引和搜索服务器112、:以及索引存储114可以有任意个。 生产存储102、备份数据110和索引存储114可以是一个或多个存储 介质,包括硬盘驱动器,文件系统区,备份带,NAS(网络附属存储), SAN(存储区域网络),任何光学和磁性存储介质,以及任何固定的, 可移动的或网络的存储。图1示出的任何连接可以包括一个或多个直 ^接和/或网络或其它连4妄,且图1所示的单元可以通过除了图1所示的 之外的其它排列连接,例如,各个单元可以通过网络106相互连接和 访问。在不同的备选实施例中,备份数据110通过网络106与备份服务 器108和/或应用主机/客户机104连接;备份数据110 ^皮包括在应用主机/客户机104中,和/或例如通过直接或存储区域网络连接与应用主机/客户机104本地相连;和/或备份数据110被包括在与备份服务 器110和/或应用主机/客户机104相关联的存储节点或代理客户机中, 或与备份服务器110和/或应用主4几/客户机104相关联的存储节点或 代理客户机相连。在一些实施例中,备份数据110包括与由通过或在 备份服务器108的控制或监督下执行的一个或多个备份操作相关联的 数据,例如为包含一组备份数据的一个或多个对象指示在该组备份数 据中对象的位置的数据。在一些实施例中,备份数据110包括从生产存储102备份的一个 或多个数据对象。如果备份数据110中包含的数据对象已经在后来被 修改,那么包含在备份数据110中的数据对象可以包括该数据对象的一些实施例中,例如,在备份数据110包括通过在相对于该相同组(或 重叠组)的生产数据而在不同时间点执行的两个或更多备份操作所生 成的备份数据的情况下,备份数据IIO可以包括相同数据对象的多个 版本。数据对象可以在周期性间隔、规定的情况或配置的时间上备份。 周期性间隔、规定的情况或配置的时间可以预先配置或动态配置。在 一些实施例中,对生产存储进行至少一个数据改变后执行备份。在一 些实施例中,对每一次备份,只有最后完成的备份中的数据改变被备 份。在一些实施例中,在每一个备份的情况下,至少备份生产存储的 配置部分。在一些实施例中,备份数据包括下列中的一个或多个快 照数据,压缩备份数据,世代备份数据,连续镜像和/或备份数据,可 移动存储格式的备份数据。 一个或多个备份情况可以与其它备份情况 结合或在自产生备份情况经过配置的时间量后被删除。在所示的实施例中,应用主机/客户机104控制应用程序并将相关 的应用程序数据存储在生产存储102中。在一些实施例中,应用主机 /客户机104配置成至少部分地执行备份操作,其中存储在生产存储102中的应用程序数椐被备份。在一些实施例中,安装在应用主机/客 户机104上的代理执行或参与执行存储在生产存储102中的应用程序 数据的备份。在一些实施例中,应用主机/客户机104有助于生产存 储102中的数据的索引编制和/或搜索。索引和搜索服务器112可以与 用来编制索引和/或搜索生产存储102的应用主机/客户机104进行通 信。生产存储102可以是与个人计算机相关联的硬盘驱动器。应用主 机/客户机104可以包括与个人计算'机相关联的处理器。应用主机/客 户机104和生产存储102可以包括个人计算机。间的通信。备份服务器108可以执行如备份协调和压缩等处理过程。 在一些实施例中,备份服务器108是运行从Hopkinton, MA的EMC 公司购买的EMC Legato NetWorker备份和恢复软件的服务器。在一些 实施例中,备份服务器108包括一个或多个存储节点和/或直接或通过 网络106与一个或多个存储节点相连接,所述节点包括复用/解复用 备份流能力(stream capability)和/或执行不同备份处理的通用代理客户 机,所述处理例如从应用程序服务器(如应用主机/客户机104)进行卸 载,这类任务例如备份、数据移动等。索引存储114存储与备份数据 110和/或生产存储102相关联的搜索数据(例如,索引数据)。索引和 搜索服务器112可以生成、维持、搜索、传递和处理与索引存储114 相关联的数据。网络106可以是任何^^共或专用网络和/或它们的结 合,包括但不限于以太网、串/并行总线、企业内部互连网、因特网、 NAS、 SAN、 LAN、 WAN,以及多个系统和/或系统组的连接的其它 形式。在一些实施例中,生产存储.102、备^f分数据110和/或索引存储 114通过其它数据路由路径与网络106连接和/或与一个或多个其它系 统连接。在一些实施例中,运行在应用主机/客户机104或一些其它主才几上 的搜索/检索应用程序、代理或界面向索引和搜索服务器112发送搜索 查询。服务器112基手所接收的查询来搜索存储在索引存储114中的索结果对于满足该查询的一个或多个数据对 象的每一个包括位置标识符,所迷位置标识符表明与索引相关联的一 组备份数据或生产数捧中的对象的相应位置。在一些实施例中,如果 对搜索作出响应的第一数据对象包括对搜索作出响应的一个或多个 其它数据对象的版本,则搜索结果包括表明第 一数据对象包括对搜索 作出响应的一个或多个其它数据对象的版本的数据。在一些实施例 中,搜索结果至少部分地由数据对象的相关版本来组织。在一些实施 例中,提供了链接,按钮或其它界面来使在搜索结果确认的一个或多 个对象能够被检索。在一些实施例中,自动地检索作出响应的对象, 而不需要另外的请求或指示。搜索/检索应用程序向备份服务器或生产 存储发送将被检索的数据的位置标识符。在一些实施例中,如果将位 置标识符发送到备份服务器,那么备份服务器使用位置标识符来从备份数据110中检索数据并向搜索/恢复应用程序发送检索的数据。检索 的数据可以通过运行在应用主机/客户机104上的应用程序来供查看、 访问和/或使用。在一些实施例中,检索的数据作为新数据存储在生产 存储102中或用来替换/合并生产存储102中预先存在的数据。在一些 实施例中,如果位置标识符发送给务份服务器或生产存储,则备份服 务器或生产存储检验位置标识符与生产存储中的数据是否匹配并检 索数据。图2是结构图,图解说明了数据对象版本搜索启用环境的实施例 的数据流程。在所示的实施例中,备^f分数据202和生产数据214可以 包括由存储在下列 一个或多个上的应用程序和/或数据生成的数据流 硬盘驱动器,备份带,NAS(网络附属存储),SAN(存储区域网络), 任何光学和磁性存储介质,以及任何固定的、可移动的或网络的存储。 备份数据202可以包括一个或多个类型的包含一个或多个数据对象版 本的备份数据,包括备份到磁盘、备份到带、快照、世代备份和/或备 份流。生产数据214可以包括至少一个最近或当前被修改的、以前被 备份到备份数据202中的数据对象版本。内容发生器204通过分度器(indexer)和搜索引擎206来处理包含和/或与备份数据202相关联的数 据以编制索引。内容发生器204可A将包含和/或与备份数据202相关 联的数据解压缩、转换、翻译和/或变换成与分度器和搜索引擎206相 关联的格式。内容发生器204可以通过相关的程序根据规定的基准, 周期性地和/或与备份数据202或生产数据214中的数据存储和/或备 份数据202或生产数才居214的生成基本并发地处理备份数椐202中的 数据。分度器和搜索引擎206可以对生产数据214编制索引。在一些 实施例中,内容发生器通过分度器和搜索引擎206来处理生产数据214 以编制索引。例如在第一配置周期间隔上,通过分度器和搜索引擎206对生产 数据214编制索引。因为在比第一自己置周期间隔长的第二配置周期间 隔上执行新的备份,所以新的备份数据可以传给内容发生器204以及 备份数据存储单元。分度器和搜索引擎206从内容发生器204和生产 数据214接收内容并且准备数据并对数据编制索引以进行搜索。因为 更新的世代数据被编制索引,所以更新/修 文/删除与相关的较旧的代 和编制索引的生产数据相关联的索引。编制索引包括任何处理数据来 进行搜索和检索的方法。在一些实施例中,编制索引包括将数据对象 的相关版本关联在一起。可以使用的编制索引和搜索软件例如,可以 从FAST of Needham, MA公司购买的FAST InStream。在一些实施例 中,与编制索引和搜索相关联的可搜索索引数据在索引存储208中生 成和存储。在一些实施例中,可搜索索引数据包括从多个数据源、备 份带和/或备份情况中综合索引数据。在一些实施例中,索引数据^皮分 组。这些分组可以与不同的数据源、备份带和/或备份情况相关联。在 一些实施例中,索引存储208中的数据包括与备份数据202或生产数 据214相关联的位置标识符,所述标识符指示相关数据例如一个或多 个特定数据对象版本、如备《分数据202或生产数据214中的文件、目 录或其它文件系统对象版本的位置。例如,索引存储208中的数据条联的关键字和唯一标识符。使用生成的索引数据,分度器和搜索引擎从搜索和检索模块210中接受搜索查询。在一些实施例中,索引存储 208中的数据条目包括与相关数据对象的其它版本相关联的一个或多 个其它数据条目的标识符和/或指针。在一些实施例中,与查询有关的搜索由引擎206执行,使用存储 在索引存储208中的索引数据,并且查询结果与同备份数据202或生 产数据214的响应部分相关联的位置标识符一起返回到模块210。在 一些实施例中,与数据对象的相关版本相对应的搜索结果^皮组织在一 起。在一些实施例中,搜索和检索才莫块210配合和/或促进引擎206、 备份数据202、生产数据214和检索目的文件212之间的相互作用。 使用接收到的搜索结果中的标识符,模块210向备份数据202和/或生 产数据214传送一个或多个与将被检索的所要求的数据相关联的标识 符。备份数据202和/或生产数据214检索与标识符相关联的数据并 将所要求数据返回到^^莫块210用于目的文件212中的数据检索。在检 索目的文件212之前,数据可以纟皮解压缩、转换、修改和/或合并。在 一些实施例中,索引存储208和/或生产数据214和/或备份数据202存 在于相同的物理存储单元中。在一些实施例中,^r索目的文件包含生 产数据214和/或备份数据202。图3 A是流程图,图解说明了用于搜索和检索数据对象版本的过 程的实施例。在302,为搜索准备与备份数据相关联的数据。在一些 实施例中,为搜索准备与备份和生产数据相关联的数据。准备过程可 包括编制索引、转换、解压缩、翻译和/或变换数据。为搜索准备备份 数据可以根据规定的基准,周期性地和/或与新的生产数据和/或备份 数据的生成(例如连同生产数据保存操作或备份操作 一起)基本并发地 执行。在304,使用与数据搜索准备相关联的数据、如索引来执行搜 索。 一旦要求检索的数据已经通过搜索定位,则在306,从生产数据 和/或备份数据中检索与 一个或多个搜索结果相关联的数据。图3 B是流程图,图解说明了用于准备供搜索的数据的过程的实 施例。在一些实施例+',图3B的过程包含在图3A的302中。在308, 生成与数据相关的内容,对于所述数据,世代搜索和/或检索功能性成 为可利用的。在一些实施例中,在308生成与一组或多组备《分数据(以 及任选地,生产数据)相关联的内容。内容生成可以包括解压缩、转换、 翻译和/或变换备份/生产数据的至少 一部分来为搜索过程准备数据。 在310,为搜索处理生成的内容。在一些实施例中,用于搜索的处理 包括生成数据的可搜索索引。在一些实施例中,可搜索索引包括能够 用于判定感兴趣的数据对象是否出现在一组备份/生产数据中和/或感 兴趣的数据在一组备份/生产数据中的位置的数据。在一些实施例中, 可搜索索引用来确定特定的感兴趣数据对象在一组备份/生产数据中 的位置,而不用访问或搜t实际的备份/生产数据。在一些实施例中, 可搜索索引用于确定有关的数据对象版本。可搜索索引可按与有关数 据对象版本相关联的顺序来组织或包含与有关数据对象版本相关联 的标识符或指针。数椐对象的相关版本可用下列一个或多个来标识 文件名称,文件路径,文件属性,文件大小,文件内容,文件创建时 间,文件修改时间,节点号,备份信息,以及相关的位置标识符。在 一些实施例中,索引数据不按与有关数据对象版本相关联的顺序来组 织或不包含与有关数据对象版本相关联的标识符或指针。在一些实施 例中,当执行查询时,确定数据对象的关系。可以使用内容生成关键词,并且可将关键词与指示特定数据在备 份/生产数据中的位置的标识符相关联。位置标识符可以包括在备份/ 生产数据中的文件路径;文件或其它对象在备份/生产媒介上的位置; 媒介路径,体(volume)或位置;或任何能够稍后用于检索相关数据和/ 或对象的其它位置数据。在一些实施例中,位置标识符可以独立于任 何物理和逻辑数据位置并独立于备份/生产数据的类型。例如,标识符 可以是唯一的标识数字,如统一资源标识符(URI)。即使相关数据被重 新定位到其它物理或逻辑位置或者即使数据^皮转换、翻译或压缩,对应于相关数据的标识数字也是有效的。为搜索而处理备份/生产数据可 以包括任何搜索方法所要求的任何处理准备。索引和关键字搜索方法 仅仅是解释性示例。在一些实施例中,在数据^皮转换、翻译、或压缩后索引可以是无效的。 因为生产数据在生产数据的周期性编制索引之间可以改变,所以如果 自索引和标识符创建之后数据对象已经^皮修改或移动,则与索引相关 联的位置标识符可以识别数据对象的错误位置。在一些实施例中,当 备份或生产数据改变时,修改索引。在一些实施例中,在标识符用于检索数据之前,检验位置标识符。在312, 310中生成的数据的至少 一部分被存储。存储在312中的数据可以与备份/生产数据存储在一起 或存储在单独的逻辑或物理存储单元中。在一些实施例中,存储在312 中的数据不存储在存储单元中。存储在312中的数据可以临时存储在 存储器中或在每一次执行搜索时生成。图3C是流程图,图解说明了用于执行数据对象版本搜索的过程 实施例。在一些实施例中,图3C的过程包括在图3A的304中。在一 些实施例中,图3C可以在图2的分度器和搜索引擎206中执行。在 314,接收搜索查询。可以从数据搜索应用程序发送搜索查询。搜索 应用程序可以是备份恢复应用程序的一部分。在一些实施例中,在接 受搜索查询之前要求安全认证。在316,执行与查询相关联的搜索。 执行搜索可以包括搜索与备份/生产数据相关联的索引数据。可以使用 如FASTInstream等的搜索引擎。在318,返回搜索查询的结果和指示 特定数据在备份数据或生产数据中的位置的一个或多个标识符。返回 查询结果可以包括将多个中间的搜索结果编译在一起。在一些实施例 中,如果对搜索查询作出响应的数据对象包括对搜索查询作出响应的 一个或多个其它数据对象版本,则搜索查询结果包括表明对搜索查询 作出响应的数据对象之间的版本关系的数据。在一些实施例中,与搜 索响应数据对象版本有关的数据对象版本,虽然没有直接对搜索查询 作出响应,但也包含在搜索结果中。'例如,所有的数据对象的版本可以包含在搜索结果中,即使只有一个数据对象的版本对搜索查询作出响应。版本关系可以使用下列中的一个或多个来确定文件名称,文 件路径,文件属性,文件大小,内容文件,文件创建时间,文件修改 时间,节点号,备份信息,以及相关的位置标识符。在一些实施例中, 搜索结果返回到搜索和检索应用程序中。图3D是流程图,图解说明了通过数据标识符检索数据的过程的 实施例。在一些实施例中,图3 D的过程包含在图3 A的306中。在 320,接收与将要检索的数据相关联的位置标识符。可以接收一个或 多个标识符。标识符可以与同备份数据或生产数据相关联的一个或多 个文件和/或目录相关联。在322,从数据源检索数据。数据源包括任 何物理的或逻辑的数据存储单元,'、包括硬盘驱动器、文件系统分区、 备份带、NAS(网络附属存储)、SAN(存储区域网络)、任何光学和磁 性存储介质以及任何固定的、可移动的或网络的存储。检索数据可以 包括将标识符转换为在备份数据或生产数据中的位置,定位和检索数 据源,以及在数据源内定位和检索所要求的数据。如果备份和/或生产 数据每一次改变时都没有更新索引,可以在标识符用于检索数据之前 检验标识符。在324,输出数据提供给恢复目的文件。输出数据可以缩、修改、转换、翻译、合并或用于替代其它数据。在一些实施例中, 输出数据在提供给恢复目的文件之前^皮提供给中间才莫块。图4是流程图,图解说明了返回搜索结果的过程的实施例。在一 些实施例中,图3C中的318包括图4的过程。在402,对于识别为对 查询作出响应的每一个数据对象接收位置数据和某些其它数据(例如, 图3C中的316),可以根据所述某些其它数据,来确定作出响应的数 据对象与一个或多个其它作出响应的数据对象的关系(如果存在)。在一些实施例中,所述某些其它数据包括与数据对象相关联的标识符, 如文件名称或路径,可以根据所述某些其它数据,来确定作出响应的 数据对象与一个或多个其它作出'响应的数据对象的关系(如果存在)。在404,如果存在,确定作出响应的数据对象中的哪些包含相同的数 据对象的版本。在一些实施例中,具有相同文件名称和/或路径但是具 有不同时间戳的数据对象(或指示数据对象最后 一 次保存或其它方式 存储(例如,与备份操作有关)的时间的其它数据)在404中确定为相同 数据对象的版本。在406,以显示作出响应的数据对象之间的版本关 系(如果存在)的方式提供搜索结果。图5图解说明了数据对象搜索结果显示的实施例,其中示出作出 响应的数据对象之间的关系。显示500包括查询文本框502,其中显 示一个或多个查询条目。在所示的示例中,用户先前已提交包括条目 "执行"和"查阅"的查询。显示500包括搜索结果显示区504,其 中,在所示的示例中,显示了在这个示例文件中识别为对查询框502 显示的查询作出响应的数据对象,。在所示的示例中,数据对象的三个 版本名为"安的执行检查",数据对象的两个版本名为"鲍勃的检查", 和一个数据对象实例名为"乔的执行检查"。每一个作出响应的数据对 象的名称显示在搜索结果显示区域504的"名称"显示区506中。每 一个作出响应的数据对象的每一个定位的版本的时间和日期(如,最后 保存的时间/日期)显示在"版本"显示区508,并且每一个版本的位置 显示在"位置,,显示区.510中。在不同的实施例中,版本和/或位置信 息可以包括可选择的链接或其它控件,它们可在由显示500的用户选 择时,使相关数据对象的相关版本被检索。在图5所示的实施例中, 作出响应的数据对象按对象名称以字母顺序列出,并且在数据对象之 间具有相同的名称时,它们将按照版本时间/日期的顺序列出,其中最所示的示例中,"安的执行检查"和"乔的执行检查"的最新的版本显 示在驻留于在本地"c,,驱动器(如本地硬件驱动器)上的名为"查看,,的 文件夹的生产数据中。在所示的示例中,生产数据上没有发现"鲍勃 的检查"的版本。当例如数据对象"鲍勃的检查"由于疏忽4皮从"c"驱 动器上删除和/或"c,,驱动器上的版本受到不可挽回的破坏时,可能出现这种状况。在一些实施例中,试图恢复当前可利用的数据对象 "鲍勃的检查"的最新版本的用户会选择链接或控件,所述链接或控件与"11:14 6/10/05,,版本相关联,该版本被发现存在于"6/10/05备份" 数据(例如,与在05年10月6日执行的白日或黑夜备份操作有关的一 组生成或存储的备份数据)中,这些数据将导致选择的版本被例如通过 调用相关的备份和恢复应用程序来检索。类似地,显示500的用户可 以在一些实施例中检索以前的数据对象版本,例如"安的执行检查" 以前的版本,例如,如果发现随后对数据对象的修改不是所要求的(例 如,由高级管理员查看后),则回复到早期的数据对象版本。在一些实 施例中,如果数据对象的相同的版本(例如,作为时间戳识别的)被发 现驻留在超过一个位置中时,则只显示驻留于最容易访问的位置的情 况(在备份通常但不是'义、然是最新备份的情况下)。在所示的实施例中, "安的执行检查"的"14:12 6/08/05"版本可以同时存在于"6/08/05备 份"和"6/09/05备份"中,但是只示出后者的情况。虽然在图5所示的示例中,作出响应的数据对象是文件,这种情 况下是处理文档的字,但是本文描述的技术可以应用到任何类型的数 据对象并跨越不同类型的数据对象。同样,虽然图5所示的数据源(位 置)包括生产数据("c"驱动器)和备份数据位置,但是响应查询而搜索数 据对象的数据空间中还可以包括更多、更少、其它和/或不同的位置。 同样,虽然在图5所示的示例中,由于它们有相同的名称,数据对象 被确定彼此相关,但是其它和/或附加的信息也可以用于 一些的实施例 来确定哪些数据对象相互相关。虽然为了清楚理解的目的,对前述的实施例作了较详细的描述, 但是本发明不限于所提供的细节。有许多实现本发明的替代方式。所 公开的实施例是解释性的而非限制性的。
权利要求
1.一种搜索数据的方法,包括如果存在,则使用可搜索索引确定哪些包含一组备份数据的数据对象对搜索查询作出响应;以及为搜索查询生成搜索结果,如果对搜索查询作出响应的第一数据对象包括对搜索查询作出响应的一个或多个其它数据对象的版本,则所述结果包括表明第一数据对象包括所述一个或多个其它数据对象的版本的数据。
2. 如权利要求1所述的方法,还包括接收搜索查询。
3. 如权利要求1所述的方法,还包括确定对所述搜索查询作 出响应的第 一数据对象是否包括对所述搜索查询作出响应的一个或 多个其它数据对象的后续版本。
4. 如权利要求3所述的方法,其特征在于,所述确定使用下列 中的一个或多个来进行文件名称,文件路径,文件属性,文件大小, 文件内容,文件创建时间,文件修改时间,节点号,备份信息,以及 相关位置标识符。
5. 如权利要求1所述的方法,其特征在于,所述备份数据包括 从生产数据中备份的数据对象的版本。
6. 如权利要求1所述的方法,其特征在于,所述一组备份数据 包括数据对象,所述数据对象在周期性间隔、规定的情况、配置的时 间或在对生产存储进行至少 一 次数据改变后进行备份。
7. 如权利要求1所述的方法,其特征在于,所述一组备份数据 包括增加的、不同的或包括最后完成的全部备份操作中的数据改变的 其它备份数据。
8. 如权利要求1所述的方法,还包括生成可搜索索引,包括通 过执行下列中的一个或多个根据规定的基准,周期性地或与备份数 据的增加、修改和删除基本并发地解压缩备份数据,转换备份数据,翻译备份数据,变换备份数据,对备份数据编制索引,生成与备份数 据相关联的关键词,以及数据搜索和检索所要求的任何处理。
9. 如权利要求1所述的方法,其特征在于,所述可搜索索引包 括索引数据,所述索引数据表明在包含所述一组备份数据的数据对象 的所述一组备份数据中的位置。
10. 如权利要求l所述的方法,其特征在于,如果第一数据对象 的至少一部分从第二数据对象或与第二数据对象有关的其它数据对 象中复制、修改、替换或得出,则两个数据对象确定为相互的版本。
11. 如权利要求l所述的方法,还包括如果存在,则使用可搜 索索引确定哪些包括与 一组备份数据相关联的 一组生产数据的数据 对象对搜索查询作出响应。
12. 如权利要求11所述的方法,其特征在于,以第一周期间隔 来针对所述一组备份数据更新所述可搜索索引,以及以比第一周期间 隔更短的第二周期间隔来针对所述一 组生产数据更新所述可搜索索 引。
13. 如权利要求l所述的方法,其特征在于,所述可搜索索引包括与关联下列中的一个或多个的数据对象相关联的索引数据存储 在一个或多个媒介体或其它存储位置的备份数据,通过一个或多个备 份操作生成的备份数据,及生产数据,以及为每一个数据对象指示在备份或生产数据中的相关数据的位置 的位置标识符。
14. 如权利要求l所述的方法,其特征在于,所述可搜索索引数 据包括来自多个数据源、备份类型或备份情况的索引数据。
15. 如权利要求l所述的方法,其特征在于,所述搜索结果以表 明笫 一数据对象包括所述一个或多个其它数据对象的版本的顺序来 组织。
16. 如权利要求l所述的方法,其特征在于,所述搜索结果包括 分成与有关数据对象的版本相关联的分组的数据。
17. 如权利要求l所述的方法,其特征在于,所述搜索结果包括 与有关搜索响应数据对象版本的非响应的数据对象版本相关联的数 据,其中,所述非响应数据对象版本不直接对搜索查询作出响应。
18. 如权利要求l所述的方法,还包括检索与查询结果相关联的 数据对象,其中,所述数据对象可由应用程序查看、访问或使用,作 为新数据存储在生产存储中,或者用来替换或与生产存储中预先存在 的数据合并。
19. 一种用于搜索数据的系统,包括处理器,配置成如果存在,则使用可搜索索引来确定哪些包括 一组备份数据的数据对象对搜索查询作出响应,为搜索查询生成搜索 结果,如果对搜索查询作出响应的第一数据对象包括对搜索查询作出 响应的一个或多个其它数据对象的版本,则所述结果包括指示第 一数 据对象包括所述一个或多个其它数据对象的版本的数据;以及与处理器耦合并配置成提供可搜索索引的存储器。
20. 如权利要求'19所述的系统,所述处理器还配置成确定对 搜索查询作出响应的第 一数据对象是否包括对搜索查询作出响应的 一个或多个其它数据对象的后续版本。
21. 如权利要求20所述的系统,其特征在于,所述确定使用下 列中的一个或多个来进行文件名称,文件路径,文件属性,文件大 小,文件内容,文件创建时间,文件修改时间,节点号,备份信息, 以及相关的位置标识符。
22. 如权利要求19所述的系统,其特征在于,所述一组备份数 据包括增加的、不同的或包括最后完成的全部备份操作中的数据改变 的其它备份数据。
23. 如权利要求19所述的系统,所述处理器还配置成生成可 搜索索引,包括通过执行下列中的一个或多个根据规定的基准,周期性地或与备份数据的增加、修改和删除基本并发地解压缩备份数 据,转换备份数据,翻译备份数据,变换备份数据,对备份数据编制 索引,生成与备份数据相关联的关键词,以及数据搜索和检索所要求 的任何处理。
24. 如权利要求19所述的系统,其特征在于,所述可搜索索引 包括索引数据,所述索引数据表明在包含所述一组备份数据的数据对 象的所述一组备份数据中的位置。
25. 如权利要求19所述的系统,其特征在于,如果第一数据对 象的至少一部分从第二数据对象或与第二数据对象有关的其它数据 对象中复制、修改、替换或得出,则两个数据对象确定为相互的版本。
26. 如权利要求19戶斤述的系统,其特征在于,所述可搜索索引 包括与关联下列中的一个或多个的数据对象相关联的索《1数据存储 在一个或多个i某介体或其它存储位置的备份数据,通过一个或多个备 份操作生成的备份数据,及生产数据,以及为每一个数据对象指示在备份或生产数据中的相关数据的位置 的位置标识符。
27. 如权利要求19所述的系统,其特征在于,所述搜索结果以 表明第 一数据对象包括所述一个或多个其它数据对象的版本的顺序 来组织。
28. 如权利要求19所述的系统,其特征在于,所述搜索结果包 括与有关搜索响应数据对象版本的非响应的数据对象版本相关联的 数据,其中,所述非响应数据对象版本不直接对搜索查询作出响应。
29. 如权利要求19所述的系统,所述处理器还配置成检索与 查询结果相关联的数据对象,其中,所述数据对象可由应用程序查看、 访问或使用,作为新数据存储 生产存储中,或者用来替换或与生产 存储中预先存在的数据合并。
30. —种用于搜索数据的计算机程序产品,所述计算机程序产品 包含在计算机可读介质上,并且包括计算机指令来执行以下操作如果存在,则使用可搜索索引确定哪些包含一组备份数据的数据 对象对搜索查询作出响应;以及为搜索查询生成搜索结果,如果对搜索查询作出响应的第一数据 对象包括对搜索查询作出响应的一个或多个其它数据对象的版本,则 所述结果包括表明第一数据对象包括所述一个或多个其它数据对象 的版本的数据。
全文摘要
公开了搜索数据。使用可搜索索引来确定哪些(如果存在)包含一组备份数据的数据对象对搜索查询作出响应。对于搜索查询,生成搜索结果。如果对搜索查询作出响应的第一数据对象包括对搜索查询作出响应的一个或多个其它数据对象的版本,则搜索结果包括表明第一数据对象包括所述一个或多个其它数据对象的版本的数据。
文档编号G06F17/30GK101601029SQ200680030146
公开日2009年12月9日 申请日期2006年8月9日 优先权日2005年8月18日
发明者A·考施克, J·(J·)刑, R·叙尔亚纳拉亚南, S·佩里亚加拉姆 申请人:Emc公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1