用于执行智能内容索引的技术的制作方法

文档序号:6463756阅读:107来源:国知局
专利名称:用于执行智能内容索引的技术的制作方法
用于执行智能内容索引的技术技术领域0001本发明一般地涉及数据存储系统,并且,更具体地,涉及用于执行智能内容索引的技术。
技术背景0002典型的企业计算环境由数百到数千个客户端机器组成。客户 端机器可包括桌上型计算机、膝上型计算机、服务器和其它计算设备。 由于这样大量的客户端机器,所以海量的数据需要被保护。此外,存 在可能要求长时间的数据维护的新的 一 致性管理(compliance regulation)。这导致由共享的保护服务器所保护和管理的历史数据的 指数级增长。为了提供基于数据内容来定位历史数据的能力,常常利 用内容索引技术。0003传统地,通过备份数据到共享的保护服务器上并且在该共享 的保护服务器上扫描备份数据来创建中心内容索引来完成内容索引。 然而,内容索引是处理器和存储器非常密集的操作。必须为接收到的 每个客户端的每个备份映像实行该操作。此外,备份数据的索引的存 储空间是相当大的。0004由前文所述,可以理解可能存在和将备份数据编索引的当前 方法关联的重要问题和缺点。发明内容0005用于智能内容索引的技术被公开。在一个特定的示例性实施 例中,所述技术可以被实现为用于执行智能内容索引的方法,其包括 通过一个或多于一个与客户端相关联的过程来将客户端的初始完整数 据集编索引以创建客户端数据的索引,检测该客户端数据中的变化, 以及修改索引以反映该客户端数据中的变化。0006在另一个特定的示例性实施例中,该技术可被用于执行智能内容索引的系统实现,该系统包括与客户端相关联的索引引擎,该索 引引擎被配置为将客户端的初始完整数据集编索引以产生该客户端数 据的索引,检测该客户端数据中的变化,以及修改索引以反映该客户 端数据中的变化。0007本公开现在将参照在附图中示出的示例性实施例被更详细 地描述。尽管在下面本公开参照示例性实施例来描述,但应理解本公 幵不限于此。可以理解本文教导内容的本领域普通技术人员会认识到 在此处描述的本公开范围内的附加实施方式、修改以及实施例,以及 在其它领域的用途,以及本公开可能因为与其相关而具有重要效用。


0008为了促进对本公开的更全面的理解,现在参考附图,其中同 样的单元用同样的数字指示。这些附图不应被解释为对本公开的限制, 而是仅为了示例。0009图l示出根据本公开的实施例的智能内容索引的系统。0010图2示出根据本公开的替代性实施例的智能内容索引的系统。0011图3示出根据本公开的另一个替代性实施例的智能内容索引 的系统。0012图4示出根据本公开的实施例的智能内容索引的方法。0013图5示出根据本公开的替代性实施例的智能内容索引的方 法。0014图6示出根据本公开的另一个替代性实施例的智能内容索引 的方法。0015图7示出根据本公开的另一个替代性实施例的智能内容索引 的方法。
具体实施方式
0016参考图l,示出根据本公开的实施例的智能内容索引系统 100。客户端110可代表含有索引引擎115和备份代理125且运行地连接 到网络120的计算设备。备份代理125可含有改变事件记录器135。在一 个或多于一个实施例中,备份代理125可以是单独的计算设备。备份服务器140可能运行地连接到网络120并且可能管理网络120上的一个或 多于一个客户端的备份操作。备份服务器140可以利用存储器145来进 行备份存储。存储器145可以是存储区域网、冗余存取独立磁盘阵列、 磁带驱动器、磁盘驱动器或其它存储设备。0017客户端110可能使用索引引擎115来对实吋数据(live data) 编索引。实时数据可代表客户端110的当前数据。在一些实施例中,索 引引擎115可被包含在和客户端110分开的机器中,例如索引服务器。 索引引擎115可以创建可含有来自客户端110的要被备份的数据的初始 索引。然后索引引擎115可为在客户端110的数据中检测到的一个或多 于一个改变增加索引。客户端110可能含有一个或多于一个索引。0018备份映像可由备份代理125发送到备份服务器140。该备份映 像可含有可对应于客户端110的数据的一个或多于一个索引。备份服务 器140可在存储器145上存储含有该备份数据的一个或多于一个映像。0019改变事件记录器135可检测在客户端110的客户端数据的改 变并且可将改变记录到日志文件或其它存储器中。索引引擎115可在初 始的完整索引独立于备份策略被产生之后将数据中的增量改变编索 引。例如,即使客户端备份策略要求完整备份,索引引擎115也可能仅 将客户端的数据中的变化编索引。索引引擎115可仅将客户端数据的增 量的变化编索引且通过维护单个索引或单个索引的多个拷贝来完成, 并且可能因此维护该客户端110的数据的整个索引。被包含在客户端 IIO上的索引可含有历史数据。例如,客户端110上的索引可含有关于 可能已经在先前被删除了的文件的元数据。在一个或多于一个实施例 中,索引引擎115可将备份映像数据编索引并且可使用改变的记录来产 生一个或多于一个索引。这些一个或多于一个索引可通过修改所述一 个或多于一个索引来仅表示自从先前的备份映像数据被编索引之后客 户端的实时数据中的变化而被维护。0020索引引擎115可降低索引的存储量大小和增加索引的效率。 索引引擎115不是每次接收到映像就将整个备份映像编索引,而是可生 成代表客户端的实时数据或当前数据以及历史条目的单个索引。它可 通过检测客户端的添加、更新或删除其数据的请求并通过仅记录对数 据的最终改变来完成。因此,索引引擎115可清楚地区分数据中的增量或改变并可避免将整个客户端数据集编索引。通过创建初始的完整索引和在每次客户端数据的变化发生时增加该索引,索引引擎115可维护数据变化的时序记录。结果产生的索引可含有关于文件的元数据,该 元数据可能对于搜索请求是有用的并且可使得已经不在客户端的实吋 数据中的文件能够在客户端的备份数据中被找到。具有将实时数据编索引的能力和在客户端机器上被定位的能力的索引引擎115可显著地 降低集中式备份服务器上的负载。0021参考图2,示出根据本公开的替代性实施例的智能内容索引 的系统200。客户端210可代表运行地连接到网络215的客户端,其从该 智能内容索引系统200内部寻找数据。客户端210可含有搜索引擎225和 数据检索模块230,并且可连接到网络215。在一些实施例中,搜索引 擎225和/或数据检索模块230可位于和客户端210分开的机器上。在一个 或多于一个实施例中,搜索引擎225和/或数据检索模块230可位于索引 服务器上。客户端210可使用搜索引擎225发送查询。搜索引擎225可搜 索一个或多于一个索引且可定位与搜索请求对应的数据。搜索引擎225 可返回结果给客户端210。客户端210可从数据检索模块230处请求由一 个或多于一个搜索结果指示的数据。数据检索模块230可从本地机器(即客户端210的存储器)检索数据。数据检索模块230也可以向备份 服务器235发送请求,请求来自一个或多于一个备份的数据。数据检索 模块230可接收来自可能在存储器240上的一个或多于一个备份的数 据。数据检索模块230可返回该被请求的数据到客户端210。0022参考图3,示出根据本公开的另一个替代性实施例的智能内 容索引系统300。在一个或多于一个实施例中,智能内容索引系统300 允许对一个或多于一个客户端的一个或多于一个索引的分布式搜索。 例如,客户端325可利用搜索引擎330发送搜索请求。搜索引擎330可代 表联合搜索引擎且可发送请求到客户端310、 315、 320上含有的搜索引 擎。搜索引擎330也可搜索本地索引,本地索引可将客户端325的数据 编索引。数据可从搜索客户端310、 315和325的索引的搜索引擎被接收。 然而,搜索引擎330可检测到没有接收到来自客户端320的数据。例如, 对客户端320的搜索请求可能由于客户端320可能当机、离线或由于其 它原因不可访问而超时。然后,搜索引擎330可发送对来自于存储器345的映像的査询到备份服务器340,该来自存储器345的映像可代表客户 端320的最近的备份。备份服务器340可解析出客户端320最近的己知映 像的位置。解析过程可利用判断备份时间,备份是否被存档、移动、 复制过,或者其它因素。备份服务器340可从存储器345获取该备份映 像并且可加载客户端320的合适备份映像。备份服务器340可在该备份 服务器上开始搜索引擎过程,其可为被请求的数据搜索被包含在该备 份映像中的索引。搜索引擎330可接收对客户端310、 315和325的搜索 结果。搜索引擎330也可接收来自备份服务器340的客户端320的搜索结 果。数据检索模块335可检索可能随后被客户端325请求的数据。数据 检索模块335可从一个或多于一个客户端检索实时数据且可从一个或 多于一个备份检索数据。客户端310、 315、 320、 325、备份服务器340 和存储器345可运行地连接到网络350。0023参考图4,示出根据本公开的实施例的智能内容索引的方法 400。方法400可在框410开始。在框415,该方法可检测在客户端的数 据的一个或多于一个变化。在框420,该方法可判断是否存在客户端的 初始完整索引。如果不存在,该方法可在框425继续,在其中该客户端 的初始完整索引可被生成。在其它实施例中,索引过程一开始,该过 程就可生成初始完整索引。客户端的初始完整索引可由索引引擎生成, 索引引擎可将在该客户端上的实时数据编索引。在一些实施例中,该 索引引擎可将客户端的备份映像编索引。该方法在框440结束。如果在 框420中该方法判断客户端的初始完整索引存在,该方法就可从框420 前进到框430。在框430,该方法可更新或修改一个或多于一个已经存 在的索引以表示自从最近的索引更新或修改之后,在客户端的实时数 据中发生的一个或多于一个变化。在框440,该方法可结束。0024参考图5,示出根据本公开的替代性实施例的智能内容索引 方法500。方法500可在框510处开始。在框520,该方法可检测任何为 备份存储的映像是否已过期。例如,备份映像可被政策、法律或手续 要求而被存储一段时间。存储超过这个时间段的映像可被该方法在框 520检测到。在框530,过期的映像可被删除。在框540,指向被删除的存储映像的一个或多于一个索引可被删减和/或更新。这可移除二个或 多于一个指向被删除的映像的索引记录。在框550,该方法可结束。该方法500可降低存储的备份映像和存储的索引的大小。此外,该方法500 可增加使用映像的索弓I的效率和准确度。0025参考图6,示出根据本公开的另一个替代性实施例的智能内 容索引方法600。方法600可在框610开始。在框615,搜索请求可在搜 索引擎被接收。在框620,可针对要被搜索的客户端的索引处理该搜索 请求。在框625,搜索结果可被返回到搜索客户端。在框630,对被搜 索结果指明的数据的请求可从搜索客户端被接收。在框635,数据的位 置可被解析出。在一些实施例中,对数据的位置的解析可使用从该索 引获取的元数据,该元数据可提供文件名、文件大小、 一个或多于一 个时间戳、文件位置和其它属性。在框640,该方法可判断数据是否需 要来自备份。如果数据需要来自备份,该方法可在框645继续。在框645 , 该数据可从备份检索。如果在框640,判断不需要备份数据,该方法可 在框650继续。在框650,该方法可检索或取回被搜索的一个或多于一 个客户端的实时数据。在框655,数据可被返回到搜索客户端。在框660, 该方法可结束。0026参考图7,示出根据本公开的另一个实施例的智能内容索引 方法700。方法700可在框710开始。在框715,搜索请求可在搜索引擎 被接收,该搜索引擎能够联合或分发搜索到一个或多于一个附加的搜 索引擎。所述一个或多于一个搜索引擎可被置于一个或多于一个客户 端上且可搜索与所述一个或多于一个的相应客户端的数据相关联的索 引。所述一个或多于一个搜索引擎可被置于索引服务器或备份服务器 上且可搜索客户端的备份映像。在框720,联合搜索引擎可发送搜索请 求到一个或多于一个搜索引擎。在框725,该方法可判断来自一个或多 于一个搜索引擎的结果是否已被收到。如果一个或多于一个搜索引擎 没有返回结果,该方法可在框730继续。如果一个或多于一个搜索引擎 己返回结果,该方法可在框740继续。在框730,为与没有返回结果的 搜索引擎相关联的一个或多于一个客户端定位备份映像。在框735,该 备份映像的索引可被搜索。备份映像的索引可被备份服务器或其它设 备搜索,该其它设备装载与所需客户端对应的被检索备份映像且针对 被装载的映像运行搜索过程。在框740,来自一个或多于一个搜索引擎 的搜索结果可被联合搜索引擎合并。在框745,搜索结果可被返回客户端。在框780,该方法可结束。0027在这里应该注意上面描述的根据本公开的智能内容索引一 般在某种程度上涉及到处理输入数据和生成输出数据。这种输入数据 处理和输出数据生成可在硬件或软件中被实现。例如,可在智能内容 索引系统或类似或相关的电路中使用特定的电子元件用于实施与上述 的根据本公开的智能内容索引相关联的功能。替代地,根据存储的指 令运行的一个或多于一个处理器可实现与根据上述的本公开的智能内 容索引相关联的功能。如果是这样的话,下面的情形落在本公开的范 围内这样的指令可被存储在一个或多于一个处理器可读的载体(例 如磁盘或者其它存储器介质)中,或者通过一个或多于一个信号传输 到一个或多于一个处理器。0028本公开并不限于这里阐述的特定实施例的范围。实际上,根 据前面的描述和附图,除了本文描述的,本公开的其它各种实施例和 对本公开的改变对本领域的普通技术人员是显而易见的。这样,这种 其它实施例和改变都在本公开的范围之内。进一步,尽管本公开在这 里是在特定环境中为特定目的的特定实施的背景中介绍的,但本领域 的普通技术人员应明白其用途不限于此并且本公开可在任意多个环境 中为任何数量的目的进行有益地实施。据此,下面阐述的权利要求应 考虑到此处阐述的本公开的全部范围和精神来解释。
权利要求
1.一种用于执行智能内容索引的方法,其包括通过一个或多于一个与客户端相关联的过程,将所述客户端的初始完整数据集编索引,以创建所述客户端数据的索引;检测所述客户端数据的变化;以及修改所述索引以反映所述客户端数据的所述变化。
2. 根据权利要求1所述的方法,其中所述一个或多于一个过程包括在 所述客户端上运行的索引引擎。
3. 根据权利要求1所述的方法,其中所述一个或多于一个过程包括在 与所述客户端分开的机器上运行的索引引擎。
4. 根据权利要求1所述的方法,其进一步包括存储所述索引和可能的具有一个或多于一个备份映像的一个或多于一 个其它索引。
5. 根据权利要求1所述的方法,其中所述客户端数据是所述客户端的 实时数据而且编索引在实时客户端数据上被执行。
6. 根据权利要求1所述的方法,其中编索引在所述客户端的一个或多 于一个备份映像上被执行。
7. 根据权利要求1所述的方法,其进一步包括: 检测备份映像的到期; 删除所述备份映像;以及更新所述索引以移除指向所述备份映像的记录。
8. 根据权利要求1所述的方法,其进一步包括-在搜索弓I擎接收来自所述客户端的搜索请求;针对所述索引处理所述搜索请求;以及 返回一个或多于一个搜索结果到所述客户端。
9.根据权利要求8所述的方法,其进一步包括接收来自客户端的对与所述搜索结果相关联的数据的请求;解析所述数据的位置;从所述位置取回所述数据;以及返回所述数据到所述客户端。
10.根据权利要求9所述的方法,其中解析所述数据位置包括判断是从 所述客户端取回实时数据还是从所述客户端的备份映像取回数据。
11.根据权利要求9所述的方法,其中解析所述数据位置包括判断所述 客户端的备份映像上的所述数据的位置。
12.根据权利要求1所述的方法,其进一步包括 在联合搜索引擎接收来自所述客户端的搜索请求; 发送所述搜索请求到一个或多于一个搜索引擎;由所述一个或多于一个搜索引擎针对可能包含所述索引的一个或多于 一个数据索弓I处理所述搜索请求;判断一个或多于一个搜索引擎是否已无法响应所述搜索请求;为所述一个或多于一个无响应的搜索引擎定位备份映像;搜索所述一个或多于一个无响应的搜索引擎的所述备份映像的索引;以及返回一个或多于一个搜索结果到所述客户端。
13.根据权利要求12所述的方法,其进一步包括 接收来自于所述客户端的对与所述搜索结果相关联的数据的请求; 解析所述数据的位置; 从所述位置取回所述数据;以及返回所述数据到所述客户端。
14. 根据权利要求13所述的方法,其中取回所述数据包括以下之一 当所述数据被存储在所述客户端上或另一个客户端上吋,从所述位置取回实时数据;以及当所述数据没有被存储在所述客户端上或另一个客户端上吋,从所述 位置取回备份数据。
15. 至少一个信号,其被包含在用于传输计算机程序指令的至少一个载 波中,所述指令被设置为被至少一个处理器可读,用以指示所述至少一个 处理器实行计算机处理,以执行根据权利要求1所述的方法。
16. 至少一个处理器可读的用于存储计算机程序指令的载体,所述指令 被设置为被至少一个处理器可读,用以指示所述至少一个处理器来实行计 算机处理,以执行根据权利要求1所述的方法。
17. —种用于执行智能内容索引的系统,其包括 与客户端相关联的索引引擎,其被配置为将所述客户端的初始完整数据集编索引以创建所述客户端数据的索引;检测所述客户端数据中的变化;以及修改所述索引以反映所述客户端数据中的所述变化。
18. 根据权利要求17所述的系统,其中所述索引引擎驻存在所述客户丄山 l顺上。
19. 根据权利要求17所述的系统,其中编索引在所述客户端的实时数 据上被执行。
20. 根据权利要求17所述的系统,其进一步包括 联合搜索引擎,其被配置为从所述客户端接收搜索请求;发送所述搜索请求到一个或多于一个搜索引擎;判断所述一个或多于一个搜索引擎是否已无法响应所述搜索请求;为 一个或多于一个无响应的搜索弓I擎定位备份映像; 搜索所述一个或多于一个无响应的搜索引擎的所述备份映像的索引;以及返回一个或多于一个搜索结果到所述客户端。
全文摘要
用于执行智能内容索引的技术,本文公开了用于智能内容索引的技术。在一个特定的示例性实施例中,所述技术可实现为用于执行智能内容索引的方法,其包括通过一个或多于一个与客户端相关联的过程来将所述客户端的初始完整数据集编索引以创建客户端数据的索引,检测所述客户端数据中的变化,以及修改所述索引以反映所述客户端数据中的所述变化。
文档编号G06F17/30GK101334791SQ200810110230
公开日2008年12月31日 申请日期2008年6月18日 优先权日2007年6月29日
发明者T·科克伦, Y-P·察瓦尔 申请人:塞门铁克公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1