文件存储查询代理以及信息查找方法与系统的制作方法

文档序号:6385572阅读:199来源:国知局
专利名称:文件存储查询代理以及信息查找方法与系统的制作方法
技术领域
本发明涉及数据查找技术领域,尤其涉及ー种文件存储查询代理以及信息查找方法与系统。
背景技术
在数据存储应用中,大量的数据被存储到永久存储设备上,这些数据的应用通常需要通过查询处理来实现。对于在大量的文件中,或在大尺寸的文件内部(尤其是超过50Mbytes大小的文件)查询所需要的信息,是一件非常消耗计算机处理能力的事情,通常需要很长的时间才能遍历搜索完所有的文件。因此查找速度上会较慢,而且还可能使存储设备的响应变得缓慢。

因此需要ー种信息查找方法,可以快速地在大量文件中以及大尺寸的文件内部快速捜索到所需要的内容。

发明内容
本发明所要解决的技术问题是,提供ー种文件存储查询代理以及信息查找方法与系统,解决现有技术中在大量的文件中,或在大尺寸的文件内部查询所需要的信息时查找速度较慢的技术问题。为了解决上述问题,本发明提供了ー种文件存储查询代理,包括模版维护单元、索引建立単元、提取单元以及查找单元;所述模版维护单元用于实现建立以及导入和导出配置模版,所述配置模版中预设需要提取的文件关键词;所述索引建立単元与所述模版维护単元相连,用于存储文件吋,根据所存储的文件全文以及所述配置模版,捜索关键词,提取关键词位置建立索引数据;所述提取単元分别与所述索引建立单元以及所述模版维护单元相连,用于读取所述索引数据,根据查询内容以及所述配置模版提取出关键词;所述查找単元与所述提取単元相连,用于根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。可选的,所述文件包括文本文件、ニ进制数据文件以及多媒体文件。可选的,所述索引数据存储为一新的数据文件或保存在原文件的固定部位。进ー步,所述索引数据的索引内容包括至少ー关键词、文件名及每一所述关键词在文件中的偏移量。在文件追加存储时,所述索引建立单元进一步根据所存储的文件片段以及所述配置模版,捜索关键词,提取关键词位置更新索引数据。为了解决上述问题,本发明还提供了采用本发明所述文件存储查询代理的信息查找方法,包括如下步骤(I)通过文件存储查询代理建立索引数据;(2)接收文件查询请求后启动所述文件存储查询代理,其中,所述查询请求中携帯有查询内容;(3)所述文件存储查询代理读取索引数据,所述索引数据包括索引文件或文件中的索引信息;(4)根据查询内容以及所述文件存储查询代理的配置模版提取出关键词;(5)根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。所述步骤(I)进ー步包括(10)建立并导出配置模版,并在建立文件时导入所述配置模版,其中,所述配置模版中预设需要提取的文件关键词。所述步骤(10)之后进ー步包括(11)接收文件保存请求并启动所述文件存储查询代理;(12)根据所存储的文件全文或文件片段以及所述配置模版,捜索关键词;(13)提取关键词位置建立索引数据。所述步骤(5)之后进ー步包括(6)打开相应文件,跳转至与所述查询内容匹配的信息的位置。为了解决上述问题,本发明还提供了ー种信息查找系统,包括接收模块、启动模块以及文件存储查询代理;所述接收模块用于接收文件查询请求,其中,所述查询请求中携帯有查询内容;所述启动模块分别与所述接收模块以及所述文件存储查询代理相连,用于启动所述文件存储查询代理;所述文件存储查询代理用于在文件建立时建立索引数据,在查找文件时读取索引数据,根据查询内容以及配置模版提取出关键词,井根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。实现了在大量文件中或者大尺寸的文件内部快速查找所需要的内容;本发明简单易于实现、可以快速检索文件内容且关键词可灵活配置;建立文件时可以实时生成索引数据;索引数据可以存储为一単独的索引文件或存储在原文件地固定位置,索引数据可以缓存在内存中,以加快信息查找速度。



图1,本发明文件存储查询代理的架构 图2,本发明信息查找方法的流程 图3,本发明信息查找系统的架构图。
具体实施例方式下面结合附图对本发明提供的文件存储查询代理以及信息查找方法与系统的具体实施方式
做详细说明。首先结合附图给出本发明所述文件存储查询代理的具体实施方式
。附图1所示是本具体实施方式
所述文件存储查询代理的架构图,所述文件存储查询代理10包括模版维护单元11、索引建立単元12、提取单元13以及查找单元14。所述模版维护单元11用于实现建立以及导入和导出配置模版,所述配置模版中预设需要提取的文件关键词。可以预先建立并导出配置模版,模版中预设需要提取的文件关键词。关键词可以根据不同的应用场合进行配置,比如手机号码、姓名、単位或其它关键词;关键词可组合使用,即使用一个或多个关键词。在建立文件时导入所述配置模版,当需要添加或修改关键词时,可以对所述配置模版进行修改,并重新导入所建立的文件中。所建立的文件包括但不限于文本文件、ニ进制数据文件以及图片、声音视频等各种多媒体文件。所述索引建立単元12与所述模版维护单元11相连,用于存储文件时,根据所存储的文件全文以及所述配置模版,捜索关键词,提取关键词位置建立索引数据。在文件追加存储时,所述索引建立単元12进ー步根据所存储的文件片段以及所述配置模版,捜索关键词,提取关键词位置更新索引数据。在大量小文件的场合,所述索引数据可以単独存储为一新的数据文件;在大尺寸文件时,可以存储在原文件的固定部位,例如原文件的头部或尾部,以及原文件中其它易于读取的部位,但不限于此规则。索引数据可以缓存在内存中,以避免重复读取索引信息。所述索引数据可以根据数据的格式使用包括Hash在内的任何索引形式;所述索引数据的索引内容包括至少ー关键词、文件名及每一所述关键词在文件中的偏移量(例如关键词所在位置相对文件头部的偏移量);可以使用ー个或多个关键词。当已有的文件被编辑修改后,可以使用后台重构索引的方法更新索引数据,即重新生成索引文件或文件中的索引信息。对于一次性写入或追加写入的文件应用场合,在写时构造索引,可以避免二次打开文件遍历所有文件构造索引;并且生成文件的同时,索引可以实时生成和使用。所述提取単元13分别与所述索引建立単元12以及所述模版维护单元11相连,用于读取所述索引数据,根据查询内容以及所述配置模版提取出关键词。所述查找単元14与所述提取単元13相连,用于根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。即在查找相应文件信息时,先通过所述提取单元13读取索引文件或文件中的索引信息,根据查询内容,配合模版提取出关键词;再通过所述查找单元14使用所提取的关键词,在索引文件中查找出匹配的信息所在的文件位置,或在索引信息中查找出匹配的信息在原文件中的位置;然后打开相应文件,跳转至对应的位置,取出相关的内容。接下来结合附图给出本发明所述信息查找方法的具体实施方式
。附图2所示是本具体实施方式
所述信息查找方法的流程图,采用本发明所述文件存储查询代理,接下来对附图2所示的步骤做详细说明。S210 :通过文件存储查询代理建立索引数据。其中,所述步骤S210可以进ー步采用步骤S201 — S204来执行。S201 :建立并导出配置模版,并在建立文件时导入所述配置模版,其中,所述配置模版中预设需要提取的文件关键词。可以预先建立并导出配置模版,模版中预设需要提取的文件关键词。关键词可以根据不同的应用场合进行配置,可以使用ー个或多个关键词。在建立文件时导入所述配置模版,当需要添加或修改关键词时,可以对所述配置模版进行修改,并重新导入所建立的文件中。所建立的文件包括但不限于文本文件以及图片、声音视频等多媒体文件。S202 :接收文件保存请求并启动所述文件存储查询代理。S203:根据所存储的文件全文或文件片段以及所述配置模版,搜索关键词。S204 :提取关键词位置建立索引数据。在存储文件时,根据所存储的文件全文以及所述配置模版,捜索关键词,提取关键词位置计算并填写索引,建立索引数据;在文件追加存储时,根据所存储的文件片段以及所述配置模版,捜索关键词,提取关键词位置更新索引数据。所建立的索引数据在大量小文件的场合,所述索引数据可以単独存储为一新的数据文件;在大尺寸文件时,可以存储在原文件的头部或尾部,以及原文件中其它易于读取的部位,但不限于此规则。
所述索引数据可以根据数据的格式使用包括Hash在内的任何索引形式;所述索引数据的索引内容包括至少ー关键词、文件名及每一所述关键词在文件中的偏移量;可以使用ー个或多个关键词。S220 :接收文件查询请求后启动所述文件存储查询代理,其中,所述查询请求中携带有查询内容。S230:所述文件存储查询代理读取索引数据,所述索引数据包括索引文件或文件中的索引信息。所述索引数据可以缓存在内存中,可以加快查找速度。S240:根据查询内容以及所述文件存储查询代理的配置模版提取出关键词。S250:根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。即使用关键词计算和查询索引数据,找出符合条件的索引项,进而查找出相应信息的位置。在本发明的其它实施方式中,在步骤S250之后进ー步执行步骤S260。S260 :打开相应文件,跳转至与所述查询内容匹配的信息的位置。使用所提取的关键词,在索弓I文件中查找出匹配的信息所在的文件位置,或在索引信息中查找出匹配的信息在原文件中的位置后,打开相应文件,跳转至对应的位置,就可以取出相关的内容。接下来结合附图给出本发明所述信息查找系统的具体实施方式
。附图3所示是本具体实施方式
所述信息查找系统的架构图,所述信息查找系统包括接收模块31、启动模块32以及文件存储查询代理10。所述接收模块31用于接收文件查询请求,其中,所述查询请求中携帯有查询内容。所述文件包括但不限于文本文件以及图片、声音视频等多媒体文件。所述接收模块31还可以用于接收文件存储请求。所述启动模块32分别与所述接收模块31以及所述文件存储查询代理10相连,用于启动所述文件存储查询代理10。所述文件存储查询代理10用于在文件建立时建立索引数据,在查找文件时读取索引数据,根据查询内容以及配置模版提取出关键词,井根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。所述文件存储查询代理10支持建立以及导入和导出配置模版,所述配置模版中预设需要提取的文件关键词。关键词可以根据不同的应用场合进行配置,可以使用ー个或多个关键词。在存储文件时,根据所存储的文件全文或文件片段(文件追加存储时)配合所述配置模版,捜索关键词,提取关键词位置建立索引数据。索引数据可以缓存在内存中,以加快信息查找速度。所述索引数据的索引内容包括至少ー关键词、文件名及每一所述关键词在文件中的偏移量。在查找相应文件信息时,所述文件存储查询代理10先读取索引文件或文件中的索引信息,根据查询内容,配合模版提取出关键词;再使用所提取的关键词,在索引文件中查找出匹配的信息所在的文件位置,或在索引信息中查找出匹配的信息在原文件中的位置。查找出相应信息的位置后,系统就可以打开相应文件,跳转至对应的位置,取出相关的内容;也可以将查找到的位置信息显示给用户,用户选择打开相应文件。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
权利要求
1.ー种文件存储查询代理,其特征在于,包括模版维护单元、索引建立単元、提取单元以及查找单元;所述模版维护单元用于实现建立以及导入和导出配置模版,所述配置模版中预设需要提取的文件关键词;所述索引建立単元与所述模版维护单元相连,用于存储文件时,根据所存储的文件全文以及所述配置模版,捜索关键词,提取关键词位置建立索引数据;所述提取単元分别与所述索引建立单元以及所述模版维护单元相连,用于读取所述索引数据,根据查询内容以及所述配置模版提取出关键词;所述查找単元与所述提取単元相连,用于根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。
2.根据权利要求1所述的文件存储查询代理,其特征在于,所述文件包括文本文件、ニ进制数据文件以及多媒体文件。
3.根据权利要求1所述的文件存储查询代理,其特征在于,所述索引数据存储为一新的数据文件或保存在原文件的固定部位。
4.根据权利要求1所述的文件存储查询代理,其特征在于,所述索引数据的索引内容包括至少ー关键词、文件名及每一所述关键词在文件中的偏移量。
5.根据权利要求1所述的文件存储查询代理,其特征在于,在文件追加存储时,所述索引建立单元进一步根据所存储的文件片段以及所述配置模版,捜索关键词,提取关键词位置更新索引数据。
6.ー种采用权利要求1所述的文件存储查询代理的信息查找方法,其特征在于,包括如下步骤(I)通过文件存储查询代理建立索引数据;(2)接收文件查询请求后启动所述文件存储查询代理,其中,所述查询请求中携帯有查询内容;(3)所述文件存储查询代理读取索引数据,所述索引数据包括索引文件或文件中的索引信息;(4)根据查询内容以及所述文件存储查询代理的配置模版提取出关键词;(5)根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。
7.根据权利要求6所述的信息查找方法,其特征在干,所述步骤(I)进ー步包括(10)建立并导出配置模版,并在建立文件时导入所述配置模版,其中,所述配置模版中预设需要提取的文件关键词。
8.根据权利要求7所述的信息查找方法,其特征在干,所述步骤(10)之后进ー步包括(11)接收文件保存请求并启动所述文件存储查询代理;(12)根据所存储的文件全文或文件片段以及所述配置模版,捜索关键词;(13)提取关键词位置建立索引数据。
9.根据权利要求6所述的信息查找方法,其特征在于,所述步骤(5)之后进ー步包括(6)打开相应文件,跳转至与所述查询内容匹配的信息的位置。
10.ー种信息查找系统,其特征在于,包括接收模块、启动模块以及文件存储查询代理;所述接收模块用于接收文件查询请求,其中,所述查询请求中携帯有查询内容;所述启动模块分别与所述接收模块以及所述文件存储查询代理相连,用于启动所述文件存储查询代理;所述文件存储查询代理用于在文件建立时建立索引数据,在查找文件时读取索引数据,根据查询内容以及配置模版提取出关键词,井根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。
全文摘要
本发明提供了一种文件存储查询代理以及信息查找方法与系统。所述文件存储查询代理包括模版维护单元用于实现建立以及导入和导出配置模版,所述配置模版中预设需要提取的文件关键词;与所述模版维护单元相连的索引建立单元,用于存储文件时,根据所存储的文件全文以及所述配置模版,搜索关键词,提取关键词位置建立索引数据;分别与所述索引建立单元以及所述模版维护单元相连的提取单元,用于读取所述索引数据,根据查询内容以及所述配置模版提取出关键词;与所述提取单元相连的查找单元,用于根据所提取的关键词在所述索引数据中查找出与所述查询内容匹配的信息的位置。本发明实现了在大量文件中或者文件内部快速查找所需内容。
文档编号G06F17/30GK103034734SQ20121057568
公开日2013年4月10日 申请日期2012年12月27日 优先权日2012年12月27日
发明者顾明毅 申请人:上海顶竹通讯技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1