基于索引库的数据检索方法及系统的制作方法

文档序号:9727441阅读:357来源:国知局
基于索引库的数据检索方法及系统的制作方法
【技术领域】
[0001]本发明涉及数据检索技术领域,特别是涉及基于索引库的数据检索方法及系统。
【背景技术】
[0002]为了提高检索效率,数据检索系统通常会为检索对象构建索引库,然后基于索引库进行数据检索,其中,索引库通常为:将从检索对象中所提取出的一些信息作为索引信息组织而成。举例而言:对于一篇文档,所对应的索引信息为从该文档中提取的文字内容或者文档的属性参数,文档的属性参数可以为:作者姓名,文档类别,等等。
[0003]其中,数据检索系统在启动时,会构建当前所存在的作为检索对象的基础数据所对应的索引库,进而基于该索引库执行后续的数据检索;并且,由于数据资源会不断增多,需要增加辅助数据来完善所存在的检索对象,此时,相应的索引库也需要更新,例如:对于百度、谷歌等的数据检索系统,由于每天的网络资源不断增加,这无疑使得需要不断增加辅助数据来完善检索对象,那么,相应的索引库也就需要不断更新。现有技术中,数据检索系统在获得所增加的辅助数据后,每次都基于所增加的辅助数据和当前所存在的检索对象,对当前所存在的索引库进行重构,从而在重构完成后,后续基于所重构的索引库来进行数据检索。
[0004]尽管现有的方式能够保证索引库与检索对象的有效对应,但是,每次获得辅助数据对旧的索引库执行重构,导致更新索引库的工作量较大,并且,在执行重构过程无疑影响对数据检索请求的响应。

【发明内容】

[0005]本发明实施例的目的在于提供一种基于索引库的数据检索方法及系统,以降低更新索引库的工作量且避免数据检索请求的响应受到影响。具体技术方案如下:
[0006]第一方面,本发明实施例提供了一种基于索引库的数据检索方法,应用于数据检索系统,所述数据检索系统预先构建作为检索对象的基础数据所对应的基础索引库;所述方法包括:当获得作为检索对象的辅助数据时,构建所述辅助数据所对应的辅助索引库;[0007 ] 所述方法还包括:
[0008]当获得数据检索请求时,确定当前所存在的至少一个目标索引库,其中,所述至少一个目标索引库包括基础索引库一类索引库,或者,所述基础索引库和所述辅助索引库两类索引库;
[0009]基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定所述数据检索请求所对应的检索结果。
[0010]可选的,所述辅助索引库与所述基础索引库的构建方式相同。
[0011]可选的,所述基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定所述数据检索请求所对应的检索结果,包括:
[0012]从至少一个目标索引库中,分别确定是否存在与所述数据检索请求所携带检索词相匹配的索引信息,如果存在,从该目标索引库所对应的检索对象中,获得该索引信息所对应的初级检索结果;
[0013]基于所获得的初级检索结果,确定所述数据检索请求所对应的检索结果。
[0014]可选的,所述基于所获得的初级检索结果,确定所述数据检索请求所对应的检索结果,包括:
[0015]对所获得的初级检索结果求并集;
[0016]将求并集所得结果作为所述数据检索请求所对应的检索结果。
[0017]可选的,获得作为检索对象的辅助数据的方式包括:
[0018]基于网络爬虫定时上传数据的方式,获得作为检索对象的辅助数据;
[0019]或者,
[0020]基于定时从网络爬虫处请求数据的方式,获得作为检索对象的辅助数据。
[0021]可选的,获得作为检索对象的辅助数据的方式包括:
[0022]基于人工导入数据方式,获得作为检索对象的辅助数据。
[0023]可选的,所述辅助索引库与所述基础索引库的构建方式为:倒排表方式。
[0024]第二方面,本发明实施例提供了一种基于索引库的数据检索系统,所述数据检索系统预先构建作为检索对象的基础数据所对应的基础索引库;所述系统包括:
[0025]辅助索引库构建模块,用于当获得作为检索对象的辅助数据时,构建所述辅助数据所对应的辅助索引库;
[0026]所述系统还包括:
[0027]目标索引库确定模块,用于当获得数据检索请求时,确定当前所存在的至少一个目标索引库,其中,所述至少一个目标索引库包括基础索引库一类索引库,或者,所述基础索引库和所述辅助索引库两类索引库;
[0028]检索结果确定模块,用于基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定所述数据检索请求所对应的检索结果。
[0029]可选的,所述辅助索引库与所述基础索引库的构建方式相同。
[0030]可选的,所述检索结果确定模块,包括:
[0031]初级索引结果获得单元,用于从至少一个目标索引库中,分别确定是否存在与所述数据检索请求所携带检索词相匹配的索引信息,如果存在,从该目标索引库所对应的检索对象中,获得该索引信息所对应的初级检索结果;
[0032]检索结果确定单元,用于基于所获得的初级检索结果,确定所述数据检索请求所对应的检索结果。
[0033]可选的,所述检索结果确定单元,包括:
[0034]并集求取子单元,用于对所获得的初级检索结果求并集;
[0035]检索结果确定子单元,用于将求并集所得结果作为所述数据检索请求所对应的检索结果。
[0036]可选的,所述辅助索引库构建模块获得作为检索对象的辅助数据的方式包括:
[0037]基于网络爬虫定时上传数据的方式,获得作为检索对象的辅助数据;
[0038]或者,
[0039]基于定时从网络爬虫处请求数据的方式,获得作为检索对象的辅助数据。
[0040]可选的,所述辅助索引库构建模块获得作为检索对象的辅助数据的方式包括:
[0041]基于人工导入数据方式,获得作为检索对象的辅助数据。
[0042]可选的,所述辅助索引库与所述基础索引库的构建方式为:倒排表方式。
[0043]本发明实施例中,数据检索系统预先构建作为检索对象的基础数据所对应的基础索引库,并当获得作为检索对象的辅助数据时,构建该辅助数据所对应的辅助索引库;进而,当获得数据检索请求时,确定当前所存在的至少一个目标索引库;基于所确定出的当前所存在的至少一个目标索引库以及所对应的检索对象,确定该数据检索请求所对应的检索结果。可见,与现有技术相比,本方案并不依据多次获得的辅助数据对基础索引库重构,而是在保证基础索引库不变的情况,增设辅助数据所对应的辅助索引库,因此,可以降低更新索引库的工作量且避免数据检索请求的响应受到影响。
【附图说明】
[0044]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]图1为本发明实施例所提供的一种基于索引库的数据检索方法的流程图;
[0046]图2为本发明实施例所提供的一种基于索引库的数据检索系统的结构示意图。
【具体实施方式】
[0047]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0048]为了降低更新索引库的工作量且避免数据检索请求的响应受到影响,本发明实施例提供了一种基于索引库的数据检索方法及系统。
[0049]下面首先对本发明实施例所提供的一种基于索引库的数据检索方法进行介绍。
[0050]本发明实施例所提供的一种基于索引库的数据检索方法应用于数据检索系统,SP本发明实施例所提供的一种基于索引库的数据检索方法的执行主体为一种基于索引库的数据检索系统;并
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1