一种检索信息的缓存方法和搜索引擎系统的制作方法

文档序号:6340697阅读:168来源:国知局
专利名称:一种检索信息的缓存方法和搜索引擎系统的制作方法
技术领域
本发明涉及通信技术领域,特别是涉及一种检索信息的缓存方法和搜索引擎系统。
背景技术
检索是指从文献资料、网络信息等信息集合中查找到自己需要的信息或资料的过程。为了进行检索,通常需要对资料进行索引。传统文献资料需要提取题名、作者、出版年、 主题词等作为索引,而在网络时代,计算机可以对全文进行索引,即文中每一个词都能成为检索点。
在网络时代,网络用户无时无刻地进行着检索。在互联网(Internet)上进行检索主要有两种方式目录浏览和使用搜索引擎。
通过目录浏览的方式,网络用户可以根据自己的需要点击目录,深入下一层子目录,从而找到自己需要的信息。这种方式便于查找某一类的信息集合,但是精确定位的能力不强。
搜索引擎是目前最为常用的一种网络检索工具。网络用户只需要提交自己的需求,搜索引擎就能返回大量搜索结果。一般的情况下,这些搜索结果按照和检索提问的相关性进行排序。
在搜索引擎系统中,可以通过缓存检索结果提高检索速度,但是,在现有的技术方案中,一般都是通过直接对最终的检索结果界面进行缓存,来实现提高检索速度的目的。
在实现本发明的过程中,发明人发现现有技术至少存在如下问题
如果只是单纯缓存最终的检索结果界面,那么,由于最终的检索请求对应的结果页面需要占据很大的空间,在缓存空间受限的情况下,导致缓存的最终检索信息页面数量有限,大量的检索结果实际上并没有进行缓存,在用户需要获取更多的检索结果时,只能通过新的检索操作来实现新的检索结果的获取,这样的情况必然影响检索速度,使缓存对检索过程的速度提升十分有限。发明内容
本发明的目的在于提供一种检索信息的缓存方法和搜索引擎系统,通过分级缓存检索结果,以有限的缓存空间缓存更多的检索结果,从而提高检索速度,为此,本发明采用如下技术方案
一种检索信息的缓存方法,包括
将检索操作所得到的检索信息所对应的部分最终检索信息页面缓存于第一缓存区域中;
将所述检索信息所对应的部分中间检索信息缓存于相应的其他缓存区域中。
一种搜索引擎系统,包括
缓存服务器,用于缓存检索信息,包含第一缓存区域和至少一个其他缓存区域;
检索服务器,用于根据检索请求进行检索操作,并将检索操作所得到的检索信息所对应的部分最终检索信息页面缓存于所述缓存服务器的第一缓存区域中,将所述检索信息所对应的部分中间检索信息缓存于相应的所述缓存服务器的其他缓存区域中。
与现有技术相比,本发明实施例所提出的技术方案具有以下优点
通过应用本发明实施例所提出的技术方案,可以对检索信息进行分级的缓存,除了缓存最终的检索请求对应的结果页面外,还缓存一些占用空间比较小的中间检索结果信息,从而,使缓存的检索提问总量得到了大幅提高,加快检索速度,改善了用户体验。


图1为本发明实施例所提出的一种检索信息的缓存方法的流程示意图2为本发明实施例所提出的一种缓存信息的应用过程的示意图3为本发明实施例所提出的另一种缓存信息的应用过程的示意图4为本发明实施例所提出的一种应用场景的网络结构示意图5为本发明实施例所提出的一种搜索引擎系统的结构示意图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
如背景技术所述,在缓存空间有限的情况下,单纯的对于最终检索信息页面进行缓存,会导致被缓存的检索信息总量有限,因此,在进行检索操作时,检索结果很可能并不存在于被缓存的信息中,因此,只能直接进行真正的检索操作,不仅被缓存的信息不能起到原有的结果暂存的目的,而且,实际的检索速度不仅不能提高,还会因为缓存查询和实际查询两个过程而被增长,影响实际的检索效率。
基于此,本发明实施例中提出了一种搜索引擎系统中检索信息的分级缓存方法, 旨在解决缓存空间与检索速度的平衡问题,利用有限的缓存空间达到最优的检索速度。
本发明实施例所提出的技术方案提供分级的检索结果信息缓存,首先,减少最终请求对应的结果页面缓存数量;其次,利用节省下来的缓存空间,对其他一些查询的中间检索信息进行缓存。
如图1所示,为本发明实施例所提出的一种检索信息的缓存方法的流程示意图, 具体包括以下步骤
步骤S101、将检索操作所得到的检索信息所对应的部分最终检索信息页面缓存于第一缓存区域中。
在实际的应用场景中,检索操作执行之前,还需要缓存区域的划分操作,即将全部的缓存资源划分为第一缓存区域和至少一个其他缓存区域。
其中,在实际的应用场景中,由于最终检索信息页面的大小要远大于中间检索信息的大小,所以,增加中间检索信息的缓存,可以大大提高所缓存的检索结果相关信息的数量,从而,提高检索的处理效率。
步骤S102、将检索信息所对应的部分中间检索信息缓存于相应的其他缓存区域中。
在上述的处理过程中,为了达到最佳的检索效果,对于实际的应用场景,可以设定最终检索信息页面所对应的检索提问热度高于中间检索信息所对应的检索提问热度,所谓检索提问热度,即为检索频率较高的检索项目,或者预设的热点检索项目,基于这样的设定,将具有更高的检索提问热度的检索项目所对应的检索结果,以能够更快捷获取的最终检索信息页面的形式进行缓存,可以进一步的提高检索效率,当对检索提问热度更高的检索项目进行检索时,可以直接在第一缓存区域中获取相对应的最终检索信息页面,而当对检索提问热度较低的检索项目进行检索时,则需要通过其他缓存区域中根据中间检索结果生成最终检索页面后,才能获取到检索结果所对应的最终检索信息页面,甚至,在对检索热度更低的检索项目进行检索时,有可能出现没有对该检索项目的检索结果进行缓存的情况,那么,则需要重新对该检索项目进行检索。
由以上说明可以看出,按照检索提问热度分梯度的缓存检索结果的方式,可以明显的提高具有更高检索提问热度的检索项目的检索效率,而由于这样的检索操作在总的检索操作中占有相当大的比例,所以,通过这种方式可以明显的提高检索效率。
在具体的应用场景中,当中间检索信息包括多个级别的检索信息时,步骤S102中将检索信息所对应的部分中间检索信息缓存于相应的其他缓存区域中的操作过程,具体包括
将不同级别的中间检索信息分别缓存于不同的其他缓存区域中。
在实际的应用场景中,中间检索信息至少包括结果文档ID和/或倒排链表信息;
其中,当中间检索信息包括结果文档ID和倒排链表信息时,结果文档ID所对应的检索提问热度高于倒排链表信息所对应的检索提问热度。
通过上述的处理,完成了检索信息的缓存过程,但是实际的处理过程中,这些被缓存的信息的作用在于应用在后续的检索操作中,因此,在后续说明中进一步对于缓存信息的利用过程进行说明,在具体的应用场景中,根据具体的场景需要,可以分为顺序查询和并行查询两种方式进行缓存信息的利用,具体说明如下
方法一、顺序查询
该方法具体的流程示意图如图2所示。
步骤S201、当需要获取检索请求的检索结果时,在第一缓存区域所缓存的最终检索信息页面中查询是否包含检索结果。
如果不包含,执行步骤S202 ;
如果包含,则提取包含该检索结果的最终检索信息页面,将该最终检索信息页面作为检索请求的检索结果。
步骤S202、在其他缓存区域所缓存的中间检索信息所对应的检索信息中查询是否包含检索结果。
如果不包含,则执行步骤S203 ;
如果包含,则提取包含该检索结果的检索信息所对应的中间检索信息,根据该中间检索信息生成最终检索信息页面,并将该最终检索信息页面作为检索请求的检索结果。
步骤S203、根据检索请求进行检索操作。
此步骤的实施,表示现有的所有缓存信息中都没有相应的检索结果,因此,只能通过新的检索过程去查找相应的检索结果。
在上述的处理过程中,进行查询的顺序由所缓存的信息的级别高低决定,即可以按照所存储的检索中间信息的级别,由高到低的查询各级别检索中间信息所在的各其他缓存区域,判断是否包含检索结果。
进一步的,当中间检索信息包括结果文档ID和倒排链表信息时,步骤S202中的处理过程具体包括
在其他缓存区域所缓存的结果文档ID所对应的检索信息中查询是否包含检索结果,如果包含,则根据包含该检索结果的检索信息所对应的结果文档ID生成最终检索信息页面,并将该最终检索信息页面作为本次检索请求的检索结果;
如果不包含,在其他缓存区域所缓存的倒排链表信息所对应的检索信息中查询是否包含检索结果,如果包含,根据包含该检索结果的检索信息所对应的倒排链表信息生成最终检索信息页面,并将该最终检索信息页面作为本次检索请求的检索结果。
方法二、并行查询
即同时对各级别的缓存信息进行检索,从而,可以避免逐级进行检索所带来的检索时间的延长,但并行检索必然需要占用更多的系统资源,因此,可以根据实际的应用场景的要求进行相应的检索策略的调整,这样的变化并不会影响本发明的保护范围。
现对上述的方法而进行说明,该方法具体的流程示意图如图3所示。
步骤S301、当需要获取检索请求的检索结果时,同时在第一缓存区域和其他缓存区域所缓存的信息中查询是否包含检索结果。
如果第一缓存区域和/或至少一个其他缓存区域所缓存的信息中包含检索结果, 执行步骤S302 ;
如果第一缓存区域和全部其他缓存区域所缓存的信息中均不包含检索结果,执行步骤S303。
步骤S302、将最快得到的检索结果作为检索请求的检索结果。
在实际的应用场景中,本步骤的处理实际上包括多种情况,如果第一缓存区域所缓存的信息中包含检索结果,那么,由于第一缓存区域中所缓存的都是最终检索信息页面, 所以,无需进一步的处理,便可将最终检索信息页面作为最终的检索结果返回,在此种情况下,无论其他缓存区域中所缓存的信息中是否包含该检索结果,第一缓存区域中所缓存的最终检索信息页面都将是最快得到的检索结果。
由于各级别的缓存空间中所缓存的信息转换为最终检索信息页面的时间是逐级增加的,所以,如果没有其他检索故障,那么,最快得到的检索结果应该是高级别的缓存空间中所缓存的信息所转化的最终检索信息页面,这样的操作显然在没有逐级检索的情况下,同样保证了检索速度。
步骤S303、根据检索请求进行检索操作。
此步骤的实施,表示现有的所有缓存信息中都没有相应的检索结果,因此,只能通过新的检索过程去查找相应的检索结果。
与现有技术相比,本发明实施例所提出的技术方案具有以下优点
通过应用本发明实施例所提出的技术方案,可以对检索信息进行分级的缓存,除了缓存最终的检索请求对应的结果页面外,还缓存一些占用空间比较小的中间检索结果信息,从而,使缓存的检索提问总量得到了大幅提高,加快检索速度,改善了用户体验。
下面,结合具体的应用场景,对本发明实施例所提出的技术方案进行进一步的详细说明。
本发明实施例中提出了一种搜索引擎系统中检索信息的分级缓存方法,其主体思路如下
首先,减少最终请求对应的结果页面缓存数量;
其次,利用节省下来的缓存空间,将一些查询的中间结果及常用的倒排链表信息缓存到Cache中,极大地加快检索速度,降低因相同查询带来的检索代价。
基于上述的技术思路,在如图4所示的系统结构中,包括三级缓存结构,检索信息共分为三级进行缓存
第一级缓存,缓存检索请求对应的最终结果页面。
第二级缓存,缓存检索请求对应的结果文档ID,例如10个相关网页的编号,可以利用这些网页编号作为索引,快速的从存储系统中提取URL、标题、摘要等信息,拼成最终检索信息页面。
第三级缓存,检索词对应的倒排链表级别,可以通过该倒排链表快速计算得到与检索词相关的结果文档ID。
在实际的应用场景中,上述的三级缓存通过相应的缓存服务器组或缓存资源来实现,需要指出的是,三个级别的缓存空间在逻辑上相互独立,但是,在物理上,三个级别的缓存空间可以相互独立,即位于不同的缓存服务器组,或位于相同的缓存服务器组中的不同的缓存服务器,也可以在物理上不相互独立,如位于同一台缓存服务器中,这样的变化并不影响本发明的保护范围。
在如图3所示的网络结构中,第一级和第二级缓存位于同一个缓存服务器组的不同缓存服务器中,而第三级缓存则位于检索服务器组的缓存资源中,检索控制服务器对于系统中的检索操作进行调度和控制,在缓存完成后,基于如图3所示的网络结构,具体的信息应用过程如下
当需要进行检索结果的获取时,首先查询第一个级别的缓存信息,第一个级别的缓存信息存放在缓存服务器组中,缓存的基本单位是“一页”,即一次查询所返回的所有结果,在查询过程中,一旦命中检索结果,则检索系统将不需要做其他工作,只需将缓存的检索结果返回给用户。
而如果在第一级缓存中没有找到缓存的结果页面(即最终检索信息页面),缓存服务器组将自动查找第二级缓存(因为第二级缓存存放在同一个缓存服务器组上)。第二级缓存所缓存的是检索请求对应的结果文档ID。该级缓存命中后,系统不能像第一级缓存命中一样直接得到最终检索信息页面,需要根据结果文档ID重新生成最终检索信息页面。 生成最终检索信息页面的过程中,需重新为每个文档生成摘要、进行关键词着色等。
如果缓存服务器组中的第一级缓存和第二级缓存都查找不到检索请求对应的内容,则检索控制服务器将检索请求并行的交给检索服务器组中的所有检索服务器。每个检索服务器在执行真正的检索前,首先查看本地的Term级缓存,也即第三级缓存。如果命中, 可以减少倒排链表操作的复杂性;如果不命中,执行真正的检索操作。
在上述的说明过程中,对于具体的应用场景,第一级和第二级缓存位于缓存服务器组中的缓存服务器上,通过缓存服务器缓存的数据按检索请求的内容进行划分,对缓存服务器组进行查询时,只需要对缓存服务器组中的一台服务器发出查询请求,而不需要对所有缓存服务器请求。具体可以根据检索请求的拼音顺序或者散列值进行划分,以散列值划分为例先计算检索请求的散列值,然后根据该散列值选择一台服务器存放缓存内容; 查找缓存内容使用的划分方法相同。
与现有技术相比,本发明实施例所提出的技术方案具有以下优点
通过应用本发明实施例所提出的技术方案,可以对检索信息进行分级的缓存,除了缓存最终的检索请求对应的结果页面外,还缓存一些占用空间比较小的中间检索结果信息,从而,使缓存的检索提问总量得到了大幅提高,加快检索速度,改善了用户体验。
为了实现本发明实施例的技术方案,本发明实施例还提供了一种搜索引擎系统, 其结构示意图如图5所示,具体包括
缓存服务器51,用于缓存检索信息,包含第一缓存区域和至少一个其他缓存区域;
检索服务器52,用于根据检索请求进行检索操作,并将检索操作所得到的检索信息所对应的部分最终检索信息页面缓存于缓存服务器51的第一缓存区域中,将检索信息所对应的部分中间检索信息缓存于相应的缓存服务器51的其他缓存区域中。
进一步的,当检索所服务器通过检索操作所得到的中间检索信息包括多个级别的检索信息时,检索服务器52,具体用于
将不同级别的中间检索信息分别缓存于缓存服务器51所划分的不同的其他缓存区域中;
在实际的应用场景中,中间检索信息,至少包括结果文档ID和/或倒排链表信息, 当中间检索信息包括结果文档ID和倒排链表信息时,结果文档ID所对应的检索提问热度高于倒排链表信息所对应的检索提问热度。
当需要获取检索请求的检索结果时,检索服务器52,具体用于
在缓存服务器51所划分的第一缓存区域所缓存的最终检索信息页面中查询是否包含检索结果,如果包含,将包含检索结果的最终检索信息页面作为检索请求的检索结果;
如果不包含,在缓存服务器51所划分的其他缓存区域所缓存的中间检索信息所对应的检索信息中查询是否包含检索结果,如果包含,根据包含检索结果的检索信息所对应的中间检索信息生成最终检索信息页面,并将最终检索信息页面作为检索请求的检索结果;
如果不包含,根据检索请求进行检索操作。
在具体的实施场景中,当缓存服务器所划分的其他缓存区域所缓存的中间检索信息分为多个级别时,检索服务器52,具体用于
按照所存储的检索中间信息的级别,由高到低的查询各级别检索中间信息所在的缓存服务器51所划分的各其他缓存区域,判断是否包含检索结果
进一步的,对应前述的步骤S201至步骤S203所描述的方法一中的顺序查询的查询方案,当中间检索信息包括结果文档ID和倒排链表信息时,检索服务器52,还用于
在缓存服务器51所划分的其他缓存区域所缓存的结果文档ID所对应的检索信息中查询是否包含检索结果,如果包含,根据包含检索结果的检索信息所对应的结果文档ID 生成最终检索信息页面,并将最终检索信息页面作为检索请求的检索结果;
如果不包含,在缓存服务器51所划分的其他缓存区域所缓存的倒排链表信息所对应的检索信息中查询是否包含检索结果,如果包含,根据包含检索结果的检索信息所对应的倒排链表信息生成最终检索信息页面,并将最终检索信息页面作为检索请求的检索结果。
另一方面,对应前述的步骤S301至步骤S303所描述的方法二中的并行查询的查询方案,当需要获取检索请求的检索结果时,检索服务器52,具体用于
同时在缓存服务器51所划分的第一缓存区域和其他缓存区域所缓存的信息中查询是否包含检索结果;
如果第一缓存区域和/或至少一个其他缓存区域所缓存的信息中包含检索结果, 将最快得到的检索结果作为检索请求的检索结果;
如果第一缓存区域和全部其他缓存区域所缓存的信息中均不包含检索结果,根据检索请求进行检索操作。
在实际的应用中,如前述的图4所示的应用场景中,本发明实施例所提出的搜索引擎系统中,还进一步包括检索控制服务器53,用于接收检索请求,并在缓存服务器51中所划分的第一缓存区域和其他缓存区域中查询是否包含检索请求的检索结果,如果没有查询到,则指示检索服务器52进行检索操作。
需要指出的是,图4中所示的检索服务器中所实现的第三级缓存实际上也是一种以具体的缓存资源作为缓存的实现形式,这种缓存性的具体应用在哪种物理设备上并不会影响本发明的保护范围。
与现有技术相比,本发明实施例所提出的技术方案具有以下优点
通过应用本发明实施例所提出的技术方案,可以对检索信息进行分级的缓存,除了缓存最终的检索请求对应的结果页面外,还缓存一些占用空间比较小的中间检索结果信息,从而,使缓存的检索提问总量得到了大幅提高,加快检索速度,改善了用户体验。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明实施例可以通过硬件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,本发明实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是⑶-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或网络设备等)执行本发明实施例各个实施场景所述的方法。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本发明实施例所必须的。
本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本发明实施例序号仅仅为了描述,不代表实施场景的优劣。
以上公开的仅为本发明实施例的几个具体实施场景,但是,本发明实施例并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明实施例的业务限制范围。
权利要求
1.一种检索信息的缓存方法,其特征在于,包括以下步骤将检索操作所得到的检索信息所对应的部分最终检索信息页面缓存于第一缓存区域中;将所述检索信息所对应的部分中间检索信息缓存于相应的其他缓存区域中。
2.如权利要求1所述的方法,其特征在于,所述最终检索信息页面所对应的检索提问热度高于所述中间检索信息所对应的检索提问热度。
3.如权利要求1所述的方法,其特征在于,所述检索操作执行之前,还包括将全部的缓存资源划分为第一缓存区域和至少一个其他缓存区域。
4.如权利要求3所述的方法,当所述中间检索信息包括多个级别的检索信息时,将所述检索信息所对应的部分中间检索信息缓存于相应的其他缓存区域中,具体包括将不同级别的中间检索信息分别缓存于不同的其他缓存区域中。
5.如权利要求1所述的方法,其特征在于,所述中间检索信息,至少包括结果文档ID和/或倒排链表信息;当所述中间检索信息包括结果文档ID和倒排链表信息时,所述结果文档ID所对应的检索提问热度高于所述倒排链表信息所对应的检索提问热度。
6.如权利要求1所述的方法,其特征在于,还包括当需要获取检索请求的检索结果时,在所述第一缓存区域所缓存的最终检索信息页面中查询是否包含所述检索结果,如果包含,将包含所述检索结果的最终检索信息页面作为所述检索请求的检索结果;如果不包含,在所述其他缓存区域所缓存的中间检索信息所对应的检索信息中查询是否包含所述检索结果,如果包含,根据包含所述检索结果的检索信息所对应的中间检索信息生成最终检索信息页面,并将所述最终检索信息页面作为所述检索请求的检索结果;如果不包含,根据所述检索请求进行检索操作。
7.如权利要求6所述的方法,其特征在于,当所述其他缓存区域所缓存的中间检索信息分为多个级别时,所述在所述其他缓存区域所缓存的中间检索信息所对应的检索信息中查询是否包含所述检索结果,具体包括按照所存储的检索中间信息的级别,由高到低的查询各级别检索中间信息所在的各所述其他缓存区域,判断是否包含所述检索结果。
8.如权利要求6所述的方法,其特征在于,当所述中间检索信息包括结果文档ID和倒排链表信息时,在所述其他缓存区域所缓存的中间检索信息中查询是否包含所述检索结果,具体包括在所述其他缓存区域所缓存的结果文档ID所对应的检索信息中查询是否包含所述检索结果,如果包含,根据包含所述检索结果的检索信息所对应的结果文档ID生成最终检索信息页面,并将所述最终检索信息页面作为所述检索请求的检索结果;如果不包含,在所述其他缓存区域所缓存的倒排链表信息所对应的检索信息中查询是否包含所述检索结果,如果包含,根据包含所述检索结果的检索信息所对应的倒排链表信息生成最终检索信息页面,并将所述最终检索信息页面作为所述检索请求的检索结果。
9.如权利要求1所述的方法,其特征在于,还包括当需要获取检索请求的检索结果时,同时在所述第一缓存区域和所述其他缓存区域所缓存的信息中查询是否包含所述检索结果;如果所述第一缓存区域和/或至少一个所述其他缓存区域所缓存的信息中包含所述检索结果,将最快得到的检索结果作为所述检索请求的检索结果;如果所述第一缓存区域和全部所述其他缓存区域所缓存的信息中均不包含所述检索结果,根据所述检索请求进行检索操作。
10.一种搜索引擎系统,其特征在于,包括缓存服务器,用于缓存检索信息,包含第一缓存区域和至少一个其他缓存区域;检索服务器,用于根据检索请求进行检索操作,并将检索操作所得到的检索信息所对应的部分最终检索信息页面缓存于所述缓存服务器的第一缓存区域中,将所述检索信息所对应的部分中间检索信息缓存于相应的所述缓存服务器的其他缓存区域中。
11.如权利要求10所述的搜索引擎系统,其特征在于,当所述检索所服务器通过检索操作所得到的中间检索信息包括多个级别的检索信息时,所述检索服务器,具体用于将不同级别的中间检索信息分别缓存于所述缓存服务器所划分的不同的其他缓存区域中;所述中间检索信息,至少包括结果文档ID和/或倒排链表信息,当所述中间检索信息包括结果文档ID和倒排链表信息时,所述结果文档ID所对应的检索提问热度高于所述倒排链表信息所对应的检索提问热度。
12.如权利要求10所述的搜索引擎系统,其特征在于,当需要获取检索请求的检索结果时,所述检索服务器,具体用于在所述缓存服务器所划分的第一缓存区域所缓存的最终检索信息页面中查询是否包含所述检索结果,如果包含,将包含所述检索结果的最终检索信息页面作为所述检索请求的检索结果;如果不包含,在所述缓存服务器所划分的其他缓存区域所缓存的中间检索信息所对应的检索信息中查询是否包含所述检索结果,如果包含,根据包含所述检索结果的检索信息所对应的中间检索信息生成最终检索信息页面,并将所述最终检索信息页面作为所述检索请求的检索结果;如果不包含,根据所述检索请求进行检索操作。
13.如权利要求12所述的搜索引擎系统,其特征在于,当所述缓存服务器所划分的其他缓存区域所缓存的中间检索信息分为多个级别时,所述检索服务器,具体用于按照所存储的检索中间信息的级别,由高到低的查询各级别检索中间信息所在的所述缓存服务器所划分的各所述其他缓存区域,判断是否包含所述检索结果。
14.如权利要求12所述的搜索引擎系统,其特征在于,当所述中间检索信息包括结果文档ID和倒排链表信息时,所述检索服务器,还用于在所述缓存服务器所划分的其他缓存区域所缓存的结果文档ID所对应的检索信息中查询是否包含所述检索结果,如果包含,根据包含所述检索结果的检索信息所对应的结果文档ID生成最终检索信息页面,并将所述最终检索信息页面作为所述检索请求的检索结果;如果不包含,在所述缓存服务器所划分的其他缓存区域所缓存的倒排链表信息所对应的检索信息中查询是否包含所述检索结果,如果包含,根据包含所述检索结果的检索信息所对应的倒排链表信息生成最终检索信息页面,并将所述最终检索信息页面作为所述检索请求的检索结果。
15.如权利要求10所述的搜索引擎系统,其特征在于,当需要获取检索请求的检索结果时,所述检索服务器,具体用于同时在所述缓存服务器所划分的第一缓存区域和所述其他缓存区域所缓存的信息中查询是否包含所述检索结果;如果所述第一缓存区域和/或至少一个所述其他缓存区域所缓存的信息中包含所述检索结果,将最快得到的检索结果作为所述检索请求的检索结果;如果所述第一缓存区域和全部所述其他缓存区域所缓存的信息中均不包含所述检索结果,根据所述检索请求进行检索操作。
16.如权利要求10至15中任一项所述的搜索引擎系统,其特征在于,还包括检索控制服务器,用于接收检索请求,并在所述缓存服务器中所划分的所述第一缓存区域和其他缓存区域中查询是否包含所述检索请求的检索结果,如果没有查询到,则指示所述检索服务器进行检索操作。
全文摘要
本发明实施例公开了一种检索信息的缓存方法和搜索引擎系统,通过应用本发明实施例所提出的技术方案,可以对检索信息进行分级的缓存,除了缓存最终的检索请求对应的结果页面外,还缓存一些占用空间比较小的中间检索结果信息,从而,使缓存的检索提问总量得到了大幅提高,加快检索速度,改善了用户体验。
文档编号G06F17/30GK102541924SQ201010614750
公开日2012年7月4日 申请日期2010年12月21日 优先权日2010年12月21日
发明者孙宏伟, 罗治国, 胡珉 申请人:中国移动通信集团公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1