一种信息检索装置和方法

文档序号:6525725阅读:169来源:国知局
一种信息检索装置和方法
【专利摘要】本发明提供一种信息检索装置和方法,应用在信息检索服务器上,所述信息检索服务器与主题索引服务器交互,为用户提供信息检索服务。所述方法包括:解析用户的信息检索请求,获取所述信息检索请求所包含的文档主题,并在预设的索引表项中查找所述文档主题对应的主题索引服务器;根据查找结果,将所述信息检索请求转发给所述文档主题对应的主题索引服务器;接收主题索引服务器返回的检索结果,并对所述检索结果进行汇总和排序以生成供用户查看的检索结果列表。本发明对信息文档进行主题划分,并通过多个主题索引服务器对不同主题下的信息文档进行维护,提高信息检索的效率和质量。
【专利说明】一种信息检索装置和方法
【技术领域】
[0001]本发明涉及信息【技术领域】,尤其涉及一种信息检索装置和方法。
【背景技术】
[0002]信息检索(Information Retrieval)是指信息按照一定的方式组织起来,并根据信息用户的需要找出相关的信息的过程和技术。广义的信息检索全称为信息存储与检索,是指将信息按照一定的方式组织和存储起来,并根据用户的需要从信息集合中找出用户所需要的有关信息的过程。
[0003]信息检索的主要评价指标包含如下两方面:
[0004]1.检索质量:包含查准率和查全率。即对于一个用户查询,应能够检索到准确符合查询要求的结果并尽可能检索出最多的结果。
[0005]2.检索效率:应尽可能快地处理用户查询请求及反馈检索到的结果。主要评价指标为响应时间和吞吐量,即对从用户提交一次查询请求到获得结果所经历的时间和每秒钟处理的查询数。
[0006]在信息检索的过程中,如何提升检索质量和检索效率是目前同业开发者技术探索的重要方向。

【发明内容】

[0007]有鉴于此,本发明提供一种信息检索装置和方法。通过本发明,可以有效地提高检索质量和检索效率。
[0008]具体地,本发明是通过如下技术方案实现的:
[0009]一种信息检索装置,应用在信息检索服务器上,所述信息检索服务器与主题索引服务器交互,为用户提供信息检索服务,该装置包括:
[0010]请求解析单元,用于解析用户的信息检索请求,获取所述信息检索请求所包含的文档主题,并在预设的索引表项中查找所述文档主题对应的主题索引服务器;
[0011]请求转发单元,用于根据查找结果,将所述信息检索请求转发给所述文档主题对应的主题索引服务器;
[0012]接收整理单元,用于接收主题索引服务器返回的检索结果,并对所述检索结果进行汇总和排序以生成供用户查看的检索结果列表。
[0013]进一步地,所述接收整理单元,用于如果在预定的时间内没有接收到文档主题对应的主题索引服务器返回的检索结果,则通知请求解析单元在所述预设的索引表项中查找所述文档主题对应的备份主题索引服务器;
[0014]所述请求转发单元,进一步用于将所述信息检索请求转发给所述文档主题对应的备份主题索引服务器。
[0015]进一步地,所述请求转发单元,用于在所述信息检索请求不包含任何文档主题时,将所述信息检索请求转发给所有主题索引服务器。[0016]进一步地,所述装置还包括:
[0017]信息缓存单元,用于根据预定的缓存策略在本地缓存主题索引服务器返回的检索结果。
[0018]进一步地,所述文档主题包括:设备信息、本地文件以及关系型数据库中的一种或多种。
[0019]一种信息检索方法,应用在信息检索服务器上,所述信息检索服务器与主题索引服务器交互,为用户提供信息检索服务,该方法包括:
[0020]解析用户的信息检索请求,获取所述信息检索请求所包含的文档主题,并在预设的索引表项中查找所述文档主题对应的主题索引服务器;
[0021]根据查找结果,将所述信息检索请求转发给所述文档主题对应的主题索引服务器;
[0022]接收主题索引服务器返回的检索结果,并对所述检索结果进行汇总和排序以生成供用户查看的检索结果列表。
[0023]进一步地,所述方法还包括:
[0024]如果在预定的时间内没有接收到文档主题对应的主题索引服务器返回的检索结果,则在所述预设的索引表项中查找所述文档主题对应的备份主题索引服务器;
[0025]将所述信息检索请求转发给所述文档主题对应的备份主题索引服务器。
[0026]进一步地,所述方法还包括:
[0027]在所述信息检索请求不包含任何文档主题时,将所述信息检索请求转发给所有主题索引服务器。
[0028]进一步地,所述方法还包括:
[0029]根据预定的缓存策略在本地缓存主题索引服务器返回的检索结果。
[0030]进一步地,所述文档主题包括:设备信息、本地文件以及关系型数据库中的一种或多种。
[0031]由以上描述可以看出,本发明通过对网管系统中多业务、异构的信息资源进行信息文档主题的抽取和定义,同时对信息文档进行主题划分,并通过多个主题索引服务器对不同主题下的信息文档进行维护,进而提高信息检索的效率和质量。
【专利附图】

【附图说明】
[0032]图1是典型的提供信息检索服务的网络架构示意图;
[0033]图2是本发明示例性的一种实施方式中信息检索的网络架构示意图;
[0034]图3是本发明示例性的一种实施方式中信息检索装置的逻辑结构图;
[0035]图4是本发明示例性的一种实施方式中信息检索方法的流程示意图。
【具体实施方式】
[0036]信息检索时所涉及到的信息资源有很多种类,以网管系统为例,通常会涉及到诸如:关系型数据库、本地文件、网络设备MIB (Management Information Base,管理信息库)等,且一次信息检索可能会从多个信息资源中查找数据,因而目前所使用的典型信息检索服务架构图可以参考图1,包括:信息检索服务器和索引服务器。其中,索引服务器对检索目标的信息资源抽象提取为文本格式的信息文档,并对信息文档进行提取和分析,生成并存储索引与包含该索引的信息文档的映射关系。信息检索服务器用于接收用户的检索请求,并与所述索引服务器进行交互,将用户的检索请求转发给索引服务器,在索引服务器解析并执行上述检索请求后,信息检索服务器将索引服务器返回的检索结果反馈给用户。
[0037]然而,这样的方案在实现上存在一些难以避免的问题。例如:该方案面临的第一个实际问题是索引服务器上的文档索引与检索功能存在资源争用。仍以网管系统为例,其业务数据来源比较复杂,涉及关系型数据库、本地文件、网络设备MIB等异构信息载体。同时,即使是相同的信息载体,在不同的业务应用下,其信息存储格式也可能不一样。比如,设计为不同结构的数据库表和字段、不一样的文件数据格式、MIB表和字段等等。在同一个索弓I服务器中,信息文档的获取、索引功能与执行用户检索请求的功能存在对CPU、内存、磁盘I/O、进程句柄、网络带宽等各种索引服务器本地资源的争用。
[0038]另外,这样的方案在大规模文档容量下的检索响应延时长。由于所有的信息文档都集中在同一台索引服务器中进行索引与维护,在信息文档较多的时候,如果信息文档发生变化,就需要对全部的索引文档进行索引更新和检索时的索引文档加载。这往往成为检索过程中的性能瓶颈,导致信息检索的响应缓慢。
[0039]最后,这样的实现方案在处理并发检索请求时吞吐量低。由于是在同一个索引服务器上进行文档的索引和检索,多个业务种类的信息文档采集、分析、生成索引的过程与并发时检索请求处理过程存在本地资源争用,单位时间内处理的检索请求数量较低,影响用户体验。
[0040]有鉴于此,请参考图2,本发明提供一种信息检索装置和方法,针对多业务、异构的信息资源进行信息文档主题的抽取和定义,并根据主题对信息文档进行归类和划分。再根据不同主题下信息文档容量的增长趋势,将一个文档主题或者多个文档主题所属的信息文档由一个主题索引服务器提供索引和检索服务。也就是说,本发明设置有多个主题索引服务器,每一个主题索引服务器对一个或者多个文档主题对应的信息文档进行获取和分析,生成并存储索引与包含该索引的信息文档的映射关系。
[0041]原有需要在同一个索引服务器中执行的信息文档的获取、索引功能与执行用户的检索请求功能现在由多个主题索引服务器分担执行,在单个主题索引服务器上对CPU、内存、磁盘I/O、进程句柄、网络带宽等各种本地资源的竞争相对原方案要低。在用户请求检索时,由多个主题索引服务器并行处理,不再受单一索引服务器处理能力的局限,从而可以迅速响应检索请求,进而提高信息检索服务器的服务速度,提升用户体验。更进一步,设置多个主题索引服务器,每个主题索引服务器只需要获取、分析和更新各自关联的主题相关文档到服务器索引即可,避免了涉及全部文档索引的集中式维护引发的响应缓慢等问题。同时,可以依据不同主题下文档容量的增长趋势来规划和调整不同主题与主题索引服务器的对应规则。比如,扩充主题索引服务器,以实现主题索引服务器负载平衡。
[0042]下面以软件实现为例,详细描述本发明具体实现。本发明提供的信息检索装置,其运行在信息检索服务器上。作为本发明装置的运行载体,所述信息检索服务器通常至少包括有CPU、内存以及非易失性存储器,当然还可能包括各种转发芯片和I/O接口等硬件。所述信息检索服务器与主题索引服务器交互,为用户提供信息检索服务。请参考图3和图4,所述装置包括有:请求解析单元、请求转发单元、接收整理单元。在一个示例性的实施方案中,该装置在运行过程中执行如下步骤:
[0043]步骤101,请求解析单元解析用户的信息检索请求,获取所述信息检索请求所包含的文档主题,并在预设的索引表项中查找所述文档主题对应的主题索引服务器。
[0044]步骤102,请求转发单元根据查找结果,将所述信息检索请求转发给所述文档主题对应的主题索引服务器。
[0045]步骤103,接收整理单元接收主题索引服务器返回的检索结果,并对所述检索结果进行汇总和排序以生成供用户查看的检索结果列表。
[0046]为实现本发明目的,在进行上述步骤之前,管理人员或者开发人员需要事先将信息资源进行主题分类,并根据不同主题下信息文档容量的增长趋势,规划和制定不同主题所属信息文档对应进行索引和检索服务器的主题索引服务器规则,以生成预设的索引表项。以网管系统为例,在本发明一种示例性优选的实施方式中,对网管系统中不同业务应用中需要进行信息检索的各项信息资源进行分析,定义文档的主题。所述文档主题包括:设备信息、本地文件以及关系型数据库中的一种或多种。例如,可以具体分为:
[0047]设备:网络设备(包括路由器、交换机等)的信息。
[0048]接口:网络设备单板中接口的信息。
[0049]链路:物理或虚拟网络链接的信息。
[0050]Trap:网络设备或网管系统发送给管理人员的通知网络状况的告警消息。
[0051]系统日志:依照Syslog协议发送给网管系统的网络接入用户信息。
[0052]接入用户:用户管理 或计费应用中的网络接入用户信息。
[0053]审计日志:服务质量分析等应用中对于服务质量达成的审计信息。
[0054]所述索引表项中文档主题与主题索引服务器的对应关系可以参照表1设置。
[0055]
【权利要求】
1.一种信息检索装置,应用在信息检索服务器上,所述信息检索服务器与主题索引服务器交互,为用户提供信息检索服务,其特征在于,该装置包括: 请求解析单元,用于解析用户的信息检索请求,获取所述信息检索请求所包含的文档主题,并在预设的索引表项中查找所述文档主题对应的主题索引服务器; 请求转发单元,用于根据查找结果,将所述信息检索请求转发给所述文档主题对应的主题索引服务器; 接收整理单元,用于接收主题索引服务器返回的检索结果,并对所述检索结果进行汇总和排序以生成供用户查看的检索结果列表。
2.根据权利要求1所述的装置,其特征在于, 所述接收整理单元,进一步用于如果在预定的时间内没有接收到文档主题对应的主题索引服务器返回的检索结果,则通知请求解析单元在所述预设的索引表项中查找所述文档主题对应的备份主题索引服务器; 所述请求转发单元,进一步用于将所述信息检索请求转发给所述文档主题对应的备份主题索引服务器。
3.根据权利要求1所述的装置,其特征在于, 所述请求转发单元,进一步用于在所述信息检索请求不包含任何文档主题时,将所述信息检索请求转发给所有主题索引服务器。
4.根据权利要求1所述的装置,其特征在于,所述装置还包括: 信息缓存单元,用于根据预定 的缓存策略在本地缓存主题索引服务器返回的检索结果O
5.根据权利要求1所述的装置,其特征在于,所述文档主题包括:设备信息、本地文件以及关系型数据库中的一种或多种。
6.一种信息检索方法,应用在信息检索服务器上,所述信息检索服务器与主题索引服务器交互,为用户提供信息检索服务,其特征在于,该方法包括: 解析用户的信息检索请求,获取所述信息检索请求所包含的文档主题,并在预设的索引表项中查找所述文档主题对应的主题索引服务器; 根据查找结果,将所述信息检索请求转发给所述文档主题对应的主题索引服务器; 接收主题索引服务器返回的检索结果,并对所述检索结果进行汇总和排序以生成供用户查看的检索结果列表。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括: 如果在预定的时间内没有接收到文档主题对应的主题索引服务器返回的检索结果,则在所述预设的索引表项中查找所述文档主题对应的备份主题索引服务器; 将所述信息检索请求转发给所述文档主题对应的备份主题索引服务器。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括: 在所述信息检索请求不包含任何文档主题时,将所述信息检索请求转发给所有主题索引服务器。
9.根据权利要求6所述的方法,其特征在于,所述方法还包括: 根据预定的缓存策略在本地缓存主题索引服务器返回的检索结果。
10.根据权利要求6所述的方法,其特征在于,所述文档主题包括:设备信息、本地文件以及关系型数据库 中的一种或多种。
【文档编号】G06F17/30GK103714144SQ201310729264
【公开日】2014年4月9日 申请日期:2013年12月25日 优先权日:2013年12月25日
【发明者】刘梦雯 申请人:杭州华三通信技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1