一种信息检索方法和设备的制作方法

文档序号:6386452阅读:124来源:国知局
专利名称:一种信息检索方法和设备的制作方法
技术领域
本发明涉及通信领域,尤其涉及一种信息检索方法和设备。
背景技术
信息检索(Information Retrieval)是指信息按一定的方式组织起来,并根据用户的需求找出相关的信息的过程和技术。广义的信息检索全称为信息存储与检索,是指将信息按一定的方式组织和存储起来,并根据用户的需求从信息集合中找出用户所需要的有关信息的过程。信息检索的主要评价指标包含如下两方面1、检索质量包含查准率和查全率。即对于一个用户查询请求,应能够检索到准确、符合查询要求的结果并尽可能检索出最多的结果。2、检索效率应尽可能快地处理用户查询请求及反馈检索到的结果。参见图1,现有网管系统信息检索过程中,信息检索服务器根据用户输入的查询条件,在信息资源集合中查找到符合条件的信息集合,并将查找到的信息集合反馈给用户。由于信息检索时所涉及到的信息资源有很多种类(如关系型数据库、本地文件、网络设备MIB (Management Information Base,管理信息库)等),且一次信息检索可能会从多个信息资源中查找数据,因而目前使用的信息检索服务实现方式可以如图2所示,包括信息检索服务器解析查询请求者提供的检索内容,生成对应的布尔查询表达式;信息检索服务器依照不同的信息资源的访问方式,将查询请求分派到各个信息资源,对信息资源中的信息数据进行查询过滤或委托信息资源进行查询;当各个信息资源完成查询后,汇总检索到的信息集合,作为检索结果反馈给查询请求者。在实现本发明的过程中,申请人发现现有技术中至少存在以下问题1、信息检索过程与业务信息高耦合由于网管系统中业务数据的来源比较复杂,涉及诸如关系型数据库、本地文件、网络设备MIB等异构信息载体。而且即使是相同的信息载体,在不同业务应用下,其信息存储格式也可能是不一样的,比如设计为不同结构的数据库表和字段、不一样的文件数据格式、MIB表及字段等。因而某种业务数据的检索就需要在它涉及的信息载体上按照对应的信息存储格式进行检索,信息检索过程与业务信息高度耦合,不利于扩展和维护;2、大规模信息量下响应缓慢关系型数据库及网络设备MIB等信息资源在大规模信息量情况下,往往成为检索过程的性能瓶颈,导致信息检索响应缓慢;3、多业务信息检索效率低由于不同业务数据的信息载体和信息结构不一致,往往都需要实现自己的信息检索过程。因而多业务信息检索需要使用各个业务的信息检索过程来检索各自的数据并最终汇总,此种实现方式在非并发条件下可能效率低下。

发明内容
本发明的目的在于提供一种信息检索方法和设备,以提高网管系统中信息检索的效率和可扩展性,为此,本发明采用如下技术方案一种信息检索方法,应用于包括信息资源、信息检索服务器和索引服务器的网管系统中,该方法包括索引服务器从信息资源中获得信息数据,并确定所述信息数据中包含的索引项;所述索引服务器根据所获得的信息数据以及所确定的所述信息数据中包含的索引项,生成并存储索引项与包含该索引项的信息数据的映射关系;当所述索引服务器接收到信息检索服务器转发的检索请求时,所述索引服务器确定该检索请求对应的索引项;所述索引服务器根据所述检索请求对应的索引项,以及自身存储的索引项与包含该索引项的信息数据的映射关系,确定所述检索请求对应的信息数据,并将该信息数据返回给所述信息检索服务器,由所述信息检索服务器将该信息数据反馈给检索请求发起方。其中,所述索引服务器从信息资源中获得信息数据,具体为所述索引服务器根据信息资源的配置自动发现信息资源中的信息数据;或,所述索引服务器接收所述信息资源主动推送的信息数据。其中,所述索引服务器确定信息数据中包含的索引项,具体为所述索引服务器将获得的信息数据转换为预定义格式的信息摘要,并确定该信息摘要包含的索引项。其中,所述索引服务器确定信息数据中包含的索引项之后,还包括所述索引服务器根据所获得的信息数据以及所确定的所述信息数据中包含的索引项,存储信息数据与该信息数据包含的索引项的映射关系;所述索引服务器将所述信息数据返回给信息检索服务器,具体为所述索引服务器根据自身存储的信息数据与该信息数据包含的索引项的映射关系,确定所述检索请求对应的信息数据与该检索请求的相关度,并将该检索请求对应的信息数据按照相关度从高到低的顺序返回给所述信息检索服务器。其中,所述索引服务器中还存储有信息数据到信息资源中信息位置的定位方式,该方法还包括当所述索引服务器接收到对所述信息数据的访问请求时,所述索引服务器根据该请求访问的信息数据到信息资源中信息位置的定位方式,定位所述信息数据在所述信息资源中的信息位置,并返回给访问请求发起方。其中,所述信息资源包括数据库、网络设备以及文件系统中的一种或多种。一种索引服务器,应用于包括信息资源和信息检索服务器的网管系统中,该索引服务器包括数据获得模块,用于从信息资源中获得信息数据;数据分析模块,确定所述信息数据中包含的索引项;索引模块,用于根据所述数据获得模块获得的信息数据以及所述数据分析模块确定的信息数据中包含的索引项,生成并存储索引项与包含该索引项的信息数据的映射关系;确定模块,用于当所述索引服务器接收到信息检索服务器转发的信息检索请求时,确定该检索请求对应的索引项;
处理模块,用于根据所述检索请求对应的索引项,以及所述索引模块存储的索引项与包含该索引项的信息数据的映射关系,确定所述检索请求对应的信息数据,并将该信息数据返回给所述信息检索服务器,由所述信息检索服务器将该信息数据反馈给检索请求发起方。其中,所述数据获得模块具体用于,根据信息资源的配置自动发现信息资源中的信息数据;或,接收所述信息资源主动推送的信息数据。其中,所述数据分析模块具体用于,将所述数据获得模块获得的信息数据转换为预定义格式的信息摘要,并确定该信息摘要包含的索引项。其中,所述索引模块还用于,根据所述获得模块获得的数据信息以及所述数据分析模块确定的所述信息数据中包含的索引项,存储信息数据与该信息数据包含的索引项的映射关系;所述处理模块具体用于,根据所述索引模块存储的信息数据与该信息数据包含的索引项的映射关系,确定所述检索请求对应的信息数据与该检索请求的相关度,并将该检索请求对应的信息数据按照相关度从高到低的顺序返回给所述信息检索服务器。其中,所述索引模块还用于,存储信息数据到信息资源中信息位置的定位方式;所述处理模块还用于,当所述索引服务器接收到对所述信息数据的访问请求时,根据该请求访问的信息数据到信息资源中信息位置的定位方式,定位所述信息数据在所述信息资源中的信息位置,并返回给访问请求发起方。其中,所述信息资源包括数据库、网络设备以及文件系统中的一种或多种。本发明上述实施例中,通过索引服务器从信息资源中获得信息数据,并确定该信息数据中包含的索引项,从而根据所获得的信息数据以及所确定的该信息数据中包含的索引项,生成并存储索引项与包含该索引项的信息数据的映射关系;当索引服务器接收到信息检索服务器转发的检索请求时,该索引服务器确定该检索请求对应的索引项,并根据该检索请求对应的索引项,以及索引服务器自身存储的索引项与包含该索引项的信息数据的映射关系,确定该检索请求对应的信息数据,进而将该信息数据返回给信息检索服务器,由该信息检索服务器将该信息数据返回给检索请求发起方,提高了网管系统中信息检索的效率和可扩展性。


图1为一种现有网管系统中信息检索流程示意图;图2为一种现有网管系统中信息检索流程示意图;图3为本发明实施例提供的一种信息检索流程示意图;图4为本发明实施例提供的一种索引服务器的结构示意图。
具体实施例方式针对上述现有技术中存在的问题,本发明实施例提供了一种信息检索的技术方案,可以应用于包括信息检索服务器和索引服务器的网管系统。在该技术方案中,通过索引服务器从信息资源中获得信息数据,并确定该信息数据中包含的索引项,从而根据所获得的信息数据以及所确定的该信息数据中包含的索引项,生成并存储索引项与包含该索引项的信息数据的映射关系;当索引服务器接收到信息检索服务器转发的检索请求时,该索引服务器确定该检索请求对应的索引项,并根据该检索请求对应的索引项,以及索引服务器自身存储的索引项与包含该索引项的信息数据的映射关系,确定该检索请求对应的信息数据,进而将该信息数据返回给信息检索服务器,由该信息检索服务器将该信息数据返回给检索请求发起方。其中,上述信息资源可以包括数据库、网络设备以及文件系统中的一种或多种;相应地,索引服务器对信息资源的访问方式以及获得的信息数据的形式与信息资源的具体形式对应。下面将结合本发明的实施例中的附图,对本发明的实施例中的技术方案进行清楚、完整的描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明的实施例保护的范围。如图3所示,为本发明实施例提供的一种信息检索方法的流程示意图,可以包括以下步骤步骤301、索引服务器从信息资源中获得信息数据,并确定该信息数据中包含的索引项。具体的,针对异构的信息资源集合,在本发明实施例中,在网管系统中引入了索引服务器,对异构的信息资源集合中的信息数据进行组织,并响应检索请求。为了对异构的信息资源集合中的信息数据进行组织,在本发明实施例中,索引服务器可以根据信息资源的配置自动发现信息资源中的信息数据,或由业务功能实现信息资源采用主动推送的方式将信息数据注册到索引服务器中。其中,索引服务器自动发现信息资源中的信息数据可以周期性地进行;信息资源采用主动推送的方式将信息数据注册到索引服务器可以周期性的进行,也可以当信息资源中发生信息数据更新时进行。索引服务器从信息资源中获得信息数据后,可以通过预定义的转换方式将该信息数据转换成预定义格式的信息摘要。通常数据信息可以转换为“key :value”的文本摘要格式(即“属性属性值”,如“[属性A]:属性值A ;[属性B]:属性值B”),而文本信息则可以抽取需要进行查询的关键部分。完成信息数据到信息摘要的转换后,索引服务器可以将得到的信息摘要通过词素切分、停用词去除、词干提取等方式进行数据分析,得到信息摘要所对应的索引项。步骤302、索引服务器根据所获得的信息数据以及所确定的信息数据中包含的索引项,生成并存储索引项与包含该索引项的信息数据的映射关系。具体的,索引服务器确定所获得的信息数据中包含的索引项后,可以根据所获得的信息数据,以及该信息中包含的索引项,生成索引项与包含该索引项的信息数据的映射关系。例如,索引服务器获得的信息数据包括信息数据1、信息数据2和信息数据3 ;信息数据I中包含索引项a、索引项b、索引项C,信息数据2中包含索引项a、索引项C、索引项山信息数据3中包含索引项b、索引项d ;则索引服务器生成的索引项与包含该索引项的映射关系可以如表I所示表I
索引项信息数据索引项a信息数据1、信息数据2索引项b信息数据1、信息数据3索引项c信息数据1、信息数据2索引项d信息数据2、信息数据3优选地,索引服务器生成的索引项与包含该索引项的映射关系中还可以记录索引项在相应信息数据中出现的次数,如表2所示表2
索引项信息数据索引项a信息数据I [2]、信息数据2 [I]索引项b信息数据I [I]、信息数据3 [3]其中,索引项a在信息数据I中出现2次,在信息数据2中出现I次;索引项b在信息数据I中出现I次,在信息数据3中出现3次。步骤303、当索引服务器接收到信息检索服务器转发的检索请求时,索引服务器确定该检索请求对应的索引项。具体的,在本发明实施例中,当信息检索服务器接收到用户发起的检索请求时。该信息检索服务器会将该检索请求转发给索弓I服务器,由索引服务器解析并执行该检索请求。索引服务器接收到信息检索服务器转发的检索请求后,对该检索请求进行解析(如词素切分、停用词去除、词干提取等),得到该检索请求对应的索引项。步骤304、索引服务器根据该检索请求对应的索引项,以及自身存储的索引项与包含该索引项的信息数据的映射关系,确定该检索请求对应的信息数据,并将该信息数据返回给信息检索服务器,由信息检索服务器将该信息数据反馈给检索请求发起方。具体的,当索引服务器确定了接收到的检索请求对应的索引项之后,该索引服务器可以根据该检索请求对应的索引项,以及索引服务器自身存储的索引项与包含该索引项的信息数据的映射关系,确定该检索请求对应的信息数据。以表I所示的索引项与包含该索引项的信息数据的映射关系为例,假设索引服务器确定的检索请求对应的索引项为索引a和索引项C,则索引服务器根据该索引项以及自身存储的映射关系确定的信息数据为信息数据I和信息数据2。索引服务器确定检索请求对应的信息数据后,可以将该信息数据返回给信息检索服务器,由信息检索服务器将该信息数据反馈给检索请求发起方。进一步地,在本发明实施例中,索引服务器确定检索请求对应的信息数据后,还可以确定该信息数据与检索请求的相关度,并将该检索请求对应的信息数据按照相关度从高到低的顺序返回给信息检索服务器。相应地,索引服务器从信息资源中获得信息数据,并确定了该信息数据中包含的索引项后,可以存储信息数据与该信息数据包含的索引项的映射关系,如表3所示表3
信息数据索引项信息数据I索引项a、索引项b、索引项c信息数据2索引项a、索引项C、索引项d信息数据3索引项b、索引项d优选地,索引服务器生成的信息数据与该信息数据包含的索引项的映射关系中还可以记录索引项在相应信息数据中出现的次数。当索引服务器确定了检索请求对应的信息数据后,该索引服务器可以根据该检索请求对应的索引项、索引服务器存储的索引项与包含该索引项的信息数据的映射关系、以及信息数据与该信息数据包含的索引项的映射关系确定检索请求与对应的信息数据的相关度,并根据该相关度对信息数据进行排序和反馈。其中,索引服务器确定检索请求与对应的信息数据的相关度的具体实现方式在此不再赘述。进一步地,在本发明实施例中,索引服务器中还可以存储信息数据到信息资源中信息位置的定位方式。用户在使用检索结果进行业务功能操作时,当需要定位到信息资源中的原始信息数据时,可以发起对信息数据的访问请求。当索引服务器接收到对信息数据的访问请求时,索引服务器根据该请求访问的信息数据到信息资源中信息位置的定位方式,定位该信息数据在信息资源中的信息位置,并返回给访问请求发起方。通过以上描述可知,在本发明实施例提供的技术方案中,通过索引服务器将异构信息资源中的信息数据进行了统一的索引,在需要时可以将不同信息资源中的信息数据同时检索,提高了不同信息资源中信息数据的检索效率;在信息检索过程中,不需要请求信息数据所在的原始信息资源,可以迅速进行检索响应;通过索引服务器中索引项与包含该索引项的信息数据的映射关系的存储,避免了在大规模信息量情况下,关系型数据库及网络设备MIB等信息资源造成的信息检索的性能瓶颈,提高了网管系统中信息检索的可扩展性。基于上述方法实施例系统的发明构思,本发明实施例还提供了一种索引服务器,可以应用于上述方法实施例。如图4所示,为本发明实施例提供的一种索引服务器的结构示意图,可以包括数据获得模块41,用于从信息资源中获得信息数据;数据分析模块42,确定所述信息数据中包含的索引项;索引模块43,用于根据所述数据获得模块41获得的信息数据以及所述数据分析模块42确定的信息数据中包含的索引项,生成并存储索引项与包含该索引项的信息数据的映射关系;
确定模块44,用于当所述索引服务器接收到信息检索服务器转发的信息检索请求时,确定该检索请求对应的索引项;处理模块45,用于根据所述检索请求对应的索引项,以及所述索引模块43存储的索引项与包含该索引项的信息数据的映射关系,确定所述检索请求对应的信息数据,并将该信息数据返回给所述信息检索服务器,由所述信息检索服务器将该信息数据反馈给检索请求发起方。其中,所述数据获得模块42可以具体用于,根据信息资源的配置自动发现信息资源中的信息数据;或,接收所述信息资源主动推送的信息数据。其中,所述数据分析模块42可以具体用于,将所述数据获得模块41获得的信息数据转换为预定义格式的信息摘要,并确定该信息摘要包含的索引项。其中,所述索引模块43还可以用于,根据所述获得模块获得的数据信息以及所述数据分析模块确定的所述信息数据中包含的索引项,存储信息数据与该信息数据包含的索引项的映射关系;相应地,所述处理模块45可以具体用于,根据所述索引模块43存储的信息数据与该信息数据包含的索引项的映射关系,确定所述检索请求对应的信息数据与该检索请求的相关度,并将该检索请求对应的信息数据按照相关度从高到低的顺序返回给所述信息检索服务器。其中,所述索引模块43还可以用于,存储信息数据到信息资源中信息位置的定位方式;相应地,所述处理模块45还可以用于,当所述索引服务器接收到对所述信息数据的访问请求时,根据该请求访问的信息数据到信息资源中信息位置的定位方式,定位所述信息数据在所述信息资源中的信息位置,并返回给访问请求发起方。其中,所述信息资源包括数据库、网络设备以及文件系统中的一种或多种。本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备(可以是手机,个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。
权利要求
1.一种信息检索方法,其特征在于,应用于包括信息资源、信息检索服务器和索引服务器的网管系统中,该方法包括 索引服务器从信息资源中获得信息数据,并确定所述信息数据中包含的索引项; 所述索引服务器根据所获得的信息数据以及所确定的所述信息数据中包含的索引项,生成并存储索引项与包含该索引项的信息数据的映射关系; 当所述索引服务器接收到信息检索服务器转发的检索请求时,所述索引服务器确定该检索请求对应的索引项; 所述索引服务器根据所述检索请求对应的索引项,以及自身存储的索引项与包含该索引项的信息数据的映射关系,确定所述检索请求对应的信息数据,并将该信息数据返回给所述信息检索服务器,由所述信息检索服务器将该信息数据反馈给检索请求发起方。
2.如权利要求1所述的方法,其特征在于,所述索引服务器从信息资源中获得信息数据,具体为 所述索引服务器根据信息资源的配置自动发现信息资源中的信息数据;或, 所述索引服务器接收所述信息资源主动推送的信息数据。
3.如权利要求1所述的方法,其特征在于,所述索引服务器确定信息数据中包含的索引项,具体为 所述索引服务器将获得的信息数据转换为预定义格式的信息摘要,并确定该信息摘要包含的索引项。
4.如权利要求1所述的方法,其特征在于,所述索引服务器确定信息数据中包含的索引项之后,还包括 所述索引服务器根据所获得的信息数据以及所确定的所述信息数据中包含的索引项,存储信息数据与该信息数据包含的索引项的映射关系; 所述索引服务器将所述信息数据返回给信息检索服务器,具体为 所述索引服务器根据自身存储的信息数据与该信息数据包含的索引项的映射关系,确定所述检索请求对应的信息数据与该检索请求的相关度,并将该检索请求对应的信息数据按照相关度从高到低的顺序返回给所述信息检索服务器。
5.如权利要求1所述的方法,其特征在于,所述索引服务器中还存储有信息数据到信息资源中信息位置的定位方式,该方法还包括 当所述索引服务器接收到对所述信息数据的访问请求时,所述索引服务器根据该请求访问的信息数据到信息资源中信息位置的定位方式,定位所述信息数据在所述信息资源中的信息位置,并返回给访问请求发起方。
6.如权利要求1-5任一项所述的方法,其特征在于,所述信息资源包括数据库、网络设备以及文件系统中的一种或多种。
7.一种索引服务器,其特征在于,应用于包括信息资源和信息检索服务器的网管系统中,该索引服务器包括 数据获得模块,用于从信息资源中获得信息数据; 数据分析模块,确定所述信息数据中包含的索引项; 索引模块,用于根据所述数据获得模块获得的信息数据以及所述数据分析模块确定的信息数据中包含的索引项,生成并存储索引项与包含该索引项的信息数据的映射关系;确定模块,用于当所述索引服务器接收到信息检索服务器转发的信息检索请求时,确定该检索请求对应的索引项; 处理模块,用于根据所述检索请求对应的索引项,以及所述索引模块存储的索引项与包含该索引项的信息数据的映射关系,确定所述检索请求对应的信息数据,并将该信息数据返回给所述信息检索服务器,由所述信息检索服务器将该信息数据反馈给检索请求发起方。
8.如权利要求7所述的索引服务器,其特征在于, 所述数据获得模块具体用于,根据信息资源的配置自动发现信息资源中的信息数据;或,接收所述信息资源主动推送的信息数据。
9.如权利要求7所述的索引服务器,其特征在于, 所述数据分析模块具体用于,将所述数据获得模块获得的信息数据转换为预定义格式的信息摘要,并确定该信息摘要包含的索引项。
10.如权利要求7所述的索引服务器,其特征在于, 所述索引模块还用于,根据所述获得模块获得的数据信息以及所述数据分析模块确定的所述信息数据中包含的索引项,存储信息数据与该信息数据包含的索引项的映射关系; 所述处理模块具体用于,根据所述索引模块存储的信息数据与该信息数据包含的索引项的映射关系,确定所述检索请求对应的信息数据与该检索请求的相关度,并将该检索请求对应的信息数据按照相关度从高到低的顺序返回给所述信息检索服务器。
11.如权利要求7所述的索引服务器,其特征在于, 所述索引模块还用于,存储信息数据到信息资源中信息位置的定位方式; 所述处理模块还用于,当所述索引服务器接收到对所述信息数据的访问请求时,根据该请求访问的信息数据到信息资源中信息位置的定位方式,定位所述信息数据在所述信息资源中的信息位置,并返回给访问请求发起方。
12.如权利要求7-11任一项所述的索引服务器,其特征在于,所述信息资源包括数据库、网络设备以及文件系统中的一种或多种。
全文摘要
本发明公开了一种信息检索方法和设备,该方法包括索引服务器从信息资源中获得信息数据,并确定信息数据中包含的索引项;索引服务器根据所获得的信息数据以及所确定的信息数据中包含的索引项,生成并存储索引项与包含该索引项的信息数据的映射关系;当索引服务器接收到信息检索服务器转发的检索请求时,索引服务器确定该检索请求对应的索引项;索引服务器根据检索请求对应的索引项,以及自身存储的索引项与包含该索引项的信息数据的映射关系,确定检索请求对应的信息数据,并将该信息数据返回给信息检索服务器,由信息检索服务器将该信息数据反馈给检索请求发起方。在本发明中,提高了网管系统中信息检索的效率和可扩展性。
文档编号G06F17/30GK103020300SQ20121059253
公开日2013年4月3日 申请日期2012年12月28日 优先权日2012年12月28日
发明者刘梦雯 申请人:杭州华三通信技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1