搜索调度方法及搜索服务器的制作方法

文档序号:6469227阅读:118来源:国知局

专利名称::搜索调度方法及搜索服务器的制作方法
技术领域
:本发明涉及网络
技术领域
,尤其涉及一种搜索调度方法及一种搜索服务器。
背景技术
:在当今网络世界中,搜索引.擎已经成为进行互联网信息检索必不可少的工具,现有的搜索引擎有传统的互联网巨头,如Google,Yahoo,Baidu,还有一些专业的针对某一行业的垂直搜索引擎,如酷讯的火车票搜索,房老大房地产信息搜索平台。还有移动领域的搜索引擎,如cgogo,UUCun,roboo等。还有一些提供本地服务的搜索引擎,如电信的号码百事通。然而,网上信息极度膨胀导致查找信息犹如大海捞针。虽然优秀搜索引擎提供了大量的信息资源并以优先的算法做支撑来帮助用户寻找他希望用的信息,但目前单个搜索引擎也有它的局限性。元搜索引擎(MetasearchEngine),是一种调用其它独立搜索引擎的引擎,亦称"搜索引擎之母(Themotherofsearceengines)"。在这里,"元"(Meta)为"总的"、"超越"之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。相对元搜索引擎,可被利用的独立搜索引擎称为"源搜索引擎"(sourceEngine),或"成员搜索引擎",整合、调用、控制和优化利用源搜索引擎的技术,称为"元搜索技术"(Meta-searchingtechnique),元4叟索技术是元搜索引擎的核心。元搜索引擎可以通过元索引选择较优的搜索引擎。但不同搜索引擎一般有不同的请求格式与返回结果格式,因此,传统元搜索引擎不能无限制的集成多个成员搜索引擎的能力。在OpenSearch(开放搜索)规范中为各搜索引擎描述其能力提供了一种标准,搜索引擎只要按照OpenSearch规范提供描述文件,其它应用就能够很方便的通过其接口描述文件提供的公共接口与搜索引擎进行信息交互。规范的推出方便了各搜索引擎能力之间的集成。但现有的元搜索引擎要么元搜索引擎之间不能互相访问,或者选择搜索引擎的过程复杂。斯i旦3畐大学的LuisGravano,HkctorGarcia-Molina在i仑文《GeneralizingGIOSStoVector-SpaceDatabasesandBrokerHierarchies》中提到了基于元元索亏I的搜索引擎调度方案,该技术方案的系统构架如图1所示,该系统包括多个元搜索平台(图中示出两个),各元搜索平台基于元元搜索平台进行管理,元元搜索平台为各搜索平台建立元元索引,各元搜索平台管理各自所管理的成员搜索引擎,为各成员搜索引擎建立元索引,图2为该现有:^支术的基于元元索引的搜索引擎调度方法,包括101,元搜索平台接收来自用户的搜索请求;102,元搜索平台把所接收到的搜索请求转发到元元搜索平台;103,元元搜索平台根据元元索引计算出元搜索51擎对搜索请求的区配度,并根据预先设定的阈值,选择区配度较好的元搜索平台,例如选择元搜索平台B和元搜索平台C;104,把搜索请求转发到步骤103所选择的元搜索平台B;105,元搜索平台B接收到搜索请求后,根据元索引计算出成员搜索引擎的区配度;106,把搜索引擎标识及其区配度返回给元元搜索平台;107,把搜索请求转发到步骤103所选择的元搜索平台C;108,元搜索平台C接收到搜索请求后,根据元索引计算出成员搜索引擎的区配度;109,把搜索引擎标识及其区配度返回给元元搜索平台;110,元元搜索平台根据各元搜索平台返回的搜索引擎及其权重和预先设定的阈值,计算出较好的成员搜索引擎;111,元元搜索平台把较好的成员搜索引擎返回给元搜索平台。发明人在实现本发明的过程中,发现在上述现有技术方案中,由于各元搜索平台之间通过元元搜索平台实现互相调用,元元搜索平台为各元搜索平台建立元元索引的过程会导致信息损失,导致无法找到真正需要的成员搜索引擎,元搜索平台接收到搜索请求后,需通过元元搜索平台,由元元搜索平台选择确定成员搜索引擎,调度流程复杂,处理时延较长。9
发明内容为了解决上述问题,本发明实施例提供一种搜索调度方法及一种搜索服务器,以提高搜索引擎的调度效率,筒化调度流程,提高处理效率。为了达到上述发明目的,本发明实施例提供了一种搜索调度方法,包括接收搜索请求;获取本地注册的各个搜索引擎对所述搜索请求的区配度;获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息;根据所述搜索服务器的标识信息访问对应的搜索服务器,获取所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度;根据所述本地注册的各个搜索引擎对所述搜索请求的区配度及所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索的搜索引擎。及一种搜索服务器,包括本地注册单元,用于接收搜索引擎的本地注册请求,对搜索引擎进行本地注册;虚拟注册单元,用于接收归属于其他搜索服务器的搜索引擎的虚拟注册请求,所述虚拟注册请求包含搜索引擎标识、地域信息、搜索类型及所属搜索服务器的标识信息,根据所述虚拟注册请求中的搜索引擎标识、地域信息、搜索类型及所属搜索服务器的标识信息对所述搜索服务器的搜索引擎进行虚拟注册;元索引单元,用于生成并管理所述本地注册单元所注册的搜索引擎的元索引;搜索调度单元,用于接收搜索请求,从所述元索引单元获取由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度,获取由所述虚拟注册单元虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息,根据所述搜索服务器的标识信息访问所述搜索服务器,获取由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度,由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度及由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索的搜索引擎。本发明实施例还提供了另一种搜索调度方法,包括接收搜索请求;从所述搜索请求中提取搜索条件,以所提取的搜索条件查询元索引数据库,获取本地注册的各个搜索引擎对所述搜索请求的区配度;判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,若判断为是,则选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索。及另一种搜索服务器,包括接收单元,用于接收搜索请求;搜索条件提取单元,用于从所述搜索请求中提取搜索条件;区配度获取单元,用于根据所述搜索条件提取单元所提取的所述搜索条件查询元索引数据库,获取本地注册的各个搜索引擎对所述搜索请求的区配度;搜索引擎选择单元,用于判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,若判断为是,则选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索。实施本发明实施例,通过对其他搜索服务器所管理的搜索引擎进行虚拟注册,实现了在接收到搜索请求后,基于所述虚拟注册进行搜索服务器间的互相访问,在各搜索服务器所管理的搜索引擎中选择较优的搜索引擎,提高了搜索范围及搜索准确度,提高了调度效率,简化了调度流程。实施本发明另一实施例,在接收到搜索请求后,根据搜索请求中提取的搜索条件查询并获取本地注册的各个搜索引擎对所述搜索请求的区配度,进而通过判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,在判断为是时,选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索,实现了快速、高效的选择较优的搜索引擎,提高了的搜索引擎的调度效率,简化了调度流程。为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图l是现有技术的一种元元搜索系统组成示意图2是该现有技术的一种基于元元索引的搜索引擎调度方法;图3是本发明实施例一种搜索调度方法的流程示意图4是本发明实施例搜索引擎选择方法的流程示意图5是本发明搜索服务器实施例的组成示意图6是本发明搜索服务器实施例中搜索调度单元8的组成示意图7是本发明搜索调度单元8实施例中第二区配度获取单元83的组成示意图8a是本发明第二区配度获取单元83实施例中标识信息获取单元831第一实施例组成示意图8b是本发明第二区配度获取单元83实施例中标识信息获取单元831第二实施例组成示意图8c是本发明第二区配度获取单元83实施例中标识信息获取单元831第三实施例组成示意图9是本发明搜索调度单元8实施例中选择单元84的组成示意图;图10是本发明实施例的另一种搜索调度方法的流程示意图;图11是本发明实施例的另一种搜索服务器的组成示意图。具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围参考图3,是本发明实施例一种搜索调度方法的流程示意图,该方法流程包括201,搜索服务器接收搜索请求。在本实施例中,在搜索服务器需为各搜索12引擎建立元索引,也即搜索引擎在搜索服务器进行本地注册,在进行本地注册时,搜索服务器的本地注册中心按照OpenSearch规范提供注册接口给搜索引擎注册时使用。本地注册中心也可以基于OpenSearch的自动发现机制,主动获取搜索引擎的注册信息。即搜索引擎发布一个种子文档。种子文档的一个具体示例如下<feedxmlns="http:〃www.w3.org/2005/Atom"xmlns:opensearch="http:〃a9.com/-/spec/opensearch/l.l/"><linkrel="search"href="A"/>..//exaw//6.com/<9/7ew>siearcAcfe5rn》//ow._x7w/"type="application/opensearchdescription+xml"title="ContentSearch"/><!——此url中包含搜索引擎的注册信息-->々feed〉文档中link的超链接即为搜索引擎注册信息的URL(uniformresourcelocation,统一资源定位)。本地注册中心根据种子文档中搜索引擎注册信息的URL地址获取搜索引擎的注册信息。搜索引擎包括各种搜索引擎,可以是互联网和移动网上的搜索引擎,如baidu,google,cgogo等;也可以是垂直搜索引擎,也可以是提供搜索功能的数据库;也可以是本地搜索引擎,如黄页搜索等。搜索引擎在搜索服务器的本地注册中心注册的注册信息包括搜索引擎标识,地域信息,搜索类型,搜索请求接口。其中搜索引擎的标识唯一标识一个搜索引擎,可以是搜索引擎的名字,如搜索引擎百度的标识可以是baidu,或者中文的"百度,,,也可以是其他能唯一标识搜索引擎的标志;地域信息是指所述搜索引擎服务的地域范围。比如一个提供深圳餐馆搜索的引擎,则它的地域信息为中国/广东/深圳;搜索类型可以是搜索引擎的内容分类,也可以是地理位置分类,类型也可以由一个或多个标签组成。所述分类或者标签可以由搜索引擎自身定义,或者由搜索服务器定义类型,由搜索引擎注册时选择所属分类或标签。一个搜索引擎可以属于多个搜索类型。搜索请求接口是搜索引擎的搜索调用接口。搜索请求接口可以是遵守Opensearch规范的URL查询模板。也可以是其他可以调用的API(ApplicationProgrammingInterface,应用禾呈序才妄口),嗦口webservice才妄口或Ajax(asynchronousJavaScriptandXML,异步JavaScript和可扩展标记语言)*接口。下面是一个搜索引擎注册信息的具体示例<xmlversion="1.0"encoding="UTF-8"〉<OpenSearchDescriptionxmlns="http:〃a9.com/-/spec/opensearch/l.l/"><ShortName>WebSearch</ShortName><!—此处表示是搜索引擎标识画-><Description>UseExample.comtosearchtheWeb.</Description〉<Tags>exampleweb</Tags><!—此处表示是搜索类型—><Contact>admin@example.com</Contact><Urltype="application/rss+xmrtemplate="http:〃example.com/q={searchTerms}&amp;pw={startPage}&amp;format=rss'V><!_此处表示是搜索请求URL-></OpenSearchDescription〉其中,用ShortName来标识搜索引擎的标识,用Tags来表示搜索类型,用Url查询模板来表示搜索请求接口。搜索服务器所管理的搜索引擎即指所有在本地注册中心注册的搜索引擎。搜索服务器接收其所管理的搜索引擎本地注册请求后,为在本地注册中心注册的搜索引擎建立元索引,建立元索引的具体方式有多种,如表一所示的一个采用定量的方式建立的元索引的具体示例。表一:<table>tableseeoriginaldocumentpage14</column></row><table>其中,内容源一行代表内容源。术语一列代表搜4建词术语。全局反文件频率权值gidf为内容源中的文件总算与含有术语q的文件数的比值;对于给定的搜索请求q,假设q被切分成(keyl,key2,…keyk),keyl,key2,…keyk的权重分别为(ql,q2,…,qk),则对于搜索请求q对应搜索引擎的区配度{《々喊*附,+2力承g《,a,》R=max--JgrI具体实施时,无论元索引用什么算法构建,最终都是为了计算搜索请求与搜索引擎的区配度。具体可参考孟卫一和吴宗寰在《计算机研究与发展》2001年04期上发表的论文《集成搜索引擎的文本数据库选择》。本发明实施例中,搜索服务器还接收其他搜索服务器所管理的搜索引擎的虚拟注册信息,所述虚拟注册信息包含搜索引擎标识、地域信息、搜素类型及所属搜索服务器的标识信息。虚拟注册请求可以由搜索引擎直接发起的请求,也可以由其所属的搜索服务器代理发起的,搜索服务器接收到所述虚拟注册请求后,根据所述虚拟注册请求中携带的所述搜索引擎标识、地域信息、搜素类型及所属搜索服务器的标识信息对搜索引擎进行虚拟注册。也可以由其他搜索服务器发布一个虚拟注册文档,所述文档包含其所管理的支持虚拟注册的搜索引擎信息,搜索服务器从该虚拟注册文档主动获取其他搜索服务器所管理的搜索引擎信息,根据该搜索引擎信息对搜索引擎进行虚拟注册。相应地,搜索服务器的也可以把其所管理的搜索引擎虚拟注册到其他搜索服务器。虚拟注册是指虚拟注册中心接受搜索引擎的注册信息,但虚拟注册中心不为这些虚拟注册的搜索引擎建立元索引。虚拟注册信息中除了包括搜索引擎标识,地域信息、搜索类型,搜索引擎所属的搜索服务器的标识信息,还可以包含搜索请求接口。所述搜索引擎所属的搜索服务器的标识信息可以是搜索服务器的名称,也可以是搜索服务器的地理位置信息等。下面为一个搜索服务器主动获取其他搜索服务器的搜索引擎的虚拟注册信息的虚拟注册文档的具体示例。<xmlversion="1.0"encoding="UTF-8"><VirtualRegisterDescriptionxmlns="http:〃a9.com/-/spec/opensearch/l.l/"><SearchEngine><SearchEngineID〉Yohoo</SearchEngineID><!_此处表示是搜索引擎标识<MetaSearchID>MetaSearchA</MetaSearchID><!_此处是所属的搜索服务器标识-><Description〉UseExample.comtosearchtheWeb.</Description><Tags>exampleweb</Tags><!—此处表示是搜索类型—><Urltype="application/rss+xml"template="http:〃example.com/q={searchTerms}&amp;pw={startPage}&amp;format=rss7><!—此处表示是搜索请求URL陽-〉</SearchEngine></VirtualRegisterDescription>其中,一个虚拟注册文档可以包含多个可以虚拟注册的搜索引擎信息。ShortName表示搜索引擎的标识,MetaSearchID表示搜索引擎所属的搜索服务器,Tags表示搜索类型,用Url查询模板来表示搜索请求接口。202,获取本地注册的各个搜索引擎对该搜索请求的区配度。所述区配度是指搜索引擎的查询结果对于给定查询(也即搜索条件)的相似度,其相似度大小可以近似反映所述给定查询和搜索引擎相关有用程度大小。一般来说,对于给定查询,区配度越高,则搜索引擎的查询结果越正确。搜索服务器从搜索请求中提取出搜索条件,所述搜索条件可以是搜索关键词,也可以是SQL(StructuredQueryLanguage结构化查询语言)语句。从本地注册中心取出所有注册的搜索引擎列表,根据元索引计算搜索引擎对搜索条件的区配度。搜索服务器可以对其所管理的搜索引擎的区配度进行从高到低排序,若存在区配度大于预先设定的门限值T的搜索引擎,则可以认为已经找到搜索效果较好的搜索引擎,本次搜索引擎的选择流程结束。搜索服务器可以利用这些区配度大于预设门限值T的搜索引擎进行搜索。若搜索服务器不存在区配度大于所述预先设定的们限值T的搜索引擎时,则继续执行步骤203,当然搜索服务器也可以在找到区配度大于预设门限值T的搜索引擎时,仍然继续执行步骤203,以期从搜索服务器虛拟注册的搜索引擎中找到搜索效果更好的搜索引擎。预先设定的门限值T可以为搜索服务器为其所管理的各个搜索引擎统一设定的,另外每个搜索引擎可以有一个对应的门限值T,比如搜索引擎Ei对应的门限值为Ti,若Ei的区配度Ri大于Ti,则认为Ei的搜索效果已经较好,这种情况也可以认为已经找到搜索效果较好的搜索引擎。其中,Ti可以由搜索服务器预先设定,也可以为搜索引擎自己提供。203,获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息。根据所获取的搜索引擎的标识信息及其所属搜索服务器的标识信息,搜索服务器可以确定搜索引擎及其所属的搜索服务器。此步骤分如下两种情况1,搜索请求中包含搜索类型搜索服务器从搜索请求中提取出要搜索类型,虚拟注册中心找到属于该搜索类型的一个或多个搜索引擎。然后从搜索请求中提取出要搜索的地域信息,若搜索请求中不包含地域信息,则获取这些搜索引擎的标识信息及其所属的搜索服务器的标识信息。若所述搜索请求中包含地域信息,则从上述找到的搜索引擎中,找出服务的范围涵盖所述地域信息的搜索引擎。比如,若地域信息为深圳市,则选择服务范围包含深圳市的搜索引擎。然后获取这些搜索引擎的标识信息及其所属的搜索服务器的标识信息。2,搜索请求中只包含搜索关键词q,不包括搜索类型。此时,可以有如下三种方案一、虚拟注册中心可以确定搜索请求的默认搜索类型。进而确定属于该默认搜索类型的搜索引擎,获取在本搜索服务器虚拟注册的属于该默认搜索类型的搜索引擎的标识信息及其所属的搜索服务器的标识信息。所述默认搜索类型由搜索服务器预先设定。二、从所述搜索请求中提取出要搜索的地域信息,若搜索请求中不包含地域信息,则获取在虚拟注册中心注册的所有搜索引擎的标识信息以及所属的搜索服务器的标识信息。若所述搜索请求中包含地域信息,则从所有的搜索引擎中,找出服务的范围涵盖所述地域信息的搜索引擎。比如,若地域信息为深圳市,则选择服务范围包含深圳市的搜索引擎。获取在虚拟注册中心注册的所有搜索引擎的标识信息以及所属的搜索服务器的标识信息。三、为搜索类型建立词库,把搜索请求和词库进行匹配,根据匹配结果确定搜索请求所属的类型,进而确定属于该默认搜索类型的搜索引擎,获取在本搜索服务器虚拟注册的属于该搜索类型的搜索引擎的标识信息及其所属的搜索服务器的标识信息。。具体实现时,所述搜索请求和词库进行匹配为从所述搜索请求中提取搜索关键词,根据所述关键词确定预设置的对应该关键词的搜索类型。在一具体示例中,如表二所示,在搜索类型的词库中,每一个搜索类型有很多关键词组成。从搜索请求中提取出搜索请求关键词q,把q进行切词,如切成(keyl,key2),然后把《keyl,key2》与词库进行匹配。通过匹配找到搜索请求q属于的搜索类型。表二:<table>tableseeoriginaldocumentpage18</column></row><table>204,根据所述搜索服务器的标识信息访问与对应的搜索服务器,获取所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度。为了便于清楚描述,假设所述搜索服务器为搜索服务器A,所述本搜索服务器虚拟注册的搜索引擎所属搜索服务器为搜索服务器B,搜索服务器A根据所述在本搜索服务器虚拟注册的搜索引擎所属搜索服务器B的标识信息可以进而确定搜索服务器B的IP地址等信息,实现对搜索服务器B的访问,将搜索请求转发至该搜索服务器,进而根据在本搜索服务器虚拟注册的搜索引擎的标识信息,由搜索服务器B获取该搜索引擎的区配度,并将该区配度信息返回给搜索服务器A。具体实现上述过程可以包含如下两个步骤1,搜索服务器A虚拟注册中心收到虚拟注册中心返回的搜索引擎,从搜索请求中提取出搜索关键词q,然后把搜索关键词q和搜索引擎标识发送到其所属的搜索服务器。假设发送的搜索引擎为bl,其所属的搜索服务器为B。2,搜索服务器B收到请求后,通过搜索服务器B的元索引计算bl对关键词q的区配度R一bl;并把区配度和搜索引擎bl的访问授权信息返回到搜索服务器A。其中,搜索引擎bl的访问授权信息为可选,也可以只返回bl的区配度值到搜索服务器A。所述访问授权信息,是搜索服务器对搜索引擎的访问权限控制信息,可以是一个授权码。搜索服务器A可以凭借该访问授权信息直接访问搜索引擎bl.若搜索服务器收到多个搜索引擎信息,则重复上述两个步骤205,根据所述本地注册的各个搜索引擎对该搜索请求的区配度及所述本搜索服务器虛拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索的搜索引擎。搜索服务器A收到其他搜索服务器返回的搜索引擎区配度信息及其访问授权信息后,记录访问授权信息。并比较搜索服务器A所管理的搜索引擎的匹配度与这些搜索引擎的区配度。根据匹配度大小比较出搜索效果好的搜索引擎。选择的方法具体可以为让这些搜索引擎的区配度从高到低排序,选出区配度最高的前N个搜索引擎。N的值有搜索服务器预先设定。或者根据预先设置的阈值T2,选择区配度大于T2的搜索引擎。阈值T2由搜索服务器预先设定。搜索服务器A选择出搜索效果较好的一个或多个搜索引擎后,调用这些搜索引擎进行搜索。调用搜索服务器所管理的搜索引擎和其他搜索服务器所管理的搜索引擎的方式有所不同。对于搜索服务器A所管理的搜索引擎,搜索服务器A可以直接调用这些搜索引擎。然后把这些搜索引擎返回的结果进行汇集处理。最后把搜索结果返回给用户。对于其他搜索服务器的搜索引擎,搜索服务器A可以直接调用,也可以间接调用。直接调用就是搜索服务器A可以利用这些搜索引擎的访问授权信息,直接调用这些搜索引擎。间接调用就是搜索服务器A把已选择的搜索引擎标识和搜索请求发送到其所属的搜索服务器。例如发送搜索引擎bl和搜索请求q到搜索服务器B,搜索服务器B把搜索请求q发送到搜索引擎bl,bl把q的搜索结果返回给搜索服务器B,由搜索服务器B把搜索请求q的结果返回给搜索服务器A。搜索服务器A的调度中心选择出搜索引擎后,调用一个或多个搜索引擎。当调用多个搜索引擎时,把这些搜索引擎返回的结果汇集处理,最后把搜索结果返回给用户。参考图4是本发明实施例搜索引擎选择方法的流程示意图,该方法流程包括301,搜索服务器A接收来自用户的搜索请求;302,搜索服务器A获取本地注册的各个搜索引擎对所述搜索请求的区配度此步骤与前述方法实施例中步骤202相同,在此不予赘述。303,搜索服务器A把所接收到的搜索请求发送到搜索服务器A的虚拟注册中心;304,返回搜索引擎的标识信息及其所属的搜索服务器的标识信息,如假设根据所述搜索服务器标识信息确定为搜索服务器B所管理的搜索引擎及搜索服务器C所管理的搜索引擎。305,转发搜索请求至搜索服务器B;306,搜索服务器B接收到搜索请求后,根据元索引计算出所述搜索引擎标识信息所标识的搜索引擎的区配度;307,返回搜索引擎的区配度;308,转发搜索请求至搜索服务器C;309,搜索服务器C接收到搜索请求后,根据元索引计算出所述成员搜索引起标识信息所标识的搜索引擎的区配度;310,返回搜索引擎的区配度;311,比较步骤302中获取的本地注册的各个搜索引擎对所述搜索请求的区配度,步骤307中由搜索服务器B返回的区配度,及步骤310中由搜索服务器C返回的区配度,选择较优的搜索引擎。参考图5,是本发明实施例搜索服务器的结构示意图,该搜索服务器主要主要包括本地注册单元5,用于接收搜索引擎的注册信息,对搜索引擎进行本地注册;虚拟注册单元6,用于接收归属于其他搜索服务器的搜索引擎的虚拟注册信息,所述虚拟注册信息包含搜索引擎标识、地域信息、搜索类型及所属搜索服务器的标识信息,根据所述虚拟注册信息中的搜索引擎标识、搜索类型及所属搜索服务器的标识信息对所述搜索服务器的搜索引擎进行虚拟注册;元索引单元7,用于生成并管理所述本地注册单元5所注册的搜索引擎的元索引;元索引单元为所述本地注册单元5所注册的搜索引擎生成并建立元索引,建立元索引的具体方式有多种,如表三所示的一个元索引的具体示例。表三<table>tableseeoriginaldocumentpage20</column></row><table><table>tableseeoriginaldocumentpage21</column></row><table>索引擎对该搜索请求的区配度;第二区配度获取单元83,用于获取由所述虚拟注册单元6虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息,根据所述搜索服务器的标识信息访问该搜索服务器,获取由所述虚拟注册单元6虚拟注册的搜索引擎对所述搜索请求的区配度;选择单元84,用于根据所述第一区配度获取单元82获取的由所述本地注册单元所注册的搜索引擎对该搜索请求的区配度及所述第二区配度获取单元83获取的由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度选择至少一个用于根据所述搜索请求进行信息检索的搜索引擎。参考图7,所述第二区配度获取单元83主要包括标识信息获取单元831,用于获取由所述虚拟注册单元虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息;区配度获取执行单元832,用于根据所述搜索服务器的标识信息访问所述搜索服务器,并根据所述搜索引擎的标识信息获取由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度。参考图8a,是本发明实施例搜索服务器中的标识信息获取单元831的第一实施例组成示意图,该标识信息获取单元831主要包括搜索类型信息获取单元83101,用于从所述搜索请求中获取搜索类型信息;第一标识信息获取执行单元83102,用于根据所述搜索类型信息获取单元83101所获取的所述搜索类型信息获取在本搜索服务器虚拟注册的属于所述搜索类型的搜索引擎的标识信息及其所属搜索服务器的标识信息。参考图8b,是本发明实施例搜索服务器中的标识信息获取单元831的第二实施例组成示意图,该标识信息获取单元831主要包括搜索条件提取单元83111,用于从所述搜索请求中提取搜索条件;搜索类型确定单元83112,用于根据所述搜索条件提取单元83111所提取的所述搜索搜索条件确定预设置的对应该搜索条件的搜索类型;所述搜索条件可以是搜索关键词,也可以是SQL(StructuredQueryLanguage结构化查询语言)语句。第二标识信息获取执行单元83113,用于根据所述搜索类型确定单元83112所确定的搜索类型获取在本搜索服务器虚拟注册的属于所述搜索类型的搜索引擎的标识信息及其所属搜索服务器的标识信息。参考图8c,是本发明实施例搜索服务器中的标识信息获取单元831的第一实施例组成示意图,该标识信息获取单元831主要包括默认搜索类型确定单元83121,用于确定所述搜索请求对应的默认搜索类型;第三标识信息获取执行单元83122,用于根据所述默认搜索类型确定单83121元所确定的默认搜索类型获取在本搜索服务器虚拟注册的属于所述默认搜索类型的搜索引擎的标识信息及其所属搜索服务器的标识信息。参考图IO是本发明实施例的另一种搜索调度方法的流程示意图,该方法主要包括401,接收搜索请求。402,从所述搜索请求中提取搜索条件,以所提取的搜索条件查询元索引数据库,获取本地注册的各个搜索引擎对所述搜索请求的区配度。所述搜索条件可以是搜索关键词,也可以是SQL(StructuredQueryLanguage结构化查询语言)语句,搜索服务器从搜索请求中提取出搜索关4建词q,从本地注册中心取出所有注册的搜索引擎列表,根据元索引计算本地4叟索对搜索关键词的区配度。403,判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,若判断为是,则选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索。搜索服务器可以对其所管理的搜索引擎的区配度进行从高到低排序,若存在区配度大于预先设定的门限值T的搜索引擎,则可以认为已经找到搜索效果较好的搜索引擎,本次搜索引擎的选择流程结束。搜索服务器可以利用这些区配度大于预设门卩艮值T的搜索引擎进行搜索。预先设定的门限值T可以为搜索服务器为其所管理的各个搜索引擎统一设定的,另外每个搜索引擎可以有一个对应的门限值T,比如搜索引擎Ei对应的门P艮值为Ti,若Ei的区配度Ri大于Ti,则认为Ei的搜索效果已经较好,这种情况也可以认为已经找到搜索效果较好的搜索引擎。其中,Ti可以由搜索服务器预先设定,也可以为4臾索引擎自己提供。实施本实施例,在接收到搜索请求后,根据搜索请求中提取的搜索条件查询并获取本地注册的各个搜索引擎对所述搜索请求的区配度,进而通过判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,在判断为是时,选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索,实现了快速、高效的选择较优的搜索引擎,提高了的搜索引擎的调度效率,简化了调度流程。图ll是本发明实施例的另一种搜索服务器的组成示意图,本例中,所述搜索服务器包括接收单元91,用于接收搜索请求;搜索条件提取单元92,用于从所述搜索请求中提取搜索条件;所述搜索条件可以是搜索关键词,也可以是SQL(StructuredQueryLanguage结构化查询语言)语句。区配度获取单元93,用于根据所述搜索条件提取单元所提取的所述搜索条件查询元索引数据库,获取本地注册的各个搜索引擎对所述搜索请求的区配度;搜索引擎选择单元94,用于判断所述各个4叟索引擎对所述4叟索"i青求的区配度是否大于预设门限值,若判断为是,则选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索。实施本发明实施例,通过对其他搜索服务器所管理的搜索引擎进行虚拟注册,实现了在接收到搜索请求后,基于所述虚拟注册进行搜索服务器间的互相访问,在各搜索服务器所管理的搜索引擎中选择较优的搜索引擎,提高了搜索范围及搜索准确度,提高了调度效率,简化了调度流程。实施本发明另一实施例,在接收到搜索请求后,根据搜索请求中提取的搜索条件查询并获取本地注册的各个搜索引擎对所述搜索请求的区配度,进而通过判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,在判断为是时,选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索,实现了快速、高效的选择较优的搜索引擎,提高了的4叟索引擎的调度效率,筒化了调度流程。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存^f诸于一计算机可读取存储介质中,该程序在执4亍时,可包4舌如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-OnlyMemory,24ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。权利要求1、一种搜索调度方法,其特征在于,包括接收搜索请求;获取本地注册的各个搜索引擎对所述搜索请求的区配度;获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息;根据所述搜索服务器的标识信息访问对应的搜索服务器,获取所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度;根据所述本地注册的各个搜索引擎对所述搜索请求的区配度及所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索的搜索引擎。2、如权利要求l所述的方法,其特征在于,所述获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息包括判定所述搜索请求所属的搜索类型,根据所述搜索类型信息获取在本搜索服务器虚拟注册的属于所述搜索类型的搜索引擎的标识信息及其所属搜索服务器的标识信息。3、如权利要求2所述的方法,其特征在于,所述判定所述搜索请求所属的搜索类型的步骤为提取所述搜索请求的搜索类型信息,所述搜索类型为所述搜索请求所属的搜索类型;或为从所述搜索请求中提取搜索条件,根据所述搜索条件确定预设置的对应所述搜索条件的搜索类型;或为确定所述搜索请求对应的默认搜索类型,所述默认搜索类型即为所述搜索请求所属的搜索类型。4.如权利要求2所述的方法,其特征在于,所述获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息包括从所述搜索请求中获取地域信息,根据所述搜索类型和地域信息获取在本搜索服务器虚拟注册的、属于所述搜索类型的且服务范围涵盖所述地域的搜索引擎的标识信息及其所属搜索服务器的标识信息。5、如权利要求l所述的方法,其特征在于,所述获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息包括从所述搜索请求中获取地域信息,根据所述地域信息获取在本搜索服务器虚拟注册的服务范围涵盖所述地域的搜索引擎的标识信息及其所属搜索服务器的标识信息。6、如权利要求l所述的方法,其特征在于,所述获取本地注册的各个搜索引擎对所述搜索请求的区配度的步骤包括从所述搜索请求中提取搜索条件,以所提取的搜索条件查询元索引数据库,获取本地注册的各个搜索引擎对所述搜索请求的区配度。7、如权利要求1至6任意项所述的方法,其特征在于,在所述获取本地注册的各个搜索引擎对所述搜索请求的区配度的步骤与所述获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息的步骤之间还包括判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,若判断为是,则选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索,否则,执行获取在本搜索服务器虛拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息的步骤。8、如权利要求3或6所述的方法,其特征在于,所述搜索条件为搜索关键词或结构化查询语言SQL语句。9、如权利要求l所述的方法,其特征在于,所述接收搜索请求之前包括接收归属于其他搜索服务器的搜索引擎的虚拟注册信息,所述虚拟注册信息包含搜索引擎标识、地域信息、搜索类型及所属搜索服务器的标识信息;根据所述虚拟注册信息中的搜索引擎标识、地域信息、搜索类型及所属搜索服务器的标识信息对所述搜索服务器的搜索引擎进行虚拟注册。10、如权利要求9所述的方法,其特征在于,所述其他搜索服务器的搜索引擎的虚拟注册信息中还包含搜索请求接口。11、如权利要求10所述方法,其特征在于,所述搜索请求接口为URL统一资源定位查询才莫一反。12、如权利要求11所述的方法,其特征在于,接收归属于其他搜索服务器的搜索引擎的虚拟注册信息为接收所述其他搜索服务器代理其所管理的搜索引擎发送的虚拟注册请求,从所述虚拟注册请求获取所述虚拟注册请求中携带的虚拟注册信息;或为,根据所述其他搜索服务器发布的虛拟注册文档,从所述虚拟注册文档获取所述其他搜索服务器所管理的搜索引擎的虚拟注.册信息。13、一种搜索服务器,其特征在于,包括本地注册单元,用于接收搜索引擎的本地注册请求,对搜索引擎进行本地注册;虚拟注册单元,用于接收归属于其他搜索服务器的搜索引擎的虚拟注册请求,所述虚拟注册请求包含搜索引擎标识、地域信息、搜索类型及所属搜索服务器的标识信息,根据所述虚拟注册请求中的搜索引擎标识、地域信息、搜索类型及所属搜索服务器的标识信息对所述搜索服务器的搜索引擎进行虚拟注册;元索引单元,用于生成并管理所述本地注册单元所注册的搜索引擎的元索引;搜索调度单元,用于接收搜索请求,从所述元索引单元获取由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度,获取由所述虚拟注册单元虛拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息,根据所述搜索服务器的标识信息访问所述搜索服务器,获取由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度,由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度及由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索的搜索引擎。14、如权利要求13所述的搜索服务器,其特征在于,所述搜索调度单元包括搜索请求接收单元,用于接收搜索请求;第一区配度获取单元,用于获取由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度;第二区配度获取单元,用于获取由所述虚拟注册单元虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息,根据所述搜索服务器的标识信息访问所述搜索服务器,获取由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度;选择单元,用于根据所述第一区配度获取单元获取的由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度,及所述第二区配度获取单元获取的由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度,选择至少一个用于根据所述搜索请求进行信息检索的搜索引擎。15、如权利要求14所述的搜索服务器,其特征在于,所述选择单元还包括判断单元、第一选择执行单元及第二选择执行单元,其中所述判断单元,用于判断所述第一区配度获取单元获取的由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度是否大于预设门P艮值;所述第一选择执行单元,用于当所述判断单元判断为是时,选择区配度大于所述预设门P艮值的搜索引擎用于根据所述搜索请求进行信息检索;所述第二选择执行单元,用于当所述判断单元判断为否时,根据所述第一区配度获取单元获取的由所述本地注册单元所注册的各个搜索引擎对所述搜索请求的区配度及所述第二区配度获取单元获取的由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度选择至少一个用于根据所述搜索请求进行信息检索的搜索引擎。16、如权利要求13所述的搜索服务器,其特征在于,所述第二区配度获取单元包括标识信息获取单元,用于获取由所述虚拟注册单元虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息;区配度获取执行单元,用于根据所述搜索服务器的标识信息访问所述搜索服务器,并根据所述搜索引擎的标识信息获取由所述虚拟注册单元虚拟注册的搜索引擎对所述搜索请求的区配度。17、如权利要求16所述的搜索服务器,其特征在于,所述标识信息获取单元包括搜索类型信息获取单元,用于从所述搜索请求中获取搜索类型信息;第一标识信息获取执行单元,用于根据所述搜索类型信息获取单元所获取的所述搜索类型信息获取在本搜索服务器虚拟注册的属于所述搜索类型的搜索引擎的标识信息及其所属搜索服务器的标识信息。18、如权利要求16所述的搜索服务器,其特征在于,所述标识信息获取单元包括搜索条件提取单元,用于从所述搜索请求中提取搜索条件;搜索类型确定单元,用于根据所述搜索条件提取单元所提取的所述搜索条件确定预设置的对应所述搜索条件的搜索类型;第二标识信息获取执行单元,用于根据所述搜索类型确定单元所确定的搜索类型获取在本搜索服务器虚拟注册的属于所述搜索类型的搜索引擎的标识信息及其所属搜索服务器的标识信息。19、如权利要求16所述的搜索服务器,其特征在于,所述标识信息获取单元包括默认搜索类型确定单元,用于确定所述所述搜索请求对应的默i人搜索类型;第三标识信息获取执行单元,用于根据所述默认搜索类型确定单元所确定的默认搜索类型获取在本搜索服务器虚拟注册的属于所述默认搜索类型的搜索引擎的标识信息及其所属搜索服务器的标识信息。20、如权利要求18所述的搜索服务器,其特征在于,所述4臾索条件为搜索关4建词或结构化查询语言SQL语句。21、一种搜索调度方法,其特征在于,包括接收搜索请求;从所述搜索请求中提取搜索条件,以所提取的搜索条件查询元索引数据库,获取本地注册的各个搜索引擎对所述搜索请求的区配度;判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,若判断为是,则选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索。22、如权利要求21所述的方法,其特征在于,所述搜索条件为搜索关键词或结构化查询语言SQL语句。23、一种搜索服务器,其特征在于,包括接收单元,用于接收搜索请求;搜索条件提取单元,用于从所述搜索请求中提取搜索条件;区配度获取单元,用于根据所述搜索条件提取单元所提取的所述搜索条件查询元索引数据库,获取本地注册的各个搜索引擎对所述搜索请求的区配度;搜索引擎选择单元,用于判断所述各个搜索引擎对所述搜索请求的区配度是否大于预设门限值,若判断为是,则选择区配度大于预设门限值的搜索引擎用于根据所述搜索请求进行信息检索。全文摘要本发明公开了一种搜索调度方法,包括接收搜索请求;获取本地注册的各个搜索引擎对所述搜索请求的区配度;获取在本搜索服务器虚拟注册的搜索引擎的标识信息及其所属搜索服务器的标识信息;根据所述搜索服务器的标识信息访问在本搜索服务器虚拟注册的搜索引擎所属搜索服务器,获取所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度;根据所述本地注册的各个搜索引擎对该搜索请求的区配度及所述本搜索服务器虚拟注册的搜索引擎对所述搜索请求的区配度,确定至少一个用于根据所述搜索请求进行信息检索的搜索引擎。同时本发明还公开了一种搜索服务器,本发明实现了快速、高效的选择较优的搜索引擎,提高了的搜索引擎的调度效率。文档编号G06F17/30GK101676901SQ20081019864公开日2010年3月24日申请日期2008年9月19日优先权日2008年9月19日发明者崔首领,李正兵,胡汉强,董晓艺,闵国兵,翀顾申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1