通过若干搜索引擎实现的联合搜索的制作方法

文档序号:6476445阅读:413来源:国知局

专利名称::通过若干搜索引擎实现的联合搜索的制作方法
技术领域
:本发明一般涉及信息检索,并且更具体地涉及通过若干搜索引擎实现的联合搜索。
背景技术
:标准网络和因特网搜索通常覆盖可以经由网络访问的信息的一小部分,或许只有大约百分之十。对于此限制有多种原因。一个原因涉及可扩展性(scalability)。例如,相当大的花费、努力和基本设施与存储和索引数据、保持信息常新并且可访问相关联。对于相对很少访问的信息,花费相对于明显的需求、信息的有用性等可能似乎过多。对可以经由网络访问的所有信息进行限制可以抑制花费。其次,基于搜索引擎的标准网络被阻止访问网络中的许多信息,这是因为有助于建立搜索引擎用于搜索的索引的标准网络爬虫(webcrawler)可能缺少获取那些信息的能力。例如,网络爬虫可能不能访问要求诸如口令认证或其它安全措施之类的肯定访问使能(positiveaccessenablement)的数据库或网站。最后,标准网络搜索是针对宽范性和大众性而设计的,跨越上层较大众的信息。虽然许多标准网络搜索结果在某种意义上被设计为返回可以最有可能使大多数用户满意的搜索结果,但是大部分时候,对于相当大数量的用户来说可能缺少相关性。为了寻找更加相关的搜索结果,可以使用垂直搜索,垂直搜索比标准搜索更精确,更定向于特定域和主题。然而,垂直搜索的用户针对每个搜索引擎都要或多或少单独地对他们的系统进行配置。对于选择相对较少的搜索引擎,这种实施或多或少是可管理的。然而,对于许多垂直搜索引擎,这可能不久会变得低效并且昂贵。基于前述说明,更加高效地执行垂直搜索将是有用的。在本部分中描述的方法是可以执行的方法,但不一定是之前就已经想到或者已经执行的方法。因此,不应假定本部分中描述的任何方法仅仅因为包括在本部分中就被认为是现有技术,除非另有指定。在附图的各视图中通过示例而非限制来图示出本发明,其中相似的标号指代相似的元件,并且其中图1示出根据本发明的一个实施例的示例处理;图2示出根据本发明的一个实施例的示例系统;图3A示出根据本发明的一个实施例的示例搜索结果呈现;图3B、3C、3D示出根据本发明的一个实施例的示例截屏;图4示出可以基于其实施本发明的实施例的示例计算机平台;以及图5示出根据一个实施例的用于对来自若干搜索引擎的结果进行合并的示例处理。具体实施例方式这里描述涉及通过若干搜索引擎实现的联合搜索的示例实施例。在下面的描述中,为了说明的目的,大量特定细节被提出以便提供对本发明的彻底理解。然而,很明显,本发明可以在没有这些特定细节的情况下实施。在其它实例中,已知的结构和设备是在没有详尽对待的情况被提及的,以避免不必要地模糊本发明。概述根据一个实施例,基于搜索査询选择一组垂直搜索引擎。很可能提供与查询比较相关的搜索结果的垂直搜索引擎被选择用于所述组。例如,查询可能是请求"猪肉食谱"。基于在査询中包括这些搜索关键词,针对食谱的搜索引擎被选择。因此,在执行垂直搜索中利用较少的用户配置来访问若干搜索引擎,以利用这些搜索引擎执行查询。此外,高效且低花费的垂直搜索査询通过若干专门的搜索引擎来执行并且是有选择的被执行。每个所选择的搜索引擎,接收搜索结果。通过对从多个搜索引擎的每个搜索引擎接收的某些搜索结果进行合并来生成合并的搜索结果。在一个实施例中,依赖于垂直搜索用户的偏好,对根据跨越若干搜索引擎的査询的结果的合并可以变化。例如,用户可能喜欢被呈现来自若干搜索引擎的组合搜索结果的单个列表。这向端用户呈现出执行查询的搜索引擎系统认为最相关的结果。上述方式以外或者替代上述方式,用户可能喜欢被呈现来自选择的搜索引擎中的每个搜索引擎的结果。在这样的情况中,用户被呈现来自搜索引擎系统认为是最相关的搜索引擎的搜索引擎的结果。意图发出将被限于特定域的额外査询的垂直搜索用户因此可以被呈现很可能相关的结果。因此,这里描述的实施例实现了通过若干搜索引擎的联合搜索,并且向搜索用户呈现出相关的搜索结果以及用于此外更多的特定于域的搜索的相关搜索引擎。用语和注释除非另有特定声明以外,这里所使用一些术语和短语具有本部分所描述的含义。搜索引擎是被配置用于搜索一组信息资源的软件(可执行指令和数据)。执行搜索引擎的计算机生成针对向搜索引擎提交的査询的搜索结果。搜索引擎通常在服务器(这里被称为搜索引擎服务器)上运行。服务器是集成软件组件(包括数据)和诸如在计算机上用于执行集成软件组件的存储器、节点和处理器之类的计算资源的分配的组合,在服务器上,软件和计算资源的组合专用于特别的功能。在搜索引擎服务器的情况中,服务器专用于搜索一组信息资源。搜索引擎在因特网、万维网(www,Web,WWW等等)以及其它大型内部网络和信息资源网络中被广泛使用。通常,搜索引擎可作为网站在服务器上被访问,所述网站诸如是可利用Yahoo和Google网页来访问的那些网站,它们分另!J利用链接(http:〃search.yahoo.com/)和7(http:〃www.google.com/)来访问。由搜索引擎搜索出的信息资源的集合在这里称为文档(document)。文档是可通过搜索引擎索引来索引的任何信息单元。搜索引擎索引在下面描述。通常,文档是可以包含无格式的或带格式的文本、行内图形(inlinegraphic)和其它多媒体数据以及对其它文档的超级链接。文档可以是静态或者动态生成的。搜索引擎使用搜索引擎索引(即,一个或多个)来搜索信息,搜索引擎索引在这里也被简单称为索引。搜索引擎索引可以是其中内容或多或少被手动索引的目录,以反映人为观察。更具体地,搜索引擎索引被这里称为爬虫的处理自动创建并维护。爬虫在因特网中探索信息,在该爬虫被配置搜索的位置处本质上连续地寻找它们尽可能多地找到的文档。爬虫可以沿着从一个文档到另一文档的链接而行进。爬虫可以检索(例如,获取、下载)网络资源(例如,页面),保存原始形式的页面或其它资源,识别和提取到其它资源、网页的链接,等等。这使得这些资源/页面又能够被随后检索。当检索爬虫得到的页面或其它资源时,可以从爬虫得到的资源/页面提取其它形式的信息。从利用爬虫检索的资源/页面提取的内容然后可以被索引。在搜索索引中,资源/页面的内容被索引(例如,语义索引、概念索引等等)并且被总结在数据库中,此数据库通常具有相当大的大小。响应于搜索査询实际搜索的就是这些索引和数据库。因此,一般而言,用于建立索引的索引处理要使用爬虫获取内容。在一种配置中,用于搜索引擎的软件可以被配置用于搜索一组资源,而在另一种配置中被配置用于搜索另一组资源。这样的配置中的每一种配置被认为是不同的搜索引擎。垂直搜索引擎是使用用于索引被限制于特定域或特定主题的文档的索引的引擎。例如可以通过将爬虫配置为搜索特定位置的方式来限定垂直搜索引擎。例如,针对食谱的用于垂直搜索引擎的爬虫可以被配置为搜索保持有食谱文档的站点和/或位置。由搜索引擎生成的搜索结果包括文档的列表并且可以包含关于文档的概要信息。文档的列表可以被排序。为了对文档的列表进行排序,搜索引擎可以为列表中的每个文档分配排名。当列表通过排名而被排序时,具有相对较高排名的文档与具有相对较低排名的文档相比可能被置为离列表的头部更近。搜索引擎可以根据对搜索査询的相关性来对文档排名。相关性是文档的主题与搜索查询关键词匹配得多么近的量度。说明性实施例图1示出根据一个实施例的示例处理100。处理100以基于搜索查询和至少一个标准从若干搜索引擎中选择多个搜索引擎而开始。一个或多个搜索查询被提交102给多个搜索引擎以便获得搜索结果。对于每个搜索引擎,某一些搜索结果被接收103以用于针对提交给每个搜索引擎的每个查询。来自各个搜索引擎的这些结果被合并104以生成合并的搜索结果。图2示出根据一个实施例的示例系统200。搜索联合器201接收用户査询。诸如联合器201之类的联合器包括执行软件的一个或多个计算机处理,其中,软件使得计算机处理接收搜索査询、基于搜索査询选择一个或多个搜索引擎,以及将搜索查询发送给所选择的搜索引擎。联合器还可以合并响应于搜索查询从若干搜索引擎返回的结果。联合器可以是搜索引擎的集成组件,其中分配给搜索弓I擎的一个或多个处理还操纵此联合器。为了选择向其提交搜索查询的搜索引擎,联合器201需要可用来做出选择的信息。在一个实施例中,联合器201通过向搜索元数据引擎205提交搜索元数据查询来获得这样的信息。搜索元数据引擎是这样的搜索引擎,其中信息资源组是关于其它搜索引擎的信息。此信息包括搜索引擎元数据,搜索引擎元数据是描述搜索引擎和/或搜索引擎索引的信息。元数据可以包括与搜索引擎相关的主题的描述符以及与相关主题相关联的关键字。返回的结果标识一个或多个搜索引擎,例如,网站和/或搜索引擎索引的身份。提交给搜索引擎元数据205的査询这里被称为搜索元数据査询。在一个实施例中,搜索元数据查询是基于用户的査询(包括用户查询中的关键词)而生成的。在一种实施方式中,转换处理本质上将用户査询转换成适9用于査询其它搜索引擎的另一查询。由搜索引擎元数据205返回的结果可以基于对用户査询的相关性而被排名。基于从搜索引擎元数据205返回的结果,联合器201从若干搜索引擎211和212_299中选择要向其发出搜索查询的搜索引擎,并且然后向所选择的搜索引擎发出查询。所述选择可以选择诸如由搜索引擎服务器寄留的搜索引擎(例如网站)之类的特别的搜索引擎服务器,或者可以是搜索引擎索引。在后一种的情况中,联合器201通过向被配置用于搜索索引的搜索弓I擎提交查询来向所选择的搜索弓I擎提交查询。然后从每个所选择的搜索引擎返回搜索结果。返回的结果然后被联合器201合并和排名。所述排名可以基于多种技术,例如,使用诸如统一资源定位符(URL)之类的文档标识符的频率。此外,在一个实施例中,针对每个搜索引擎计算排名;排名被用于确定如何合并来自所有选择的搜索引擎的搜索结果。可以根据在共同待决的美国专利申请中所描述的方法来计算搜索引擎排名,所述美国专利申请是由RyanSue于[将被确定的日期]提交的、名称为"对文档进行排名"、序列号为[将被确定]并且转让给本申请的受让者的美国专利申请,该申请通过引用以其全部内容被结合于此,正如其在这里被充分给出一样。在一种实施方式中,按照下面参考图5所描述的那样来计算搜索弓I擎排名。在一个实施例中,可以通过简单地不使用搜索元数据引擎205来避免可能与其相关联的执行开销或者其它花费。替代地,搜索査询被简单地提交给若干搜索引擎的组中的所有搜索引擎。然而,通过此措施实现的执行节约也具有必须针对若干搜索引擎中的所有搜索引擎执行端用户查询的额外的花费,其中若干搜索引擎中的一些搜索引擎可能返回缺少与端用户的査询的相关性的内容或其它结果。示例搜索结果呈现这里,搜索联合器201向搜索元数据引擎205发出对于"鸡肉"的搜索元数据查询,搜索元数据引擎205返回标识与对于"鸡肉"的端用户查询相关的搜索引擎的搜索引擎结果。搜索联合器201通过由元数据引擎205返回的相关搜索引擎发出"鸡肉"査询。从相关搜索引擎"1"和"2"返回的搜索结果被合并成搜索结果组,以便呈现给端用户。从所有相关搜索引擎合并的搜索结果可以以一种或多种方式呈现给端用户。图3A示出根据本发明的一个实施例的返回的搜索结果的示例300。根据一个实施例,当执行用户的査询时,响应于用户偏好,结果呈现311、结果呈现312或者二者可以被呈现给用户。响应于用户的查询,相关搜索引擎"1"和"2"返回很多(例如十个)结果。应当理解,其它数量的搜索引擎可以是相关的并且可以返回任意数量的结果。结果呈现311将根据与用户的查询的相关性排名的、来自若干搜索引擎的相互混合的结果呈现为单个列表。因此,一个实施例向用户呈现系统200(图2)认为最相关的结果。结果呈现312呈现出由选择的若干搜索引擎中的各个搜索引擎分组的结果。按照此格式,用户可以更好地能够可视地观察和识别哪个搜索引擎提供了与查询或用户的希望最相关的结果。图3B示出跨相关搜索引擎合并的搜索结果311B的示例截屏。在一种实施方式中,跨相关搜索引擎合并的搜索结果可以包括对于结果的或多或少"标准的"视图,这可以根据用户的偏好来改变。图3C示出被分组的搜索结果312C的示例截屏,搜索引擎是根据这样的分组返回各组搜索结果的。在一种实施方式中,被分组(搜索引擎是根据这样的分组返回各组搜索结果)的搜索结果可以包括对于结果的或多或少探索性的,例如"探索(exploration)"视图,这可以根据用户的偏好来改变。图3D示出包括来自单个搜索引擎的结果的搜索结果313D的示例截屏,所述单个搜索引擎诸如可以是例如用户在考虑了一个或多个探索截屏(例如搜索结果312C;图3C)、合并的结果的单个列表(例如搜索结果311B;图3B)或者二者都考虑之后所选择、指定等的搜索引擎。在一种实施方式中,当用户发现(例如,根据先前的执行和/或对其它搜索结果分组的考虑发现)特别的搜索引擎返回最相关的结果(例如,从该用户的观点来看为最相关的结果)时,可以从单个搜索引擎寻找搜索结果。被选择ii用于呈现结果的搜索引擎可以根据用户的偏好来改变。示例硬件概述图4示出可以基于其实施本发明的示例计算机系统400。计算机系统400包括总线402或用于传递信息的其它通信机构,以及与总线耦合用于处理信息的处理器404。计算机系统400还包括耦合到总线402用于存储处理器404将要执行的信息和指令的主存储器406,主存储器406诸如是随机存取存储器(RAM)或者其它动态存储设备。主存储器406还可以用于存储在处理器404执行要被执行的指令时的临时变量或其它中间信息。计算机系统400还包括耦合到总线402用于存储用于处理器404的静态信息和指令的只读存储器(ROM)408或其它静态存储设备。诸如磁盘或光盘之类的存储设备410被提供并且耦合到总线402以存储信息和指令。计算机系统400可以经由总线402耦合到诸如液晶显示器(LCD)、阴极射线管(CRT)等等用于向计算机用户显示信息的显示器412。包括字母数字和其它键的输入设备414被耦合到总线402以向处理器404传递信息和指令选择。另一种类型的用户输入设备是诸如鼠标、跟踪球或光标导向键之类用于向处理器404传递方向信息和指令选择以及用于控制光标在显示器412上的移动的光标控制416。这种输入设备通常具有两个轴的自由度,第一轴(例如x)和第二轴(例如y),这使得设备指定平面中的位置。本发明的示例实施例涉及计算机系统400用于将对于源数据库系统处的数据块做出的改变复制成备用数据块系统处的数据块的复制品。根据本发明的一个实施例,将对于源数据块系统处的数据块做出的改变复制成备用数据库系统处的数据块的复制品是由一个或多个实例的计算机系统400响应于处理器404执行在主存储器406中所包含的一个或多个指令而提供的。这样的指令可以从诸如存储设备410之类的另一计算机可读介质读入主存储器406中。包含在主存储器406中的指令序列的执行使得处理器404执行这里描述的处理步骤。多处理配置中的一个或多个处理器也可以被采用来执行包含在主存储器406中的指令序列。在替代实施例中,硬线电路可以用来替代软件指令以实施本发明,或者与软指令组合来实施本发明。因此,本发明的实施例不限于硬件电路和软件的任何特定组合。这里所使用的术语"计算机可读介质"涉及参与向处理器404提供以便执行的指令的任何介质。这样的介质可以采取多种形式,包括但不限于非易失性介质、易失性介质和传输介质。非易失性介质例如包括诸如存储设备410之类的光盘或磁盘。易失性介质包括诸如主存储器406之类的动态存储器。传输介质包括同轴电缆、铜线和光纤,包括包含总线402在内的线缆。传输介质还可以采用诸如在无线电波和红外数据通信期间所生成那些声波或光波的形式。普通形式的计算机可读介质例如包括软盘、柔性盘、硬盘、磁带,或任何其它磁介质、CD-ROM、任何其它光介质、穿孔卡、纸带、具有洞图案的任何其它遗留物或其它物理介质以及其它计算机可读介质、RAM、PROM,和EPROM、FLASH-EPROM、任何其它存储芯片或存储盒、下文描述的载波,或计算机可读的任何其它介质。在将一个或多个序列的一个或多个指令携带到处理器404以便执行的过程中可以涉及多种形式的计算机可读介质。例如,指令可以最初承载在远程计算机的磁盘上。远程计算机可以将指令加载到其动态存储器中并且通过利用调制解调器的电话线来发送指令。计算机系统400本地的调制解调器可以接收电话线上的数据并且使用红外发射器将数据转换成红外信号。耦合到总线402的红外探测器可以接收红外信号中携带的数据并且将数据置于总线402上。总线402将数据携带到主存储器406,处理器404从主存储器406检索指令并执行指令。由主存储器406接收的指令可以可选地在被处理器404执行之前或者之后被存储在存储设备410上。计算机系统400还包括耦合到总线402地通信接口418。通信接口418耦合到网络链路420的双向数据通信,网络链路420被连接到本地网络422。例如,通信接口418可以是综合服务数字网络(ISDN)卡、电缆或者数字订户线(DSL)调制解调器或用于向相应类型的电话线提供数据通信连接的另一调制解调器。作为另一示例,通信接口418可以是用于向兼容LAN提供数据通信连接的局域网(LAN)卡。还可以实行无线链路。在任何这样的实施方式中,通信接口418发送和接收携带有表示各种类型的信息的数字数据流的电信号、光电信号或光信号。网络链路420通常通过一个或多个网络向其它数据设备提供数据通信。例如,网络链路420可以通过本地网络422向主机计算机424或者向由因特网服务提供商(ISP)426操纵的数据装备提供连接。ISP426进而通过现在通常被称为"因特网"的全世界范围分组数据通信网络428提供数据通信服务。本地网络422和因特网428二者都使用携带有数字数据流的电信号、光电信号或光信号。通过各种网络的信号以及网络链路420上或者通过通信接口418的信号是传送信息的载波的示例性形式,其中,这些信号携带有到计算机系统400或者来自计算机系统400的数字数据。计算机系统400可以通过网络(一种或多种)、网络链路420和通信接口418发送消息和接收数据,包括程序代码。在因特网的示例中,服务器430可以通过因特网428、ISP426、本地网络422和通信接口418发送应用程序请求的代码。如这里所述,根据本发明,一种这样的下载的应用提供对源数据库系统处的数据块做出的改变到备用数据库系统处的数据块的复制品的复制。接收的代码可以由处理器404按照接收那样来执行,和/或被存储在存储设备410或者其它非易失性存储装置中以供以后执行。按照这样的方式,计算机系统400可以获得载波形式的应用代码。来自若干搜索引擎的结果的示例合并图5示出根据一个实施例的用于合并来自若干搜索引擎的结果的示例处理500。处理500以对多个文档进行排名501开始,所述多个文档中的每一个与一个统一资源定位符(URL)相关联。所述文档是作为由多个搜索引擎中的每个搜索引擎计算的査询的结果而被返回的。所述多个文档中的至少一个文档是作为来自每个搜索引擎的査询的结果而被返回的。对于与多个文档中的文档相关联的每个URL,URL的频率被确定502。上面(块501)描述的排名包括基于一个或多个因素对多个文档进行排名。这些因素基于针对与多个文档相关联的每个URL确定的频率。在一个实施例中,计算与响应于通过多个(例如一组)搜索引擎14'S'执行的査询而返回的多个文档中的文档相关联的每个URL'u'的频率furi(Ui,S),以进行URL频率确定502。在一个实施例中,根据下面的公式1来计URL的频率furi(Ui,sHsi〕"'刚(公式l)其中,d是URL频率,W是执行査询的搜索引擎的总数,以及lsi〕"是返回包含URL,Ui的结果的搜索引擎的总数。在一个实施例中,文档的排名是根据其在一组搜索引擎结果中的罕见度(rarity)(例如相对于其它URL的频率)来量度的。从搜索引擎返回的搜索结果中的文档的罕见度有效地包括对于文档是多么感兴趣的衡量。在一个实施例中,文档的排名因此与倒数的URL频率相对应。根据这样的实施例执行的搜索因此可以返回非常专用的、不明显的、常常被其它搜索引擎忽略的文档。这样的搜索的结果因此很可能返回一般的,例如非专用搜索不能返回的结果。例如,一般的网络搜索通常返回常访问的文档,并且一般的网络搜索是以那些常访问的文档具有相对高的相关性排名而完成的。此外,即使标准网络搜索确实设法返回了相对罕见的文档,其罕见度将很可能使其具有相对低的相关性排名。低的相关性排名很可能将该文档"埋藏"在搜索结果内可能被许多其它搜索结果遮蔽它的地方。这本质上可能迫使用户在搜索结果的页面中找寻它,这可能是单调乏味并且低效的。在文档在搜索结果中的排名基于其相对罕见度的一个实施例中,针对查询返回的排名是正规化的排名(Rn。nnalized)与URLlli的频率furi的倒数的函数f,根据下面的公式2来计算RJ",,^肌J"pW/仇卯(公式2)其中,正规化的排名(Rn。n^zed)表示与对组S的搜索引擎的本地排名进行组合有关的所有其它计算。在一个实施例中,与文档的排名相关联的其它计算包括但不限于对搜索引擎中完全相同的结果、点击率、用户评价的处理。15实施例不限于根据文档在一组搜索引擎结果中的罕见度来对文档进行排名。例如,在一个实施例中,文档的相关性根据该文档在一组搜索引擎结果中多么常见来量度,这可以是非倒数的与URL相关联的频率的函数。根据这样的实施例执行的搜索因此可以返回反映其它搜索者、搜索引擎创建者、管理员和其它参与者常见的看法、多数人的意见等(例如利用垂直搜索)。可以利用诸如已经被之前的用户定制的垂直搜索之类的更专用的搜索的结果。这可以使得根据这样的实施例执行的搜索得到的结果能够反映已经被证明有用或大众的搜索结果,并且因此利用别人的看法、教训和经验,结合诸如集体的知识和智慧之类有用的社会因素,从而促进搜索引擎使用中的高效率和经济实惠。在文档的相关性根据该文档在一组搜索引擎结果的搜索结果中多么常出现来量度一个实施例中,针对査询返回的搜索结果中的文档的总排名是正规化的排名(Rn。alized)与非倒数的URLUi的频率fun的函数f,根据下面的公式3来计算R證aU("i,S)=/(^。画/w(",,S),/^(W,^))(公式3)其中,正规化的排名(Rn。rm^ed)表示与对组S的搜索引擎的本地排名进行组合有关的所有其它计算。在一个实施例中,与正规化的排名相关联的其它计算包括但不限于对搜索引擎中完全相同的结果、点击率、用户评价的处理。对每个URL的总排名被分配503,在一个实施例中,基于简单实施诸如对频率的列表进行分类之类的总排名函数进行分配。例如,对于针对三个单独的搜索引擎1、2和3执行的示例査询返回的结果(例如URL)按照下面表1所示那样被排名(501)。表1搜索引擎l结果搜索引擎2结果搜索引擎3结果AADBDF响应于査询返回的各个URL的频率被确定(502),例如利用上面的公式1来计算。在下面的表2中示出示例频率的列表。表2<table>tableseeoriginaldocumentpage17</column></row><table>为了对每个ULR分配(503)总排名,频率列表被分类。当被分类时,表2中所示的示例频率按照下面表3中所示那样被排名。可以利用上面的公式2和/或公式3或者根据另一种排名模型来确定排名。表3<table>tableseeoriginaldocumentpage17</column></row><table>这些排名例如可以被呈现给用户和/或被呈现用于进一步的处理。在一个实施例中,使用URL频率和/或搜索引擎排名来合并504从若干搜索引擎返回的结果。例如,如下面表4中所示,可以将利用各个搜索引擎返回的URL的频率进行加和。表4搜索引擎i结果0.66+0.33+0.33=1.33搜索引擎2结果0.66+0.66+0.33=1.66搜索引擎3结果0.66+0.33+0.33=1.33然后,可以根据搜索引擎结果的加和的URL频率对这些搜索引擎结果进行排名。根据表4中所示的示例结果进行排名,搜索引擎2结果排名第一,搜索引擎1结果排名第二,并且搜索引擎3结果排名第三(例如,可以使用一种或多种其它标准来在同样得分的结果之间进行区分)。因此,根据分组格式(例如,分组呈现格式312;图3A)呈现,示例结果如下面表5所示c搜索引擎结果2ADE搜索引擎结果1ABC搜索引擎结果3DFG等同物、扩展、替换&混合因此,描述了涉及可读物理备用数据库系统的示例实施例。在前面的说明中,已经参考大量特定细节描述了本发明的实施例,所述特定细节可以依赖于实施方式而有所变化。因此,对于本发明是什么以及申请人希望本发明是什么的唯一并且排他的指示是从本申请得出的特定形式的权利要求组(这些权利要求是在特定形式中得出的),包括任何随后的修正。这里对于在这些权利要求中包含的术语明确提出的任何定义应当按照权利要求中所使用那样来决定这些术语的含义。因此,没有在权利要求中明确叙述的限定、元素、特性、特征、优点或属性不应当以任何方式限制这些权利要求的范围。说明书和附图因此被认为是说明性的,而非具有限制意义。权利要求1.一种方法,包括基于搜索查询和一个或多个标准从若干搜索引擎中选择多个搜索引擎;为了获得针对所述搜索查询的搜索结果,向所述多个搜索引擎提交一个或多个搜索查询;对于所述多个搜索引擎中的每个搜索引擎,接收针对向该搜索引擎提交的所述一个或多个搜索查询的某些搜索结果;以及将从所述多个搜索引擎中的每个搜索引擎接收的所述某些搜索结果进行合并。2.如权利要求1所述的方法,其中,所述一个或多个标准基于描述所述多个搜索引擎中的每个搜索引擎的信息。3.如权利要求2所述的方法,其中,基于所述信息发出査询包括基于所述搜索查询生成另一査询。4.如权利要求1所述的方法,其中,所述多个搜索引擎中的一个或多个搜索引擎包括web站点。5.如权利要求1所述的方法,其中,选择多个搜索引擎包括选择搜索引擎索引。6.如权利要求1所述的方法,其中,所述合并包括将从所选择的所述多个搜索引擎中的每个搜索引擎返回的结果组合成单组搜索结果,以便呈现给提交所述搜索査询的端用户。7.如权利要求6所述的方法,其中,所述单组搜索结果根据相关性而被排名。8.如权利要求6所述的方法,其中,所述单组搜索结果中的一个或多个结果根据所述多个搜索引擎中的哪个搜索引擎返回所述一个或多个结果而被分组。9.一种方法,包括为了获得针对搜索查询的搜索结果,向多个搜索引擎提交一个或多个搜索查询;其中,所述多个搜索引擎是基于所述搜索査询和一个多个标准从若干搜索引擎中选出的;对于所述多个搜索引擎中的每个搜索引擎,接收针对向该搜索引擎提交的所述一个或多个搜索查询的某些搜索结果;以及将从所述多个搜索引擎中的每个搜索引擎接收的所述某些搜索结果进行合并;其中,所述合并包括对所述搜索结果进行分组,该分组步骤是根据所述多个搜索引擎中的哪个搜索引擎是返回所述搜索结果来执行的。10.—种承载有一个或多个指令序列的计算机可读介质,所述指令序列在被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1所述的方法。11.一种承载有一个或多个指令序列的计算机可读介质,所述指令序列在被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求2所述的方法。12.—种承载有一个或多个指令序列的计算机可读介质,所述指令序列在被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求3所述的方法。13.—种承载有一个或多个指令序列的计算机可读介质,所述指令序列在被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求4所述的方法。14.一种承载有一个或多个指令序列的计算机可读介质,所述指令序列在被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求5所述的方法。15.—种承载有一个或多个指令序列的计算机可读介质,所述指令序列在被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求6所述的方法。16.—种承载有一个或多个指令序列的计算机可读介质,所述指令序列在被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求7所述的方法。17.—种承载有一个或多个指令序列的计算机可读介质,所述指令序列在被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求8所述的方法。18.—种承载有一个或多个指令序列的计算机可读介质,所述指令序列在被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求9所述的方法。19.一种系统,包括计算机系统,所述计算机系统被配置为-基于所接收的搜索查询和描述搜索引擎的元数据从若干搜索引擎中选择多个搜索引擎;向所述多个搜索引擎提交一个或多个搜索査询;对于所述多个搜索引擎中的每个搜索引擎,接收针对向该搜索引擎提交的所述一个或多个搜索查询的某些搜索结果;以及基于从所述多个搜索引擎中的每个搜索引擎接收的所述某些搜索结果对搜索结果进行合并。全文摘要基于搜索查询和一个或多个标准从若干搜索引擎中选择多个搜索引擎。为了获得针对搜索查询的搜索结果,向所述多个搜索引擎提交一个或多个搜索查询。对于所述多个搜索引擎中的每个搜索引擎,接收针对向该搜索引擎提交的一个或多个搜索查询的某些搜索结果。通过对从所述多个搜索引擎中的每个搜索引擎接收的所述某些搜索结果进行合并来生成合并的搜索结果。文档编号G06F17/30GK101641694SQ200880005237公开日2010年2月3日申请日期2008年2月12日优先权日2007年2月16日发明者雷恩·休申请人:雅虎公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1