一种元搜索引擎的排名方法及元搜索引擎的制作方法

文档序号:6471806阅读:219来源:国知局
专利名称:一种元搜索引擎的排名方法及元搜索引擎的制作方法
技术领域
本发明涉及互联网信息检索技术领域,尤其涉及一种元搜索引擎的排名方法及元
搜索引擎。
背景技术
搜索引擎是互联网基础结构的关键组成部分。随着网络技术的发展,搜索引擎也得到了不断的完善,通过搜索引擎可以从互联网上获取各种信息。然而各种搜索引擎都有其特定的索引范围、独特的功能、使用方法及预期的用户群指向。 一种搜索引擎不可能满足所有人或一个人所有的检索需求。在某些情况下,如文献普查、专题查询、新闻调查与朔源、软件及MP3下载地址搜索、生活信息搜索等等,人们往往需要使用多种搜索引擎,对搜索结果进行比较、筛选和相互印证。为简化逐一登陆各搜索引擎,并在各搜索引擎中分别多次输入同一检索请求即同一个检索字串等烦琐操作,元搜索引擎应运而生。
元搜索引擎(Meta-search Engine)将多个独立搜索引擎集成在一起,提供统一的检索界面,将用户的检索请求同时提交给多个独立的搜索引擎,同时检索多个数据库;并根据多个独立的搜索引擎的检索结果进行二次加工,如对检索结果去重、排名等;最后将结果输出给用户。其中,独立搜索引擎在元搜索引擎的系统中可以称为源搜索引擎(SourceEngine)。 决定元搜索质量的一个关键因素是其结果的排名。在现有技术中,没有考虑到元搜索引擎调用的每个独立搜索引擎其所侧重的搜索信息类别的不同,即每个独立搜索引擎对某一类或某几类信息提供的搜索比较准确。由于元搜索引擎提供的搜索结果较多,而用户一般比较关注位置比较靠前的搜索结果,因此导致从元搜索引擎获取的搜索结果不能令人满意。

发明内容
有鉴于此,本发明提供一种元搜索引擎的排名方法及元搜索引擎,用以解决现有
技术中用户从元搜索引擎获取的搜索结果不准确的问题。 本发明实施例提供的一种元搜索引擎的排名方法,包括 元搜索引擎根据用户输入的搜索请求提取搜索关键词,确定该搜索关键词对应的文本类别; 元搜索引擎将该搜索关键词发送到其调用的每个独立搜索引擎; 接收每个独立搜索引擎返回的搜索结果,根据保存的每个独立搜索引擎对应所述
文本类别的权重系数,确定每个搜索结果的排名; 将确定排名后的搜索结果提供给所述用户。 本发明实施例提供的一种元搜索引擎,包括 文本类别确定模块,用于根据用户输入的搜索请求提取搜索关键词,确定该搜索关键词对应的文本类别;
发送模块,用于将该搜索关键词发送到其调用的每个独立搜索引擎,并将确定排 名后的搜索结果提供给所述用户; 排名模块,用于接收每个独立搜索引擎返回的搜索结果,根据保存的每个独立搜 索引擎对应所述文本类别的权重系数,确定每个搜索结果的排名。 本发明实施例提供的元搜索引擎及搜索方法,确定用户输入的搜索请求对应的文 本类别,在将每个独立引擎返回的结果进行排名时,根据每个独立搜索引擎相对该文本类 别的权重系数确定,充分考虑了其调用的每个独立搜索引擎的搜索特点,针对每个文本类 别的准确性,从而可以向用户提供更为准确的搜索结果,大大提高了元搜索引擎提供的搜 索结果的搜索质量。


图1为本发明实施例提供的一种元搜索引擎的排名方法流程图; 图2为本发明实施例提供的用户输入的搜索请求包括一个文本类别,元搜索引擎
的排名方法流程图; 图3为本发明实施例提供的确定的搜索关键词长度较长时,元搜索引擎的排名方 法流程图; 图4为本发明实施例提供的一种元搜索引擎结构示意图。
具体实施例方式
本发明实施例中为了有效提高用户从元搜索引擎获取的搜索结果的准确性,提高 元搜索引擎提供的搜索结果的搜索质量,如图1所示,本发明实施例提供了一种元搜索引 擎的排名方法,具体包括以下步骤 S101 :元搜索引擎根据用户输入的搜索请求提取搜索关键词,确定该搜索关键词 对应的文本类别。
在本发明实施例中可以采用文本分类方法确定每个搜索关键词的文本类别。
S102 :元搜索引擎将该搜索关键词发送到其调用的每个独立搜索引擎。
S103:接收每个独立搜索引擎返回的搜索结果,根据每个独立搜索引擎对应所述 文本类别的权重系数,确定每个搜索结果的排名。 在本发明实施例中,每个独立搜索引擎对应所述文本类别的权重系数,根据每个 独立搜索引擎对所述文本类别搜索的准确度确定。 所述根据保存的每个独立搜索引擎对应所述文本类别的权重系数,确定每个搜索
结果的排名包括根据保存的每个独立搜索引擎对应所述文本类别的权重系数,及所述每
个独立搜索引擎返回的搜索结果的位置,确定每个搜索结果的排名。
S104 :将确定排名后的搜索结果提供给所述用户。
下面结合说明书附图,对本发明实施例进行详细说明。 在本发明实施例中,根据用户可能涉及到的搜索文本的类别,确定元搜索引擎中 调用的每个独立搜索引擎相对每个文本类别的权重系数,也可以理解为确定每个元搜索引 擎调用的每个独立搜索引擎对每个搜索文本搜索的准确度,其中,确定每个独立搜索引擎 相对每个文本类别的权重系数,可以通过用户对每个独立搜索引擎对其搜索每个文本类别的评价确定,例如用户A,对独立搜索引擎B搜索新闻文本类别的评价为较好,或评价为80分,则通过若干个用户对独立搜索引擎B搜索新闻文本类别的评价,确定独立搜索引擎B搜索新闻文本类别的权重系数。 当然,也可以通过第三方测试平台,针对每个文本类别,确定元搜索引擎调用的每个独立搜索引擎搜索该文本类别的准确度,从而确定每个独立搜索引擎相对每个文本类别的权重系数。在本发明实施例中,元搜索引擎调用的每个独立搜索引擎相对一个文本类别的权重系数的和可以为1,当然也可以不限定权重系数的和,只要该权重系数能够体现其搜索对应文本类别的准确度即可。例如用户常用的文本类别包括时政A、财经B、娱乐C、 IT互联网D、科技E、生活F、软件G等,并且,该元搜索引擎调用的独立搜索引擎分别为a、b和c时,通过评测后,确定独立搜索引擎a相对时政A的权重系数为0. 6,可以理解为独立搜索引擎a搜索文本类别时政的准确性为0. 6,独立搜索引擎b相对时政A的权重系数为0. 3,独立搜索引擎c相对时政A的权重系数为0. l,独立搜索引擎a相对娱乐C的权重系数为0. 2,独立搜索引擎b相对娱乐C的权重系数为0. 5,独立搜索引擎c相对娱乐C的权重系数为0. 3,等等,依次确定元搜索引擎调用的每个独立搜索引擎相对每个文本类别的权重系数。 图2为本发明实施例中,当用户输入的搜索请求包括一个文本类别时,元搜索引擎的排名方法,具体包括以下步骤 S201 :元搜索引擎根据接收到的用户输入的搜索请求提取搜索关键词,确定该搜索关键词对应的文本类别。 例如可以采用文本分类方法确定搜索关键词对应的文本类别,当然可以采用其他的方法确定搜索关键词对应的文本类别。 S202 :元搜索引擎将该搜索关键词发送给其调用的每个独立搜索引擎。 S203 :每个独立搜索引擎接收到该搜索关键词后,根据该搜索关键词进行搜索,并
向元搜索引擎返回其搜索结果。 S204 :元搜索引擎接收其调用的每个独立搜索引擎返回的搜索结果。 S205:根据该搜索关键词的文本类别,及每个独立搜索引擎对应该文本类别的权
重系数,将每个独立搜索引擎返回的搜索结果排名,并将确定排名后的搜索结果返回给用户。 其中,根据接收到的用户输入的搜索请求提取搜索关键词,确定该搜索关键词对应的文本类别包括将用户输入的搜索请求进行文档切分处理,根据搜索请求的词频特性,提取该搜索请求中的类别关键词,进行类别关键词的学习与调整,当每个类别的关键词学习完毕后,需要对原支持每个类别的向量进行权重调整,从而确定搜索请求的搜索关键词,及该搜索关键词对应的文本类别。 根据该搜索关键词的文本类别,及每个独立搜索引擎对应该文本类别的权重系数,将每个独立搜索引擎返回的搜索结果排名包括 例如当根据用户输入搜索请求提取的搜索关键词为影视明星张三时,元搜索引擎确定该搜索关键词的文本类别为娱乐。元搜索引擎将搜索关键词张三发送到其调用的每个独立搜索引擎a、 b和C。每个独立搜索引擎根据接收到的搜索关键词张三进行搜索,并将搜索结果返回元搜索引擎。元搜索引擎接收到其调用的每个独立搜索引擎返回的搜索结
6果后,根据每个独立搜索引擎相对该娱乐文本类别的权重系数,例如独立搜索引擎a相对 娱乐C的权重系数为0. 2,独立搜索引擎b相对娱乐C的权重系数为0. 5,独立搜索引擎c 相对娱乐C的权重系数为0. 3,由于,独立搜索引擎相对娱乐C的权重系数的高低顺序为b、 c和a,因此,可以首先将独立搜索引擎b返回的搜索结果进行排名,然后排独立搜索引擎c 返回的搜索结果,最后排独立搜索引擎a返回的搜索结果。 由于独立搜索引擎返回的搜索结果也可能是按照与搜索关键词的密切程度进行 排名的,可以认为每个独立搜索引擎返回的搜索结果排列在前的其与搜索关键词的相关度 比较高。因此,在将每个独立搜素引擎返回的搜索结果进行排名时,也可以根据每个独立搜 索引擎相对文本类别的权重系数,及每个独立搜索引擎返回的每个搜索结果在总搜索结果 中的位置,将每个独立搜索引擎返回的每个搜索结果进行排名输出。 例如,独立搜索引擎a相对娱乐C的权重系数为0. 2,独立搜索引擎b相对娱乐C 的权重系数为0. 5,独立搜索引擎c相对娱乐C的权重系数为0. 3,由于,独立搜索引擎相对 娱乐C的权重系数的高低顺序为b、c和a,同时,独立搜索引擎a返回的搜索结果中排列顺
序为la、2a、3a.......,独立搜索引擎b返回的搜索结果中排列顺序为lb、2b、3b.......,
独立搜索引擎c返回的搜索结果中排列顺序为lc、2c、3c.......,则排名后可以包括lb、
lc、 la、2b、2c、2a、3b、3c、3a、......。 或者,根据每个独立搜索引擎返回的每个搜索结果在总搜索结果中的位置,确定 每个位置对应的权重系数,并且根据每个独立搜索引擎相对每个文本类别的权重系数,将 每个独立搜索引擎返回的搜索结果进行排名。 例如,根据每个独立搜索引擎返回的每个搜索结果在总搜索结果中的位置,确定 每个位置对应的权重系数,例如每个位置对应的权重系数为与该位置对应数的倒数,比如, 当某一搜索结果为独立搜索返回的搜索结果的第n个,n为正整数,则该搜索结果对应的权 重系数为1/n。因此再将每个独立搜索引擎返回的结果进行排名时,例如,独立搜索引擎a 相对娱乐C的权重系数为0. 2,独立搜索引擎b相对娱乐C的权重系数为0. 5,独立搜索引 擎c相对娱乐C的权重系数为0. 3,由于,独立搜索引擎相对娱乐C的权重系数的高低顺序
为b、c和a,同时,独立搜索引擎a返回的搜索结果中排列顺序为la、2a、3a.......,独立搜
索引擎b返回的搜索结果中排列顺序为lb、2b、3b.......,独立搜索引擎c返回的搜索结果
中排列顺序为lc、2c、3c.......,则可知独立搜索引擎a返回的每条搜索结果的排名参数
为0. 2、0. 1、0. 2/3.......,独立搜索引擎b返回的每条搜索结果的排名参数为0. 5、0. 25、
0. 5/3.......,独立搜索引擎c返回的每条搜索结果的排名参数为0.3、0. 15、0. 1.......,
因此将排名后的搜索结果为lb、lc、2b、la、3b、2c、2a、3c、3a.......。 在本发明实施例中,当两个独立搜索引擎对应的文本类别的权重系数相同时,该 两个独立搜索引擎返回的搜索结果的顺序可以任意排列。 采用本发明实施例所提供的方法,根据每个独立搜索引擎相对每个搜索文本类别 的权重系数,以及根据每个独立搜索引擎返回的结果的位置,确定每个搜索结果的排名,充 分考虑了每个独立搜索引擎的搜索特点,并结合了每个独立搜索引擎返回的结果的特点, 因此采用本发明实施例提供的确定排名的方法,可以使用户从元搜索引擎获取的搜索结果 更准确。 或者,在对每个独立搜索引擎返回的搜索结果进行排名时,根据每个独立搜索引擎搜索信息的准确度,及每个独立搜索引擎搜索每个文本类别的准确度,确定每个搜索结 果的排名。 在本发明实施例中,可以根据每个独立搜索引擎对搜索文本类别,即对综合信息 的搜索的准确度,确定每个独立搜索引擎相对该综合信息的第一权重系数,再根据每个独 立搜索引擎搜索每个文本类别的准确度,确定每个独立搜索引擎相对每个文本类别的权重 系数,根据该两个权重系数,确定每个搜索引擎返回的每个搜索结果的排名。其中,综合信 息包括时政、财经、娱乐、IT互联网、科技、生活、软件等等信息。 例如,两个独立搜素引擎a和b,其相对综合信息的第一权重系数分别为0.7和 0. 3,其相对经济文本类别的权重系数分别为0. 4和0. 6,则当元搜索引擎调用该两个独立 搜索引擎,对文本类别为经济的搜索关键词进行搜索时,将该两个独立搜索引擎返回的搜 索结果进行排序时,根据该两个独立搜素引擎相对综合信息的第一权重系数和相对经济文 本类别的权重系数,确定每个搜索结果的排名时,则独立搜索引擎a返回的搜索结果la,
2a......的排名参数为0.28,独立搜索引擎b返回的搜索结果lb,2b......的排名参数为
0. 18,因此,在将独立搜索引擎返回的每个搜索结果进行排名是,可以按照先排独立搜索引 擎a返回的搜索结果,然后排独立搜索引擎b返回的搜索结果。 同时,在上述将每个搜索结果进行排名的过程中,也可以按照每个独立搜索引擎 返回的搜索结果的位置进行排名。例如,按照上述返回的结果,在排名时,可以确定排名为 la, lb,2a,2b......。 采用本发明实施例所提供的方法,根据每个独立搜索引擎相对每个搜索文本类别
的权重系数,以及根据每个独立搜索引擎返回的结果的位置,确定每个搜索结果的排名,充
分考虑了每个独立搜索引擎搜索综合信息及各个文本信息的特点,因此采用本发明实施例
提供的确定排名的方法,可以使用户从元搜索引擎获取的搜索结果更准确。 采用本发明实施例提供的元搜索引擎的搜索方法,充分考虑了其调用的每个独立
搜索引擎的搜索特点,针对每个文本类别的准确性,从而可以向用户提供更为准确的搜索结果。 同时,在本发明实施例中,在进行搜索结果排名时还可以根据每个独立搜索引擎
返回的搜索结果的位置,及每个独立搜索引擎相对每个文本类别的权重系数,确定每个独
立搜索引擎返回的搜索结果的顺序,从而可以向用户提供更为准确的搜索结果。 在本发明实施例中,为了提高元搜索引擎向用户提供搜索结果的速度,可以在接
收到每个独立的搜索引擎返回的部分搜索结果时,按照上述排名方法将该部分搜索结果进
行排名,例如接收到每个独立搜索引擎返回的搜索结果的首页后者前几页时,将每个搜索
结果进行排名。当元搜索引擎接收到每个独立搜索引擎返回的所有搜索结果后,将该所有
搜索结果按照上述方法进行排名,将排名后的搜索结果提供给用户。 由于各个独立的搜索引擎,其接收搜索关键词的长度都是有限制的,在本发明实
施例中,可以实现对超长关键词的搜索,如图3所示,具体包括以下步骤 S301 :元搜索引擎根据接收到的用户输入的搜索请求提取搜索关键词,确定该搜
索关键词对应的文本类别。 S302:判断搜索关键词的长度是否不大于独立搜索引擎搜索关键词的长度阈值, 当判断结果为是时,进行步骤S303,否则进行步骤S305 ;
S303 :元搜索引擎将该搜索关键词发送到其调用的每个独立搜索引擎。 S304:根据接收到每个独立搜索引擎返回对搜索关键词的搜索结果,及每个独立
搜索引擎相对该文本类别的权重系数,将每个独立引擎返回的每个搜索结果进行排名,并
将确定排名后的搜索结果提供给用户。 S305:当搜索关键词的长度大于独立搜索引擎搜索关键词的长度阈值时,将该搜索关键词进行拆分,拆分为至少两个子句。 在本发明实施例中可以采用逻辑拆分的方法,将搜索关键词拆分为至少两个子
句,或者也可以采用其他的拆分方法,将该搜索关键词拆分为至少两个子句。 S306:判断拆分后的子句的长度,是否不大于独立搜索引擎搜索关键词的长度阈
值,当判断结果为是时,进行S307,否则,进行S309。 S307 :当拆分后的某一个子句或某几个子句的长度不大于独立搜索引擎搜索关键词的长度阈值时,将拆分后的该一个或几个子句发送给其调用的每个独立搜索引擎。
S308:根据接收到每个独立搜索引擎返回对每个子句的搜索结果,及每个独立搜索引擎相对该文本类别的权重系数,将每个独立引擎返回的每个搜索结果进行排名,并将确定排名后的搜索结果提供给用户。 S309:当拆分后的某一个子句或某几个子句的长度大于独立搜索引擎搜索关键词的长度阈值时,根据独立搜索引擎搜索关键词的长度阈值,将该一个或几个子句中的每个子句拆分为至少两个分词。将每个分词发送给每个独立搜索引擎。 在本发明实施例中,可以采用中文分词方法将每个子句拆分为至少两个分词,当然也可以采用其他方法,将每个子句拆分为至少两个分词。 S310:根据每个独立搜索引擎返回的对每个分词的搜索结果,及每个独立搜索引擎相对该文本类别的权重系数,将每个独立搜索引擎返回的每个搜索结果进行排名,并将排名后的搜索结果提供给用户。 在本发明实施例中,当确定的搜索关键词的长度大于设定的独立搜索引擎搜索关
键词的长度阈值时,将该搜索关键词进行拆分首先进行逻辑拆分,如果逻辑拆分后的子句
仍然大于独立搜索引擎搜索关键词的长度阙值时,再利用中文分词技术进行分拆。 在本发明实施例中所采用的逻辑分拆将搜索关键词拆分为至少两个子句包括针
对超出长度限制的词句逻辑组合,将其分解为析取范式:(a厂a2"a3. ) | (bl"b2"b3.)
...,其中的合取子句(ara2"a3. ..), (bl~b2~b3...),...可以作为独立的查询分别发给搜索引擎,然后取返回结果的并集。
词句逻辑组合分解为析取范式的步骤包括 首先,对搜索关键词中的语句的逻辑组合进行语法分析,在计算机中将语法分析后的结果存储为分析树。 然后,前序遍历该分析树,在遍历该分析树的过程中,利用德摩根(DeMorgan)定理进行处理,即^H^-7org ,^^-7andg,直到所有的取否操作都应用于原子命题上,其中,在本发明实施例中,原子命题包括不含逻辑连接字"and"或"or"的子句。
再后,对处理的分析树再进行一次前序遍历,检查分析树内部是否出现连续两个取否操作,当出现两个连续取否操作时,将其消除,例如~~A = A。 继而,对分析树再进行一次后序遍历,利用命题公式的分配律,(AorB)and(CorD)
9=(AandC)or (AandD)or (BandC)or (BandD),将分析树转化为析取范式的形式。当分析树中 存在(Qand^ )的形式时,则该子句无效,可以将其删除。 当逻辑拆分后的子句的长度仍然大于独立搜索引擎的搜索长度阈值时,采用中文 分词方法将每个子句划分为至少两个分词。例如拆分后的子句为"拆分后的子句的长度仍 然大于独立搜索引擎的搜索长度阈值时,采用中文分词方法将每个分句划分为至少两个分 词",则采用中文分词方法将该子句拆分为两个分词后得到第一分词"拆分后的子句的长度 仍然大于独立搜索引擎的搜索长度阈值时"和第二分词"采用中文分词方法将每个分句划 分为至少两个分词"。 例如,当元搜索引擎从用户输入的搜索请求中,确定了搜索关键词及该搜索关键 词对应的文本类别时,当该搜索关键词的长度大于某一个或某几个独立搜索引擎搜索长度 阈值,则将该搜索关键词进行逻辑拆分或中文分词方法拆分后,得到满足长度要求的子句 或分词。例如该搜索关键词对应的搜索文本类型为软件G,以拆分得到的3个子句a、b和c 的长度满足要求为例进行说明。 元搜索引擎将拆分后的3个子句分别都发送到独立搜索引擎A、 B和C,当接收到 独立搜索引擎A、 B和C对该3个子句的搜索结果后,将该搜索结果进行排名。其中具体的 排名时,根据该每个独立搜索引擎相对该文本类别的权重系数进行,例如,独立搜索引擎A
针对子句a返回的搜索结果分别为1Aa、2Aa.......,针对子句b返回的搜索结果分别为
1Ab、2Ab.......,针对子句c返回的搜索结果分别为1Ac、2Ac.......,独立搜索引擎B针
对子句a返回的搜索结果分别为1Ba、2Ba.......,独立搜索引擎B针对子句b返回的搜
索结果分别为1Bb、2Bb.......,独立搜索引擎B针对子句c返回的搜索结果分别为lBc、
2Bc.......,独立搜索引擎C针对子句a返回的搜索结果分别为1Ca、2Ca.......,独立搜
索引擎C针对子句b返回的搜索结果分别为1Cb、2Cb.......,独立搜索引擎C针对子句c
返回的搜索结果分别为1Cc、2Cc.......,当根据每个独立搜索引擎返回的搜索结果进行排
名时,针对每个独立搜索引擎相对搜索软件文本类别的权重系数确定。 例如,独立搜索引擎A相对搜索软件文本类别的权重系数为0. 3,独立搜索引擎B
相对搜索软件文本类别的权重系数为0.2,独立搜索引擎C相对搜索软件文本类别的权重
系数为0.5。因此,在进行搜索结果排名时,元搜索引擎可以首先排独立搜索引擎C返回的
针对该3个子句的搜索结果,然后排独立搜索引擎A返回的针对该3个子句的搜索结果,最
后排独立搜索引擎B返回的针对该3个子句的搜索结果。 或者,在将每个独立搜素引擎返回的搜索结果进行排名时,也可以根据每个独立 搜索引擎相对文本类别的权重系数,及每个独立搜索引擎返回的每个搜索结果在总搜索结 果中的位置,将每个独立搜索引擎返回的每个搜索结果进行排名输出。 例如,元搜索引擎对独立搜索引擎返回的结果排名时,由于独立搜索引擎相对该 搜索软件文本类别的权重系数由高到低的顺序为C、A和B,因此在进行搜索结果排名时,可 以首先排独立搜索引擎C返回的针对每个子句的第一个搜索结果1Ca、lCb和1Cc,其中,该 三个搜索结果之间的顺序可以任意排列,然后,排列独立搜索引擎A返回的针对每个子句 的第一搜索结果1Aa、lAb和1Ac,其中,该三个搜索结果之间的顺序可以任意排列,再后,排 列独立搜索引擎B返回的针对每个子句的第一搜索结果1Bc、lBa和1Bb,其中,该三个搜索 结果之间的顺序可以任意排列,再后,排独立搜索引擎C返回的针对每个子句的第二个搜索结果2Ca、2Cb和2Cc,按照此顺序依次将每个独立搜索引擎返回的结果进行排名,将排名 后的搜索结果提供给用户。 或者,根据每个独立搜索引擎返回的每个搜索结果在总搜索结果中的位置,确定 每个位置对应的权重系数,并且根据每个独立搜索引擎相对每个文本类别的权重系数,将 每个独立搜索引擎返回的搜索结果进行排名。 例如,根据每个独立搜索引擎返回的每个搜索结果在总搜索结果中的位置,确定 每个位置对应的权重系数,例如每个位置对应的权重系数为与该位置对应数的倒数,比如, 当某一搜索结果为独立搜索返回的搜索结果的第n个,n为正整数,则该搜索结果对应的权 重系数为1/n。其中,当两个搜索结果得到的权重系数相同时,该两个搜索结果的可以任意 排列。 或者,在对每个独立搜索引擎返回的搜索结果进行排名时,根据每个独立搜索引 擎搜索信息的准确度,及每个独立搜索引擎搜索每个文本类别的准确度,确定每个搜索结 果的排名。 同时,在将每个独立搜索引擎返回的搜索结果进行排名时,还可以根据每个独立 搜索引擎搜索信息的准确度,每个独立搜索引擎搜索每个文本类别的准确度,以及每个独 立搜索引擎返回的搜索结果的位置,确定每个搜索结果的排名。在这里就不一一赘述,相信 本领域技术人员可以根据上述实施例,按照本发明实施例提供的方法将每个搜索结果的排 名。 如图4所示,为本发明实施例提供的一种元搜索引擎,包括 文本类别确定模块40,用于根据用户输入的搜索请求提取搜索关键词,确定该搜 索关键词对应的文本类别; 发送模块41,用于将该搜索关键词发送到每个独立搜索引擎,并将确定排名后的 搜索结果提供给所述用户; 排名模块42,用于接收每个独立搜索引擎返回的搜索结果,根据保存的每个独立
搜索引擎对应所述文本类别的权重系数,确定每个搜索结果的排名。 所述元搜索引擎还包括 判断模块43,用于判断所述搜索关键词的长度是否不大于独立搜索引擎搜索关键 词的长度阈值; 拆分模块44,用于当所述搜索关键词的长度大于独立搜索引擎搜索关键词的长度
阈值时,将所述搜索关键词拆分为至少两个子句。
所述判断模块43还用于, 判断每个子句的长度是否不大于独立搜索引擎搜索关键词的长度阈值。
所述拆分模块44还用于, 当所述每个子句的长度大于独立搜索引擎搜索关键词的长度阈值时,根据每个独
立搜索引擎搜索关键词的长度阈值,将所述每个子句拆分为至少两个分词。 所述排名模块42还用于, 根据保存的每个独立搜索引擎对应所述文本类别的权重系数,及所述每个独立搜
索引擎返回的搜索结果的位置,确定每个搜索结果的排名。 所述排名模块42还用于,
根据保存的每个独立搜索引擎对应所述文本类别的权重系数,及所述每个独立搜 索引擎相对综合信息的权重系数,确定每个搜索结果的排名。
所述排名模块42还用于, 根据保存的每个独立搜索引擎对应所述文本类别的权重系数,所述每个独立搜索 引擎返回的搜索结果的位置,及所述每个独立搜索引擎相对综合信息的权重系数,确定每 个搜索结果的排名。 本发明实施例提供的元搜索引擎及搜索方法,确定用户输入的搜索请求对应的文 本类别,在将每个独立引擎返回的结果进行排名时,根据每个独立搜索引擎相对该文本类 别的权重系数确定,充分考虑了其调用的每个独立搜索引擎的搜索特点,针对每个文本类 别的准确性,从而可以向用户提供更为准确的搜索结果。 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含这些改动和变型在内。
权利要求
一种元搜索引擎的排名方法,其特征在于,包括元搜索引擎根据用户输入的搜索请求提取搜索关键词,确定该搜索关键词对应的文本类别;元搜索引擎将该搜索关键词发送到其调用的每个独立搜索引擎;接收每个独立搜索引擎返回的搜索结果,根据保存的每个独立搜索引擎对应所述文本类别的权重系数,确定每个搜索结果的排名;将确定排名后的搜索结果提供给所述用户。
2. 如权利要求1所述的方法,其特征在于,所述每个独立搜索引擎对应所述文本类别 的权重系数,根据每个独立搜索引擎对所述文本类别搜索的准确度确定。
3. 如权利要求1所述的方法,其特征在于,所述元搜索引擎将该搜索关键词发送到每 个独立搜索引擎之前所述方法进一步包括判断所述搜索关键词的长度是否不大于独立搜索引擎搜索关键词的长度阈值; 当所述搜索关键词的长度不大于独立搜索引擎搜索关键词的长度阈值时,进行所述的 将该搜索关键词发送到每个独立搜索引擎的步骤; 否则,将所述搜索关键词拆分为至少两个子句。
4. 如权利要求3所述的方法,其特征在于,所述方法进一步包括 判断每个子句的长度是否不大于独立搜索引擎搜索关键词的长度阈值; 当所述每个子句的长度不大于独立搜索引擎搜索关键词的长度阈值时,进行所述的将该搜索关键词每个子句发送到每个独立搜索引擎的步骤;否则,根据每个独立搜索引擎搜索关键词的长度阈值,将所述每个子句拆分为至少两 个分词。
5. 如权利要求1所述的方法,其特征在于,所述根据保存的每个独立搜索引擎对应所 述文本类别的权重系数,确定每个搜索结果的排名包括根据保存的每个独立搜索引擎对应所述文本类别的权重系数,及所述每个独立搜索引 擎返回的搜索结果的位置,确定每个搜索结果的排名。
6. 如权利要求1所述的方法,其特征在于,所述根据保存的每个独立搜索引擎对应所 述文本类别的权重系数,确定每个搜索结果的排名包括根据保存的每个独立搜索引擎对应所述文本类别的权重系数,及所述每个独立搜索引 擎相对综合信息的权重系数,确定每个搜索结果的排名。
7. 如权利要求1或6所述的方法,其特征在于,所述根据保存的每个独立搜索引擎对应 所述文本类别的权重系数,确定每个搜索结果的排名包括根据保存的每个独立搜索引擎对应所述文本类别的权重系数,所述每个独立搜索引擎 返回的搜索结果的位置,及所述每个独立搜索引擎相对综合信息的权重系数,确定每个搜 索结果的排名。
8. —种元搜索引擎,其特征在于,包括文本类别确定模块,用于根据用户输入的搜索请求提取搜索关键词,确定该搜索关键 词对应的文本类别;发送模块,用于将该搜索关键词发送到其调用的每个独立搜索引擎,并将确定排名后 的搜索结果提供给所述用户;排名模块,用于接收每个独立搜索引擎返回的搜索结果,根据保存的每个独立搜索引擎对应所述文本类别的权重系数,确定每个搜索结果的排名。
9. 如权利要求8所述的元搜索引擎,其特征在于,所述元搜索引擎还包括判断模块,用于判断所述搜索关键词的长度是否不大于独立搜索引擎搜索关键词的长度阈值;拆分模块,用于当所述搜索关键词的长度大于独立搜索引擎搜索关键词的长度阈值时,将所述搜索关键词拆分为至少两个子句。
10. 如权利要求9所述的元搜索引擎,其特征在于,所述判断模块还用于,判断每个子句的长度是否不大于独立搜索引擎搜索关键词的长度阈值。
11. 如权利要求10所述的元搜索引擎,其特征在于,所述拆分模块还用于,当所述每个子句的长度大于独立搜索引擎搜索关键词的长度阈值时,根据每个独立搜索引擎搜索关键词的长度阈值,将所述每个子句拆分为至少两个分词。
12. 如权利要求8所述的元搜索引擎,其特征在于,所述排名模块还用于,根据保存的每个独立搜索引擎对应所述文本类别的权重系数,及所述每个独立搜索引擎返回的搜索结果的位置,确定每个搜索结果的排名。
13. 如权利要求8所述的元搜索引擎,其特征在于,所述排名模块还用于,根据保存的每个独立搜索引擎对应所述文本类别的权重系数,及所述每个独立搜索引擎相对综合信息的权重系数,确定每个搜索结果的排名。
14. 如权利要求8所述的元搜索引擎,其特征在于,所述排名模块还用于,根据保存的每个独立搜索引擎对应所述文本类别的权重系数,所述每个独立搜索引擎返回的搜索结果的位置,及所述每个独立搜索引擎相对综合信息的权重系数,确定每个搜索结果的排名。
全文摘要
本发明公开了一种元搜索引擎的排名方法及元搜索引擎,用以解决现有技术中用户从元搜索引擎获取的搜索结果不准确的问题。该方法包括元搜索引擎根据用户输入的搜索请求提取搜索关键词,确定该搜索关键词对应的文本类别;元搜索引擎将该搜索关键词发送到其调用的每个独立搜索引擎;接收每个独立搜索引擎返回的搜索结果,根据保存的每个独立搜索引擎对应所述文本类别的权重系数,确定每个搜索结果的排名;将确定排名后的搜索结果提供给所述用户。如本发明提出的方案,可以向用户提供更为准确的搜索结果,大大提高了元搜索引擎提供的搜索结果的搜索质量。
文档编号G06F17/30GK101751434SQ20081024001
公开日2010年6月23日 申请日期2008年12月16日 优先权日2008年12月16日
发明者吴新丽, 尹小刚, 杨建武 申请人:北大方正集团有限公司;北京大学;北京方正电子政务信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1