一种基于查询词进行搜索的方法和搜索装置的制作方法

文档序号:6336756阅读:167来源:国知局
专利名称:一种基于查询词进行搜索的方法和搜索装置的制作方法
技术领域
本发明涉及一种互联网信息搜索方法及工具,特别涉及一种基于查询词进行搜索 的方法和搜索装置。
背景技术
随着网络技术的发展,搜索引擎得到了不断的完善,通过搜索引擎可以从互联网 上获取各种信息。搜索引擎是当前互联网帮助用户快速获取信息的主要途径之一。用户提 交一个查询词(Query)给搜索引擎,搜索引擎返回给用户与该查询词相关的搜索结果,这 些结果按与查询词相关的程度从高到低排列。
现有的搜索引擎技术大致可以分为两种。传统搜索引擎,使用网络爬虫从互联网 抓取网页,建立索引,并为用户提供查询服务,以百度、谷歌的网页搜索为代表。垂直搜索引 擎,对特定领域的数据进行抓取、索引和搜索,并为用户提供查询服务,以搜狗音乐搜索为 代表。例如,还存在新闻、音乐、图片、视频、购物、地图等专业领域的垂直搜索引擎。
传统的搜索引擎技术通常包括网页抓取、网页处理、搜索服务等几个部分。无论哪 一家搜索引擎,都不可能去抓取互联网的全部内容,因此各家搜索引擎通常都是索引整个 互联网的一个子集;另外,传统的网络爬虫基于网页之间的链接进行抓取,对于没有链接的 页面难以抓取;最后,传统搜索引擎从抓取、建立索引、提供查询服务需要一定周期,对大部 分内容无法做到实时更新。
同时,一种搜索引擎可能无法满足所有人或者一个人的所有搜索需求。在某些情 况下,为了得到较为全面及准确的搜索结果,人们需要使用多个搜索引擎来进行搜索,通过 对搜索结果进行比较和筛选来获取搜索结果,但是其操作较为繁琐,降低了搜索效率,也提 高了搜索的难度。
进一步,对于候选多个搜索引擎而言,将这类候选引擎都选择查询并将结果返回 是不可取的(搜索时间将大大加长),且会存在某些引擎对衣服类商品词有更好的结果,但 对电子产品的商品词效果会比较差,这使得搜索结果无法更好的满足用户需求,即准确度 降低。
总之,本领域技术人员希望能够对用户的查询意图进行分析,以便更好的提供搜 索结果,提高用户搜索的准确性。发明内容
本发明所要解决的技术问题是提供一种基于查询词进行搜索的方法及搜索装置, 能够对用户的查询意图进行分析,选择与用户需求相关的搜索引擎,进行有针对性的搜索。
为了解决上述问题,本发明公开了一种基于查询词进行搜索的方法,包括以下步 骤搜索客户端获取用户输入的查询词,结合查询词属性库,从多个搜索引擎中选择适合该 查询词的搜索引擎;所述查询词属性库用于表征各查询词或各查询词类别与各搜索引擎的 相关程度;获取所选择的搜索引擎的搜索结果信息,处理后进行展示。
优选的,所述选择为由客户端基于本地查询词属性库选择。
优选的,所述方法还可以包括发送查询词至搜索服务器端,由服务器端同时执行 查询词分析操作;服务器端选择搜索引擎并将选择的搜索引擎及其权重返回给客户端,客 户端根据服务器端选择的搜索引擎及其权重对客户端选择的搜索引擎的权重进行调整。
优选的,所述方法还可以包括客户端接收服务器端返回的查询词分析的相关参 数;则所述处理包括利用分析查询词得到的相关参数,通过对搜索结果数和/或搜索结果 的摘要与查询词的匹配程度,对搜索结果进行评估,得到评估分值;如果该评估分值低于预 设阈值,则对相应搜索引擎的搜索结果进行降权或者删除。
优选的,所述相关参数包括查询词分词信息或纠错信息等。
优选的,所述服务器端的查询词属性库通过如下方法建立步骤11,统计查询词 或查询词类别与搜索引擎的相关信息;步骤12,根据步骤11中的统计信息计算出查询词或 查询词类别与各搜索引擎相关程度的向量;步骤13,根据步骤12中的相关程度向量生成查 询词属性库。
优选的,所述客户端查询词属性库从服务器端更新得到,其通过提取服务器端属 性库中的关键信息而生成。
优选的,所述步骤11中相关信息的统计包括以下步骤获取各搜索引擎的查询词 分布数据;获取查询词在各搜索引擎的点击分布数据。
优选的,所述方法还可以包括收集用户在当前搜索客户端上,对所展示的搜索结 果的点击情况,对查询词属性库进行修正。
依据本发明的另一实施例,还公开了一种基于查询词的搜索装置,其位于搜索客 户端,具体可以包括
第一选择模块,用于根据所获取的查询词,结合查询词属性库,从多个搜索引擎中 选择适合该查询词的搜索引擎;所述查询词属性库用于表征各查询词或各查询词类别与各 搜索引擎的相关程度;
获取模块,用于获取搜索引擎的搜索结果信息;
解析展示模块,用于对搜索结果处理后进行展示。
优选的,所述装置还可以包括
发送模块,用于发送查询词至搜索服务器端;
接收模块,用于接收服务器端执行查询词分析操作后,所选择的搜索引擎及其权 重;
调整模块,用于根据服务器端选择的搜索引擎及其权重对第一选择模块所选择的 搜索引擎的权重进行调整。
优选的,所述接收模块还用于接收服务器端返回的查询词分析的相关参数;所述 相关参数包括查询词分词信息或纠错信息等;
则所述解析展示模块包括
解析处理子模块,用于利用分析查询词得到的相关参数,通过对搜索结果数和/ 或搜索结果的摘要与查询词的匹配程度,对搜索结果进行评估,得到评估分值;如果该评估 分值低于预设阈值,则对相应搜索引擎的搜索结果进行降权或者删除;
展示子模块,用于展示解析处理子模块排序修正后的搜索结果。5
优选的,所述第一选择模块所依据的查询词属性库位于本地客户端,其通过提取 服务器端属性库中的关键信息而生成。
优选的,所述装置还可以包括
反馈模块,用于收集用户在当前搜索客户端上,对所展示的搜索结果的点击情况, 以对查询词属性库进行修正。
与现有技术相比,本发明具有以下优点
本发明的基于查询词进行搜索的方法及搜索装置在有多个搜索引擎的时候,通过 对用户查询词的意图理解分析,选择与用户需求相关的搜索引擎(或者在用户意图方向上 搜索准确性较高的搜索引擎),进行有针对性的链接搜索,不仅可以提高系统的效率,更增 加了用户的搜索准确度。
此外,由于客户端计算性能或计算资源等限制,可能影响选择结果,所以本发明优 选的,在客户端与服务器端两部分都做选择,客户端首先对查询意图做判断,选择可能的搜 索引擎,服务器端对查询词做进一步的准确分析,将最后的搜索引擎选取结果,以及查询词 的分词、纠错等相关参数,返回给客户端,客户端根据这些信息,对所选搜索引擎的查询结 果、查询意图相关程度、以及搜索质量做进一步的筛选、排序。这种客户端与服务器相结合 方式,提升了系统性能、降低了对客户端的要求和对客户端资源的占用,进一步提高了用户 的搜索准确度。


图1是本发明的一种基于查询词进行搜索的方法实施例一的流程图2是本发明的一种基于查询词进行搜索的方法实施例一中查询词属性库的建 立方法实施例的流程图3是本发明的一种基于查询词进行搜索的方法实施例一中查询词属性库的建 立方法另一实施例的流程图4是本发明的一种基于查询词进行搜索的方法实施例二的流程图5是本发明的一种基于查询词的搜索装置实施例的示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本发明作进一步详细的说明。
请参照图1,示出本发明的基于查询词进行搜索的方法实施例一,包括以下步骤
步骤101,搜索客户端获取用户输入的查询词,结合查询词属性库,从多个搜索引 擎中选择适合该查询词的搜索引擎。
搜索客户端获取用户输入的查询词的方式多种多样,本发明仅仅给出以下几个示 例。例如,当用户在搜索工具栏的搜索框中输入字符时,在浏览器地址栏中输入中文词时, 搜索客户端可以获取这些字符和中文词作为查询词。
在技术实现上,本发明的搜索客户端可以作为一个独立的客户端软件(独立的搜 索入口),对用户查询请求进行获取,也可以在搜索客户端中集成浏览器模块或者其他应用 程序模块,例如,IManstantMessaging,即时通讯)程序、输入法程序、甚至文本编辑程序word等),获取用户的查询请求。这样,便于用户在使用相关应用时能够方便的使用本发明 的搜索功能。
扩展理解,用户所使用的客户端计算机本身也就是本发明所说的搜索客户端,本 发明所强调的各个步骤都是由该计算机发起的,即该物理实体也可以理解为本发明所说的 搜索客户端。当然,为了方便说明,在下面的描述中直接采用搜索客户端进行说明,并主要 强调其软件属性。
请参照图2,查询词的属性库可以是预先统计得出,并储存在搜索客户端,当然,查 询词属性库也可以直接存储在服务器端,由服务器端自己完成操作后将选择结果返回客户 端即可。
具体的,在实现中,查询词属性库可以通过如下方法得出
步骤1011,统计查询词与搜索引擎的相关信息。
在具体实现时,可以首先统计获取各搜索引擎的查询词分布数据,再统计获取查 询词在各搜索引擎的点击分布数据,基于这些统计信息就可以计算出各查询词与各搜索引 擎相关程度的向量。
统计查询词与搜索引擎的相关信息包括,获取搜索引擎中用户查询词的分布数 据,例如,用户在www. taobao. com站内搜索或者www. gougou. com等搜索引擎中所搜索的查 询词。
其中,需要说明的是,www. gougou. com本身就是一搜索引擎,而www. taobao. com、 www. skycn. com等是在其站点内拥有搜索引擎,在本发明中为了方便说明,直接采用www. taobao. com, www. skycn. com等表示搜索引擎,在此特别说明。
同时,还包括获取在某一特定搜索引擎下,用户查询词与相应的搜索引擎或者站 点的点击日志数据,例如,用户在www. sogou. com下查询“衣服”时,点击www. taobao. com域 名下面的网页链接的次数。
通过上述统计数据,可以得出每个查询词在各目标搜索引擎下的查询分布统计信 息,以及在特定搜索引擎下的查询词与目标搜索引擎或站点下的点击分布统计信息。
步骤1012,分析查询词与目标搜索引擎的相关程度。
根据以上查询词与搜索引擎的分布统计信息,生成每个查询词与目标搜索引擎的 向量,向量值表示查询词与此搜索引擎的相关程度。例如,“手机”与搜索引擎“www. taobao. com”的相关程度向量值为0. 8,则表示为mm. taobao. com#0. 8,“衣服”与搜索引擎“www. taobao. com”的相关程度向量为0. 9,则表示为www. taobao. com#0. 9。
步骤1013,建立包含查询词与搜索引擎相关程度向量的查询词属性库。
对计算出的每个查询词与目标搜索引擎的相关程度向量值进行汇总,整理为表格 或者其他形式作为查询词属性库,用于对用户查询词意图进行分析。查询词属性库可以直 接存储在客户端,当用户在客户端进行搜索时,则可以首先通过查询词属性库对查询词进 行分析,选取相关的搜索引擎,进行搜索。
请参照图3,考虑客户端的性能限制,不能负载完整的查询词属性库,为了保证用 户查询的顺利,也可以在前述实现方式的基础上增加步骤1014,提取查询词属性库中的查 询词所包含的实体词及关键属性词,对查询词属性库做压缩。压缩后的查询词属性库可以 仅包含查询实体词及关键属性词。例如,“搜狗输入法免费下载地址”通过实体词和属性词提取后,压缩为实体词“搜狗输入法”和属性词“下载”。将压缩后的查询词属性库储存在客 户端,用于对用户查询词做初步分析,筛选出相关的搜索引擎。
这样可以降低查询词属性库对客户端存储空间的占用,同时在查询词分析时也可 以降低对运算性能的要求,提高分析运算速度。
还需要说明的是,本发明的查询词属性库还可以表征查询词类别与搜索引擎的相 关程度,例如,
IT 类一A 引擎 #0. 9,B 引擎 #0. 8,C 引擎 #0. 6
服饰类一A引擎#0. 5,B引擎#0. 7,C引擎#0. 9
百科类一A引擎#0. 7,B引擎#0. 9,C引擎#0. 6
采用类别相关度的方法,可以进一步缩小查询词属性库的空间占用和提高分析运 算速度。当然,在本发明的优选实施例中,查询词属性库也可以同时表征这样的两种相关度 参数。
关于查询词类别分析,可以使用人工的方式确定某一个词属于哪一个类别(预设 词表),或通过用户在搜索引擎下的查询词与点击内容的关联分析,来得到查询词属于某个 或几个特定类别。在本发明的一个优选实施例中,具体的查询词类别分析过程可以通过服 务器端运算完成。
总之,可以通过预设词表的方式,对用户的查询词进行归类或分类,在此本发明不 再详述。
步骤102,获取搜索引擎的搜索结果信息,处理后进行展示。
简单的,通过链接各个搜索引擎,就可以得到其搜索结果,进而通过对搜索结果信 息进行解析、合并滤重或重排序等操作后,将最终确认的搜索结果展示给用户。
具体实现中有很多重排序或者修正搜索结果的方案,基于实际需要本领域技术人 员选用即可,本发明在此不再赘述。
在前述实施例中,本发明给出了相关程度的向量实现方式,实际上,为了从多个搜 索引擎中选择适合该查询词的搜索引擎,可以采用更为简单的方式。例如,对于查询词和搜 索引擎分别进行分类,针对某个查询词,选择与其相同或者相近类别的搜索引擎即可。
例如,用户搜索“hp笔记本价格”,由于该查询词属于IT类,则选择IT类的搜索引 擎即可,当然,也可以选择相近类别的搜索引擎(例如,综合类别的搜索引擎)。
在选择适合该查询词的搜索引擎时,通常都会选择出多个搜索引擎,某个特定情 况下,也可能仅仅选择出唯一的适合的搜索引擎。也就是说,本发明对于选择得到的搜索引 擎的数量并不需要加以限定。
请参照图4,示出本发明的基于查询词进行搜索的方法实施例二,包括以下步骤
步骤201,搜索客户端获取用户输入的查询词,结合客户端的查询词属性库,从多 个搜索引擎中选择适合该查询词的搜索引擎。此步骤与实施例一中相同,在此不再描述。
步骤202,将客户端获取的查询词发送至搜索服务器端,由服务器端同时执行查询 词分析操作。服务器端根据对查询词的分析选择搜索引擎并将选取的搜索引擎及其权重返 回给客户端
步骤203,在服务器端分析的过程中,客户端链接所选择的搜索引擎,获取所需的 搜索结果。
步骤204,客户端根据服务器端选择的搜索引擎及其权重对客户端选择的搜索引 擎的权重进行调整;
步骤205,客户端接收服务器端返回的查询词分析的相关参数;所述相关参数包 括查询词分词信息或纠错信息等.
利用分析查询词得到的相关参数,通过对搜索结果数和/或搜索结果的摘要与查 询词的匹配程度,对搜索结果进行评估,得到评估分值;如果该评估分值低于预设阈值,则 对相应搜索引擎的搜索结果进行降权或者删除。
步骤206,根据调整后的搜索引擎权重对搜索结果进行筛选、排序;对修正后的搜 索结果进行展示。
在具体实现中,服务器端的查询词属性库可以通过挖掘用户日志生成完整查询词 库,而客户端的查询词属性库可以在服务器端完整词表的基础上,提取实体关键词、属性关 键词生成。它们的数据源为同一个,都是用户查询日志,但是服务器端的查询词属性库更完整更完善一些。
其中,服务器端分析查询词并选择搜索引擎后,可能出现多种情况
1、客户端与服务器端选择的搜索引擎相同,若同一搜索引擎,服务器端的查询词 属性库中查询词与该搜索引擎的相关程度向量值与客户端的查询词属性库中查询词与该 搜索引擎相关程度向量值不同,则根据服务器端确定的向量值来改变该搜索引擎的权重, 根据改变后的权重对所有搜索引擎的搜索结果按照既定的方式进行排序。若两者相同,则 无需改变搜索引擎的权重,直接对搜索结果进行排序。
2、客户端与服务器端选择的搜索引擎不同,则根据下述方法调整
2. 1、客户端选择了 10个搜索引擎,服务器端选择了 5个搜索引擎,且服务器端选 择的5个搜索引擎属于客户端的10个搜索引擎中的。客户端会降低服务器端未选择的5个 搜索引擎的权重。同时,对于客户端和服务器端共同选择的那5个搜索引擎,若同一搜索引 擎,服务器端确定的与查询词的相关程度向量值与客户端确定的与查询词的相关程度向量 值不同,则根据服务器端确定的向量值来改变该搜索引擎的权重,对搜索结果进行排序。例 如,查询词为“短袖衬衫价格”,服务器计算返回www. taobao. com#0. 9,www. vancl. com#0. 8 其中taobao和vancl是对应这个查询词服务器计算与其相关的外部引擎,0. 9和0. 8标准 各自相关的权重信息;客户端会根据服务器所选引擎及其权重,调整各引擎结果的排序;
2. 2、客户端选择选择了 10个搜索引擎,服务器端选择了 5个搜索引擎,服务器端 选择的5个搜索引擎属于客户端选择的10个搜索引擎中的。同时,服务器端还返回了相关 的参数给客户端,返回的参数包括查询词分类、分词、纠错等相应参数信息。分类参数即是 指查询词与搜索引擎的相关程度向量值;分词参数是指将将一个长查询串分离为过更细粒 度的词的信息,例如,“短袖衬衫价格”,分词为“短袖”,“衬衫”,“价格”;纠错参数是指对用户 查询词中包含的输入错误做纠错的信息,例如“短袖衬衫架格”纠错后为“短袖衬衫价格”。 同样的,客户端会降低未被服务器端选取的那5个搜索引擎的权重,同时,根据服务器所选 的搜索引擎及其与查询词的相关程度向量值来改变客户端之前确定的该搜索引擎的权重。 另外,客户端还会根据服务器端返回的分词及纠错参数对所选的5个搜索引擎的搜索结果 进行评估。客户端用服务器端返回的分词与客户端选择的搜索引擎的搜索结果的文本进行 比对,计算查询词与该搜索结果之间的相关性,得出搜索结果的评估分值,若评估分值低于预设阀值,则对相应的搜索结果进行降权或删除。
2. 3、客户端选择了 10个,而服务器端未选择搜索引擎,只是返回查询词分类、分 词、纠错等相应参数信息,基于这些参数信息,客户端对所选的10个搜索引擎的搜索结果 进行评估,并根据评估结果对搜索结果进行排序。评估的方法与2. 2中相同。
通过2. 2及2. 3中采用服务器端返回的参数来对搜索结果重新排序的方法,可以 提高搜索结果的质量,特别是对于某些特殊的情况具有较好的效果。比如搜索结果匹配 效果不好、引擎故障、网络故障等,这些情况会导致所选引擎与用户实际查询意图不相关、 或搜索结果质量不好等,从而影响搜索的整体效果。为此,对最终选取的搜索引擎的查询结 果,利用返回的参数信息,通过搜索结果数,整体摘要与查询词的文本匹配程度等,对所选 搜索引擎与查询词的相关性、搜索结果质量计算评估分值,用阈值来再次判定是否给出此 搜索引擎的结果。最后将整体结果重排序后,展现给用户。
下面结合实例进一步对本发明的基于查询词进行搜索的方法进行详细说明。
首先通过一些挖掘方法,获取用户查询词在各目标搜索引擎或站点的分布比例
1)获取在各目标搜索引擎站点下,用户日常查询词。比如,用户在search, taobao. com、www. gougou. com 等所搜索的查询词。
2)在特定全文搜索引擎下,用户查询词与相应点击日志数据。比如,用户在胃W. sogou. com下查询“手机”时,点击过www. taobao. com站点下的网页链接次数。
由此生成每个查询词对应某个目标搜索引擎及相应站点域下的分布比例信息。 比如,查询词“手机”在搜索引擎A下查询NA次,在m sogou. com下查询此词时点击 到搜索引擎A下的页面为MA次。此词在搜索引擎B下查询NB次,在www. sogou. com下 查询此词时点击到搜索引擎B下的页面为MB次。用分布比例信息我们计算出每个查询 词与各目标搜索引擎相关程度向量,得到“手机”与搜索引擎A的相关程度向量公式为 wl*NA/ (NA+NB) +w2*MA/ (MA+MB),与搜索弓丨擎 B 的相关程度向量为 wl*NB/ (NA+NB) +w2*MB/ (MA+MB)。其中,wl、w2为不同分布信息来源的权重。另外,在计算相关程度向量时,可认为 站点域相同的为同一目标搜索引擎,如search, taobao. com、www. taobao. com的站点域为 taobao. com,则可以认为两者为同一目标搜索引擎。相关程度可以根据实际需要附上不同 的权重计算,本发明实施例对此不进行限定。
通过上述方法,为每个查询词生成对应于目标搜索引擎的属性库,例如下表1
权利要求
1.一种基于查询词进行搜索的方法,其特征在于,包括以下步骤搜索客户端获取用户输入的查询词,结合查询词属性库,从多个搜索引擎中选择适合 该查询词的搜索引擎;所述查询词属性库用于表征各查询词或各查询词类别与各搜索引擎 的相关程度;获取所选择的搜索引擎的搜索结果信息,处理后进行展示。
2.如权利要求1所述的方法,其特征在于,所述选择为由客户端基于本地查询词属性 库选择。
3.如权利要求2所述的方法,其特征在于,所述方法还包括发送查询词至搜索服务器端,由服务器端同时执行查询词分析操作; 服务器端选择搜索引擎并将选择的搜索引擎及其权重返回给客户端,客户端根据服务 器端选择的搜索引擎及其权重对客户端选择的搜索引擎的权重进行调整。
4.如权利要求1或3所述的方法,其特征在于,所述方法还包括 客户端接收服务器端返回的查询词分析的相关参数;则所述处理包括利用分析查询词得到的相关参数,通过对搜索结果数和/或搜索结果的摘要与查询词 的匹配程度,对搜索结果进行评估,得到评估分值;如果该评估分值低于预设阈值,则对相应搜索引擎的搜索结果进行降权或者删除。
5.如权利要求4所述的方法,其特征在于,所述相关参数包括查询词分词信息或纠错fn息等。
6.如权利要求4所述的方法,其特征在于,所述服务器端的查询词属性库通过如下方法建立步骤11,统计查询词或查询词类别与搜索引擎的相关信息;步骤12,根据步骤11中的统计信息计算出查询词或查询词类别与各搜索引擎相关程 度的向量;步骤13,根据步骤12中的相关程度向量生成查询词属性库。
7.如权利要求6所述的方法,其特征在于,所述客户端查询词属性库从服务器端更新 得到,其通过提取服务器端属性库中的关键信息而生成。
8.如权利要求6所述的方法,其特征在于,所述步骤11中相关信息的统计包括以下步骤获取各搜索引擎的查询词分布数据; 获取查询词在各搜索引擎的点击分布数据。
9.如权利要求6所述的方法,其特征在于,还包括收集用户在当前搜索客户端上,对所展示的搜索结果的点击情况,对查询词属性库进 行修正。
10.一种基于查询词的搜索装置,其特征在于,位于搜索客户端,包括第一选择模块,用于根据所获取的查询词,结合查询词属性库,从多个搜索引擎中选择 适合该查询词的搜索引擎;所述查询词属性库用于表征各查询词或各查询词类别与各搜索 引擎的相关程度;获取模块,用于获取搜索引擎的搜索结果信息;解析展示模块,用于对搜索结果处理后进行展示。
11.如权利要求10所述的装置,其特征在于,所述装置还包括发送模块,用于发送查询词至搜索服务器端;接收模块,用于接收服务器端执行查询词分析操作后,所选择的搜索引擎及其权重;调整模块,用于根据服务器端选择的搜索引擎及其权重对第一选择模块所选择的搜索 引擎的权重进行调整。
12.如权利要求10所述的装置,其特征在于,所述接收模块还用于接收服务器端返回的查询词分析的相关参数;所述相关参数包括 查询词分词信息或纠错信息等;则所述解析展示模块包括解析处理子模块,用于利用分析查询词得到的相关参数,通过对搜索结果数和/或搜 索结果的摘要与查询词的匹配程度,对搜索结果进行评估,得到评估分值;如果该评估分值 低于预设阈值,则对相应搜索引擎的搜索结果进行降权或者删除;展示子模块,用于展示解析处理子模块排序修正后的搜索结果。
13.如权利要求12所述的装置,其特征在于,所述第一选择模块所依据的查询词属性 库位于本地客户端,其通过提取服务器端属性库中的关键信息而生成。
14.如权利要求10所述的装置,其特征在于,所述装置还包括反馈模块,用于收集用户在当前搜索客户端上,对所展示的搜索结果的点击情况,以对 查询词属性库进行修正。
全文摘要
本发明提供了一种基于查询词进行搜索的方法和装置,所述方法包括以下步骤搜索客户端获取用户输入的查询词,结合查询词属性库,从多个搜索引擎中选择适合该查询词的搜索引擎;所述查询词属性库用于表征各查询词或各查询词类别与各搜索引擎的相关程度;获取所选择的搜索引擎的搜索结果信息,处理后进行展示。本发明在有多个搜索引擎的时候,通过对用户查询词的意图理解分析,选择与用户需求相关的搜索引擎(或者在用户意图方向上搜索准确性较高的搜索引擎),进行有针对性的链接搜索,不仅可以提高系统的效率,更增加了用户的搜索准确度。
文档编号G06F17/30GK102043833SQ201010559148
公开日2011年5月4日 申请日期2010年11月25日 优先权日2010年11月25日
发明者佟子健, 冯鑫, 吴明达 申请人:北京搜狗科技发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1