处理查询请求的方法及装置的制造方法

文档序号:8319215阅读:235来源:国知局
处理查询请求的方法及装置的制造方法
【技术领域】
[0001] 本发明涉及网络查询技术,尤其涉及一种处理查询请求的方法及装置。
【背景技术】
[0002] 目前,各搜索引擎对关键词查询请求的处理,多数考虑了用户历史点击数据。
[0003] 通常,对关键词查询请求的处理基于精确匹配查询,即搜索引擎根据关键词查询 请求进行搜索,得到搜索结果集合后,搜索引擎还会通过对用户历史点击数据的分析,提取 出相关的历史搜索结果集合,得到与关键词完全匹配的精确匹配分值,并按照精确匹配分 值调整搜索结果在搜索结果集合中的位置,以提高排序效果。
[0004] 但是,上述对关键词查询请求的处理方法基于精确匹配查询,当关键词偏冷门时, 历史积累的点击数据偏少,使得排序结果由于缺少点击数据或存在较大的噪音,对排序效 果的提升并不理想。

【发明内容】

[0005] 本发明的目的在于提出一种处理查询请求的方法及装置,以提升搜索结果的排序 效果。
[0006] 为达此目的,本发明采用以下技术方案:
[0007] -种处理查询请求的方法,包括:
[0008] 接收到携带有关键词的查询请求后,根据所述关键词,获得与所述关键词相匹配 的第一搜索结果集合;
[0009] 确定所述第一搜索结果集合中,每个搜索结果相对于所述关键词的精确匹配分值 和泛化匹配分值,所述精确匹配分值为搜索结果与所述关键词完全匹配的分值,所述泛化 匹配分值为搜索结果与所述关键词非完全匹配的分值;
[0010] 根据所述精确匹配分值和泛化匹配分值,得到所述第一搜索结果集合中每个搜索 结果相对于所述关键词的最终匹配分值;
[0011] 按照所述最终匹配分值从大到小的顺序,对所述第一搜索结果集合中的搜索结果 进行排序,得到并返回第二搜索结果集合。
[0012] 一种处理查询请求的装置,包括:
[0013] 请求接收单元,用于接收携带有关键词的查询请求;
[0014] 搜索单元,用于根据所述请求接收单元接收的查询请求中的关键词,获得与所述 关键词相匹配的第一搜索结果集合;
[0015] 第一分值确定单元,用于确定所述第一搜索结果集合中,每个搜索结果相对于所 述关键词的精确匹配分值和泛化匹配分值,所述精确匹配分值为搜索结果与所述关键词完 全匹配的分值,所述泛化匹配分值为搜索结果与所述关键词非完全匹配的分值;
[0016] 第二分值确定单元,用于根据所述精确匹配分值和泛化匹配分值,得到所述第一 搜索结果集合中每个搜索结果相对于所述关键词的最终匹配分值;
[0017] 排序单元,用于按照所述最终匹配分值从大到小的顺序,对所述第一搜索结果集 合中的搜索结果进行排序,得到第二搜索结果集合;
[0018] 结果发送单元,用于返回所述第二搜索结果集合。
[0019] 上述技术方案提供的处理查询请求的方法及装置,通过确定所述第一搜索结果集 合中,每个搜索结果相对于所述关键词的精确匹配分值和泛化匹配分值,并根据所述精确 匹配分值和泛化匹配分值,得到所述第一搜索结果集合中每个搜索结果相对于所述关键 词的最终匹配分值,按照最终匹配分值从大到小的顺序对搜索结果进行排序,增加了历史 数据对搜索结果集合中搜索结果的排序的影响,从而使得搜索引擎返回的搜索结果集合的 排序更加合理,提升了搜索结果的排序效果。
【附图说明】
[0020] 图1是本发明实施例提供的一种处理查询请求的方法的流程图;
[0021] 图2是本发明实施例提供的一种处理查询请求的装置的结构示意图。
【具体实施方式】
[0022] 下面结合附图并通过【具体实施方式】来进一步说明本发明的技术方案。
[0023] 图1是本发明实施例提供的一种处理查询请求的方法的流程图。本实施例所示的 方法可由搜索引擎实现。如图1所示,处理查询请求的方法包括:步骤11至步骤14。
[0024] 在步骤11中,接收到携带有关键词的查询请求后,根据所述关键词,获得与所述 关键词相匹配的第一搜索结果集合。
[0025] 例如,搜索引擎接收到携带有关键词"搜索技术"的查询请求后,在线通过爬虫技 术从海量网页中查找标题或正文中包含有关键词"搜索技术"的网页,并将这些标题或正文 中包含有关键词"搜索技术"的网页的url作为搜索结果,得到搜索结果集合。
[0026] 其中,第一搜索结果集合与步骤14中的第二搜索结果集合,并无实际意义上第一 和第二的限定,只是为了表示步骤11中的搜索结果集合与步骤14中的搜索结果集合不同。
[0027] 在步骤12中,确定所述第一搜索结果集合中,每个搜索结果相对于所述关键词 的精确匹配分值和泛化匹配分值,所述精确匹配分值为搜索结果与所述关键词完全匹配的 分值,所述泛化匹配分值为搜索结果与所述关键词非完全匹配的分值。
[0028] 例如,确定所述第一搜索结果集合中每个搜索结果相对于所述关键词的精确匹配 分值和泛化匹配分值,可包括:
[0029] 对于所述第一搜索结果集合中的每个搜索结果,获取相关的历史查询关键词集 合,以及所述历史查询关键词集合中每个历史查询关键词的相关度分值,所述相关度分值 为搜索结果满足用户查询需求的概率值;其中,相关度为通过分析同一关键词的用户历史 查询和点击行为,衡量与关键词相关的搜索结果集合中每个搜素结果的相关程度。
[0030] 根据所述历史查询关键词集合中每个历史查询关键词的相关度分值,得到所述第 一搜索结果集合中与所述历史查询关键词集合相关的搜索结果的精确匹配分值和泛化匹 配分值。
[0031] 其中,精确匹配分值的作用是通过判断当前查询的关键词是否出现在离线相关的 关键词集合即历史查询关键词集合中,如果出现,则使用对应的相关度作用于搜索结果的 排序。泛化匹配分值的作用是通过判断当前查询的关键词是否都在离线相关的关键词集合 即历史查询关键词集合中出现,或者当前查询的关键词与离线关键词即历史查询关键词比 较相近,并使用对应的相关度作用于搜索结果的排序。
[0032] 示例性的,其中,获取相关的历史查询关键词集合,可包括:
[0033] 从第一历史搜索数据中获取相关的历史查询关键词集合,所述第一历史搜索数据 由第二历史搜索数据反转得到;
[0034] 所述第二历史搜索数据包括所述历史查询关键词及与所述历史查询关键词相关 的历史搜索结果集合,所述历史搜索结果集合中的历史搜索结果按照相关度分值从大到小 的顺序排序,所述历史搜索结果的相关度分值通过以下公式得到:
[0035]
【主权项】
1. 一种处理查询请求的方法,其特征在于,包括: 接收到携带有关键词的查询请求后,根据所述关键词,获得与所述关键词相匹配的第 一搜索结果集合; 确定所述第一搜索结果集合中,每个搜索结果相对于所述关键词的精确匹配分值和泛 化匹配分值,所述精确匹配分值为搜索结果与所述关键词完全匹配的分值,所述泛化匹配 分值为搜索结果与所述关键词非完全匹配的分值; 根据所述精确匹配分值和泛化匹配分值,得到所述第一搜索结果集合中每个搜索结果 相对于所述关键词的最终匹配分值; 按照所述最终匹配分值从大到小的顺序,对所述第一搜索结果集合中的搜索结果进行 排序,得到并返回第二搜索结果集合。
2. 根据权利要求1所述的方法,其特征在于,确定所述第一搜索结果集合中每个搜索 结果相对于所述关键词的精确匹配分值和泛化匹配分值,包括: 对于所述第一搜索结果集合中的每个搜索结果,获取相关的历史查询关键词集合,以 及所述历史查询关键词集合中每个历史查询关键词的相关度分值,所述相关度分值为搜索 结果满足用户查询需求的概率值; 根据所述历史查询关键词集合中每个历史查询关键词的相关度分值,得到所述第一搜 索结果集合中与所述历史查询关键词集合相关的搜索结果的精确匹配分值和泛化匹配分 值。
3. 根据权利要求2所述的方法,其特征在于,获取相关的历史查询关键词集合,包括: 从第一历史搜索数据中获取相关的历史查询关键词集合,所述第一历史搜索数据由第 二历史搜索数据反转得到; 所述第二历史搜索数据包括所述历史查询关键词及与所述历史查询关键词相关的历 史搜索结果集合,所述历史搜索结果集合中的历史搜索结果按照相关度分值从大到小的顺 序排序,所述历史搜索结果的相关度分值通过以下公式得到:
其中,所述score为所述历史搜索结果的相关度分值,
DocViews为所述历史搜索结果被浏览的总数,Ptl-Pltl为权重参数,DocFirstClicks为 所述历史搜索结果被第一次点击的总数,DocCliks为所述历史搜索结果被点击的总数, DocLastClicks为所述历史搜索结果被最后一次点击的总数,DocOnlyClicks为所述历史 搜索结果仅被点击一次的总数,QueryTimes为所述历史查询关键词被查询的次数。
4. 根据权利要求2或3所述的方法,其特征在于,根据所述历史查询关键词集合中每个 历史查询关键词的相关度分值,得到所述第一搜索结果集合中与所述历史查询关键词集合 相关的搜索结果的精确匹配分值,包括: 当所述历史查询关键词集合中存在与所述查询请求中携带的关键词相同的历史查询 关键词时,则将与所述查询请求中携带的关键词相同的历史查询关键词的相关度分值,作 为所述第一搜索
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1