搜索结果排序方法及设备、搜索方法及设备的制作方法

文档序号:6345103阅读:130来源:国知局
专利名称:搜索结果排序方法及设备、搜索方法及设备的制作方法
技术领域
本申请涉及数据搜索技术领域,尤其涉及一种搜索结果排序方法及设备、搜索方法及设备。
背景技术
在互联网搜索技术领域中,基于搜索关键词的搜索是指由搜索引擎服务器根据用户输入的搜索关键词(也称查询关键词,即query),从基于海量数据而建立的索引中搜索与搜索关键词相匹配的索引,并将该索引所对应的搜索结果(即搜索到的数据)呈现给用户。在呈现搜索结果时,可以按照搜索结果与搜索关键词的相关性先对搜索结果进行排序后再呈现。一般地,在呈现搜索结果的网页页面上对搜索结果进行排序的原则是:搜索结果与搜索关键词之间由大至小的相关性对应于由上至下(或由前至后)的搜索结果排列顺序。由于衡量搜索结果与搜索关键词之间相关性大小的相关性值反映了搜索结果与用户搜索意图之间的相关程度,因此,采用上述排序原则的好处在于,能够将体现用户搜索意图的搜索结果呈现在页面比较靠上(或靠前)的位置,使得这些搜索结果更容易受到用户关注,从而可以提高用户的搜索体验。为了实现按照搜索结果与搜索关键词的相关性对搜索结果进行排序,现有技术提供了一些排序模型,其中比较成熟的模型之一是“基于每千次展现搜索结果可以获得的广告收入(ECPM,Effective Cost Per Mille)的排序模型”,简称ECPM模型。ECPM模型的基本思想在于,分别计算各个搜索结果的排序分数值,并根据计算得到的排序分数值确定搜索结果的排列顺序。具体地,该模型中所采用的计算排序分数值的公式如下式[I]所示:
权利要求
1.一种搜索结果排序方法,其特征在于,包括: 确定与搜索关键词相关的关键词单元;并 针对根据所述搜索关键词搜索得到的每个搜索结果,执行从预先存储的关键词单元、搜索结果和用于衡量搜索结果与关键词单元相关性大小的第一相关性值的对应关系中,分别确定与根据所述搜索关键词搜索得到的搜索结果、确定的关键词单元同时对应的所有第一相关性值,并分别确定用于衡量所述搜索关键词与所述确定的各个关键词单元相关性大小的第二相关性值;以及 根据第一相关性值和第二相关性值,分别确定根据所述搜索关键词搜索得到的每个搜索结果的排序分数值;以及 根据所述每个搜索结果的排序分数值,确定用于指示根据所述搜索关键词搜索得到的搜索结果的排列顺序的排序信息。
2.按权利要求1所述的方法,其特征在于,根据第一相关性值和第二相关性值,分别确定根据所述搜索关键词搜索得到的每个搜索结果的排序分数值,具体包括: 针对根据所述搜索关键词搜索得到的每个搜索结果,分别执行下述步骤: 针对确定的每个关键词单元,确定在以该关键词单元作为搜索关键词时每次展现该搜索结果所能获得的最高广告收入数据值;并 针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值以及相应的所述最高广告收入数据值,确定该搜索结果的排序分数值;以及 从确定的分别针对不同关键词单 元的排序分数值中,选取最大的排序分数值作为该搜索结果的排序分数值。
3.按权利要求2所述的方法,其特征在于,针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值以及相应的所述最高广告收入数据值,确定该搜索结果的排序分数值,具体包括: 针对确定的每个关键词单元,确定衡量该搜索结果所属信息类别与该关键词单元所属信息类别相关性大小的类目属性得分数据值;以及 针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值、相应的所述最高广告收入数据值以及所述类目属性得分数据值,确定该搜索结果的排序分数值。
4.按权利要求2所述的方法,其特征在于,针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值以及相应的所述最高广告收入数据值,确定该搜索结果的排序分数值,具体包括: 针对确定的每个关键词单元,确定该搜索结果在以该关键词单元作为搜索关键词时的被点击率;并 针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值、相应的所述最高广告收入数据值以及所述被点击率,确定该搜索结果的排序分数值。
5.按权利要求4所述的方法,其特征在于,针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值、相应的所述最高广告收入数据值以及所述被点击率,确定该搜索结果的排序分数值,具体包括: 针对确定的每个关键词单元,确定衡量该搜索结果所属信息类别与该关键词单元所属信息类别相关性大小的类目属性得分数据值;以及 针对确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值、相应的所述最高广告收入数据值、相应的所述被点击率以及类目属性得分数据值,确定该搜索结果的排序分数值。
6.一种搜索方法,其特征在于,包括: 接收携带有搜索关键词的搜索请求;以及 根据所述搜索关键词搜索相应的搜索结果,并确定用于指示搜索得到的搜索结果的排序顺序的排序信息; 将搜索得到的搜索结果和所述排序信息发送给所述搜索请求对应的发送方设备,指示发送方设备根据所述排序信息对搜索得到的搜索结果进行排序; 其中,确定所述排序信息具体包括:权利要求1 5任一所述的搜索结果排序方法。
7.一种搜索结果排序设备,其特征在于,包括: 关键词单元确定单元,用于确定与搜索关键词相关的关键词单元; 第一相关性值确定单元,用于针对根据所述搜索关键词搜索得到的每个搜索结果,执行从预先存储的关键词单元、搜索结果和用于衡量搜索结果与关键词单元相关性大小的第一相关性值的对应关系中,分别确定与根据所述搜索关键词搜索得到的搜索结果、关键词单元确定单元确定的关键词单元同时对应的所有第一相关性值; 第二相关性值确定单元,用于分别确定用于衡量所述搜索关键词与关键词单元确定单元确定的各个关键词单元相关性大小的第二相关性值; 排序分数值确定单元,用于根据第一相关性值确定单元确定的第一相关性值和第二相关性值确定单元确定的第二相关性值,分别确定根据所述搜索关键词搜索得到的每个搜索结果的排序分数值; 排序单元,用于根据排序分数值确定单元确定的每个搜索结果的排序分数值,确定用于指示根据所述搜索关键词搜索得到的搜索结果的排列顺序的排序信息。
8.按权利要求7所述的设备,其特征在于,所述排序分数值确定单元具体包括: 最高广告收入数据值确定子单元,用于针对根据所述搜索关键词搜索得到的每个搜索结果和确定的每个关键词单元,确定在以该关键词单元作为搜索关键词时每次展现该搜索结果所能获得的最高广告收入数据值; 排序分数值确定子单元,用于针对根据所述搜索关键词搜索得到的每个搜索结果和确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值以及最高广告收入数据值确定子单元确定的相应的最高广告收入数据值,确定该搜索结果的排序分数值;排序分数值选取子单元,用于从排序分数值确定子单元确定的分别针对不同关键词单元的排序分数值中,选取最大的排序分数值作为该搜索结果的排序分数值。
9.权利要求8所述的设备,其特征在于,所述排序分数值确定子单元具体包括: 类目属性得分数据值确定模块,用于针对根据所述搜索关键词搜索得到的每个搜索结果和确定的每个关键词单元,确定衡量该搜索结果所属信息类别与该关键词单元所属信息类别相关性大小的类目属性得分数据值; 排序分数值确定模块,用于针对根据所述搜索关键词搜索得到的每个搜索结果和确定的每个关键词单元,根据用于衡量该搜索结果与该关键词单元相关性大小的第一相关性值、用于衡量所述搜索关键词与该关键词单元相关性大小的第二相关性值、相应的最高广告收入数据值、类目属性得分数据值确定模块确定的相应的类目属性得分数据值,确定该搜索结果的排序分数值。
10.种搜索设备,其特征在于,包括: 搜索请求接收单元,用于接收携带有搜索关键词的搜索请求; 搜索单元,用于根据搜索请求接收单元接收的搜索请求中携带的搜索关键词,搜索相应的搜索结果; 排序信息确定单元,用于确定用于指示搜索单元搜索得到的搜索结果的排序顺序的排序信息; 发送单元,用于将搜索单元搜索得到的搜索结果和排序信息确定单元确定的排序信息发送给所述搜索请求对应的发送方设备,指示发送方设备根据所述排序信息对搜索得到的搜索结果进行排序; 其中,所述排序信息确定单元具体包括:权利要求7 9任一所述的搜索结果排序设备。
全文摘要
本申请公开了一种搜索结果排序方法及设备、搜索方法及设备,以解决对根据长尾搜索关键词搜索得到的搜索结果进行排序时可能导致排序不准确的问题。方法包括确定与搜索关键词相关的关键词单元;针对根据搜索关键词搜索到的每个搜索结果,执行从预先存储的对应关系中,分别确定与根据搜索关键词搜索得到的搜索结果、确定的关键词单元同时对应的所有第一相关性值,并分别确定用于衡量搜索关键词与确定的各个关键词单元相关性大小的第二相关性值;根据第一相关性值和第二相关性值,确定搜索结果的排序分数值;根据每个搜索结果的排序分数值,确定用于指示根据所述搜索关键词搜索得到的搜索结果的排列顺序的排序信息。
文档编号G06F17/30GK103092856SQ201110338609
公开日2013年5月8日 申请日期2011年10月31日 优先权日2011年10月31日
发明者周恒民 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1