一种搜索结果生成方法及信息搜索系统的制作方法

文档序号:6577856阅读:168来源:国知局
专利名称:一种搜索结果生成方法及信息搜索系统的制作方法
技术领域
本申请涉及计算机应用领域,特别是涉及一种搜索结果生成方法及信息搜索系统。
背景技术
信息搜索系统是一种能够为用户提供信息检索服务的系统,以互联网中常用的搜 索引擎为例,作为应用在互联网领域的搜索系统,搜索引擎目前已经成为用户上网必不可 少的辅助工具之一。从用户的角度看,搜索引擎一般提供一个包含搜索框的页面,用户在搜 索框输入关键词或其他搜索条件,通过浏览器提交给搜索引擎后,搜索引擎就会返回与用 户输入的关键词内容相匹配的信息。针对同样的用户搜索请求(例如用户在搜索时所输入的搜索关键词),搜索引擎 往往能够检索到多条匹配信息,这个数量可能会达到数十至数万。而从用户的角度来讲,往 往只会重点关注在搜索结果中排序比较靠前的信息。这样,在搜索引擎向用户提供搜索结 果时,如何对这些信息进行排序就显得尤为重要,搜索结果的排序是否合理将直接影响着 用户的体验。搜索引擎在对信息进行排序时,会对多种因素进行综合考虑,参考的因素可以包 括信息来源、信息可信度、用户反馈等等,其中,用户反馈是影响搜索结果排序的一个重要 因素。例如,当搜索关键词为“中国中央电视台”时,80%的用户都点击了中国中央电视台 的官方主页,那么,如果仅从用户反馈的角度来讲,搜索引擎就有理由将中国中央电视台的 官方主页排在“中国中央电视台”这个关键词所对应搜索结果的第一位。为达到上述效果,现有技术中,搜索引擎是通过对搜索关键词所对应各条匹配信 息的用户反馈量进行统计,并根据用户反馈量由大到小的顺序,生成搜索结果提供给用户。 通过对现有技术的研究,发明人发现现有搜索结果生成方法存在的问题是对于新发布的 信息,反馈量的初始值为0(或很低),导致其排名靠后,由于排名靠后又很难被用户关注 至IJ,这样就一直无法提升排名。而从另一个角度讲,个别用户也可以通过一些作弊手段(例 如欺诈点击)来迅速改变反馈量,从而使自己发布的信息能够在搜索结果中排名靠前,对 他人的正常利益造成影响。可见,从用户的角度来看,现有技术生成的搜索结果排序存在着 不合理之处,对用户体验造成了影响。

发明内容
为解决上述技术问题,本申请提供了一种搜索结果生成方法及信息搜索系统,可 以将更为合理的匹配信息排序结果展现给用户,提升用户体验,技术方案如下本申请提供一种搜索结果生成方法,包括信息搜索系统接收搜索请求,通过检索获得与所述搜索请求相匹配的各条匹配信 息;对所述各条匹配信息的用户反馈量进行查询,进一步计算得到所述各条匹配信息所属类别的用户反馈总量;根据所述各条匹配信息所属类别的用户反馈总量的大小,对所述各条匹配信息进 行排序,生成搜索结果。本申请还提供一种信息搜索系统,包括信息检索单元,用于接收搜索请求,通过检索获得与所述搜索请求相匹配的各条 匹配信息;用户反馈量计算单元,用于对各条匹配信息的用户反馈量进行查询,进一步计算 得到每个类别的匹配信息的用户反馈总量;结果生成单元,用于根据所述各条匹配信息所属类别的用户反馈总量的大小,对 所述各条匹配信息进行排序,生成搜索结果。
与现有技术相比,本申请实施例所提供的技术方案,不是以单条信息的用户反馈 量大小作为排序依据,而是以每条信息所属类别的用户反馈总量的大小作为排序依据。这 样,即使是新发布信息的用户反馈量很小,如果其所属类别比较受用户关注,那么该条信息 同样有机会排在相对靠前的位置。从另一个角度来讲,单条信息的用户反馈量的增加,并不 能直接提高该条信息的排名,而是提高了该条信息所属类别的排名,因此可以有效地减小 欺诈点击等作弊手段对搜索结果排序的影响。


为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提 下,还可以根据这些附图获得其他的附图。图1为本申请实施例一种搜索结果生成方法的流程图;图2为本申请实施例一种信息搜索系统的结构示意图;图3为本申请实施例结果生成单元的结构示意图;图4为本申请实施例排序分值计算子单元的结构示意图;图5为本申请实施例结果生成单元的另一种结构示意图。
具体实施例方式首先对本申请实施例的一种搜索结果生成方法进行说明,包括信息搜索系统接收搜索请求,通过检索获得与所述搜索请求相匹配的各条匹配信 息;对所述各条匹配信息的用户反馈量进行查询,进一步计算得到所述各条匹配信息 所属类别的用户反馈总量;根据所述各条匹配信息所属类别的用户反馈总量的大小,对所述各条匹配信息进 行排序,生成搜索结果。为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实 施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施 例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护 的范围。 下面以网络搜索应用为例,对本申请所提供的技术方案进行详细说明,图1所示 为本申请实施例的一种搜索结果生成方法的流程图,包括以下步骤S101、搜索引擎接收搜索请求,通过检索获得与所述搜索请求相匹配的各条匹配 fn息;当用户需要在网络上搜索信息时,会输入一个或多个搜索条件,一般最为常用的 搜索条件是搜索关键词,根据具体搜索应用场景的不同,有些搜索引擎还可以支持更多类 型的搜索条件,例如信息发布时间、信息属性等等,本申请实施例中,将各种搜索条件统称 为搜索请求。搜索引擎接收到搜索请求之后,检索与搜索请求相匹配的信息。对应不同的 搜索应用场景,检索到的信息类型也有所不同,例如在网页搜索中,检索到的信息为网页; 在电子商务搜索中,检索到的信息为商品;在文献搜索中,检索到的信息为期刊或论文等 等。其中,根据搜索请求检索与之相匹配的信息,其实现方法与现有技术相同,本申请实施 例对此不再进行详细说明。S102、对各条匹配信息的用户反馈量进行查询,进一步计算得到各条匹配信息所 属类别的用户反馈总量;对应一个搜索请求,搜索引擎往往能够检索到多条与之相匹配的信息,搜索引擎 需要根据一定的原则,对这些信息进行筛选、排序,以方便用户的阅读。其中,用户反馈是影响搜索结果排序的一个重要因素,其基本原则是将用户最为 关注的信息排在搜索结果的最前面。在本申请实施例中,以用户反馈量作为反映用户对某 条信息关注程度的参数。例如,一个网页链接点击次数、链接被收藏次数等,能够直接反映 出用户对这个网页的关注程度,因此,对于网页来说,可以以链接点击次数、链接被收藏次 数等信息作为用户反馈量。而在电子商务中,某个商品的用户反馈量可以包括商品成交 量、商品成交金额、商品询价次数、商品信息被收藏次数等信息。本领域技术人员可以理解 的是,可以选择某一种信息来表示用户反馈量,也可以综合考虑多种信息来表示用户反馈 量,例如用户反馈量=商品成交量X0. 3+被收藏次数X2、用户反馈量=商品成交金额X商品信息被收藏次数+log(商品成交量),等等。用户反馈量一般是被记录在用户反馈日志中,搜索引擎通过读取用户反馈日志, 就可以获得各条匹配信息所对应的用户反馈量。可以理解的是,搜索引擎可以选择只对某 段时间(例如最近一周、最近一个月等)的用户反馈日志进行读取,以适应用户兴趣点的不 断变化。假设对应某个搜索请求,搜索引擎检索到4条与之相匹配的信息,读取用户反馈 日志,得到各条匹配信息所对应的用户反馈量如表1所示
"11用户反馈量
匹配信息ι~~Ioo 表 1由表1可以看出,4条匹配信息的用户反馈量大小关系为匹 配信息1 >匹配信息 3 >匹配信息2 >匹配信息4。如果根据现有技术的方案,也将以这个顺序生成搜索结果, 并最终展现给用户。而在本申请技术方案中,需要对各条匹配信息所对应的用户反馈量做 进一步处理。互联网中的信息,很多都是按照一定的类别进行发布的,例如,在门户网站中,网 页类型可以包括新闻、体育、娱乐、财经等等,在电子商务网站中,商品类别包括家居、电器、 服饰、食品等等。那么,对于搜索引擎检索到的每条匹配信息,都会对应一个自身所属的类 另IJ。本申请实施例中,获得各条匹配信息所对应的用户反馈量之后,首先查询各条匹配信息 所属的类别。对于网页而言,可以根据网址的路径获知网页所属的类别,例如,网址路径中 包含‘‘news”字段的网页为新闻类网页,网址路径中包含‘‘sports”字段的网页为体育类网 页,等等;而对于商品而言,直接查询其商品信息就可以获得该商品所属的类别。还要进一步计算每个类别的匹配信息的用户反馈总量。例如,在表1的例子中,匹 配信息1和匹配信息4是属于“类型A”,匹配信息2和匹配信息3是属于“类型B”,则“类 型A”的用户反馈总量为100+5 = 105、“类型B”的用户反馈总量为30+40 = 70,如表2所 示 表2S103、根据各条匹配信息所属类别的用户反馈总量的大小,对各条匹配信息进行 排序,生成搜索结果。由表2可以看出,“类型Α”比“类型B”更受用户的关注,因此,如果仅从用户反馈 总量的角度考虑,属于“类型Α”的信息应该排在属于“类型B”的信息的前面。对于匹配信息4而言,其用户反馈量很小,如果应用现有技术的方案,常规情况 下,匹配信息4将很难获得靠前的排名。而本申请的技术方案并不是以单条信息的用户反 馈量大小作为排序依据,匹配信息4的用户反馈量虽然很小,但是由于它属于比较受到关 注的类型,因此在本申请技术方案所生成的搜索结果中,匹配信息4将排在匹配信息2和匹 配信息3的前面(或者说匹配信息4将有更多的机会排在匹配信息2和匹配信息3的前面)。这样,即使是新发布的信息,也有了更多的机会能够在搜索结果中获得比较靠前的排名,更好地适应了用户的实际需求。以表1为基础,如果有人新发布了能够和搜索请求相匹配的信息5 (假设该信息5 属于类型C),并且通过欺诈点击等手段令其用户反馈量在短时间内达到50,如果应用现有 技术的方案,这条匹配信息5将直接排在搜索结果中的第二名,从而影响了其他信息发布 者的正常利益。但是,应用本申请的技术方案,由于其所属类型C的用户反馈总量低于类型 A和类型B,因此即使通过作弊手段,匹配信息5仍然无法获得靠前的排名。可以理解的,上 述的例子仅用于示意性说明,在实际应用中,信息的分类更多,所检索到的匹配信息数量也 更大,个别用户虽然可以对自己所发布的一条或几条信息采用作弊手段提高反馈量,但是 无法对信息所在类别的用户反馈总量造成太大影响,从而有效地减小了作弊对搜索结果排 序的影响。需要说明的是,以上实施例所介绍的,是仅从用户反馈量这一角度考虑,对匹配信 息进行排名,在实际的应用中,搜索引擎在生成搜索结果时,可以对多种因素进行综合考 虑。一般是将每个因素都作为一个加权参数,并且根据这些因素的重要程度,为每个加权参 数设定一个加权系数,通过对各个加权参数的加权平均处理,得到一个排序分值,搜索引擎 最终根据各条匹配信息排序分值的大小,确定各条匹配信息在搜索结果中的排列顺序。如果应用现有技术的方案,单条匹配信息的用户反馈量越大,则其所获得的加权 值就越大。而应用本申请的技术方案,单条匹配信息所属类别的用户反馈总量越大,则其所 获得的加权值就越大。根据表2所示的结果,匹配信息1和匹配信息4在用户反馈量这项 参数的加权值大于匹配信息2和匹配信息3的加权值。与现有技术相比,匹配信息1将有 更大的机会获得比较靠前的排名。具体而言,可以根据每个类别匹配信息的用户反馈总量的比值,计算得到属于每 个类别的匹配信息的加权值。以表2为例,类型A的用户反馈总量为105、类型B的用户反 馈总量为70,其比值为3 2。可以进一步对该比值进行归一化处理,例如,将每一个类别 的用户反馈总量除以所有类别的用户反馈总量之和,所得到的比值为0.6 0.4,那么0.6 和0. 4就分别是属于类别A和类别B的匹配信息在用户反馈量这一参数上所获得的加权 值。也可以将每一个类别的用户反馈总量除以最大的单类用户反馈总量,则所得的比值为 1 0.67,那么1和0.67就分别是属于类别A和类别B的匹配信息在用户反馈量这一参数 上所获得的加权值。搜索引擎也可以对每个类别匹配信息的用户反馈总量进行排序,根据排序结果, 得到属于每个类别的匹配信息的加权值。如表3所示 表3可见,最终的每个类别信息所获得的加权值,只和这个类别的用户反馈总量的排 列顺序有关,与具体的用户反馈总量值无关,也就是说,对于属于类型E的信息而言,只有 当类型E的用户反馈总量超过500时,才会获得更大的加权值以提升排名,从而能够进一步 减小作弊对搜索结果排序的影响。以上介绍了两种计算加权值的具体例子,根据“单条匹配信息所属类别的用户反 馈总量越大,则其所获得的加权值就越大”这一原则,本领域技术人员还可以结合具体需 求,采取其他技术手段来计算加权值,这些也在本申请的保护范围内。在实际应用中,对于多种因素的综合考虑,除了采用加权的形式之外,还可以采用 分级的形式。即在根据一个(或多个)因素对匹配信息进行第一次排序之后,再根据其他 一个或多个因素对第一次排序的结果做第二次排序。针对本申请所提出的技术方案,本领域技术人员容易想到的是在根据各条匹配 信息所属类别的用户反馈总量的大小对各条匹配信息进行排序之后,还可以进一步根据各 条匹配信息的用户反馈量大小,对各类别下的匹配信息进行排序。以表1中的数据为例,应用申请技术方案,可得到“属于类型A的信息应该排在属 于类型B的信息的前面”,即匹配信息1和4应排在匹配信息2和3之前。进一步地,根据 单条匹配信息的用户反馈量大小对每个类别下的匹配信息进行二次排序,可以得到匹配 信息1应排在匹配信息4之前、匹配信息3应排在匹配信息2之前,则最终的排序结果为匹配信息4、匹配信息1、匹配信息3、匹配信息2。可见,上述方案,一方面保证了受关注的类型能够排在前面,另一方面,在类型相 同的前提下,进一步根据单条用户反馈量的大小,分别对每个类别下的匹配信息进行排序。 当然,本领域技术人员可以理解的是,在根据各条匹配信息所属类别的用户反馈总量的大 小对各条匹配信息进行排序之后,也可以根据其他的因素(可是一个或多个)对各类别下 的各条匹配信息进行排序。并且,如果有必要,还可以根据其他因素进一步做第三次排序、 第四次排序......,本说明书不再一一列举。下面将结合几个具体的应用实例,对本申请的搜索结果生成方法进行说明。例如在网页搜索应用中,以“赤壁”这一关键词进行搜索,搜索引擎会检索到很多 条与“赤壁”匹配的网页,这些网页分别属于不同类别。通过读取某段时间的用户反馈日志, 并根据网页类别计算每个类别的用户反馈总量,得到结果如表4所示 表4“赤壁”对应的是一场著名的古代战役,自然有很多匹配的网页都是属于“军事”、 “历史”类别的;同时“赤壁”也经常出现于影视或游戏情节中,所以也有很多匹配的网页是 属于“娱乐”、“游戏”类别。此外“赤壁”还是一个旅游景点,因此,也有一些匹配网页是属 于“旅游”类别。由于用户反馈量是通过读取某段时间的用户反馈日志获得,因此可以反映出这段 时间的用户关注焦点。例如,《赤壁》作为一部电影,受到大量人的关注,因此,在影片上映前 后的一段时间内,属于“娱乐”这一类别的匹配网页将会多于其他类别,并且有着很高的用 户点击量,如表4所示。应用本申请技术方案,如果用户使用“赤壁”这一关键词进行搜索, 那么属于“娱乐”这一类别的匹配网页,无论其单个网页的用户点击量多少,都将会获得更 高的加权值,从而在搜索结果中排在比较靠前的位置,便于用户进行点击浏览。本申请所提供的技术方案,还适用于电子商务的搜索应用。例如,用户以关键词 “笔记本”进行商品搜索,搜索引擎可能检索到的商品会涉及笔记本电脑,笔记本电池、笔记 本散热器,甚至传统意义上写字用的笔记本。按照电子商务网站对商品类别的划分,笔记本 电脑可能属于“笔记本整机”类别,而笔记本电池、笔记本散热器属于“笔记本配件”类别, 至于传统意义上写字用的笔记本,则可能属于“文化用品,,或“办公用品,,类别。通过对用 户反馈量的统计,可以发现在现阶段,大部分以“笔记本”为关键词进行搜索的用户,其真正 关注的商品都是笔记本电脑,那么,应用本申请技术方案,属于“笔记本整机”这一类型的商 品,都将获得较高的加权值,从而在搜索结果中排在比较靠前的位置,便于用户进行点击浏 览,并且,对于新发布的笔记本电脑商品信息,同样有机会排在比较靠前的位置。而对于属 于“文化用品”或“办公用品”类别的传统笔记本,即使通过作弊手段(例如发布者自己提 高询价次数、自己对商品信息多次进行收藏),也无法针对“笔记本”这一关键词提升排名。 因为传统的笔记本根本不是大多数搜索“笔记本”的用户所真正关注的(真正关注传统笔 记本的用户会进一步在“文化用品,,或“办公用品,,的范围进行搜索,与本申请技术方案无 关,在此不做详细说明),可见,应用本申请技术方案所生成的搜索结果,其排序更加符合多 数用户的需求,有效提高了用户体验。以上两个例子,仅用于示意性说明,实际的互联网信息,可能具有更为完善的分类 层次,例如,在上面的例子中,“笔记本电池”和“笔记本散热器”指的都是“笔记本配件”分 类下的单条的商品信息。而在实际应用中,“笔记本电池”和“笔记本散热器”也可能是“笔 记本配件”分类下的两个子类。那么,应用本申请所提供的技术方案,这两个子类也分别具 有所对应的用户反馈总量,如果用户是在“笔记本配件”这个范围内进行搜索,那么这两个子类的商品也将分别获得不同的加权值。可以理解的是,如果用户是在一个最小的分类范 围内进行搜索,那么所获得的搜索结果,就是以该类别下的单条商品信息的用户反馈量大 小作为排序依据的。
以上介绍了本申请技术方案在网页搜索和电子商务搜索两个方面的应用,可以理 解的是,这只是本申请技术方案较佳的两种实施方式,事实上,本申请技术方案可以应用于 各类搜索需求,例如图书数据库搜索、文献数据库搜索等。并且应用范围也仅不局限于互联 网领域,其他如单机、局域网中的搜索,都可以应用本申请所提供的技术方案。相应于上面的方法实施例,本申请还提供一种信息搜索系统,参见图2所示,包 括信息检索单元210,用于接收搜索请求,通过检索获得与所述搜索请求相匹配的各 条匹配信息;用户反馈量计算单元220,用于对各条匹配信息的用户反馈量进行查询,进一步计 算得到每个类别的匹配信息的用户反馈总量;其中,所述用户反馈总量为属于该类别的匹配信息的用户反馈量之和;结果生成单元230,用于根据各条匹配信息所属类别的用户反馈总量的大小,对各 条匹配信息进行排序,生成搜索结果。其中所述用户反馈量计算单元220,可以通过读取特定时间段的用户反馈日志,对 各条匹配信息的用户反馈量进行查询。参见图3所示,所述结果生成单元230,可以包括排序分值计算子单元231,用于以各条匹配信息所属类别的用户反馈总量的大小 作为加权参数,计算所述各条匹配信息的排序分值;其中,如果第一匹配信息所属类别的用户反馈总量大于第二匹配信息所属类别的 用户反馈总量,则所述第一匹配信息的加权值大于所述第二匹配信息的加权值;结果生成子单元232,用于根据各条匹配信息排序分值的大小,生成搜索结果。参见图4所示,所述排序分值计算子单元231,可以包括第一加权值计算模块2311,用于根据各条匹配信息所属类别的用户反馈总量的大 小,得到属于每个类别的匹配信息的加权值;本领域技术人员可以理解,排序分值计算子单元231中,还可以进一步包括第二
加权值计算模块2312、第三加权值计算模块2313......,用于对其他加权参数所对应的加
权值进行计算。加权平均模块2310,用于对包括所述第一加权值计算模块的计算结果在内的加权 值进行加权平均处理,得到各条匹配信息的排序分值。其中,所述第一加权值计算模块2311,具体可以用于计算每个类别匹配信息的用 户反馈总量的比值,根据所述比值,得到属于每个类别的匹配信息的加权值。也可以对每个 类别匹配信息的用户反馈总量进行排序,根据排序结果,得到属于每个类别的匹配信息的 加权值。参见图5所示,所述结果生成单元230,也可以包括以下的组成部分第一排序子单元233,用于根据所述各条匹配信息所属类别的用户反馈总量的大 小,对所述各条匹配信息进行排序;
第二排序子单元234,用于根据所述各条匹配信息的用户反馈量大小,对各类别下 的匹配信息进行排序。以上所提供的信息搜索系统,可以是应用于互联网搜索的搜索引擎,也可以是应 用于单机、局域网络的搜索的信息搜索系统。当然,用户反馈量并不一定是对搜索结果排序的唯一因素。其他因素,例如用户输 入的关键词与网页所展示信息的匹配程度,网页的Page Rank值等,都可以与用户反馈量一 起作为对搜索结果排序的因素。为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本 申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。 通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可 借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质 上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品 可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备 (可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些 部分所述的方法。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部 分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实 施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例 的部分说明即可。以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明 的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是 物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要 选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出 创造性劳动的情况下,即可以理解并实施。本申请可用于众多通用或专用的计算系统环境或配置中。例如个人计算机、服务 器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶 盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的 分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序 模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组 件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由 通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以 位于包括存储设备在内的本地和远程计算机存储介质中。以上所述仅是本申请的具体实施方式
,应当指出,对于本技术领域的普通技术人 员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应 视为本申请的保护范围。
权利要求
一种搜索结果生成方法,其特征在于,包括信息搜索系统接收搜索请求,通过检索获得与所述搜索请求相匹配的各条匹配信息;对所述各条匹配信息的用户反馈量进行查询,进一步计算得到所述各条匹配信息所属类别的用户反馈总量;根据所述各条匹配信息所属类别的用户反馈总量的大小,对所述各条匹配信息进行排序,生成搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述用户反馈总量为属于该类别的匹配 信息的用户反馈量之和。
3.根据权利要求2所述的方法,其特征在于,所述对所述各条匹配信息的用户反馈量 进行查询,具体实现为通过读取特定时间段的用户反馈日志,对所述各条匹配信息的用户反馈量进行查询。
4.根据权利要求3所述的方法,其特征在于,所述根据所述各条匹配信息所属类别的 用户反馈总量的大小,对所述各条匹配信息进行排序,包括以所述各条匹配信息所属类别的用户反馈总量的大小作为加权参数,计算所述各条匹 配信息的排序分值;其中,如果第一匹配信息所属类别的用户反馈总量大于第二匹配信息所属类别的用户 反馈总量,则所述第一匹配信息的加权值大于所述第二匹配信息的加权值;所述各条匹配 信息排序分值的大小,用于确定所述各条匹配信息在所述搜索结果中的排列顺序。
5.根据权利要求4所述的方法,其特征在于,所述以所述各条匹配信息所属类别的用 户反馈总量的大小作为加权参数,具体实现为计算每个类别匹配信息的用户反馈总量的比值,根据所述比值,得到属于每个类别的 匹配信息的加权值。
6.根据权利要求4所述的方法,其特征在于,所述以所述各条匹配信息所属类别的用 户反馈总量的大小作为加权参数,具体实现为对每个类别匹配信息的用户反馈总量进行排序,根据排序结果,得到属于每个类别的 匹配信息的加权值。
7.根据权利要求3所述的方法,其特征在于,所述根据所述各条匹配信息所属类别的 用户反馈总量的大小,对所述各条匹配信息进行排序之后,还包括根据所述各条匹配信息的用户反馈量大小,对各类别下的匹配信息进行排序。
8.根据权利要求1所述的方法,其特征在于,所述搜索请求,包括网页搜索请求,和/或电子商务搜索请求。
9.根据权利要求8所述的方法,其特征在于,当所述搜索请求为网页搜索请求时,所述 用户反馈量包括网页链接点击次数,和/或网页链接被收藏次数。
10.根据权利要求8所述的方法,其特征在于,当所述搜索请求为电子商务搜索请求 时,所述用户反馈量包括商品成交量、商品成交金额、商品询价次数和/或商品信息被收藏次数。
11.一种信息搜索系统,其特征在于,包括信息检索单元,用于接收搜索请求,通过检索获得与所述搜索请求相匹配的各条匹配fn息;用户反馈量计算单元,用于对各条匹配信息的用户反馈量进行查询,进一步计算得到 每个类别的匹配信息的用户反馈总量;结果生成单元,用于根据所述各条匹配信息所属类别的用户反馈总量的大小,对所述 各条匹配信息进行排序,生成搜索结果。
12.根据权利要求11所述的系统,其特征在于,所述用户反馈总量为属于该类别的匹 配信息的用户反馈量之和。
13.根据权利要求12所述的信息搜索系统,其特征在于,所述用户反馈量计算单元,通 过读取特定时间段的用户反馈日志,对所述各条匹配信息的用户反馈量进行查询。
14.根据权利要求13所述的信息搜索系统,其特征在于,所述结果生成单元,包括排序分值计算子单元,用于以所述各条匹配信息所属类别的用户反馈总量的大小作为 加权参数,计算所述各条匹配信息的排序分值;其中,如果第一匹配信息所属类别的用户反馈总量大于第二匹配信息所属类别的用户 反馈总量,则所述第一匹配信息的加权值大于所述第二匹配信息的加权值;结果生成子单元,用于根据所述各条匹配信息排序分值的大小,生成搜索结果。
15.根据权利要求14所述的信息搜索系统,其特征在于,所述排序分值计算子单元,包括第一加权值计算模块,用于根据所述各条匹配信息所属类别的用户反馈总量的大小, 得到属于每个类别的匹配信息的加权值;加权平均模块,用于对包括所述第一加权值计算模块的计算结果在内的加权值进行加 权平均处理,得到所述各条匹配信息的排序分值。
16.根据权利要求15所述的信息搜索系统,其特征在于,所述第一加权值计算模块,用于计算每个类别匹配信息的用户反馈总量的比值,根据 所述比值,得到属于每个类别的匹配信息的加权值。
17.根据权利要求15所述的信息搜索系统,其特征在于,所述第一加权值计算模块,用于对每个类别匹配信息的用户反馈总量进行排序,根据 排序结果,得到属于每个类别的匹配信息的加权值。
18.根据权利要求13所述的信息搜索系统,其特征在于,所述结果生成单元,包括第一排序子单元,用于根据所述各条匹配信息所属类别的用户反馈总量的大小,对所 述各条匹配信息进行排序;第二排序子单元,用于根据所述各条匹配信息的用户反馈量大小,对各类别下的匹配 信息进行排序。
全文摘要
本申请公开了一种搜索结果生成方法及信息搜索系统。一种搜索结果生成方法,包括信息搜索系统接收搜索请求,通过检索获得与所述搜索请求相匹配的各条匹配信息;对所述各条匹配信息的用户反馈量进行查询,进一步计算得到所述各条匹配信息所属类别的用户反馈总量;根据所述各条匹配信息所属类别的用户反馈总量的大小,对所述各条匹配信息进行排序,生成搜索结果。应用以上技术方案,在用户进行搜索时,可以将更为合理的匹配信息排序结果展现给用户,提升用户体验。
文档编号G06F17/30GK101887437SQ20091013527
公开日2010年11月17日 申请日期2009年5月12日 优先权日2009年5月12日
发明者侯磊, 张勤, 谢宇恒, 邢飞, 郭宁 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1