一种垂直搜索的查询方法、系统和装置的制作方法

文档序号:6583050阅读:167来源:国知局
专利名称:一种垂直搜索的查询方法、系统和装置的制作方法
技术领域
本申请涉及网络技术领域,特别是涉及一种垂直搜索的查询方法、系统和装置。
背景技术
随着互联网的日益发展,互联网上存储的信息量日趋庞大。当人们需要获取某方 面的专用信息时,通过搜索引擎进行搜索。但由于互联网上的信息量过大,采用通用搜索方 式获取的搜索结果缺乏准确性,于是垂直搜索方式得到了快速的发展。垂直搜索是针对某 一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进 行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通 用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针 对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其 特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索 弓I擎则显得更加专注、具体和深入。垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、 房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索等,几乎各行各业各类信息都可以进一 步细化成各类的垂直搜索引擎。当垂直搜索用于购物搜索时,用户在B2C (Business to Customer,企业对消费者 购物模式)或C2C(C0nsumer to Customer,消费者对消费者购物模式)购物网站输入查询 词购物,通常会返回两部分的结果1.商品分类的导航信息,2.与查询相关的搜索结果。导 航的商品分类名称依据树的结构组织起来,方便用户沿树结构的路径自上而下通过商品分 类的信息的定位到更准确的搜索结果。商品类目树结构保存在数据库相对应的数据表,数据的输入与维护需要人工进 行,在B2C或C2C网站中每一个商品的展示都必须属于该商品类目树的某一个节点或多个 节点。当前的电子商务网站往往商品数量过于庞大,导致商品分类过多。在上亿规模的 商品数量上,商品类目树通常会接近一万个节点,每一层级的类目节点数量往往会多达几 十个。在用户查询时,显示给用户的商品分类信息过多,并且无法告诉用户这些商品类目哪 些对用户的查询更重要。对该问题,目前主流的解决方式是当用户查询时,逐个统计每个类 目下的返回结果数量。然后把这些商品类目依据商品数量按照从大到小进行排序,并且设 置一定的阀值。把商品数低于这个阀值的类目隐藏起来。达到减少分类数量的目的。在实现本申请的过程中,发明人发现现有技术至少存在如下问题(1)显示的类目与用户的查询相关性很低。(2)商品分类之间没有机制决定哪个商品类目更重要。(3)对于商品的类目显示的数量仅仅用阀值控制会把相关性高的类目隐藏起来。

发明内容
本申请实施例提供一种垂直搜索的查询方法、系统和装置,用于提高查询结果与 用户查询的相关性。本申请实施例提供一种垂直搜索的查询方法,应用于包括查询服务器、分析服务 器和日志服务器的系统中,其特征在于,包括查询服务器获取用户的查询信息;所述查询服务器根据所述查询信息在所述商品类目服务器的查询字典中获取查询 结果,所述查询结果为与所述查询信息相匹配的商品类目下的子商品类目及其对应的权重;所述查询服务器将所述查询结果中的子商品类目按照其对应的权重进行排序,并 将排序结果发送给所述用户,使所述用户进行查看,并使日志服务器根据所述用户查看的 商品类目和所述查询信息生成日志,并将所述日志发送给分析服务器进行统计分析获得统 计分析结果,所述统计分析结果用于更新所述商品类目服务器的查询字典,用于后续的查 询。其中,在所述查询服务器将所述查询结果中的子商品类目按照其对应的权重进行 排序之前,还包括设定一权重阈值,将所述查询结果中的权重大于所述权重阈值的子商品 类目按照其对应的权重进行排序。其中,所述查询服务器获取用户的查询信息之前,还包括前端服务器获取用户的查询信息,所述查询信息包括所述用户的查询词和商品类 目;所述前端服务器对所述查询词进行归一化处理和获取商品类目对应的商品ID ;所述前端服务器将经归一化处理的所述查询词和所述商品类目ID转发给所述商 品类目服务器。其中,其特征在于,所述日志服务器根据所述用户查看的商品类目和所述查询信息生成日志之前,还 包括获取前端服务器转发的所述用户的查询信息;分析服务器进行统计分析获得统计分析结果,所述统计分析结果用于更新所述商 品类目服务器的查询字典,用于后续的查询具体包括接收所述日志服务器定时发送的预设时间内的日志;根据预设时间内的所述日志进行统计分析,获得统计分析结果,所述统计分析结 果为所述用户查看的商品类目以及对应的权重;所述权重包括所述用户查看的商品类目对 应的点击次数以及在同级商品类目中对应的点击概率;根据商品类目树,将所述统计分析结果生成查询文件;将所述查询文件发送给所述查询服务器,以使所述查询服务器根据所述查询文件 更新所述商品类目服务器的查询字典,用户后续的查询。其中,所述查询服务器将所述查询结果中的子商品类目按照其对应的权重进行排 序,并将排序结果发送给所述用户之前,还包括所述查询服务器对所述查询结果进行拼接,所述拼接包括获取所述查询结果中所 述商品类目ID对应的商品类目。6
本申请实施例提供一种垂直搜索的查询系统,其特征在于,包括查询服务器,用于获取用户的查询信息;根据所述查询信息在所述商品类目服务 器的查询字典获取查询结果,所述查询结果为与所述查询信息相匹配的商品类目下的子商 品类目及其对应的权重;将所述查询结果中的子商品类目按照其对应的权重进行排序,并 将排序结果发送给所述用户,使所述用户进行查看;获取分析服务器发送的统计分析结果, 根据所述统计分析结果更新所述商品类目服务器的查询字典,用于后续的查询;日志服务器,用于根据所述用户查看的商品类目和所述查询信息生成日志,并将 所述日志发送给所述分析服务器。分析服务器,用于接收所述日志服务器发送的所述日志;对所述日志进行统计分 析获取所述统计分析结果;将所述统计分析结发送给所述查询服务器。其中,所述查询信息包括查询词和商品类目,所述日志服务器包括获取模块,用于获取前端服务器转发的用户的查询信息;生成模块,用于根据所述用户查看的商品类目和所述查询信息生成日志;发送模块,用于将所述生成模块生成的所述日志发送给所述分析服务器进行统计 分析获得统计分析结果,所述统计分析结果用于更新所述商品类目服务器的查询字典,用 于后续的查询。其中,所述分析服务器包括接收模块,用于接收所述日志服务器发送的日志;统计分析模块,用于对所述接收模块接收的所述日志进行统计分析,获取统计分 析结果;发送模块,用于将所述统计分析模块获取的所述统计分析结果发送给查询服务 器,使所述查询服务器更新所述查询服务器的查询字典,用于后续的查询。其中,所述统计分析模块包括统计分析子模块,用于根据预设时间内的所述获取模块获取的所述日志进行统计 分析,获得统计分析结果,所述统计分析结果为所述用户查看的商品类目以及对应的权重; 所述权重包括所述用户查看的商品类目对应的点击次数以及在同级商品类目中对应的点 击概率;生成子模块用于根据商品类目树,将所述统计分析子模块获取的所述统计分析 结果生成查询文件。本申请实施例提供一种服务器,作为查询服务器,应用于包括查询服务器、分析服 务器和日志服务器的系统中,其特征在于,包括获取模块,用于获取用户的查询信息;查询模块,用于根据所述获取模块获取的所述查询信息在所述商品类目服务器的 查询字典获取查询结果,所述查询结果为与所述查询信息相匹配的商品类目下的子商品类 目及其对应的权重;发送模块,用于将所述查询模块获取的所述查询结果中的子商品类目按照其对应 的权重进行排序,并将排序结果发送给所述用户,使所述用户进行查看,并使日志服务器根 据所述用户查看的商品类目和所述查询信息生成日志,并将所述日志发送给分析服务器进 行统计分析获得统计分析结果,所述统计分析结果用于更新所述商品类目服务器的查询字典,用于后续的查询;更新模块,用于根据所述获取模块获取的统计分析结果更新所述商品类目服务器 的查询字典,并将所述更新后的查询字典发送到所述查询模块,用于后续的查询。其中,所述发送模块还用于设定一权重阈值,将所述查询结果中的权重大于所述 权重阈值的子商品类目按照其对应的权重进行排序。其中,所述查询信息包括经归一化处理的所述查询词和所述商品类目对应的商品 类目ID;还包括拼接模块,用于对所述查询结果进行拼接,所述拼接包括获取所述查询结 果中所述商品类目ID对应的商品类目。本申请通过根据用户点击记录返回用户的查询结果,提高了查询结果与用户查询 的相关性。当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。


为了更清楚地说明本申请或现有技术中的技术方案,下面将对本申请或现有技术 描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的 一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这 些附图获得其他的附图。图1为本申请实施例中一种垂直搜索的查询方法的流程图;图2为本申请实施例中一种垂直搜索的查询方法的交互图;图3为本申请实施例中一种垂直搜索的查询方法的交互图;图4为本申请实施例中一种垂直搜索的查询方法的流程图;图5为本申请实施例中根据点击查看的商品类目生成的点击类目树;图6为本申请实施例中根据点击查看的商品类目以及次数生成的点击类目树;图7为本申请实施例中一种垂直搜索的查询方法的流程图;图8为本申请实施例中一种垂直搜索的查询方法的流程图;图9为本申请实施例中一种日志服务器的结构示意图;图10为本申请实施例中一种分析服务器的结构示意图;图11为本申请实施例中一种分析服务器的结构示意图;图12为本申请实施例中一种查询服务器的结构示意图;图13为本申请实施例中一种查询服务器的结构示意图。
具体实施例方式本申请实施例提出查询服务器获取用户的查询信息;所述查询服务器根据所述 查询信息在所述商品类目服务器的查询字典中获取查询结果,所述查询结果为与所述查询 信息相匹配的商品类目下的子商品类目及其对应的权重;所述查询服务器将所述查询结果 中的子商品类目按照其对应的权重进行排序,并将排序结果发送给所述用户,使所述用户 进行查看,并使日志服务器根据所述用户查看的商品类目和所述查询信息生成日志,并将 所述日志发送给分析服务器进行统计分析获得统计分析结果,所述统计分析结果用于更新 所述商品类目服务器的查询字典,用于后续的查询。
下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整的描述,显 然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施 例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属 于本申请保护的范围。如背景技术所述,垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索 引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索。举个例子来说明会更 容易理解,比如购物搜索引擎,整体流程大致如下根据用户的搜索要求,抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介......甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏.......”,并将搜索结果返回给用户。为了根据用户的搜索要求,提高返回信息与用于所要搜索的信息的相关性,本申请提出了一种垂 直搜索的查询方法。本申请实施例提供一种垂直搜索的查询方法,如图1所示,包括以下步骤步骤101、查询服务器获取用户的查询信息。其中,所述查询信息可以包括所述用户输入的查询词和用户输入或选择的商品类目。步骤102、所述查询服务器根据所述查询信息在所述商品类目服务器的查询字典 中获取查询结果,所述查询结果为与所述查询信息相匹配的商品类目下的子商品类目及其 对应的权重。步骤103、所述查询服务器将所述查询结果中的子商品类目按照其对应的权重进 行排序,并将排序结果发送给所述用户,使所述用户进行查看,并使日志服务器根据所述用 户查看的商品类目和所述查询信息生成日志,并将所述日志发送给分析服务器进行统计分 析获得统计分析结果,所述统计分析结果用于更新所述商品类目服务器的查询字典,用于 后续的查询。其中,在所述查询服务器将所述查询结果中的子商品类目按照其对应的权重进行 排序之前,还可以设定一权重阈值,将所述查询结果中的权重大于所述权重阈值的子商品 类目按照其对应的权重进行排序。通过查询信息在查询词典中查询获得相匹配的商品类 目,可以对该商品类目下的所有子商品类目按照权重进行排序,也可只对部分子商品类目 按照权重进行排序。当对部分子商品类目按照权重进行排序时,可以预先设定一权重阈值, 仅选取查询结果中的权重大于该权重阈值的子商品类目按照其对应的权重进行排序。通过 对部分子商品类目进行排序,并把排序结果发送给用户可以减少排序的计算量,提高排序 的计算速度。本申请实施例中提供的一种垂直搜索的查询方法,如图2所示,其中,查询服务器 具体为商品类目查询服务器,分析服务器具体为分布式文件存储及并行运算平台,如图3 所示,具体包括以下步骤(1)前端服务器接收用户输入的查询信息,查询信息中包括查询词和商品类目, 前端服务器将该查询词转发给日志查询服务器,用于后续根据该次查询生成日志;将该查 询信息转发给商品类目查询服务器,用于在商品类目查询服务器中根据该查询信息进行查 询,并将查询结果返回给用户,以供用户点击查看。(2)用户在前端服务器根据自己的需要对商品类目以及商品进行点击查看,此时,每一个点击查看动作均会由日志服务器生成对应的一条日志记录,该日志有用户点击查看 的商品以及该商品所属的商品类目。一段时间后,日志服务器将该段时间内所有的日志导 入到分布式文件存储及并行运算平台,用于对日志的存储以及统计分析。
(3)分布式文件存储及并行运算平台中的点击分析统计程序对一段时间内的日志 进行统计分析,该分析包括获取每个商品类目点击的权重,权重体现了商品类目与用户查 询信息的相关度,优选地,可以为查询信息对应的点击次数或点击概率。当用户点击查看商 品时,由于每一个日志都记录有该次点击查看对应的用户查询词,以及该点击查看的商品 所属商品类目,从而根据大量的日志便可以获取针对同一查询词,用户所查看的商品所在 的商品类目以及权重。从中可以获知,当用户输入该查询词时,各个商品类目与该查询词的 相关度,即用户关心的程度。点击分析统计程序将统计分析结果作为输出,传送到商品类目 查询服务器。(4)商品类目查询服务器根据统计分析结果通过hash算法以Key-Value的形式编 译查询字典,从而提高查询的速度。其中Key为用户输入的查询词,Value为该查询词对应 的多个商品类目以及相应的权重,该查询字典体现了查询词与各个商品类目的相关度。当 获知用户的查询词和商品类目时,即可以在查询字典中进行查询,将与该查询词相关的商 品类目返回给用户,并按照相关度的高低,即商品类目的权重进行排列,以供用户选择。需要说明的时,根据本次的统计分析结果更新查询字典可以是仅仅根据该次统计 分析的查询结果生成的查询字典,也可以将该次统计分析结果添加到原查询字典中,生成 新的查询字典,也可以根据需要删除指定时段内或指定时段之前的统计分析结果在查询字 典中对应的数据。例如对于服装类的商品,当到换季的季节时,之前的统计分析结果将不 适用于随后的查询,所以将不用于随后查询的统计分析结果对应的数据删除,以保证查询 的准确性。通过上述的说明可知,该查询方法是一个循环的过程。用户进行查询时,返回的查 询结果是商品类目查询服务器在上一时间段的点击查看行为生成的查询字典中查询而获 得的查询结果;而根据用户在本次查询中进行点击查看的行为生成的日志将在下一个时间 段进行统计分析,并发送给商品类目查询服务器,用于后续的商品类目查询。本申请实施例提供一种垂直搜索的查询方法,如图4所示,包括以下步骤步骤401、用户输入查询信息。此处,我们定义用于进行一次查询所需的查询信息为查询词,也可以包括商品类目。前端服务器通过查询页面,提供与用户进行交互的窗口。用户通过浏览器,访问该 查询页面,在该查询页面中输入想要查询的查询信息进行查询。例如,当用户需要买一件T恤时,用户登录在线交易网站,通过该网站的查询页 面,输入用户想要查询的查询信息“T恤”。此时,若用户只想查看有关男装T恤的信息时, 可以通过输入“T恤”时系统弹出的下拉框选择商品类目,从而在输入查询词的同时,输入商 品类目,对查询范围进行限定,例如用户选择下拉框中的“T恤男装”,其中“男装”即为商 品类目,查询信息为“T恤男装”。用户还可以仅输入查询词“T恤”,当系统根据“T恤”返回的页面上提供有“男装”、 “女装”和“休闲装”时,用户选择“男装”,其中“男装”为商品类目,查询信息为“T恤男装”。
步骤402、前端服务器获取用户输入的查询信息。前端服务器通过查询页面,获取到用户输入的查询信息,具体包括以下步骤(1)前端服务器通过查询页面获取用户输入的查询信息。(2)前端服务器获取该查询信息中的商品类目所对应的商品类目ID。为了便于后端的商品类目查询服务器的查询,前端服务器并非直接将所获取的查 询信息中的商品类目发送给商品类目查询服务器,而是将该商品类目对应的商品类目ID 发送给商品类目查询服务器,所以前端服务器需要获取该商品类目对应的商品类目ID。此时,若查询信息仅为查询词,没有商品类目,则无需获取商品类目ID。当然,也可以由前端服务器将商品类目转发给后端的商品类目查询服务器,由后 端的商品类目查询服务器获取该商品类目对应的商品类目ID,再通过该商品类目ID进行 查询。步骤403、前端服务器将查询信息中查询词和商品类目ID转发给后端的商品类目 服务器。前端服务器和后端的商品类目查询服务器通过接口进行数据的传输。前端接口的 输入输出采用http的方式进行访问及返回结果。输入参数采用http协议,通过Get方式 提交参数给“商品类目查询服务器”。传入的参数主要有两个查询词和商品类目ID。输入连接的格式如下http://host ? query =查询词 &catid =商品类目 id返回结果采用XML的格式,具体格式如下< xml version=" 1.0" encoding="GBK" > <conf>〈module name="catsort" v=""><p name="result">510001:200,510021:100,10221:30</p></module></conf^步骤404、后端的商品类目查询服务器根据接收的查询信息,进行查询,并将查询 结果发送给前端服务器。步骤405、前端服务器将由后端的商品类目查询服务器发送的查询结果显示给用 户。其中,当查询信息仅为查询词时,查询结果为与该查询词匹配的所有商品类目及 其对应的权重(即商品类目的点击次数或点击概率),并按照权重由高到低的顺序排列;当 查询信息为查询词和商品类目时,查询结果为与该查询信息匹配的商品类目下的所有子商 品类目及其对应的权重(即商品类目的点击次数或点击概率),并按照权重由高到低的顺 序排列。优选地,显示给用户的查询结果页面中,既包括与查询信息相匹配的商品类目下 的所有子商品类目,也包括该等子商品类目下的每一款商品信息的详单,以便用户在该查 询结果中直接选择具体商品进行查看。11
步骤406、用户根据查询结果,从中选择查看的商品类目进行点击查看,日志服务 器根据点击生成日志。前端服务器通过查询结果显示页面,将后端的商品类目查询服务器返回的查询结 果显示给用户。用户从显示的查询结果中选择所要查看的商品类目进行点击查看,再在所 查看的商品类目的子类目中进行点击,再由商品类目查询服务器按照上述查询方法返回给 用户以供查看。如此往复,通过逐级地查看商品类目查找到所要查看的商品,进行点击查看。上述所显示的每一个商品中都添加了保存到“日志服务器”的连接。在点击查看 的过程中,每当对商品进行点击后,都将根据该次点击行为生成相应的日志,保存在日志服 务器中。其中,每一次点击行为为一条点击日志,日志的格式如表1所示表1日志格式查询词查询类目商品ID商品类目商品属性其中,查询词为用户输入的查询信息中的查询词,查询类目为用户在页面返回的 商品类目中所选择点击查看的商品类目并从点击该商品类目返回的页面中选择商品进行 点击查看,此时该商品类目为查询类目,所以查询类目可能有多个,而日志中的查询类目仅 存储的查询类目为用户点击查看商品之前最近一次点击的商品类目。点击该查询类目后, 返回给用户的查询结果既包括该查询类目下的所有子商品类目也包括该等子商品类目下 的每一款商品信息的详单。商品ID为每一个商品所对应的ID号,用于唯一标识每一款商 品。商品类目为用户点击查看的商品直接所属的商品类目。该商品类目可能是查询类目的 子商品类目。商品属性为该商品所对应的附属信息,例如品牌。例如,当用户输入的查询词为“T恤”时,在根据用户点选的商品类目为“长袖T恤” 返回的查询结果中,在商品详单中选择了一款品牌为POLO的T恤,该件商品对应的商品ID 为12200021,其直接所属商品类目为男装T恤,其中“男装T恤”为“长袖T恤”的子类目, 根据上述信息生成如表2所示的一条日志记录。表2日志记录查询词查询类目商品ID商品类目商品属性T恤长袖T恤12200021男装T恤品牌P0L0
步骤407、日志服务器定时将生成的日志导入到分布式文件存储及并行运算平台。分布式文件存储及并行运算平台用于存储生成的日志,以及对所有日志进行分析 时的计算。每一条日志记录的产生是随着用户的点击查看而同时产生的,日志服务器定时将 该时间段内的所有日志导入到分布式文件存储及并行运算平台。其中,日志服务器的定期 操作可以为每天,或每12小时等等。步骤408、点击分析统计程序定时对存储的日志进行统计分析,得出统计分析结果 ο日志服务器定时将生成的日志导入到分布式文件存储及并行运算平台后,点击分 析统计程序将定时对存储的日志进行统计分析,得出统计分析结果。该统计分析的对象可 以为最近十天的日志,或最近两周的日志,具体的时间可以按照经验值或统计需求进行调 離iF. ο具体的,点击分析统计程序定时对存储的日志进行统计分析,得出统计分析结果, 具体包括以下步骤(1)获取进行统计分析的日志。日志服务器会定时更新分布式文件存储及并行运算平台中的日志,点击分析统计 程序定时对存储的日志进行统计分析时,需要获取更新的日志,以获取最新的日志,提高统 计的准确性。(2)对查询词进行归一化处理。由于每个用户输入的查询词不一定符合点击分析统计程序的统计标准,为了便于 根据查询词进行统计,需要对查询词进行归一化处理。归一化处理包括去除查询词中不必 要的词,多余的空格,进行字母大小写之间的转换,全角半角之间的转换,简体繁体之间的 转换,标点的转换以及中文数字之间的转换等。经归一化处理的查询词可以直接用于点击 分析统计程序的统计。(3)对日志进行数据汇总,生成点击分布数据。成千上万的用户进行查询时,会输入相同的查询词以及点击相同的查询类目,根 据一段时间内的日志,对用户查询的查询词以及查询类目进行汇总,获取根据每个查询词 所点击的商品类目的次数。例如,通过查询词“T恤”点击查看的商品共有400个,其中有200个商品属于男 装商品类目,有100个商品属于女装商品类目,有100个商品属于运动休闲商品类目。在属 于男装商品类目的200个商品中,有200个商品属于短袖T恤商品类目,有0个商品属于长 袖T恤商品类目。在属于女装商品类目的100个商品中,有100个商品属于短袖T恤商品 类目,有0个商品属于长袖T恤商品类目。在属于运动休闲商品类目的100个商品中,有60 个商品属于情侣装商品类目,有40个商品属于运动T恤商品类目。上述每一个点击查看过程都会生成对应的日志,根据对日志的汇总,得出如表3 的点击分布数据表3点击分布数据
权利要求
1.一种垂直搜索的查询方法,应用于包括查询服务器、分析服务器和日志服务器的系 统中,其特征在于,包括查询服务器获取用户的查询信息;所述查询服务器根据所述查询信息在所述商品类目服务器的查询字典中获取查询结 果,所述查询结果为与所述查询信息相匹配的商品类目下的子商品类目及其对应的权重;所述查询服务器将所述查询结果中的子商品类目按照其对应的权重进行排序,并将排 序结果发送给所述用户,使所述用户进行查看,并使日志服务器根据所述用户查看的商品 类目和所述查询信息生成日志,并将所述日志发送给分析服务器进行统计分析获得统计分 析结果,所述统计分析结果用于更新所述商品类目服务器的查询字典,用于后续的查询。
2.如权利要求1所述的方法,其特征在于,在所述查询服务器将所述查询结果中的子 商品类目按照其对应的权重进行排序之前,还包括设定一权重阈值,将所述查询结果中的 权重大于所述权重阈值的子商品类目按照其对应的权重进行排序。
3.如权利要求1所述的方法,其特征在于,所述查询服务器获取用户的查询信息之前, 还包括前端服务器获取用户的查询信息,所述查询信息包括所述用户的查询词和商品类目;所述前端服务器对所述查询词进行归一化处理和获取商品类目对应的商品ID ;所述前端服务器将经归一化处理的所述查询词和所述商品类目ID转发给所述商品类 目服务器。
4.如权利要求1所述的方法,其特征在于,所述日志服务器根据所述用户查看的商品类目和所述查询信息生成日志之前,还包括获取前端服务器转发的所述用户的查询信息;分析服务器进行统计分析获得统计分析结果,所述统计分析结果用于更新所述商品类 目服务器的查询字典,用于后续的查询具体包括接收所述日志服务器定时发送的预设时间内的日志;根据预设时间内的所述日志进行统计分析,获得统计分析结果,所述统计分析结果为 所述用户查看的商品类目以及对应的权重;所述权重包括所述用户查看的商品类目对应的 点击次数以及在同级商品类目中对应的点击概率;根据商品类目树,将所述统计分析结果生成查询文件;将所述查询文件发送给所述查询服务器,以使所述查询服务器根据所述查询文件更新 所述商品类目服务器的查询字典,用户后续的查询。
5.如权利要求1所述的方法,其特征在于,所述查询服务器将所述查询结果中的子商 品类目按照其对应的权重进行排序,并将排序结果发送给所述用户之前,还包括所述查询服务器对所述查询结果进行拼接,所述拼接包括获取所述查询结果中所述商 品类目ID对应的商品类目。
6.一种垂直搜索的查询系统,其特征在于,包括查询服务器,用于获取用户的查询信息;根据所述查询信息在所述商品类目服务器的 查询字典获取查询结果,所述查询结果为与所述查询信息相匹配的商品类目下的子商品类 目及其对应的权重;将所述查询结果中的子商品类目按照其对应的权重进行排序,并将排序结果发送给所述用户,使所述用户进行查看;获取分析服务器发送的统计分析结果,根据 所述统计分析结果更新所述商品类目服务器的查询字典,用于后续的查询;日志服务器,用于根据所述用户查看的商品类目和所述查询信息生成日志,并将所述 日志发送给所述分析服务器。分析服务器,用于接收所述日志服务器发送的所述日志;对所述日志进行统计分析获 取所述统计分析结果;将所述统计分析结发送给所述查询服务器。
7.如权利要求6所述的系统,其特征在于,所述查询信息包括查询词和商品类目,所述 日志服务器包括获取模块,用于获取前端服务器转发的用户的查询信息;生成模块,用于根据所述用户查看的商品类目和所述查询信息生成日志;发送模块,用于将所述生成模块生成的所述日志发送给所述分析服务器进行统计分析 获得统计分析结果,所述统计分析结果用于更新所述商品类目服务器的查询字典,用于后 续的查询。
8.如权利要求6所述的系统,其特征在于,所述分析服务器包括接收模块,用于接收所述日志服务器发送的日志;统计分析模块,用于对所述接收模块接收的所述日志进行统计分析,获取统计分析结果;发送模块,用于将所述统计分析模块获取的所述统计分析结果发送给查询服务器,使 所述查询服务器更新所述查询服务器的查询字典,用于后续的查询。
9.如权利要求8所述的系统,其特征在于,所述统计分析模块包括统计分析子模块,用于根据预设时间内的所述获取模块获取的所述日志进行统计分 析,获得统计分析结果,所述统计分析结果为所述用户查看的商品类目以及对应的权重;所 述权重包括所述用户查看的商品类目对应的点击次数以及在同级商品类目中对应的点击 概率;生成子模块用于根据商品类目树,将所述统计分析子模块获取的所述统计分析结果 生成查询文件。
10.一种服务器,作为查询服务器,应用于包括查询服务器、分析服务器和日志服务器 的系统中,其特征在于,包括获取模块,用于获取用户的查询信息;用于获取分析服务器发送的统计分析结果;查询模块,用于根据所述获取模块获取的所述查询信息在所述商品类目服务器的查询 字典获取查询结果,所述查询结果为与所述查询信息相匹配的商品类目下的子商品类目及 其对应的权重;发送模块,用于将所述查询模块获取的所述查询结果中的子商品类目按照其对应的权 重进行排序,并将排序结果发送给所述用户,使所述用户进行查看,并使日志服务器根据所 述用户查看的商品类目和所述查询信息生成日志,并将所述日志发送给分析服务器进行统 计分析获得统计分析结果,所述统计分析结果用于更新所述商品类目服务器的查询字典, 用于后续的查询;更新模块,用于根据所述获取模块获取的统计分析结果更新所述商品类目服务器的查 询字典,并将所述更新后的查询字典发送到所述查询模块,用于后续的查询。
11.如权利要求10所述的服务器,其特征在于,所述发送模块还用于设定一权重阈 值,将所述查询结果中的权重大于所述权重阈值的子商品类目按照其对应的权重进行排
12.如权利要求10所述的服务器,其特征在于,所述查询信息包括经归一化处理的所述查询词和所述商品类目对应的商品类目ID ; 还包括拼接模块,用于对所述查询结果进行拼接,所述拼接包括获取所述查询结果中 所述商品类目ID对应的商品类目。
全文摘要
本申请实施例公开了一种垂直搜索的查询方法、系统和装置,该方法包括查询服务器获取用户的查询信息;所述查询服务器根据所述查询信息在所述商品类目服务器的查询字典中获取查询结果,所述查询结果为与所述查询信息相匹配的商品类目下的子商品类目及其对应的权重;所述查询服务器将所述查询结果中的子商品类目按照其对应的权重进行排序,并将排序结果发送给所述用户,使所述用户进行查看,并使日志服务器根据所述用户查看的商品类目和所述查询信息生成日志,并将所述日志发送给分析服务器进行统计分析获得统计分析结果,所述统计分析结果用于更新所述商品类目服务器的查询字典,用于后续的查询。通过本申请,实现了根据用户点击记录返回用户的查询结果,提高了查询结果与用户查询的相关性。
文档编号G06F17/30GK102053983SQ20091021042
公开日2011年5月11日 申请日期2009年11月2日 优先权日2009年11月2日
发明者何杰 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1