一种基于垂直搜索的查询方法、系统和装置的制作方法

文档序号:6601655阅读:248来源:国知局
专利名称:一种基于垂直搜索的查询方法、系统和装置的制作方法
技术领域
本申请涉及网络技术领域,特别是涉及一种基于垂直搜索的查询方法、系统和装置。
背景技术
随着互联网的日益发展,互联网上存储的信息量日趋庞大。当人们需要获取某方面的专用信息时,通过搜索引擎进行搜索。但由于互联网上的信息量过大,采用通用搜索方式获取的查询结果缺乏准确性,于是垂直搜索方式得到了快速的发展。垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索弓I擎则显得更加专注、具体和深入。垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、 房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索等,几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。当垂直搜索用于购物搜索时,用户在B2C (Business to Customer,企业对消费者购物模式)或C2C(C0nsumer to Customer,消费者对消费者购物模式)购物网站输入查询词购物,如图1(a)和图1(b)所示,通常会返回两部分的结果1.商品分类的导航信息,即商品类目,2.与推送的商品类目对应的属性类目,3.对应商品类目下推送的商品。导航的商品分类名称依据树的结构组织起来,方便用户沿树结构的路径自上而下通过商品分类的信息定位到更准确的查询结果。属性类目为根据用户的历史点击记录获得的用户关注度较高的商品类目中关注度较高的商品属性。商品类目树结构保存在数据库相对应的数据表,数据的输入与维护需要人工进行,在B2C或C2C网站中每一个商品的展示都必须属于该商品类目树的某一个节点或多个节点。当前的电子商务网站往往商品数量过于庞大,导致商品分类过多。在上亿规模的商品数量上,商品类目树通常会接近一万个节点,每一层级的类目节点数量往往会多达几十个。在用户查询时,显示给用户的商品分类信息过多,并且无法告诉用户这些商品类目哪些对用户的查询更重要。对该问题,目前主流的解决方式是当用户查询时,逐个统计每个类目下的返回结果数量。然后把这些商品类目依据商品数量按照从大到小进行排序,并且设置一定的阀值。把商品数低于这个阀值的类目隐藏起来。达到减少分类数量的目的。在实现本申请的过程中,发明人发现现有技术至少存在如下问题(1)显示的类目与用户的查询相关性很低。(2)商品分类之间没有机制决定哪个商品类目更重要。
(3)对于商品的类目显示的数量仅仅用阀值控制会把相关性高的类目隐藏起来。

发明内容
本申请实施例提供一种基于垂直搜索的查询方法、系统和装置,用于提高用户查询结果与用户查询意图的相关度,提高用户体验感。本申请实施例提供一种基于垂直搜索的查询方法,包括获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。其中,所述生成最终查询结果之后,还包括将所述最终查询结果发送给用户,使所述用户进行查看,并根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,对所述日志进行统计分析获得类目模型,将所述类目模型更新到所述类目模型库中。其中,所述类目模型还包括与所述商品类目对应的属性类目;所述生成第二查询结果的方法,还包括根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。其中,所述查询信息仅包括用户输入的关键字时,所述根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;若存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止;根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果。其中,所述查询信息包括用户输入的关键字和用户所选择的商品类目时,所述根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;若存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;获取与该商品类目匹配的类目模型中的商品类目及其对应的权重,生成第一查询结果。其中,对所述第一查询结果和所述第二查询结果合并,生成最终查询结果,具体包括获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重,其中第一合并结果中的权重根据同一商品类目来自两个查询结果的权重进行加权获得;获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重;对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。其中,对所述第一查询结果和所述第二查询结果合并,生成最终查询结果,具体包括获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得;获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与所述商品类目对应的属性类目及其对应权重;对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。其中,所述根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,具体包括获取用户对作为请求响应返回的商品类目、与商品类目对应的属性类目和商品进行点击查看的点击操作;根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目;存储所生成的日志。其中,所述对所述日志进行统计分析获得类目模型,具体包括根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和与商品类目对应的属性类目点击次数和/或点击概率;根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。其中,所述根据所述统计分析结果生成类目模型,具体包括
9
判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。本申请实施例还提供一种基于垂直搜索的查询系统,包括查询服务器、建模服务器和日志服务器,其中,所述查询服务器,用于获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果;所述日志服务器,用于根据所述用户对所述查询服务器生成的最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给所述建模服务器;所述建模服务器,用于对所述日志进行统计分析,获得类目模型。其中,所述建模服务器,还用于将所述类目模型发送给所述查询服务器;所述查询服务器,还用于将所述最终查询结果发送给用户,使所述用户进行查看; 将来自所述建模服务器的类目模型更新到所述类目模型库中。其中,所述类目模型还包括与所述商品类目对应的属性类目;所述查询服务器,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。其中,所述日志服务器,具体用于获取用户对作为请求响应返回的商品类目、与商品类目对应的属性类目和商品进行点击查看的点击操作;根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目;存储所生成的日志。其中,所述建模服务器,具体用于根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和与商品类目对应的属性类目点击次数和/或点击概率;根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。其中,所述建模服务器,具体用于判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。本申请实施例还提供一种查询服务器,包括获取模块,用于获取用户的查询信息;查询模块,用于根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;
合并模块,用于对所述第一查询结果和所述第二查询结果合并,生成最终查询结^ ο其中,所述查询服务器,还包括发送模块,用于将所述最终查询结果发送给用户,使所述用户进行查看,并使日志服务器根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给建模服务器进行统计分析获得类目模型并将所述类目模型更新到所述商品类目服务器的类目模型库中。其中,所述类目模型还包括与所述商品类目对应的属性类目;所述查询模块,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。其中,所述查询信息仅包括用户输入的关键字时,所述查询模块,具体包括判断子模块,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;匹配子模块,用于若判断子模块判断存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止;生成子模块,用于根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果。其中,所述查询信息包括用户输入的关键字和用户所选择的商品类目时,所述查询模块,具体包括判断子模块,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;匹配子模块,用于若判断子模块判断存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;提取子模块,用于从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;生成子模块,用于所述查询服务器获取与该商品类目匹配的类目模型中的商品类目及其对应的权重,生成第一查询结果。其中,所述合并模块,具体包括第一合并子模块,用于获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重,其中第一合并结果中的权重根据同一商品类目来自两个查询结果的权重进行加权获得;第二合并子模块,用于获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重;权重提升子模块,用于对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;生成子模块,用于按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。其中,所述合并模块,具体包括第一合并子模块,用于获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得;第二合并子模块,用于获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与所述商品类目对应的属性类目及其对应权重;权重提升子模块,用于对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;生成子模块,用于按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。本申请具有以下优点通过在由用户的历史点击操作生成的类目模型库和商品库中查询用户的请求,并对二者进行合并,从而提高了用户查询结果与用户查询意图的相关度,提高用户体验感。通过对第一查询结果、第二查询结果的权重进行加权合并,可以将更重要的商品类目提供给用户。另外,本申请与现有技术相比,只需在类目模型库中以及商品库中匹配查找与查询信息相匹配的商品类目,作为排序结果的商品类目仅仅是所有商品类目中的一部分;而现有技术需要统计每一个商品类目下的商品数量,并按照商品数量的大小对所有商品类目进行排序,因此,本申请节省了对商品类目的排序时间,能够更加快速的生成查询结果。


为了更清楚地说明本申请或现有技术中的技术方案,下面将对本申请或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1 (a)为现有技术中返回查询结果的结构示意图;图1 (b)为现有技术中返回的查询结果;图2为本申请中的一种基于垂直搜索的查询方法流程图;图3为本申请中的一种基于垂直搜索的查询系统结构示意图;图4为本申请中的前端查询服务器的结构示意图;图5为本申请中的类目查询服务器的结构示意图;图6为本申请中的商品查询服务器的结构示意图;图7为本申请中的建模服务器的结构示意图;图8为本申请中的一种基于垂直搜索的查询方法流程图;图9为本申请中的类目查询服务器检索与查询信息相匹配的商品类目和对应的属性类目的流程12
图10为本申请中的一种基于垂直搜索的查询方法流程图;图11为本申请中的一种基于垂直搜索的查询系统结构示意图;图12为本申请中的一种查询服务器的结构示意图;图13为本申请中的查询服务器中查询模块的结构示意图;图14为本申请中的查询服务器中合并模块的结构示意图。
具体实施例方式本申请的实施例包括在由用户的点击操作生成的类目模型库和商品库中查询用户的请求,并对二者进行合并作为最终的查询结果返回给用户,提高了查询结果的相关度, 提高用户体验感。其中类目模型为根据用户历史的查询信息中的关键词和对应的点击记录生成的与关键词对应的商品类目和与商品类目对应的属性类目,每一个类目模型中的商品类目和属性类目为用户根据某一关键词查询时,用户所关注的查询结果,按照商品类目树的形式组织。商品库是指将各类商品按照商品类目树的形式进行存储的数据库,通过商品类目对商品进行导航,对于其中的每一个商品,存储有其对应的属性信息。下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。本申请实施例提供一种基于垂直搜索的查询方法,如图2所示,包括以下步骤步骤101、获取用户的查询信息。其中,所述查询信息可以包括所述用户输入的关键词、用户输入或选择的由查询系统提供的商品类目、商品属性。其中,商品类目是指将商品按照不同的种类进行划分,所得的种类名称,例如“服装”、“手机”,用于对商品进行导航。而且商品类目是有层次和父子关系的,例如“服装_>男装_>另式牛仔裤”,其中“男士牛仔裤”是“男装”的子类目,“服装”是“男装”的父类目。每一个商品都有一些属性,并从属于一个或多个类目,例如某一品牌的男士牛仔裤,既属于“男装”商品类目,也属于“休闲装”商品类目,拥有“品牌苹果 /款式直筒”等商品属性。与商品类目类似,将商品按照不同的属性划分,得到属性类目, 例如“品牌_>国产”。例如若用户输入关键词“Nokia”,并未选择由查询系统提供的商品类目或商品属性,此时查询信息为“Nokia” ;或用户输入关键词“Nokia”并选择由查询系统提供的商品类目“手机”,此时查询信息为“Nokia手机”。步骤102、根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,所述类目模型包括与用户输入的关键词对应的商品类目和与商品类目对应的属性类目,并根据检索到的类目模型生成第一查询结果。其中根据查询信息的不同,该步骤包括以下两种情况情况1、所述查询信息仅包括用户输入的关键字,此时根据所述查询信息在类目模型库中检索与所述查询信息相匹配的商品类目和对应的属性类目,生成第一查询结果包括以下步骤(1)判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字。(2)若存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止。(3)从所获取的类目模型中获取峰值类目,并根据该峰值类目获取对应的直达属性的属性类目。其中,峰值类目是能够突出地反映用户的查询意图和需求的商品类目,可以是权重最高的商品类目,举例来说,可以是用户历史点击次数或点击概率最高的商品类目。 直达属性的属性类目是从峰值类目的多个商品属性中提取的属性类目,该提取过程与从全部商品类目中获得作为查询结果中的商品类目的方法类似,此处不再赘述。例如当查询信息仅包括关键字“Nokia”时,在类目模型库获取到的匹配的类目模型为手机(4000)和手机外壳(2000),其中4000为商品类目“手机”对应的权重,2000 为商品类目“手机外壳”对应的权重。若此时权重门限为500,则此时峰值类目为“手机”,按照类似的流程从“手机” 一商品类目下的多个属性中提取出直达属性的属性类目,例如根据直达属性“品牌”获得“品牌”属性类目。需要说明的是,若没有满足条件的峰值类目,则可以设定权重最高的商品类目为峰值类目,或者无峰值类目,此时无需获取直达属性的属性类目。具体的设定条件不影响本申请的保护范围,例如权重最高的两个商品类目,此时直达属性的属性类目从该两个商品类目中各取一半。(4)根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果。具体地,将商品类目按照权重由高到低的顺序排列,生成第一查询结果中商品类目集合,同时将属性类目按照权重由高到低的顺序排列,生成第一查询结果的属性类目集合,第一查询结果中的商品类目和属性类目集合均将推送给用户。优选地,属性类目按照所属的不同属性进行分类排列。例如基于步骤(3),生成的第一查询结果中的商品类目集合为手机0000);手机外壳O000);生成的第一查询结果中的属性类目集合为按属性“品牌”划分的国产品牌O000);欧美品牌(1000)。当然,属性类目集合还可以包括按属性“网络制式”划分的 GSM(IOOO) ;CDMA (500)。情况2、所述查询信息包括用户输入的关键字和用户所选择的商品类目,此时根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括以下步骤判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;若存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;获取与该商品类目匹配的类目模型中的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,生成第一查询结果。
例如当查询信息为“Nokia手机”时,由于该“手机”商品类目下没有子类目, 因此第一查询结果中仅有属性类目集合,即按属性“品牌”划分的国产品牌O000);欧美品牌(1000)。当然,属性类目集合还可以包括按属性“网络制式”划分的GSM(IOOO); CDMA(500)。需要说明的是,若“手机”商品类目下没有子类目时,也可将该层类目作为第一查询结果中的商品类目集合,例如手机G000);手机外壳O000)。步骤103、根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和对应的属性类目,生成第二查询结果。该步骤与现有技术类似,即在商品库中按照商品树的结构查找匹配的商品类目和对应的属性类目,生成商品类目集合和属性类目集合,此处不再赘述。需要说明的是,第一查询结果中的类目模型是根据用户对查询结果的历史点击数据生成的,因此作为排序标准的权重为对应的点击次数或概率,而第二查询结果中商品库的商品类目是按照商品自身的分类而组织的,因此作为排序标准的权重为该商品类目、或商品属性在所有商品中的数量分布。例如生成的第二查询结果为生成的第二查询结果中的商品类目集合为手机 (4000);手机挂链(2000),其中4000为商品类目“手机”对应的权重,2000为商品类目“手机挂链”对应的权重;生成的第二查询结果中的属性类目集合为按属性“品牌”划分的国产品牌^)00);欧美品牌(500)。步骤104、对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。具体地,第一查询结果和第二查询结果分别由商品类目集合和对应的属性类目集合组成,因此分别将两个查询结果中的商品类目集合和对应的属性类目集合进行合并,生成最终查询结果中的商品类目集合和属性类目集合,包括以下步骤(1)获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得。其中,具体的加权方式可根据实际情况预先设定,如进行1比1的加权,或进行2 比1的加权。(2)获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与该商品类目对应的属性类目及其对应权重。(3)对第一合并结果中的权重进行权重提升,使第一合并结果中的每一个权重高于第二合并结果中的每一个权重。此时,若第一合并结果中的对应集合中每一个权重已经高于第二合并结果中的每一个权重,则无需进行权重提升。(4)按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。本申请实施例中以第一查询结果为手机0000);手机外壳O000);按属性“品牌”划分的国产品牌O000);欧美品牌(1000);生成的第二查询结果为手机G000);手机挂链O000);按属性“品牌”划分的国产品牌O000);欧美品牌(500)为例说明。此时,对上述两个查询结果进行合并,具体地,获取商品类目集合中相同的商品类
15目“手机”,并对分别来自第一查询结果的权重“4000”和来自第二查询结果的“4000”进行加权,加权比例为2比1,此时,商品类目“手机”的权重为“12000”;类似地,得出按属性“品牌”划分的国产品牌(6000);欧美品牌(2500),得到第一合并结果。获取只在第一查询结果中的手机外壳(2000),进行加权后,得到第二合并结果为手机外壳0000)。优选地,在上述最终查询结果中提取具体的商品,并作为最终查询结果中的一部分返回给用户。例如从最终查询结果中排在第一位的商品类目中提取点击率最高的商品及其详细信息作为最终查询结果的一部分。步骤105、将所述最终查询结果发送给用户,使所述用户进行查看。步骤106、根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日
ο优选地,根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志包括获取用户对作为请求响应返回的商品类目、对应的属性类目和商品进行点击查看的点击操作;根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目; 存储所生成的日志。例如用户在查询信息“Nokia”的最终查询结果中依次点击了 “手机->Nokia->1600万色”,并在此时选择了一款手机商品进行点击查看。此时,根据用户的每一次点击操作生成日志记录,该日志记录中包括查询信息,点击对象,相关点击对象(即点击“手机”为点击“ 1600万色”的相关点击操作)等等。步骤107、根据接收的日志进行统计分析获得类目模型。具体地,根据接收的日志进行统计分析获得类目模型包括以下步骤根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和对应的属性类目点击次数和/或点击概率;根据所述统计分析结果生成类目模型;将所述统计分析结果按照商品类目树进行排列,生成类目模型。其中,根据所述统计分析结果生成类目模型包括判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。例如对一天之内的日志进行统计分析,得到当查询信息为“Nokia”时,点击商品类目“手机”的次数为1000,点击“手机外壳”次数为500,点击“手机”下的网络制式的次数为300,其中点击“GSM”的次数为100次,点击“CDMA”的次数为50次。此时,生成的类目模型为商品类目手机(1000)手机外壳(500);属性类目GSM(100)CDMA(50)。步骤108、将所述类目模型更新到所述类目模型库中。该步骤不断地通过用户的历史点击记录更新类目模型库,而更新后的类目模型库用于根据后续用户的查询返回查询结果,从而不断地保持类目模型库的精度,提高返回的查询结果的准确性。当然,也可以对时间较早的数据进行数据淘汰。需要说明的是,上述步骤102和步骤103之间无先后顺序。为实现上述基于垂直搜索的查询方法,本申请实施例提供一种基于垂直搜索的查询系统,如图3所示,包括日志服务器、建模服务器、查询服务器、商品库和商品类目模型库。其中,查询服务器包括为前端查询服务器,类目查询服务器和商品查询服务器,商品类目模型库存储在类目查询服务器,商品库存储在商品查询服务器。其中,前端服务器作为用户与后台交互的媒介,用于接收用户的查询请求,并将后台的查询结果反馈给用户。而类目查询服务器和商品查询服务器用于根据前台服务器转发的查询请求在商品库和商品类目模型库中进行查询。其中,商品类目模型库中的类目模型是由建模服务器根据日志服务器记录的日志生成的。以下分别对上述功能模块进行进一步的介绍。其中,如图4所示,前端查询服务器包括接收模块,用于接收用户的查询请求和类目查询服务器和商品查询服务器返回的查询结果;合并模块,用于对类目查询服务器和商品查询服务器返回的查询结果进行合并,生成最终的查询结果;发送模块,用于将用户的查询请求发送给类目查询服务器和商品查询服务器,并将接收的查询结果发送给用户。如图5所示,类目查询服务器包括接收模块,用于接收前端查询服务器发送的查询请求,该查询请求中携带查询信息;查询模块,用于根据查询信息在类目模型库中检索与所述查询信息相匹配的商品类目以及对应的权重和对应的属性类目以及对应的权重;发送模块,用于将查询结果发送给前端查询服务器。如图6所示,商品查询服务器包括接收模块,用于接收前端查询服务器发送的查询请求,该查询请求中携带查询信息;查询模块,用于根据查询信息在商品库检索与所述查询信息相匹配的商品类目以及对应的权重和对应的属性类目以及对应的权重;发送模块, 用于并将查询结果发送给前端查询服务器。如图7所示,建模服务器包括接收模块,用于接收日志服务器生成的日志记录; 统计分析模块,用于根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和对应的属性类目点击次数和/或点击概率。生成模块,根据所述统计分析结果生成类目模型, 并将所述统计分析结果按照商品类目树进行排列。发送模块,用于将生成的类目模型发送给商品类目模型库。上述各种服务器之间的交互过程具体包括以下两个阶段⑴查询阶段;(2)更新阶段。其中,查询阶段为前端查询服务器接收用户的查询请求,所述查询请求中携带查询信息。前端查询服务器将该查询信息分别发送给类目查询服务器和商品查询服务器。类目查询服务器根据该查询信息在类目模型库中检索与所述查询信息相匹配的商品类目和/ 或属性类目,生成第一查询结果,并将该第一查询结果发送给前端查询服务器。商品查询服务器根据该查询信息在商品库中检索与所述查询信息相匹配的商品类目和/或属性类目,生成第二查询结果,并将该第二查询结果发送给前端查询服务器。前端查询服务器将二个查询结果进行合并,生成最终查询结果发送给用户,使用户进行点击查看。查询后的更新阶段为当用户在最终查询结果中进行点击查看时,前端查询服务器将该操作发送给日志服务器,使日志服务器根据该点击操作生成日志;日志服务器将一段时间内的批量日志发送给建模服务器,建模服务器根据本批数据进行统计分析,获取统计分析结果,并根据该统计分析结果生成类目模型,发送给类目查询服务器,使类目查询服务器将该生成的类目模型更新到类目模型库中。而对于商品搜索服务器中的商品库,则根据商品自身的所属类目和属性进行维护和更新。由上述交互过过程可知,查询阶段和更新阶段是一个整体循环过程,查询的返回结果供用户点击查看,根据用户的点击查看进行更新,在根据更新后的数据进行查询,如此往复,不断更新,以提高查询的相关度。以下结合具体应用场景,对本申请中的基于垂直搜索的查询方法进行详细阐述。如图8所示,为本申请实施例提供的一种基于垂直搜索的查询方法,为根据查询请求在类目模型库和商品库中进行查询的过程(即查询阶段),具体包括以下步骤步骤301、前端查询服务器获取用户的查询请求,该查询请求中携带查询信息。前端查询服务器通过对查询请求进行解析,获取查询信息。该解析过程具体包括, 分析该查询请求是用户通过查询输入框输入的关键字还是用户在查询系统提供的商品类目或属性类目中选择的某一商品类目或属性类目。因此,所述查询请求中携带的查询信息可以为用户输入的查询关键字,也可以是用户输入的查询关键字和用户选择的商品类目或属性类目的组合。例如当查询请求中携带的内容为“Nokia手机滑盖”时,前端服务器从该内容中提取出查询信息“Nokia”,“手机”,“滑盖”,并分析该三个查询信息的来源,若“Nokia”为用户通过查询输入框输入的关键词,“手机”为用户选择的商品类目,“滑盖”为用户选择的属性类目,则该查询请求为用户输入的查询关键字和用户选择的商品类目或属性类目的组
I=I O步骤302、前端查询服务器将接收的查询信息分别转发给类目查询服务器和商品查询服务器。步骤303、类目查询服务器根据所述查询信息在类目模型库中检索与该查询信息相匹配的商品类目和对应的属性类目,生成第一查询结果,并将第一查询结果返回给前端查询服务器。类目模型库存储有大量的类目模型,每一个类目模型由若干个商品类目及其权重和对应的属性类目及其权重组成,并与关键词一一对应。其中由商品类目及其权重组成根据对应的关键词推送的商品类目集合,与商品类目对应的属性及其权重组成根据对应的关键词推送的属性集合,且每个集合中按照权重由高到低的顺序进行排列。需要说明的是, 每一个类目模型的生成根据对应的关键词的历史点击数据完成,具体生成过程详见后续说明。优选地,该类目模型以关键字为单位按照商品类目树的结构(当然,也可以为其他顺序)进行存储,具体地,该类目模型的格式如表1所示表1、类目模型
18
权利要求
1.一种基于垂直搜索的查询方法,其特征在于,包括获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。
2.如权利要求1所述的方法,其特征在于,所述生成最终查询结果之后,还包括将所述最终查询结果发送给用户,使所述用户进行查看,并根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,对所述日志进行统计分析获得类目模型, 将所述类目模型更新到所述类目模型库中。
3.如权利要求1所述的方法,其特征在于,所述类目模型还包括与所述商品类目对应的属性类目;所述生成第二查询结果的方法,还包括根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
4.如权利要求1所述的方法,其特征在于,所述查询信息仅包括用户输入的关键字时, 所述根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;若存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止;根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果。
5.如权利要求1所述的方法,其特征在于,所述查询信息包括用户输入的关键字和用户所选择的商品类目时,所述根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,具体包括判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;若存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;获取与该商品类目匹配的类目模型中的商品类目及其对应的权重,生成第一查询结
6.如权利要求1所述的方法,其特征在于,对所述第一查询结果和所述第二查询结果合并,生成最终查询结果,具体包括获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重,其中第一合并结果中的权重根据同一商品类目来自两个查询结果的权重进行加权获得;获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重;对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
7.如权利要求3所述的方法,其特征在于,对所述第一查询结果和所述第二查询结果合并,生成最终查询结果,具体包括获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得;获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与所述商品类目对应的属性类目及其对应权重;对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
8.如权利要求2所述的方法,其特征在于,所述根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,具体包括获取用户对作为请求响应返回的商品类目、与商品类目对应的属性类目和商品进行点击查看的点击操作;根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、点击的商品类目和点击的属性类目; 存储所生成的日志。
9.如权利要求2所述的方法,其特征在于,所述对所述日志进行统计分析获得类目模型,具体包括根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和与商品类目对应的属性类目点击次数和/或点击概率;根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。
10.如权利要求9所述的方法,其特征在于,所述根据所述统计分析结果生成类目模型,具体包括判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。
11.一种基于垂直搜索的查询系统,其特征在于,包括查询服务器、建模服务器和日志服务器,其中,所述查询服务器,用于获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果;所述日志服务器,用于根据所述用户对所述查询服务器生成的最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给所述建模服务器;所述建模服务器,用于对所述日志进行统计分析,获得类目模型。
12.如权利要求11所述的系统,其特征在于,所述建模服务器,还用于将所述类目模型发送给所述查询服务器;所述查询服务器,还用于将所述最终查询结果发送给用户,使所述用户进行查看;将来自所述建模服务器的类目模型更新到所述类目模型库中。
13.如权利要求11所述的系统,其特征在于,所述类目模型还包括与所述商品类目对应的属性类目;所述查询服务器,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
14.如权利要求11所述的系统,其特征在于,所述日志服务器,具体用于获取用户对作为请求响应返回的商品类目、与商品类目对应的属性类目和商品进行点击查看的点击操作;根据点击操作生成日志,所述日志包括查询信息和对应的点击信息,所述点击信息包括点击的商品所在商品类目和所属商品属性、 点击的商品类目和点击的属性类目;存储所生成的日志。
15.如权利要求11所述的系统,其特征在于,所述建模服务器,具体用于根据所述日志记录中的查询信息和对应的点击信息对所述日志记录进行统计分析,获得统计分析结果,所述统计分析结果为与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重;所述权重为所述商品类目和与商品类目对应的属性类目点击次数和/或点击概率;根据所述统计分析结果生成类目模型,并将所述统计分析结果按照商品类目树进行排列。
16.如权利要求15所述的系统,其特征在于,所述建模服务器,具体用于判断与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重是否达到预设的权重门限;当达到预设的权重门限时,根据与所述查询信息对应的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重建立类目模型。
17.—种查询服务器,其特征在于,包括获取模块,用于获取用户的查询信息;查询模块,用于根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目,;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;合并模块,用于对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。
18.如权利要求17所述的服务器,其特征在于,所述查询服务器,还包括发送模块,用于将所述最终查询结果发送给用户,使所述用户进行查看,并使日志服务器根据所述用户对所述最终查询结果的点击操作和所述查询信息生成日志,并将所述日志发送给建模服务器进行统计分析获得类目模型并将所述类目模型更新到所述商品类目服务器的类目模型库中。
19.如权利要求17所述的服务器,其特征在于,所述类目模型还包括与所述商品类目对应的属性类目;所述查询模块,还用于根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目和与所述商品类目对应的属性类目。
20.如权利要求17所述的服务器,其特征在于,所述查询信息仅包括用户输入的关键字时,所述查询模块,具体包括判断子模块,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;匹配子模块,用于若判断子模块判断存在,则根据所述查询信息中的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写, 并进行再次判断,直到判断结果为存在并获取到匹配的类目模型为止;生成子模块,用于根据所获取的类目模型及其对应的权重和所获取的直达属性的属性类目及其对应权重,生成第一查询结果。
21.如权利要求17所述的服务器,其特征在于,所述查询信息包括用户输入的关键字和用户所选择的商品类目时,所述查询模块,具体包括判断子模块,用于判断类目模型对应的关键字中是否存在与所述查询信息中的关键字匹配的关键字;匹配子模块,用于若判断子模块判断存在,则根据所述用户输入的关键字在所述类目模型库中检索,查询并获取匹配的类目模型;否则,对所述查询信息中关键字进行改写,并进行再次判断,直到判断结果为存在并获取到与该关键字匹配的类目模型为止;提取子模块,用于从所获取的类目模型中获取与该查询信息中的商品类目匹配的类目模型;生成子模块,用于所述查询服务器获取与该商品类目匹配的类目模型中的商品类目及其对应的权重,生成第一查询结果。
22.如权利要求17所述的服务器,其特征在于,所述合并模块,具体包括第一合并子模块,用于获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重,其中第一合并结果中的权重根据同一商品类目来自两个查询结果的权重进行加权获得;第二合并子模块,用于获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重;权重提升子模块,用于对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;生成子模块,用于按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
23.如权利要求19所述的服务器,其特征在于,所述合并模块,具体包括 第一合并子模块,用于获取第一合并结果,所述第一合并结果为所述第一查询结果和所述第二查询结果中相同的商品类目及其对应的权重和与商品类目对应的属性类目及其对应权重,其中第一合并结果中的权重根据同一商品类目或属性类目的来自两个查询结果的权重进行加权获得;第二合并子模块,用于获取第二合并结果,所述第二合并结果为仅在所述第二查询结果中出现的商品类目及其对应的权重和与所述商品类目对应的属性类目及其对应权重;权重提升子模块,用于对第一合并结果中的权重进行权重提升,分别使第一合并结果中商品类目和属性类目的每一个权重高于第二合并结果中的商品类目和属性类目的每一个权重;生成子模块,用于按照商品类目对应的权重和与商品类目对应的属性类目对应的权重由高到低的顺序排列,并返回给用户。
全文摘要
本发明公开了一种基于垂直搜索的查询方法、系统和装置,该方法包括获取用户的查询信息;根据所述查询信息在类目模型库中检索与所述查询信息相匹配的类目模型,并根据检索到的类目模型生成第一查询结果,所述类目模型包括与用户输入的关键词对应的商品类目;并根据所述查询信息在商品库中搜索与所述查询信息相匹配的商品类目,生成第二查询结果;对所述第一查询结果和所述第二查询结果合并,生成最终查询结果。通过本申请,提高了用户查询结果与用户查询意图的相关度,提高用户体验感。
文档编号G06Q30/00GK102236663SQ20101016053
公开日2011年11月9日 申请日期2010年4月30日 优先权日2010年4月30日
发明者傅其乐, 宁伟, 聂绪平, 肖和, 莫毅 申请人:阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1