一种用于提供搜索结果的方法、设备及系统的制作方法

文档序号:10624925阅读:536来源:国知局
一种用于提供搜索结果的方法、设备及系统的制作方法
【专利摘要】本申请的目的是提供一种用于提供搜索结果的方法及系统。与现有技术相比,本申请首先确定由用户设备所提供的查询序列所对应的第一类目优化信息及第二类目优化信息;再根据所述第一类目优化信息及所述第二类目优化信息确定查询序列所对应的类目预测信息;同时获取与所述查询序列相对应的一个或多个搜索结果;再基于所述搜索结果的类目信息与所述类目预测信息的匹配度信息,确定所述搜索结果的优先级信息。根据所述搜索结果的优先级信息展示所述一个或多个搜索结果。本申请能有效解决搜索结果与用户输入的查询序列所表达的意愿相差甚远的问题。
【专利说明】
-种用于提供搜索结果的方法、设备及系统
技术领域
[0001] 本申请设及计算机领域,尤其设及一种用于提供捜索结果的技术。
【背景技术】
[0002] 分类捜索引擎的类目体系按照从总到分逐级展开的方式进行划分。由于资源特点 和用户需求不同,类目体系的设置也并不相同。例如,在网购平台中,通常按照商品的类型 设置其捜索引擎的类目体系。然而,当用户输入"手机"运个查询词进行捜索时,捜索引擎 可W在手机类目和手机充电器类目中查询到多种商品。由上可见,在该两种类目下所查询 到的捜索结果完全不同。因此,仅通过查询词和类目之间的相关性,很难区分用户的意图。 因此,需要对现有的捜索引擎的查询机制进行改进。

【发明内容】

[0003] 本申请的目的是提供一种的用于提供捜索结果的方法、设备及系统。
[0004] 根据本申请的一个方面,提供了一种在第一网络设备端用于提供捜索结果的方 法,其中,该方法包括: 阳〇化]获取与用户设备所发送的查询序列相对应的一个或多个捜索结果;
[0006] 获取所述查询序列对应的类目预测信息;
[0007] 基于所述捜索结果的类目信息与所述类目预测信息的匹配度信息,确定所述捜索 结果的优先级信息;
[0008] 根据所述捜索结果的优先级信息将所述一个或多个捜索结果中至少一个提供至 所述用户设备。
[0009] 根据本申请的另一方面,还提供了一种在用户设备端用于提供捜索结果的方法, 其中,该方法包括:
[0010] 将查询序列发送至对应的第二网络设备;
[0011] 接收所述第二网络设备所返回的所述查询序列对应的类目预测信息;
[0012] 将所述查询序列及所述类目预测信息发送至对应的第一网络设备;
[0013] 接收所述第一网络设备返回的与所述查询序列相对应的一个或多个捜索结果。
[0014] 根据本申请的再一方面,还提供了一种在第二网络设备端用于确定查询序列对应 的类目预测信息的方法,其中,该方法包括:
[0015] 接收用户设备发送的查询序列;
[0016] 确定所述查询序列所对应的第一类目优化信息及第二类目优化信息;
[0017] 根据所述第一类目优化信息及所述第二类目优化信息确定所述查询序列所对应 的类目预测信息;
[0018] 将所述类目预测信息发送至所述用户设备。
[0019] 根据本申请的再一方面,还提供了一种用于提供捜索结果的第一网络设备,其包 括:
[0020] 结果获取装置,用于获取与用户设备所发送的查询序列相对应的一个或多个捜索 结果;
[0021] 类目获取装置,用于获取所述查询序列对应的类目预测信息;
[0022] 优先级确定装置,用于基于所述捜索结果的类目信息与所述类目预测信息的匹配 度信息,确定所述捜索结果的优先级信息;
[0023] 提供装置,用于根据所述捜索结果的优先级信息将所述一个或多个捜索结果中至 少一个提供至所述用户设备。
[0024] 根据本申请的再一方面,还提供了一种用于提供捜索结果的用户设备,其包括:
[00巧]第一发送装置,用于将查询序列发送至对应的第二网络设备;
[00%] 第一接收装置,用于接收所述第二网络设备所返回的所述查询序列对应的类目预 测信息;
[0027] 第Ξ发送装置,用于将所述查询序列及所述类目预测信息发送至对应的第一网络 设备;
[0028] 第Ξ接收装置,用于接收所述第一网络设备返回的与所述查询序列相对应的一个 或多个捜索结果。
[0029] 根据本申请的再一方面,还提供了一种用于确定查询序列对应的类目预测信息的 第二网络设备,其包括:
[0030] 第二接收装置,用于接收用户设备发送的查询序列;
[0031] 第二确定装置,用于确定所述查询序列所对应的第一类目优化信息及第二类目优 化信息;
[0032] 第四确定装置,用于根据所述第一类目优化信息及所述第二类目优化信息确定所 述查询序列所对应的类目预测信息;
[0033] 第二发送装置,用于将所述类目预测信息发送至所述用户设备。
[0034] 根据本申请的再一方面,还提供了一种用于提供捜索结果的系统,其中,该系统包 括如本申请一方面所述的第一网络设备、如本申请另一方面所述的用户设备及如本申请又 一方面所述的第二网络设备中的至少两个。
[0035] 与现有技术相比,本申请通过对用户设备所提供的查询序列进行类目预测,并根 据对应所述查询序列的各捜索结果所属的类目与所预测的类目的匹配程度来设置各所述 捜索结果的优先级,能有效解决捜索结果与用户输入的查询序列所表达的意愿相差甚远的 问题。此外,本申请还通过根据所述查询词与类目的映射关系,W及所述查询序列所对应的 类目层次结构信息,确定所述查询序列所对应的第一类目优化信息,或者根据所述查询词 与类目的映射关系,W及所述查询序列所对应的修改后查询序列,确定所述查询序列所对 应的第二类目优化信息,从而获取更准确的类目预测信息,有效抑制了基于点击比例进行 类目预测所导致的"马太效应",从而进一步提高用户获取信息的效率、提高用户设备的屏 幕利用率。
【附图说明】
[0036] 通过阅读参照W下附图所作的对非限制性实施例所作的详细描述,本申请的其它 特征、目的和优点将会变得更明显:
[0037] 图1示出根据本申请一个方面的一种用于提供捜索结果的系统示意图;
[0038] 图2示出根据本申请一个优选实施例的一种用于提供捜索结果的系统中第二网 络设备示意图;
[0039] 图3示出根据本申请另一个方面的一种用于提供捜索结果的方法流程图;
[0040] 图4示出根据本申请一个优选实施例的一种用于提供捜索结果的方法流程图。
[0041] 附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0042] 下面结合附图对本申请作进一步详细描述。
[0043] 在本申请一个典型的配置中,终端、服务网络的设备和可信方均包括一个或多个 处理器(CPU)、输入/输出接口、网络接口和内存。 W44] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/ 或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质 的示例。
[0045] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可W由任何方法 或技术来实现信息存储。信息可W是计算机可读指令、数据结构、程序的模块或其他数据。 计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、 动态随机存取存储器值RAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电 可擦除可编程只读存储器巧EPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘值VD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性 存储设备或任何其他非传输介质,可用于存储可W被计算设备访问的信息。按照本文中的 界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信 号和载波。
[0046] 图1示出根据本申请一个方面的一种用于提供捜索结果的系统。所述系统1包括 第一网络设备13、第二网络设备12和用户设备11。其中,所述第一网络设备13包括:结果 获取装置131、类目获取装置132、优先级确定装置133、提供装置134。第二网络设备12包 括:第二接收装置121、第二确定装置122、第四确定装置123、第二发送装置124。所述用户 设备11包括:第一发送装置111、第一接收装置112、第Ξ发送装置113、第Ξ接收装置114。
[0047] 具体地,所述第一发送装置111用于将查询序列发送至对应的第二接收装置121, 并由所述第二接收装置121传递给所述第二确定装置122。所述第二确定装置122用于确 定所述查询序列所对应的第一类目优化信息及第二类目优化信息。接着,由所述第四确定 装置123根据所述第一类目优化信息及所述第二类目优化信息确定所述查询序列所对应 的类目预测信息。再由所述第二发送装置将所述类目预测信息发送至所述第一接收装置 112,并由所述第一接收装置112将其传递给所述第Ξ发送装置113, W便所述第Ξ发送装 置113将所述查询序列及所述类目预测信息发送至所述第一网络设备13。所述第一网络设 备13将所述查询序列及所述类目预测信息分别分配给所述结果获取装置131和类目获取 装置132。其中,所述结果获取装置131还获取与所述查询序列相对应的一个或多个捜索结 果。接着,由所述优先级确定装置133基于所述捜索结果的类目信息与所述类目预测信息 的匹配度信息,确定所述捜索结果的优先级信息。再由所述提供装置134根据所述捜索结 果的优先级信息将所述一个或多个捜索结果中至少一个提供至所述第Ξ接收装置114, W 便所述用户设备11将所述第Ξ接收装置114所接收的捜索结果展示给用户。
[0048] 在此,所述第一网络设备13和第二网络设备12可W是同一网络设备,也可W是基 于通信连接的不同网络设备。在此,所述第一网络设备13和第二网络设备12均可由网络 主机、单个网络服务器、多个网络服务器集或多个服务器构成的云等实现。在此,云由基于 云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一 种,由一群松散禪合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解所 述第一网络设备13和第二网络设备12仅为举例,其他现有的或今后可能出现的其他网络 设备如可适用于本申请,也应包含在本申请保护范围W内,并在此W引用方式包含于此。
[0049] 在此,所述用户设备11包括一种能够按照事先设定或存储的指令,自动进行数值 计算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程 口阵列(FPGA)、数字处理器值SP)、嵌入式设备等。
[0050] 当用户通过人机交互装置在捜索栏中输入包含查询词和类目的查询序列并予W 提交时,所述第一发送装置111通过http、https等通信协议将所述查询序列提交给所述第 二接收装置121,再由所述第二接收装置121传递给所述第二确定装置122, W确定所述查 询序列所对应的第一类目优化信息及第二类目优化信息。
[0051] 在此,所述类目是指在捜索引擎中设置的用于帮助查找与所述查询词相关的捜索 结果所属的节点。在所述捜索引擎中包含基于树状的多层次体系结构的类目,每个捜索结 果所属的类目对应该体系结构中的一个节点。例如,类目为"女装"的节点下面可能包含: "连衣裙"、"毛衣"、"外套"等类目作为子节点;类目为"连衣裙"的节点下面还可W进一步的 包含:"厚连衣裙"、"薄连衣裙"等类目作为子节点。所述体系结构中的根节点可W为空节 点(即没有具体含义)。
[0052] 在此,所述第一类目优化信息和第二类目优化信息可W根据所述查询序列中的类 目W及所述类目下的层次结构来确定。
[0053] 具体地,所述第二确定装置122按照预设的两种类目优化算法分别确定对应所接 收的查询序列的第一类目优化信息和第二类目优化信息。其中,所述两种类目优化算法均 可W通过对捜索日志信息的分析来确定查询词所对应的类目及其层次结构下的各类目的 第一类目优化信息和第二类目优化信息。
[0054] 例如,所述第二确定装置122根据类目的体系结构确定所接收的类目下的层次结 构下的各类目,并在捜索日志信息中计算所接收的类目及其层次结构下的各类目中与所接 收的查询词相匹配的捜索结果的点击量,再按照所统计的对应各所述类目的点击量计算各 所述类目所对应的点击概率。接着,所述第二确定装置122执行的一个类目优化的算法是: 将所得到的各概率按照预设的概率区间进行分组,并对每组类目的概率进行均匀化,由此 得到包含类目和所对应的均匀化后的概率的第一类目优化信息。所述第二确定装置122执 行的另一个类目优化的算法是:将所得到的各概率进行开立方处理和归一化处理,由此得 到包含类目和所对应的归一化处理后的概率的第二类目优化信息。 阳化5] 需要说明的是,确定上述第一类目优化信息和第二类目优化信息的算法并不限于 此。事实上,所述第一类目优化信息和第二类目优化信息的确定算法可W交换使用。本领域 技术人员应能理解确定上述第一类目优化信息和第二类目优化信息的算法仅为举例,其他 现有的或今后可能出现的网络设备如可适用于本申请,也应包含在本申请保护范围w内, 并在此W引用方式包含于此。
[0056] 优选地,所述第二网络设备12还包括:统计装置125 (如图2所示)。所述统计装 置125用于对捜索日志信息进行统计处理,W获得查询词与类目的映射关系。对应的,所述 第二确定装置122用于根据所述查询词与类目的映射关系,确定所述查询序列所对应的第 一类目优化信息及第二类目优化信息。
[0057] 具体地,所述统计装置125根据捜索日志信息中的查询词、点击的捜索结果、点击 的捜索结果所属的类目进行统计处理,从而获得查询词与至少一个类目的映射关系,并予 W保存。当所述第二确定装置122得到一用户输入的查询序列时,所述第二确定装置122 根据所述统计装置125所提供的映射关系来确定所述查询序列中的查询词所对应的类目, 并根据通过所述映射关系所确定的类目及所述查询序列中的类目来确定所述查询序列所 对应的第一类目优化信息及第二类目优化信息。
[0058] 在此,所述第二确定装置122根据所得到的各类目确定所述查询序列所对应的第 一类目优化信息及第二类目优化信息的方式可如上所述。优选地,所述第二确定装置122 包括:用于确定第一类目优化信息的第一确定单元或同于确定第二类目优化信息的第二确 定单元。(均未予图示)
[0059] 其中,所述第一确定单元用于根据所述查询词与类目的映射关系,W及所述查询 序列所对应的类目层次结构信息,确定所述查询序列所对应的第一类目优化信息。
[0060] 需要说明的是,所述第一确定单元可W利用已描述的各算法来确定所述查询序列 所对应的第一类目优化信息。还可W利用如下方式来确定所述第一类目优化信息。
[0061] 还需要说明的是,所述第二确定装置122可W在用户第一次输入查询序列时,仅 将所述第一类目优化信息提供给第四确定装置123。当用户修改查询词时,利用所述第二确 定单元来确定第二类目优化信息。
[0062] 具体地,所述第一确定单元根据所述映射关系确定查询词所对应的类目,并根据 类目的体系结构确定所对应的类目的类目层次结构信息。接着,所述第一确定单元从捜索 日志中确定所述查询词所对应的类目、所述查询序列中的类目和各所述类目层次结构信息 中的各类目的点击次数。并利用公式1得到每个类目的得分。
[0063]
[0064] 其中,query为查询词,catx为根据所述映射关系所得到的类目、或所述查询序列 中的类目(可W是根节点类目),c为所述类目层次结构信息中的各类目。设用户在捜索的 时候指定query、甚至catx后,点击捜索结果所属的类目的集合为:ca (query, catx),其中, 类目c的点击次数为click (query, catx, c)。 阳0化]接着,所述第一确定单元在所述类目的体系结构中,从叶子类目向根节点类目,分 层次重新计算排序得分feset^i^efitiehuery, catx, C)如公式2所示。
[0066]
[0067] 其中,参数β控制父子类目之间点击比例对最终效果的影响。catx的子类目集为 subcatx,i为子类目集中的一个类目。
[0068] 如此,所述第一确定单元得到包含所述查询词所对应的各类目的排序得分的第一 类目优化信息。
[0069] 所述第二确定单元用于根据所述查询词与类目的映射关系,W及所述查询序列所 对应的修改后查询序列,确定所述查询序列所对应的第二类目优化信息。
[0070] 在此,当用户在面对当前的捜索结果不符合期望的时候,还可能会修改查询词进 行优化。所述修改后的查询序列对应于用户修改后查询词和/或类目等的查询序列。
[0071] 例如,用户捜索"火柴棍"(期望是一种户外品牌)的时候,如果返回的都是用于点 火使用的火柴棍,那么用户就会将查询词换成"火柴棍户外"。 阳072] 当修改后的查询词queryb是修改前的查询词querya的一个子意图串,那么设 querya的子意图串集合为:sub_querya。所述第二确定单元利用公式3来确定包含查询词 querya的查询序列的第二类目优化信息。 柳7引
公 式3
[0074] 其中,参数丫控制父子类目之间点击比例对最终效果的影响。subcatx为catx的 子类目集。
[00巧]如此,所述第二确定单元得到包含所述查询词所对应的各类目的排序得分的第二 类目优化信息。
[0076] 接着,所述第二确定装置122将所得到的第一类目优化信息和第二类目优化信息 提供给所述第四确定装置123。
[0077] 所述第四确定装置123根据所述第一类目优化信息及所述第二类目优化信息确 定所述查询序列所对应的类目预测信息。
[0078] 具体地,所述第四确定装置123可W通过综合评价所述第一类目优化信息和第二 类目优化信息中各类目的概率或得分,进而确定所述查询序列的类目预测信息。
[0079] 例如,所述第一类目优化信息中类目al的概率为pi、类目a2的概率为p2,所述 第二类目优化信息中类目曰1的概率为ρΓ、类目曰2的概率为p2'。所述第四确定装置123 先将概率ρ1、ρ2、ρΓ、和p2'按照类目的数量进行归一化处理,如此得到所述查询序列的类 目预测信息包括:类目al及所对应的概率为
类目a2及所对应的概率 为:
[0080] 优选地,所述第四确定装置123根据所述第一类目优化信息及所述第二类目优化 信息加权更新所述查询序列所对应的类目预测信息。
[0081] 例如,所述第四确定装置123利用公式4对所述第一类目优化信息和第二类目优 化信息进行加权更新,并得到所述查询序列所对应的类目预测信息。
[0082] ffinai (query, catx, C)
[0083] = (1-a-b) f (query, catx, c) 公式 4 阳084] +afcat_"fine (query, catx, c) +bfwrd_"fine (query, catx, c)
[00化]其中,参数a, b分别控制第一类目优化信息和第二类目优化信息对最终预测效果 的影响。
[0086] 利用公式4,所述第四确定装置123得到类目预测信息包括:所述第一类目优化信 息和第二类目优化信息中的各类目及其各自所对应的加权得分ffmei (query, catx,C)。
[0087] 所述第四确定装置123将所得到的类目预测信息传递给所述第二发送装置,并由 其发送给所述第一接收装置112。所述第一接收装置112再通过所述第Ξ发送装置113将 所述类目预测信息和查询序列发送至所述第一网络设备13。所述第一网络设备13查询所 述查询序列所对应的至少一个捜索结果,并将各捜索结果提供给所述结果获取装置131,同 时还将所得到的类目预测信息提供给所述类目获取装置132。所述结果获取装置131和类 目获取装置132分别将所获取的捜索结果和类目预测信息提供给优先级确定装置133。
[0088] 需要说明的是,所述第四确定装置123还可W直接将所述类目预测信息发送至所 述第一网络设备13中的类目获取装置132。
[0089] 所述优先级确定装置133基于所述捜索结果的类目信息与所述类目预测信息的 匹配度信息,确定所述捜索结果的优先级信息。
[0090] 具体地,所述优先级确定装置133将各捜索结果的类目信息与所述类目预测信息 中的各类目进行匹配,按照完全一致、部分一致、不一致确定各捜索结果的类目信息的优先 级信息,并将所确定的优先级信息与各所述捜索结果相对应。
[0091] 优选地,所述优先级确定装置133基于所述匹配度信息,W及所述捜索结果与所 述查询序列的内容相关性信息,确定所述捜索结果的优先级信息。
[0092] 具体地,所述优先级确定装置133将预设的匹配度信息和内容相关性信息进行加 权处理,来确定所述捜索结果的优先级信息。
[0093] 例如,所述捜索结果包括:捜索结果bl、捜索结果b2、捜索结果b3。所述捜索结果 bl和b2所对应的类目为类目cl,所述捜索结果b3所对应的类目为c2。所述类目预测信息 中的类目包括:cl、c3。所述查询序列包括:查询词"a油b"。
[0094] 所述优先级确定装置133通过匹配类目得到捜索结果bl和b2的优先级信息Y1 和捜索结果b3的优先级信息Y2,其中,YDY2。同时,再通过文字匹配得到捜索结果bl的 中包含"a油b",完全匹配,则确定内容相关性信息为Y3 ;捜索结果b2中包含"aa",部分匹 配,则确定内容相关性信息为Y4,捜索结果b3中包含"bb",部分匹配,则确定内容相关性信 息为Y4,其中,Υ3〉Υ4。
[0095] 所述优先级确定装置133根据预设的类目匹配度的权值为al%,内容相关性的 权值为曰2%,其中,al〉a2,得到捜索结果bl的优先级信息为(al%巧1+曰2% *Υ3),捜索结 果b2的优先级信息为(al %巧1+曰2% *Υ4),捜索结果b3的优先级信息为(al %巧化曰2% 巧4)。
[0096] 所述优先级确定装置133还可W根据类目预测信息中的各类目的得分或概率作 为权值来确定各捜索结果的优先级信息。
[0097] 继续上述示例,所述优先级确定装置133确定所述捜索结果bl的优先级信息为 ffineLclbl% Yl+a2% Y3)、所述捜索结果 b2 的优先级信息为 Yl+a2% Y4)、所 述捜索结果b3的优先级信息为Y化a2% Y4)。其中,ffi。。!。1为所述类目预测 信息中的类目cl的得分,为所述优先级确定装置133预设的与所述类目预测信息中 各类目不匹配的各类目的得分。
[0098] 需要说明的是,本领域技术人员应能理解所述确定所述捜索结果的优先级信息的 方式仅为举例,事实上,所述优先级确定装置133还可W通过加权平均等方式确定各捜索 结果的优先级信息。除此W外,其他现有的或今后可能出现的确定所述捜索结果的优先级 信息的方式如可适用于本申请,也应包含在本申请保护范围W内,并在此W引用方式包含 于此。
[0099] 所述优先级确定装置133在确定了各捜索结果的优先级信息后,将各捜索结果和 相应的优先级信息通过所述提供装置134提供给所述第Ξ接收装置114,由所述第Ξ接收 装置114将至少一个所述捜索结果展示给用户。
[0100] 在此,所述提供装置134将所有的捜索结果和相应的优先级信息一并发送给所述 第Ξ接收装置114,由所述第Ξ接收装置114根据所在用户设备11屏幕尺寸来将捜索结果 按照优先级由高到低的顺序全部或分页的予W展示。 阳101] 优选地,所述提供装置134根据所述捜索结果的优先级信息对所述一个或多个捜 索结果中至少一个进行排序处理;再将对应排序结果提供至所述用户设备11。 阳102] 具体地,所述提供装置134按照各捜索结果的优先级信息由优先级从高到低的顺 序将所述一个或多个捜索结果提供至所述第Ξ接收装置114。
[0103] 在此,所述提供装置134可W将所有捜索结果设置在一个页面中提供给所述第Ξ 接收装置114。还可W通过分页技术将部分捜索结果提供给所述第Ξ接收装置114。
[0104] 图3示出根据本申请一个方面的一种用于提供捜索结果的方法,所述方法主要由 如图1所示的系统来执行。所述系统包括第一网络设备、第二网络设备和用户设备。其中, 所述第一网络设备执行步骤56、57、58。第二网络设备执行步骤52、53、54。所述用户设备 执行步骤S1、S5、S9。
[01化]具体地,在步骤S1中,所述用户设备将查询序列发送至所述第二网络设备。在步 骤S2中,所述第二网络设备确定所述查询序列所对应的第一类目优化信息及第二类目优 化信息。接着,在步骤S3中,所述第二网络设备根据所述第一类目优化信息及所述第二类 目优化信息确定所述查询序列所对应的类目预测信息。在步骤S4中,所述第二网络设备将 所述类目预测信息发送至所述用户设备。在步骤S5中,所述用户设备将所述查询序列及所 述类目预测信息发送至所述第一网络设备。在步骤S6中,所述第一网络设备还获取与所述 查询序列相对应的一个或多个捜索结果。在步骤S7中,所述第一网络设备基于所述捜索结 果的类目信息与所述类目预测信息的匹配度信息,确定所述捜索结果的优先级信息。在步 骤S8中,所述第一网络设备根据所述捜索结果的优先级信息将所述一个或多个捜索结果 中至少一个提供至所述用户设备。在步骤S9中,所述用户设备将所接收的捜索结果展示给 用户。
[0106] 在此,所述第一网络设备和第二网络设备可W是同一网络设备,也可W是基于通 信连接的不同网络设备。在此,所述第一网络设备和第二网络设备均可由网络主机、单个网 络服务器、多个网络服务器集或多个服务器构成的云等实现。在此,云由基于云计算(Cloud Computing)的大量主机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散 禪合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解所述第一网络设 备和第二网络设备仅为举例,其他现有的或今后可能出现的其他网络设备如可适用于本申 请,也应包含在本申请保护范围W内,并在此W引用方式包含于此。 阳107] 在此,所述用户设备包括一种能够按照事先设定或存储的指令,自动进行数值计 算和信息处理的电子设备,其硬件包括但不限于微处理器、专用集成电路(ASIC)、可编程口 阵列(FPGA)、数字处理器值SP)、嵌入式设备等。
[0108] 当用户通过人机交互装置在捜索栏中输入包含查询词和类目的查询序列并予W 提交时,所述用户设备通过http、https等通信协议将所述查询序列提交给所述第二网络 设备。所述第二网络设备确定所述查询序列所对应的第一类目优化信息及第二类目优化信 息。
[0109] 在此,所述类目是指在捜索引擎中设置的用于帮助查找与所述查询词相关的捜索 结果所属的节点。在所述捜索引擎中包含基于树状的多层次体系结构的类目,每个捜索结 果所属的类目对应该体系结构中的一个节点。例如,类目为"女装"的节点下面可能包含: "连衣裙"、"毛衣"、"外套"等类目作为子节点;类目为"连衣裙"的节点下面还可W进一步的 包含:"厚连衣裙"、"薄连衣裙"等类目作为子节点。所述体系结构中的根节点可W为空节 点(即没有具体含义)。
[0110] 在此,所述第一类目优化信息和第二类目优化信息可W根据所述查询序列中的类 目W及所述类目下的层次结构来确定。 阳111] 具体地,所述第二网络设备按照预设的两种类目优化算法分别确定对应所接收的 查询序列的第一类目优化信息和第二类目优化信息。其中,所述两种类目优化算法均可W 通过对捜索日志信息的分析来确定查询词所对应的类目及其层次结构下的各类目的第一 类目优化信息和第二类目优化信息。
[0112] 例如,所述第二网络设备根据类目的体系结构确定所接收的类目下的层次结构下 的各类目,并在捜索日志信息中计算所接收的类目及其层次结构下的各类目中与所接收的 查询词相匹配的捜索结果的点击量,再按照所统计的对应各所述类目的点击量计算各所述 类目所对应的点击概率。接着,所述第二网络设备执行的一个类目优化的算法是:将所得到 的各概率按照预设的概率区间进行分组,并对每组类目的概率进行均匀化,由此得到包含 类目和所对应的均匀化后的概率的第一类目优化信息。所述第二网络设备执行的另一个类 目优化的算法是:将所得到的各概率进行开立方处理和归一化处理,由此得到包含类目和 所对应的归一化处理后的概率的第二类目优化信息。
[0113] 需要说明的是,确定上述第一类目优化信息和第二类目优化信息的算法并不限于 此。事实上,所述第一类目优化信息和第二类目优化信息的确定算法可W交换使用。本领域 技术人员应能理解确定上述第一类目优化信息和第二类目优化信息的算法仅为举例,其他 现有的或今后可能出现的网络设备如可适用于本申请,也应包含在本申请保护范围W内, 并在此W引用方式包含于此。
[0114] 优选地,所述第二网络设备在执行步骤S2之前还执行步骤S10 (如图4所示)。在 步骤S10中,所述第二网络设备对捜索日志信息进行统计处理,W获得查询词与类目的映 射关系。接着,所述第二网络设备根据所述查询词与类目的映射关系,确定所述查询序列所 对应的第一类目优化信息及第二类目优化信息。
[0115] 具体地,所述第二网络设备根据捜索日志信息中的查询词、点击的捜索结果、点击 的捜索结果所属的类目进行统计处理,从而获得查询词与至少一个类目的映射关系,并予 W保存。当所述第二网络设备得到一用户输入的查询序列时,根据所述映射关系来确定所 述查询序列中的查询词所对应的类目,并根据通过所述映射关系所确定的类目及所述查询 序列中的类目来确定所述查询序列所对应的第一类目优化信息及第二类目优化信息。
[0116] 在此,所述第二网络设备根据所得到的各类目确定所述查询序列所对应的第一类 目优化信息及第二类目优化信息的方式可如上所述。优选地,所述步骤S2包括:步骤S21 或步骤S22。(均未予图示)
[0117] 在步骤S21中,所述第二网络设备根据所述查询词与类目的映射关系,W及所述 查询序列所对应的类目层次结构信息,确定所述查询序列所对应的第一类目优化信息。
[0118] 需要说明的是,所述第二网络设备可W利用已描述的各算法来确定所述查询序列 所对应的第一类目优化信息。还可W利用如下方式来确定所述第一类目优化信息。
[0119] 还需要说明的是,所述第二网络设备可W在用户第一次输入查询序列时,仅确定 所述第一类目优化信息。当用户修改查询词时,再利用所述步骤S22来确定第二类目优化 信息。
[0120] 具体地,所述第二网络设备根据所述映射关系确定查询词所对应的类目,并根据 类目的体系结构确定所对应的类目的类目层次结构信息。接着,所述第二网络设备从捜索 日志中确定所述查询词所对应的类目、所述查询序列中的类目和各所述类目层次结构信息 中的各类目的点击次数。并利用公式1得到每个类目的得分。
[0121]
[0122] 其中,query为查询词,catx为根据所述映射关系所得到的类目、或所述查询序列 中的类目(可W是根节点类目),c为所述类目层次结构信息中的各类目。设用户在捜索的 时候指定query、甚至catx后,点击捜索结果所属的类目的集合为:ca (query, catx),其中, 类目c的点击次数为click (query, catx, c)。
[0123] 接着,所述第二网络设备在所述类目的体系结构中,从叶子类目向根节点类目,分 层次重新计算排序得分feset^i^efitiehuery, catx, C)如公式2所示。 阳 124]
[0125] 其中,参数β控制父子类目之间点击比例对最终效果的影响。catx的子类目集为 subcatx,i为子类目集中的一个类目。
[01%] 如此,所述第二网络设备得到包含所述查询词所对应的各类目的排序得分的第一 类目优化信息。
[0127] 在步骤S22中,所述第二网络设备根据所述查询词与类目的映射关系,W及所述 查询序列所对应的修改后查询序列,确定所述查询序列所对应的第二类目优化信息。
[0128] 在此,当用户在面对当前的捜索结果不符合期望的时候,还可能会修改查询词进 行优化。所述修改后的查询序列对应于用户修改后查询词和/或类目等的查询序列。
[0129] 例如,用户捜索"火柴棍"(期望是一种户外品牌)的时候,如果返回的都是用于点 火使用的火柴棍,那么用户就会将查询词换成"火柴棍户外"。
[0130] 当修改后的查询词queryb是修改前的查询词querya的一个子意图串,那么设 querya的子意图串集合为:sub_querya。所述第二网络设备利用公式3来确定包含查询词 querya的查询序列的第二类目优化信息。 阳131]
公 式3
[0132] 其中,参数丫控制父子类目之间点击比例对最终效果的影响。洲bcatx为catx的 子类目集。
[0133] 如此,所述第二网络设备得到包含所述查询词所对应的各类目的排序得分的第二 类目优化信息。
[0134] 接着,在步骤S3中,所述第二网络设备根据所述第一类目优化信息及所述第二类 目优化信息确定所述查询序列所对应的类目预测信息。
[0135] 具体地,所述第二网络设备可W通过综合评价所述第一类目优化信息和第二类目 优化信息中各类目的概率或得分,进而确定所述查询序列的类目预测信息。
[0136] 例如,所述第一类目优化信息中类目al的概率为pi、类目a2的概率为p2,所述第 二类目优化信息中类目al的概率为ρΓ、类目曰2的概率为p2'。所述第二网络设备先将概 率口1、92、91'、和92'按照类目的数量进行归一化处理,如
此得到所述 查询序列的类目预测信息包括:类目al及所对应的概率为:类目a2及所对应的概率为: 阳 137]
°
[0138] 优选地,所述第二网络设备根据所述第一类目优化信息及所述第二类目优化信息 加权更新所述查询序列所对应的类目预测信息。
[0139] 例如,所述第二网络设备利用公式4对所述第一类目优化信息和第二类目优化信 息进行加权更新,并得到所述查询序列所对应的类目预测信息。
阳143] 其中,参数a, b分别控制第一类目优化信息和第二类目优化信息对最终预测效果 的影响。
[0144] 利用公式4,所述第二网络设备得到类目预测信息包括:所述第一类目优化信息 和第二类目优化信息中的各类目及其各自所对应的加权得分ffmei (query, catx,C)。
[0145] 接着,所述第二网络设备将所得到的类目预测信息传递给所述用户设备。所述用 户设备再将所述类目预测信息和查询序列发送至所述第一网络设备。所述第一网络设备查 询所述查询序列所对应的至少一个捜索结果。当所述第一网络设备查询到所述捜索结果 时,执行步骤S7。
[0146] 需要说明的是,所述二网络设备还可W直接将所述类目预测信息发送至所述第一 网络设备。
[0147] 在步骤S7中,所述第一网络设备基于所述捜索结果的类目信息与所述类目预测 信息的匹配度信息,确定所述捜索结果的优先级信息。
[0148] 具体地,所述第一网络设备将各捜索结果的类目信息与所述类目预测信息中的各 类目进行匹配,按照完全一致、部分一致、不一致确定各捜索结果的类目信息的优先级信 息,并将所确定的优先级信息与各所述捜索结果相对应。
[0149] 优选地,所述第一网络设备基于所述匹配度信息,W及所述捜索结果与所述查询 序列的内容相关性信息,确定所述捜索结果的优先级信息。
[0150] 具体地,所述第一网络设备将预设的匹配度信息和内容相关性信息进行加权处 理,来确定所述捜索结果的优先级信息。 阳151] 例如,所述捜索结果包括:捜索结果bl、捜索结果b2、捜索结果b3。所述捜索结果 bl和b2所对应的类目为类目cl,所述捜索结果b3所对应的类目为c2。所述类目预测信息 中的类目包括:cl、c3。所述查询序列包括:查询词"a油b"。 阳152] 所述第一网络设备通过匹配类目得到捜索结果bl和b2的优先级信息Y1和捜索 结果b3的优先级信息Y2,其中,YDY2。同时,再通过文字匹配得到捜索结果bl的中包含 "a油b",完全匹配,则确定内容相关性信息为Y3 ;捜索结果b2中包含"aa",部分匹配,则确 定内容相关性信息为Y4,捜索结果b3中包含"bb",部分匹配,则确定内容相关性信息为Y4, 其中,Υ3〉Υ4。
[0153] 所述第一网络设备根据预设的类目匹配度的权值为al%,内容相关性的权值为 曰2%,其中,al〉a2,得到捜索结果bl的优先级信息为(al%巧1+曰2% *Υ3),捜索结果b2的 优先级信息为(al%巧1+曰2% *Υ4),捜索结果b3的优先级信息为(al%巧化曰2%巧4)。
[0154] 所述第一网络设备还可W根据类目预测信息中的各类目的得分或概率作为权值 来确定各捜索结果的优先级信息。
[0K5] 继续上述示例,所述第一网络设备确定所述捜索结果bl的优先级信息为 cl (al % Yl+a2 % Y3)、所述捜索结果b2的优先级信息为ffmei心(al % Yl+a2 % Y4)、所述捜索 结果b3的优先级信息为ffmei心(al% Y化曰2% Y4)。其中,。1为所述类目预测信息中 的类目cl的得分,为所述第一网络设备预设的与所述类目预测信息中各类目不匹配 的各类目的得分。 阳156] 需要说明的是,本领域技术人员应能理解所述确定所述捜索结果的优先级信息的 方式仅为举例,事实上,所述第一网络设备还可W通过加权平均等方式确定各捜索结果的 优先级信息。除此W外,其他现有的或今后可能出现的确定所述捜索结果的优先级信息的 方式如可适用于本申请,也应包含在本申请保护范围W内,并在此W引用方式包含于此。 阳157] 所述第一网络设备在确定了各捜索结果的优先级信息后,将各捜索结果和相应的 优先级信息提供给所述用户设备,由所述用户设备将至少一个所述捜索结果展示给用户。
[0158] 在此,所述第一网络设备将所有的捜索结果和相应的优先级信息一并发送给所述 用户设备,由所述用户设备根据所在用户设备屏幕尺寸来将捜索结果按照优先级由高到低 的顺序全部或分页的予W展示。
[0159] 优选地,所述第一网络设备根据所述捜索结果的优先级信息对所述一个或多个捜 索结果中至少一个进行排序处理;再将对应排序结果提供至所述用户设备。
[0160] 具体地,所述第一网络设备按照各捜索结果的优先级信息由优先级从高到低的顺 序将所述一个或多个捜索结果提供至所述用户设备。 阳161] 在此,所述第一网络设备可W将所有捜索结果设置在一个页面中提供给所述用户 设备。还可W通过分页技术将部分捜索结果提供给所述用户设备。
[0162] 综上所述,本申请的用于提供捜索结果的方法及系统,通过对用户设备所提供的 查询序列进行类目预测,并根据对应所述查询序列的各捜索结果所属的类目与所预测的类 目的匹配程度来设置各所述捜索结果的优先级,能有效解决捜索结果与用户输入的查询序 列所表达的意愿相差甚远的问题;另外,通过收集用户调整前后的查询词,来调整所预测的 类目的倾向性,有效降低了捜索过程所产生的"马太效应"满有,通过各所述捜索结果所对 应类目信息与类目预测信息的匹配程度、W及查询序列与各捜索结果的内容相关性来确定 各捜索结果的优先级信息,能够将最符合用户意愿的捜索结果优先展示给用户,W便用户 如愿得到所希望的捜索结果,有效提高了用户的使用感受。所W,本申请有效克服了现有技 术中的种种缺点而具高度产业利用价值。
[0163] 对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在 不背离本申请的精神或基本特征的情况下,能够W其他的具体形式实现本申请。因此,无论 从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权 利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有 变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所设及的权利要求。此 夕F,显然"包括"一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多 个单元或装置也可W由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来 表示名称,而并不表示任何特定的顺序。
【主权项】
1. 一种在第一网络设备端用于提供搜索结果的方法,其中,该方法包括: 获取与用户设备所发送的查询序列相对应的一个或多个搜索结果; 获取所述查询序列对应的类目预测信息; 基于所述搜索结果的类目信息与所述类目预测信息的匹配度信息,确定所述搜索结果 的优先级息; 根据所述搜索结果的优先级信息将所述一个或多个搜索结果中至少一个提供至所述 用户设备。2. 根据权利要求1所述的方法,其中,所述获取所述查询序列对应的类目预测信息包 括: 接收所述用户设备发送的所述查询序列所对应的类目预测信息。3. 根据权利要求1或2所述的方法,其中,所述确定所述搜索结果的优先级信息包括: 基于所述匹配度信息,以及所述搜索结果与所述查询序列的内容相关性信息,确定所 述搜索结果的优先级信息。4. 根据权利要求1至3中任一项所述的方法,其中,所述根据所述搜索结果的优先级信 息将所述一个或多个搜索结果中至少一个提供至所述用户设备包括: 根据所述搜索结果的优先级信息对所述一个或多个搜索结果中至少一个进行排序处 理; 将对应排序结果提供至所述用户设备。5. -种在用户设备端用于提供搜索结果的方法,其中,该方法包括: 将查询序列发送至对应的第二网络设备; 接收所述第二网络设备所返回的所述查询序列对应的类目预测信息; 将所述查询序列及所述类目预测信息发送至对应的第一网络设备; 接收所述第一网络设备返回的与所述查询序列相对应的一个或多个搜索结果。6. 根据权利要求5所述的方法,其中,所述一个或多个搜索结果按所述搜索结果的优 先级信息排序,其中,所述优先级信息是基于所述搜索结果的类目信息与所述类目预测信 息的匹配度信息确定的。7. -种在第二网络设备端用于确定查询序列对应的类目预测信息的方法,其中,该方 法包括: 接收用户设备发送的查询序列; 确定所述查询序列所对应的第一类目优化信息及第二类目优化信息; 根据所述第一类目优化信息及所述第二类目优化信息确定所述查询序列所对应的类 目预测信息; 将所述类目预测信息发送至所述用户设备。8. 根据权利要求7所述的方法,其中,所述根据所述第一类目优化信息及所述第二类 目优化信息确定所述查询序列所对应的类目预测信息包括: 根据所述第一类目优化信息及所述第二类目优化信息加权更新所述查询序列所对应 的类目预测信息。9. 根据权利要求7或8所述的方法,其中,该方法还包括: 对搜索日志信息进行统计处理,以获得查询词与类目的映射关系; 其中,所述步骤B包括: 根据所述查询词与类目的映射关系,确定所述查询序列所对应的第一类目优化信息及 第二类目优化信息。10. 根据权利要求9所述的方法,其中,所述确定所述查询序列所对应的第一类目优化 信息及第二类目优化信息包括: 根据所述查询词与类目的映射关系,以及所述查询序列所对应的类目层次结构信息, 确定所述查询序列所对应的第一类目优化信息;或 根据所述查询词与类目的映射关系,以及所述查询序列所对应的修改后查询序列,确 定所述查询序列所对应的第二类目优化信息。11. 一种用于提供搜索结果的第一网络设备,其中,该第一网络设备包括: 结果获取装置,用于获取与用户设备所发送的查询序列相对应的一个或多个搜索结 果; 类目获取装置,用于获取所述查询序列对应的类目预测信息; 优先级确定装置,用于基于所述搜索结果的类目信息与所述类目预测信息的匹配度信 息,确定所述搜索结果的优先级信息; 提供装置,用于根据所述搜索结果的优先级信息将所述一个或多个搜索结果中至少一 个提供至所述用户设备。12. 根据权利要求11所述的第一网络设备,其中,所述类目获取装置用于: 接收所述用户设备发送的所述查询序列所对应的类目预测信息。13. 根据权利要求11或12所述的第一网络设备,其中,所述优先级确定装置用于: 基于所述匹配度信息,以及所述搜索结果与所述查询序列的内容相关性信息,确定所 述搜索结果的优先级信息。14. 根据权利要求11至13中任一项所述的第一网络设备,其中,所述提供装置用于: 根据所述搜索结果的优先级信息对所述一个或多个搜索结果中至少一个进行排序处 理; 将对应排序结果提供至所述用户设备。15. -种用于提供搜索结果的用户设备,其中,该用户设备包括: 第一发送装置,用于将查询序列发送至对应的第二网络设备; 第一接收装置,用于接收所述第二网络设备所返回的所述查询序列对应的类目预测信 息; 第三发送装置,用于将所述查询序列及所述类目预测信息发送至对应的第一网络设 备; 第三接收装置,用于接收所述第一网络设备返回的与所述查询序列相对应的一个或多 个搜索结果。16. 根据权利要求15所述的用户设备,其中,所述一个或多个搜索结果按所述搜索结 果的优先级信息排序,其中,所述优先级信息是基于所述搜索结果的类目信息与所述类目 预测信息的匹配度信息确定的。17. -种用于确定查询序列对应的类目预测信息的第二网络设备,其中,该第二网络设 备包括: 第二接收装置,用于接收用户设备发送的查询序列; 第二确定装置,用于确定所述查询序列所对应的第一类目优化信息及第二类目优化信 息; 第四确定装置,用于根据所述第一类目优化信息及所述第二类目优化信息确定所述查 询序列所对应的类目预测信息; 第二发送装置,用于将所述类目预测信息发送至所述用户设备。18. 根据权利要求17所述的第二网络设备,其中,所述第四确定装置用于: 根据所述第一类目优化信息及所述第二类目优化信息加权更新所述查询序列所对应 的类目预测信息。19. 根据权利要求17或18所述的第二网络设备,其中,该第二网络设备还包括: 统计装置,用于对搜索日志信息进行统计处理,以获得查询词与类目的映射关系; 其中,所述第二确定装置用于: 根据所述查询词与类目的映射关系,确定所述查询序列所对应的第一类目优化信息及 第二类目优化信息。20. 根据权利要求19所述的第二网络设备,其中,所述第二确定装置包括: 第一确定单元,用于根据所述查询词与类目的映射关系,以及所述查询序列所对应的 类目层次结构信息,确定所述查询序列所对应的第一类目优化信息;或 第二确定单元,用于根据所述查询词与类目的映射关系,以及所述查询序列所对应的 修改后查询序列,确定所述查询序列所对应的第二类目优化信息。21. -种用于提供搜索结果的系统,其中,该系统包括如权利要求11至14中任一项所 述的第一网络设备、如权利要求15或16所述的用户设备及如权利要求17至20中任一项 所述的第二网络设备中的至少两个。
【文档编号】G06F17/30GK105989156SQ201510094491
【公开日】2016年10月5日
【申请日】2015年3月3日
【发明人】姚建强
【申请人】阿里巴巴集团控股有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1