个性化数据搜索方法及装置的制造方法

文档序号:8543674阅读:240来源:国知局
个性化数据搜索方法及装置的制造方法
【技术领域】
[0001] 本申请涉及数据搜索领域,更具体地涉及一种个性化数据搜索方法及装置。
【背景技术】
[0002] 随着互联网业务迅速发展,网络中的数据量日益增加。数据搜索引擎已经成为帮 助用户在海量数据对象中找到自己满意的数据对象的重要工具。尽管数据搜索引擎可W在 海量数据对象中筛选出用户所需要的搜索结果(数据对象),但是,无论如何使用数据搜索 引擎来搜索数据对象,其关键技术都包含对搜索出的搜索结果中所有的数据对象进行排序 的输出处理。也即是说,用户输入一个查询词后,通过搜索找到对应的数据对象作为搜索结 果,并W-定的排序方式展示输出该些搜索结果。通常,数据搜索技术与用户本身的差异或 者用户的特点无关,仅与查询词有关。也就是说对不同用户使用同一个查询词,搜索到的全 部数据对象一致即搜索结果完全一致,并且,对搜索结果的输出展示的排序方式相同。因而 不同用户采用同一查询词搜索,最后看到的W-定顺序展示的搜索结果相同。由此,个性化 搜索技术逐渐兴起。所谓个性化搜索,是指不同用户能获得不同的输出展示排序的搜索结 果,并且该个结果输出更贴近用户搜索需求。具体地,不同用户采用同一查询词做搜索,所 得到的搜索结果,由于对应不同用户,其会按照不同的排序方式输出展示。此处,搜索结果 的排序方式考虑了用户在一个或多个维度上的特征,而用户在各维度上的特征可W体现出 用户的个性。其中,个性化搜索需要准确识别用户的个性化信息。其中,不同用户可W根据 其在各维度上的特征分为不同的群体。例如:性别维度,可W有男性、女性;年龄维度,可W 有儿童、青年、中年、老年;网络访问维度,可W有高、中、低;……;等等。用户可W在网站 注册过程中填写该些维度上的特征W确定所属群体,或根据用户行为使用算法识别出所属 群体。另外,搜索到的每个数据对象,在不同维度也有不同特点。例如:数据对象的类目维 度,可W有体育类目、人文类目,等等;数据对象的标志维度、数值范围维度、交互量维度,等 等。由于不同用户在某一维度上的特征可能不同,相应地,用户所偏爱/关注的搜索结果中 的数据对象的特征也不同。用户对其关注的数据对象可W通过用户行为数据分析而得到, 用户行为数据可W包括与用户对数据对象进行操作所产生的用户行为有关的各种数据。例 女口:用户对数据对象的点击、浏览、交互等行为。个性化搜索W用户为出发点,根据用户行为 数据,结合用户的特征和数据对象的特征对搜索结果中的数据对象进行个性化排序,W满 足不同用户对不同数据对象的需求。
[0003] 现有的个性化搜索,比如:主要W用户对数据对象的交互为目标,对用户行为、用 户在一个或多个维度上的特征、数据对象在一个或多个维度上的特征,训练概率预测模型, 由所述模型预测用户可能会对每个数据对象做交互的概率。所述概率可W影响数据对象在 输出排序时的排序分值。当根据用户输入的查询词进行搜索时,对搜索出的搜索结果(一个 或多个数据对象),按照用户可能会对每个数据对象做交互(或其他操作)的概率,计算每个 数据对象的排序分值,W分值从大到小的顺序,为用户展示搜索结果。但是,利用现有的预 测模型实施的个性化搜索技术,没有考虑查询词如ery的信息,在不同的查询词下用户行 为有不同的特点,比如,不同的查询词对应的用户有不同的意图。例如:在海量的商品搜索 中,男性用户搜"T恤"时倾向于购买男性T恤,而男性用户搜"连衣裙"时则仍然是购连衣 裙,此时由该查询词的信息,应该认为当前用户是属于"女性"群体,该时就不能仅仅根据用 户各维度的特征、数据对象各维度的特征、用户历史偏好(即对用户行为数据分析的历史信 息)来预测用户搜索意图。因为,根据男性用户的历史信息、或根据当前搜索关键词"连衣 裙"本身、或结合二者,都难W给出最符合当前用户真正需求(意图)的搜索结果排序,即导 致了搜索结果的输出排序不准确的缺陷。由此,需要改进搜索平台的个性化搜索处理性能, W提高搜索的输出结果准确度,为用户输出最合理最符合其搜索意图的结果。

【发明内容】

[0004] 基于上述现有技术中个性化搜索的缺陷,本申请的主要目的在于提供一种个性化 数据搜索方法和装置,W改进个性化搜索处理性能,从而最大限度为用户提供符合其搜索 意图的搜索结果、提高搜索平台的输出搜索结果的准确度。
[0005] 为了解决上述技术问题,本申请是通过W下技术方案来实现。
[0006] 根据本申请一个方面的实施例,提出一种个性化数据搜索方法,包括:根据当前用 户的搜索请求中的查询词搜索数据对象;依据历史行为日志,分别确定历史用户在利用所 述查询词的搜索访问过程中的第一行为特征,根据所述第一行为特征生成所述查询词的意 图向量;根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对所述数据对 象的第二行为特征,根据所述第二行为特征生成所述用户群体的偏好向量;计算查询词的 意图向量与每一用户群体的偏好向量的相似度;将所述相似度大于设定阔值时对应的用户 群体作为确定当前用户的意图偏好的参照群体;利用所述参照群体的历史行为特征调整所 述当前用户使用所述查询词搜索到的数据对象的排序。
[0007] 根据本申请的另一方面的实施例,提出一种个性化数据搜索装置,包括;搜索模 块,用于根据当前用户的搜索请求中的查询词搜索数据对象;第一获取模块,用于依据历史 行为日志,分别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据 所述第一行为特征生成所述查询词的意图向量;第二获取模块,用于根据用户属性,将历史 用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行为特征,根据所述 第二行为特征生成所述用户群体的偏好向量;计算模块,用于计算查询词的意图向量与每 一用户群体的偏好向量的相似度;确定模块,用于将所述相似度大于设定阔值时对应的用 户群体作为确定当前用户的意图偏好的参照群体;排序模块,用于利用所述参照群体的历 史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序。
[0008] 与现有技术相比,根据本申请的技术方案具有W下有益效果:
[0009] 本申请结合W往的用户行为数据及其记录的用户、数据对象、该用户对该数据对 象的一种或多种用户行为特征,结合查询词本身的维度或者说属性特征,即综合查询词的 意图和用户的历史信息来构建个性化模型,更准确的预测用户在数据对象上的交互概率。 由此,在用户进行数据搜索时,分析出当前查询词的意图所属用户群,在确定当前查询词意 图下所对应的用户群体之后,针对该用户群体所对应的数据对象,利用个性化模型对搜索 出的每个数据对象进行个性化分数计算,按照每个数据对象的个性化分数,对所有的数据 对象进行排序处理,进而可W通过该排序处理得到的顺序,展示该些作为搜索结果的数据 对象给用户。从而改进和提升了搜索平台的性能,提高输出给用户的搜索结果的准确性,为 用户输出最合理最符合其搜索意图的结果。进一步,还可W避免仅直接使用原始的查询词 作为个性化模型特征带来的数据稀疏问题。
【附图说明】
[0010] 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0011] 图1是根据本申请一实施例的个性化数据搜索方法的流程图;
[0012] 图2是根据本申请一实施例的个性化数据搜索方法中获取查询词的意图向量的 方法流程图;
[001引图3是根据本申请一实施例的个性化数据对象排序方法的流程图,W及
[0014] 图4是根据本申请一实施例的个性化数据搜索装置的结构图。
【具体实施方式】
[0015] 本申请的主要思想在于,通过获取到的当前用户的搜索请求中的查询词的意图向 量与每一用户群体的偏好向量的相似度的计算,来确定查询词意图与每一用户群体的相似 度;将相似度大于设定阔值时对应的用户群体作为确定当前用户的意图偏好的参照群体; 利用参照群体的历史行为特征调整当前用户使用查询词搜索到的数据对象的排序。可W有 效地提高输出给用户的搜索结果的准确性,为用户输出最合理最符合其搜索意图、个性的 结果。
[0016]为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及 相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一 部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做 出创造性劳动前提下所获得的所有其他实施例,
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1