一种个性化数据搜索方法和装置的制造方法

文档序号:8361464阅读:327来源:国知局
一种个性化数据搜索方法和装置的制造方法
【技术领域】
[0001] 本申请涉及数据搜索领域,更具体地涉及一种个性化数据搜索方法和装置。
【背景技术】
[0002] 网络中的数据量日益增加。数据搜索引擎已经成为帮助用户在海量数据对象中找 到自己满意数据对象的重要工具。数据搜索引擎的使用方式多种多样,用户可以输入一个 查询的关键词(查询词),在海量数据对象中筛选出与该查询词相匹配的搜索结果(数据对 象)。但是,无论如何使用数据搜索引擎来搜索数据对象,其关键技术都包含对搜索出的搜 索结果中所有的数据对象进行排序的输出处理。也即是说,用户输入一个查询词后,通过搜 索找到对应的数据对象作为搜索结果,并以一定的排序方式展示输出这些搜索结果。现有 技术中,数据搜索技术与用户本身的差异或者用户的特点无关,仅与查询词有关。也就是说 对不同用户使用同一个查询词,搜索到的全部数据对象一致即搜索结果完全一致,并且,对 搜索结果的输出展示的排序方式相同,因而不同用户采用同一查询词搜索,最后看到的搜 索结果相同。
[0003] 如果,同一查询词搜索出的搜索结果以及搜索结果的排序方式相同,则不能为不 同特点的用户,提供最合适、最准确的搜索结果,如:不能向特定用户提供,最符合该用户希 望的、通过其查询词在海量数据中找到的最准确的结果。从而,导致对于用户来说,搜索结 果不准确、不满意,搜索平台的性能弱、效率低,还需要用户人工浏览数量庞大的搜索结果, 进而,使得后续用户的浏览、访问等用户行为效率低,还使得对搜索到的数据对象的用户行 为减少。其中用户的特点即用户在各个维度上的特征,包括:用户的性别、年龄、工作、偏好 等。
[0004] 针对上述情形个性化搜索逐渐兴起。所谓个性化搜索,是指不同用户能获得不同 的搜索结果。具体说,不同用户采用同一查询词做搜索,所得到的搜索结果,由于对应不同 用户,其会按照不同的排序方式输出展示。这里的排序方式,考虑了用户在一个或多个维度 上的特征。而用户的维度可以体现出用户的个性。例如:性别维度,可以有男性、女性;年 龄维度,可以有儿童、青年、中年、老年;网络访问频率维度,可以有高、中、低;帐号维度,可 以有帐号A、帐号B,……;等等。另外,搜索到的数据对象,在不同维度也有不同特点。例 如:数据对象的类别可以作为维度之一,即类别维度。在类别维度上,数据对象的特征可以 有体育类、人文类,等等。由于不同用户在某一维度上可能具有不同的特征,相应地,用户所 偏爱/关注的搜索结果中的数据对象的特征也不同。而用户对其关注的数据对象可以通过 用户行为数据分析而得到,用户行为数据可以包括与用户对数据对象进行操作所产生的用 户行为有关的各种数据。例如:用户对数据对象的点击、浏览、交互等行为。个性化搜索以 用户为出发点,根据用户行为数据,结合用户的特征和数据对象的特征对搜索结果中的数 据对象进行个性化排序,以满足不同用户对不同数据对象的需求。
[0005] 现有的个性化搜索,比如:主要以用户对数据对象的交互为目标,对用户行为、用 户在一个或多个维度上的特征、数据对象在一个或多个维度上的特征做训练,得用户特征 的权重和/或数据对象的特征的权重,再由所述权重来预测用户可能会对每个数据对象做 交互的概率。所述概率可以作为数据对象在排序时的排序分值。当根据用户输入的查询词 进行搜索时,对搜索出的搜索结果(一个或多个数据对象),按照每个数据对象的数据交互 概率从大到小的顺序,为用户展示搜索结果。但是,用户不同的行为数据所体现的对数据对 象的关注或偏好程度是不一样的。例如,用户点击某一数据对象,获取该数据对象的详细 信息后就结束页面访问,没有后续的对该数据对象的行为操作;而用户点击另一数据对象, 获取该数据对象的详细信息后执行了收藏该数据对象的操作;在这样的例子中,用户后一 点击的行为数据相较于前一点击的行为数据更能表现用户对数据对象的关注或偏好程度。 在计算特征组合的权重时,只考虑"交互"这一种用户行为按照数据交互的概率对作为搜索 结果的各个数据对象进行排序,而忽略了用户的不同行为数据对用户偏好或关注程度的影 响,导致对搜索结果的排序准确性不高的缺陷。从而需要改进搜索平台的个性化搜索处理 性能,以提高搜索的输出结果准确度,为用户输出最合理最符合其搜索意图的结果。

【发明内容】

[0006] 基于上述现有技术中个性化搜索的缺陷,本申请的主要目的在于提供一种个性化 数据搜索方法和装置,以改进个性化搜索处理性能,从而最大限度为用户提供符合其搜索 意图的搜索结果、提高搜索平台的输出搜索结果的准确度。
[0007] 为了解决上述技术问题,本申请是通过以下技术方案来实现。
[0008] 本申请提供了一种个性化数据搜索方法,包括:根据对用户行为数据中记录的用 户对数据对象的用户行为进行机器学习,以获得每个用户行为数据的满意度;选择所述每 个用户行为数据中的用户的特征、以及所述数据对象的特征中的一项特征或多项特征形成 的特征组合;根据每个特征或特征组合下的用户行为数据的满意度,进行个性化模型训练, 并获得每个特征或特征组合的个性化权重;根据所述特征或特征组合的个性化权重,对根 据用户的搜索请求中的查询词所搜索出的一个或多个数据对象,进行排序,以根据所述排 序展示所述一个或多个数据对象。
[0009] 其中,在所述每个用户行为数据中,至少记录用户、所述用户对数据对象的一种或 多种用户行为、所述数据对象、以及所述数据对象对应的查询词;根据对用户行为数据中记 录的用户对数据对象的用户行为进行机器学习,包括:根据记录的所述一种或多种用户行 为中的每种用户行为进行学习。
[0010] 其中,根据对用户行为数据中记录的用户对数据对象的用户行为进行机器学习, 以获得所述每个用户行为数据的满意度,包括:所述学习,包括:训练处理和预测处理;所 述训练处理,包括:根据每个用户行为数据记录的一种或多种用户行为中的每一种用户行 为,进行满意度模型训练,并确定每种用户行为的满意度权重;所述预测处理,包括:根据 每个用户行为数据记录的一种或多种用户行为中的每种用户行为的满意度权重,预测每个 用户行为数据的满意度。
[0011] 其中,根据对用户行为数据中记录的用户对数据对象的用户行为进行机器学习, 以获得所述每个用户行为数据的满意度,包括:根据每个用户行为数据中记录的用户以及 查询词,对所述每个用户行为数据的满意度进行归一化。
[0012] 其中,选择所述每个用户行为数据中的用户的特征、以及所述数据对象的特征中 的一项特征或多项特征形成的特征组合,包括:根据预先存储的用户的特征、以及数据对象 的特征,获得每个用户行为数据中记录的用户的特征,以及记录的数据对象的特征;根据每 个特征或特征组合下的用户行为数据的满意度,进行个性化模型训练,并获得每个特征或 特征组合的个性化权重,包括:根据所述每个用户行为数据的满意度,以及所述每个用户行 为数据记录的数据对象的特征和用户的特征,训练所述每个数据对象的特征针对所述每个 用户特征的个性化权重。
[0013] 其中,根据所述特征或特征组合的个性化权重,对根据用户的搜索请求中的查询 词所搜索出的一个或多个数据对象,进行排序,包括:基于用户的搜索请求获得用户的特 征,以及根据搜索出的每个数据对象,获得数据对象的特征;通过查询与所述用户的特征和 搜索出的每个数据对象的特征相对应的特征组合的个性化权重,预测所述每个数据对象的 个性化分数;基于所述每个数据对象的个性化分数,对所述一个或多个数据对象进行排序。
[0014] 本申请还提供了一种个性化数据搜索装置,包括:学习模块,用于根据对用户行为 数据中记录的用户对数据对象的用户行为进行机器学习,以获得每个用户行为数据的满意 度;形成模块,用于选择所述每个用户行为数据中的用户的特征、以及所述数据对象的特征 中的一项特征或多项特征形成的特征组合;训练模块,用于根据每个特征或特征组合下的 用户行为数据的满意度,进行个性化模型训练,并获得每个特征或特征组合的个性化权重; 排序模块,用于根据所述
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1