问题推荐方法、装置及系统的制作方法_2

文档序号:8258606阅读:来源:国知局
问答平台的问题回答率。另外,在该问题推荐方法的基础上搭建了问题 推荐系统,为互动问答社区平台提供问题推荐服务。
[0034] 有关本发明的前述及其技术内容、特点及功效,在以下配合参考图式的较佳实施 例的详细说明中将可清楚呈现。通过【具体实施方式】的说明,当可对本发明为达成预定目的 所采取的技术手段及功效得以更加深入且具体的了解,然而所附图式仅是提供参考与说明 之用,并非用来对本发明加以限制。
[0035] 第一实施例
[0036] 图3为本发明第一实施例的问题推荐方法的流程示意图。请参照图3,本发明实施 例中的问题推荐方法包括:
[0037] 步骤S11 :服务器根据用户的短期兴趣、长期兴趣以及人群兴趣构建所述用户的 兴趣向量,所述兴趣向量中包括多个兴趣项。
[0038] 其中,用户的短期兴趣可以根据用户的实时回答记录获得,通过在线计算用户在 预定时长内的短期兴趣,快速感知用户行为体现出的兴趣变化。其中,实时回答记录记录了 用户在短期内对哪些问题进行了回答,时间的长短可以由设计人员进行设定。短期兴趣反 映用户在较短时间段的行为所体现出的兴趣项的累积,具有相对不稳定、随时间和社会热 点变化快、兴趣项比较集中等特点。
[0039] 用户的长期兴趣可以是通过对历史回答记录进行挖掘得到的用户兴趣,也可以根 据存储在服务器或数据库中的各种应用(例如QQ或"问问")的用户档案资料中用户所填 写的兴趣获得。长期兴趣可以反映用户在较长时间段内的行为所体现出的兴趣项的累积, 具有相对稳定、随时间变化慢、兴趣项比较分散等特点。其中,历史回答记录记录了哪些用 户回答过哪些问题。例如,对用户ul推荐了 5个问题a、b、c、d、e;对用户u2也推荐了 5个 问题c、d、e、f、g,那么问题a、b展示(曝光)给了用户ul,问题e、f展示给了用户u2,问 题c、d、e同时展示给了用户ul和u2。假设用户ul回答了问题a、c;用户u2回答了问题 c、f,那么在历史回答记录中将记录这种回答行为。
[0040] 用户的人群兴趣可以依据用户的属性将用户划分为若干人群,针对不同人群挖掘 长期兴趣,在用户兴趣稀疏的情况下,利用群体性的兴趣去估计用户的个性化兴趣,根据用 户所属人群来补充用户兴趣。其中,用户的属性可以包括年龄、性别、行业、教育程度等等。 人群兴趣可以反映具有相同属性的用户构成的人群所具有的长期兴趣,是一个人群基体在 较长时间段的相似行为所体现出的兴趣项的累积。
[0041] 通过对不同来源的用户兴趣(包括用户的长期兴趣、用户的短期兴趣以及人群兴 趣)进行兴趣融合,构建出完整的用户兴趣向量。
[0042] 在问题推荐系统中,CTR表示问题被展示后被用户回答的概率。CTR模型可以根据 历史回答记录、历史曝光记录,通过CTR模型训练得到。其中,历史曝光记录记录了哪些问 题展示给了哪些用户。例如,对用户ul推荐了 5个问题a、b、c、d、e;对用户u2也推荐了 5 个问题c、d、e、f、g,那么问题a、b曝光给了用户ul,问题e、f曝光给了用户u2,问题c、d、 e同时曝光给了用户ul和u2,在历史曝光记录中将会记录这种曝光信息,以及在曝光过程 中的场景信息(如曝光时间、展示位置、分页、排序等)。
[0043] 步骤S12 :根据所述兴趣向量中的多个兴趣项由待解决问题集合中获取候选推荐 问题。
[0044] 于此步骤中,根据用户兴趣向量中的兴趣项从待解决问题库中检索出与用户兴趣 相关的问题,计算检索出的问题与用户兴趣的相关性,提取出其中相关性最高的若干问题 作为候选推荐问题。
[0045] 步骤S13 :根据所述点击率模型预估用户回答所述候选推荐问题的概率,并根据 预估的概率选取待推荐问题。
[0046] 具体的,可以针对用户特征、问题特征以及场景特征,利用CTR模型来预测用户回 答候选推荐问题的概率,也就是进行CTR预估,并按回答概率的大小进行排序,提取出其中 回答概率最高的若干问题作为待推荐问题。
[0047] 步骤S14 :向所述客户端推荐所选取的待推荐问题。
[0048] 其中,用户的短期兴趣,候选问题检索和CTR预估为在线计算,人群兴趣模型和 CTR模型训练为离线计算。
[0049] 本实施例提出的问题推荐方法通过融合用户的短期兴趣、长期兴趣和人群兴趣来 构建用户的兴趣向量,并根据用户的兴趣向量中的兴趣项由待解决问题集合中获取候选推 荐问题,再根据点击率模型预估用户回答候选推荐问题的概率,根据预估的概率选取待推 荐的问题,并向客户端推荐所述待推荐问题,使得推荐的问题既符合用户的兴趣又是用户 回答意愿较高的问题,一方面,解决了现有技术中基于用户兴趣匹配的问题推荐方法中推 荐兴趣滞后的问题,以及基于点击预估的问题推荐方法中推荐结果不全面、结果单一的现 象,另一方面,可以提高互动问答平台的问题回答率。
[0050] 第二实施例
[0051] 图4为本发明第二实施例的问题推荐方法的流程示意图。图5为本发明第二实施 例的问题推荐方法的原理框图,请同时参照图4及图5,本发明实施例中的问题推荐方法包 括:
[0052] 步骤S21 :根据所述用户在距离当前时间预定时长内的实时回答记录,计算所述 用户的短期兴趣。
[0053] 可以用兴趣向量表示用户的兴趣,用户的短期兴趣可以对应的用短期兴趣向量来 表示,根据每个兴趣项(兴趣关键词或兴趣分类)在短期兴趣向量中的权重计算用户的短 期兴趣,例如,用Cu来代表用户u的短期兴趣,Cu以表示为:
[0054]
【主权项】
1. 一种问题推荐方法,其特征在于,包括: 服务器根据用户的短期兴趣、长期兴趣W及人群兴趣构建所述用户的兴趣向量,所述 用户的兴趣向量中包括多个兴趣项; 根据所述多个兴趣项由待解决问题集合中获取候选推荐问题; 根据点击率模型预估所述用户回答所述候选推荐问题的概率,并根据预估的概率选取 待推荐问题;W及 向所述客户端推荐所述待推荐问题。
2. 如权利要求1所述的方法,其特征在于,所述根据所述用户的短期兴趣、长期兴趣W 及人群兴趣构建所述用户的兴趣向量的步骤之前,包括: 根据所述用户在距离当前时间预定时长内的实时回答记录,计算所述用户的短期兴 趣; 根据历史回答记录,获取所述用户的长期兴趣; 根据历史回答记录、用户的属性W及与每种用户属性对应的兴趣项出现的概率,计算 所述用户的人群兴趣;W及 根据历史回答记录、历史曝光记录建立点击率模型。
3. 如权利要求2所述的方法,其特征在于,所述根据所述用户在距离当前时间预定时 长内的实时回答记录,计算所述用户的短期兴趣的步骤,包括: 获取用户在距离当前时间预定时长内的实时回答记录; 根据所述实时回答记录,提取每个问题对应的兴趣项W及回答每个问题的时间,W回 答每个问题的时间为所述问题对应的兴趣项的时间戳,W所述兴趣项为元素并根据其对应 的时间戳构建循环队列; 根据所述循环队列计算每个兴趣项对应的权重;W及 根据每个兴趣项对应的权重计算所述用户的短期兴趣。
4. 如权利要求3所述的方法,其特征在于,所述根据所述循环队列计算每个兴趣项对 应的权重的步骤,包括: 根据每个兴趣项在所述循环队列中的位置,计算每个兴趣项出现在该位置上时的时间 衰减函数W及每个兴趣项出现在该位置上时的时间戳与当前时间的时长;W及 根据每个兴趣项出现在该位置上时的时间衰减函数W及每个兴趣项出现在该位置上 时的时间戳与当前时间的时长,计算每个兴趣项对应的权重。
5. 如权利要求2所述的方法,其特征在于,所述根据历史回答记录、用户的属性W及与 每种用户属性对应的兴趣项出现的概率,计算所述用户的人群兴趣的步骤,包括: 根据用户的属性组合,将所有用户分为多个不同类型的人群; 计算与用户的属性组合所对应的每个兴趣项出现的概率; 根据所述概率,计算与每种类型的人群对应的兴趣项的权重; 根据所述用户的属性,查找与所述用户对应的人群;W及 根据该人群对应的兴趣项的权重,计算所述用户的人群兴趣。
6. 如权利要求1所述的方法,其特征在于,所述根据用户的短期兴趣、长期兴趣W及人 群兴趣构建用户的兴趣向量的步骤,包括: 通过向量的线性加权,将所述用户的短期兴趣、长期兴趣W及人群兴趣进行合并,得到 用户的兴趣向量。<
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1