一种信息的推送方法及装置的制造方法

文档序号:10624778阅读:341来源:国知局
一种信息的推送方法及装置的制造方法
【专利摘要】本发明公开了一种信息的推送方法及装置,该方法包括:获取用户标识和与所述用户标识对应的用户的活动历史数据,针对任一用户标识对应的用户,分别第一概率和根据所述用户的好友活动历史数据,确定第二概率;并确定所述用户在不同活动场景中参加不同活动类型的活动的第三概率;根据所述第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的第四概率;根据第四概率,向所述用户进行信息推送,用以解决基于协同过滤推荐方式进行信息推送时,推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。
【专利说明】
-种信息的推送方法及装置
技术领域
[0001] 本发明涉及通信技术领域,尤其是涉及一种信息的推送方法及装置。
【背景技术】
[0002] 随着互联网的飞速发展,互联网中的内容也呈现着爆炸式的增长,为了解决用户 在面临海量内容时的信息过载问题,推荐技术应运而生。作为最早和最成功的推荐技术之 一,协同过滤推荐(英文;Coll油orative Filtering Recommendations,缩写;CFR)算法已 被成功的运用于电子商务系统中。
[0003] 通常情况下,可W基于协同过滤推荐算法对用户的活动进行挖掘,进而根据挖掘 结果向用户推送相应的信息。其中活动是指由共同目的联合起来并完成一定社会职能的动 作的总和。活动由目的、动机和动作构成,具有完整的结构系统。例如,用户出外就餐,可W 做为一个活动,包括就餐时间、就餐地点、就餐内容等等,又如用户进行商场购物等,也可W 作为一个活动。而基于协同过滤推荐算法向用户推送信息的方式主要分为下述两种方式:
[0004] 第一种方式;基于内容的协同过滤推荐。
[0005] 基于内容的协同过滤推荐根据目标用户对内容的历史评价和喜好,并分析内容之 间的相似性,为目标用户推荐和他过去喜欢的内容类似的内容。该种方式的缺陷在于基于 内容的推荐需要对内容的特征做抽取和处理,而很多情况下很难从内容中抽取出能准确代 表该内容的信息,而且推荐的结果缺乏多样性,不能挖掘用户的潜在兴趣。
[0006] 第二种方式;基于用户的协同过滤推荐。
[0007] 基于用户的协同过滤推荐则根据目标用户与其他用户的相似性,为目标用户推荐 和他最为相似的一些用户喜欢的内容:即根据用户的历史评价信息计算两用户的相似性, 选出目标用户的最近邻居用户,利用他们对某一内容评价的加权平均值来预测目标用户对 该内容的喜好程度。基于用户的推荐则需要依赖于其他用户,由于有用户评价的内容往往 只占全部内容的少数,所W能够用来计算用户相似性的数据极端稀疏,导致推荐的结果有 偏差;而且对于一个新的内容,缺乏历史用户评价数据,也很难得到推荐,导致可扩展性不 足。
[0008] 综上所述,基于协同过滤推荐方式进行信息推送时,推荐的结果缺乏多样性、推荐 的结果有偏差或局限性较大。

【发明内容】

[0009] 本发明提供了一种信息的推送方法,用W解决基于协同过滤推荐方式进行信息推 送时,推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的问题。
[0010] 一种信息的推送方法,包括:
[0011] 获取用户标识和与所述用户标识对应的用户的活动历史数据,其中所述活动历史 数据包括用户参加活动的活动场景和活动类型;
[0012] 针对任一用户标识对应的用户,根据所述用户的活动历史数据,针对任一活动类 型,分别确定第一概率和第二概率,其中所述第一概率是用户未参加过的活动的概率,所述 未参加过的活动包含在所述活动类型中;所述第二概率是根据所述用户的好友活动历史数 据,确定出的用户参加过的活动的概率,所述参加过的活动包含在所述活动类型中;并
[0013] 确定所述用户在不同活动场景中参加不同活动类型中的活动的第Η概率;
[0014] 根据所述第一概率、第二概率和第Η概率,确定用户在任一活动场景中参加指定 类型活动的第四概率;
[0015] 根据第四概率,向所述用户进行信息推送。
[0016] 针对任一活动类型,确定第一概率,包括:
[0017] 针对任一活动类型,确定所述用户参加过的属于所述活动类型的全部活动特征组 成的活动集合;
[0018] 确定所述活动类型中,所述用户之前未参加过的活动与所述活动集合的相似度;
[0019] 所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。
[0020] 针对任一活动类型,根据所述用户的好友活动历史数据,确定第二概率,包括:
[0021] 针对任一活动类型,根据所述用户的好友活动历史数据,获得最邻居节点集合,其 中所述邻居节点集合是在所述活动类型中,所述用户和好友共同参加的活动的相似度符合 设定规则的用户;
[0022] 针对邻居节点集合中的任一邻居节点,确定所述邻居节点参加所述活动类型中的 活动的比率;
[0023] 根据所述比率确定邻居节点集合的权重和值;
[0024] 根据所述权重和值,确定所述用户参加所述活动类型的活动的第二概率。
[0025] 确定所述用户在不同活动场景中参加不同活动类型的活动的第Η概率,包括:
[0026] 针对任一活动类型,确定所述用户在不同活动场景中参加所述活动类型的频率; W及
[0027] 在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值;
[0028] 所述比值作为用户在不同活动场景中参加不同活动类型的活动的第Η概率。
[0029] 按照下述公式根据第一概率、第二概率和第Η概率,确定用户在任一活动场景中 参加指定类型活动的第四概率:
[0030] 口4=?3*[5冲1+(1-5)冲2]
[0031] 其中,Ρ4是第四概率,Ρ3是第Η概率,Pi是第一概率,δ是设定的权重值,Ρ2是第 二概率。
[0032] 一种信息的推送装置,包括:
[0033] 获取单元,用于获取用户标识和与所述用户标识对应的用户的活动历史数据,其 中所述活动历史数据包括用户参加活动的活动场景和活动类型;
[0034] 概率确定单元,用于针对任一用户标识对应的用户,根据所述用户的活动历史数 据,针对任一活动类型,分别确定第一概率和第二概率,其中所述第一概率是用户未参加过 的活动的概率,所述未参加过的活动包含在所述活动类型中;所述第二概率是根据所述用 户的好友活动历史数据,确定出的用户参加过的活动的概率,所述参加过的活动包含在所 述活动类型中;并确定所述用户在不同活动场景中参加不同活动类型中的活动的第Η概 率;根据所述第一概率、第二概率和第Η概率,确定用户在任一活动场景中参加指定类型活 动的第四概率;
[0035] 信息推送单元,用于根据第四概率,向所述用户进行信息推送。
[0036] 所述概率确定单元,具体用于针对任一活动类型,确定所述用户参加过的属于所 述活动类型的全部活动特征组成的活动集合;确定所述活动类型中,所述用户之前未参加 过的活动与所述活动集合的相似度;所述相似度作为所述用户参加所述活动类型中之前未 参加过的活动的第一概率。
[0037] 所述概率确定单元,具体用于针对任一活动类型,根据所述用户的好友活动历史 数据,获得最邻居节点集合,其中所述邻居节点集合是在所述活动类型中,所述用户和好友 共同参加的活动的相似度符合设定规则的用户;针对邻居节点集合中的任一邻居节点,确 定所述邻居节点参加所述活动类型中的活动的比率;根据所述比率确定邻居节点集合的权 重和值;根据所述权重和值,确定所述用户参加所述活动类型的活动的第二概率。
[0038] 所述概率确定单元,具体用于针对任一活动类型,确定所述用户在不同活动场景 中参加所述活动类型的频率;W及在任一活动场景中参加所述活动类型的活动占参加全部 类型活动的比值;所述比值作为用户在不同活动场景中参加不同活动类型的活动的第Η概 率。
[0039] 所述概率确定单元,具体用于按照下述公式根据第一概率、第二概率和第Η概率, 确定用户在任一活动场景中参加指定类型活动的第四概率:
[0040] 口4=?3*[5冲1+(1-5)冲2]
[00川其中,Ρ4是第四概率,Ρ3是第Η概率,Pi是第一概率,δ是设定的权重值,Ρ2是第 二概率。
[0042] 通过上述技术方案,综合使用了基于内容的协调过滤推荐和基于用户的协调过滤 推荐两种方法,并将目标用户所处的活动场景作为一个影响因子,加入到推荐的过程中,从 而根据不同的活动情景调整推荐结果,可W进一步满足用户的必理需求。解决基于协同过 滤推荐方式进行信息推送时,推荐的结果缺乏多样性、推荐的结果有偏差或局限性较大的 问题。
【附图说明】
[0043] 图1为本发明实施例一中,提出的信息的推送方法流程图;
[0044] 图2为本发明实施例二中,提出的信息的推送装置结构组成示意图。
【具体实施方式】
[0045] 针对一般情况下基于协同过滤推荐方式进行信息推送时,推荐的结果缺乏多样 性、推荐的结果有偏差或局限性较大的问题,本发明实施例提出的技术方案中,综合使用了 基于内容的协调过滤推荐和基于用户的协调过滤推荐两种方法,并将目标用户所处的活动 场景作为一个影响因子,加入到推荐的过程中,从而根据不同的活动情景调整推荐结果,可 W进一步满足用户的必理需求。解决基于协同过滤推荐方式进行信息推送时,推荐的结果 缺乏多样性、推荐的结果有偏差或局限性较大的问题。
[0046] 下面将结合各个附图对本发明实施例技术方案的主要实现原理、【具体实施方式】及 其对应能够达到的有益效果进行详细地阐述。
[0047] 实施例一
[0048] 本发明实施例一提出一种信息的推送方法,如图1所示,其具体处理过程如下述:
[0049] 步骤101,获取用户标识和与用户标识对应的用户的活动历史数据。
[0050] 其中活动历史数据包括用户参加活动的活动场景和活动类型。
[0051] W-具体实例来详细阐述本发明实施例一提出的技术方案。
[0052] 用户标识W U表示,获取用户标识,全部用户标识组成用户集合。用户集合W U表 示,具体如下述:
[005引步骤一:用户Ui及其它用户共同组成的用户集合U = {u 1,U2, . . . Ui, . . . 。
[0054] 步骤二:获得各用户的活动历史数据。
[00巧]首先,确定活动集合及活动类型。具体如下述:
[0056] A ;所有活动的集合作为活动集合,W A = {曰1,曰2, . . . aj, . . . a。}表示。
[0057] 其中,本发明实施例一提出的技术方案中,活动可W是任何类型的活动,例如餐厅 就餐、商场购物等。W餐厅就餐为例,例如餐厅1就餐、餐厅2就餐…餐厅η就餐等。
[0058] 具体地,活动集合中的每个元素表示一个活动,元素的值表示该活动在不同缔度 的平均评分。
[0059] 例如,活动a,的特征向量为α.其中每一个值都代表该活动在不同维度的平均 评分。W活动为餐厅就餐为例,其特征向量可W表示为(口味评分、价格评分、服务评分、环 境评分、速度评分等),评分W 5分为满分制,例如^ = (2,5,3,1,4) ^
[0060] Β ;确定活动类型。W C = {Ci,C2, . . . Ch,. . . Ck},k < < η表示活动类型集合。W 活动是餐厅就餐为例,活动类型可W分为火锅、西餐、快餐、烧烤、粤菜等。
[00川 C ;将活动集合A =虹,曰2, ... an}中的元素 a浪照所属活动类型进行排序,可W
得到新的活动集合 其中表示在活动集合A中 i 仁屯 属于活动类型Ch的活动a,的集合;
[0062] 其次,确定活动场景,将活动场景进行分类。
[0063] 假设有两个维度的活动场景,第一维度Ei= {ei,i,ei,2, . . . ei,^ . . . eij,例如早上、 中午、晚上;第二维度E2= {e 2,1,θ2,2, . . . θ2," . . . θ2,,},例如工作日,节假日。
[0064] 再次,构建用户标识和活动历史数据矩阵。
[00财用户Ui在活动场景e 参加了活动a j的历史次数为在活动场景e2,r - 9 参加了活动Sj的历史次数为,《/ .6
[0066] 假设ei,f表示中午,e 2,f表示晚上,a ,表示火锅分类下的小肥羊餐厅,用户Ui在中 午去小肥羊吃饭的次数为15,工作日去小肥羊吃饭的次数为12。
[0067] 步骤Η ;对获得的活动历史数据进行统计分析。
[0068] 例如,用户Ui参加了活动a ,的历史总次数为在某一维度所有活动场景下参加该活 动的总和:
[0069] 其中,是用户Ui参加了活动a ,的历史总次数为在某一维度所有活动场景 下参加该活动的总和。
[0070] 用户Ui参加的属于活动类型C h的活动集合为活动总次数
[007。 其中,是活动总次数。
[007引用户Ui在活动场景e 冲参加的属于活动类型C h的活动历史次数
在活动场景e2,f中参加的属于活动类型Ch的活动历史 狹数为-
[007引其中,f是用户U迫活动场景ei,r中参加的属于活动类型Ch的活动历史 次数,>62 f是用户U迫活动场景e 2,冲参加的属于活动类型C h的活动历史次数。
[0074] 步骤102,针对任一用户标识对应的用户,W及针对任一活动类型,根据该用户的 活动历史数据,分别确定第一概率和第二概率。
[0075] 其中第一概率是用户未参加过的活动的概率,未参加过的活动包含在所述活动类 型中;第二概率是根据用户的好友活动历史数据,确定出的用户参加过的活动的概率,所述 参加过的活动包含在所述活动类型中。
[0076] 其中,针对任一活动类型,确定用户参加所述活动类型中之前未参加过的活动的 第一概率,包括:
[0077] 步骤一:针对任一活动类型,确定该用户参加过的属于该活动类型的全部活动特 征组成的活动集合。
[0078] 步骤二:确定该活动类型中,该用户之前未参加过的活动与该活动集合的相似度。
[0079] 步骤Η ;将确定出的相似度作为该用户参加该活动类型中之前未参加过的活动的 第一概率。
[0080] 下面W-具体实例来详细阐述第一概率的计算方法。确定基于用户Ui历史活动 的记录,预测用户Ui会参加活动类型C h中该用户U 1之前未参加过的活动a ,的第一概率,其 具体方法如下述:
[0081] A ;获取用户Ui参加过的属于活动类型C h的所有活动特征。
[0082] 对于用户Ui,参加过的属于活动类型Ch的所有活动的次数为 纖/n(A. )活动集合记为4 计算活动集合乂 的平均特征向量 !,化 , Ι'?,L/i
[0083] 其中,该平均特征向量^ 表示该用户Ui对于活动类型Ch活动的喜好特征 -材 i.,Cft 值。
[0084] W火锅类和(口味评分、价格评分、服务评分、环境评分、速度评分)为特征属性为 例,评分W 5分为满分制,针对用户张 Η可W计算出
则 代表张 Η在选择火锅时,更喜欢口味好和价格实惠的餐厅,对环境要求最低。
[00财 Β ;计算活动类型Ch中新活动a,与活动集合4,,,C/,的相似度。
[0086] 对于用户Ui未参加过的属于活动类型C h的活动的a,,令其和活动集合的 相似度为:
[0087]

[0088]其中,沒論窃.4表示a,和^ ^之间的籠度, I示 UjAq邱 峰,吗 两向量夹角的余弦值,即方向相似度,
表示两向量的长度相似 性,0 < δ < 1表示权重,本发明实施例一中提出的技术方案,巧=0.5。
[0089] 针对任一活动类型,根据该用户的好友活动历史数据,确定该用户参加所述活动 类型的活动的第二概率,包括下述流程:
[0090] 步骤一:针对任一活动类型,根据该用户的好友活动历史数据,获得邻居节点集 厶 口 〇
[0091] 其中邻居节点集合是在活动类型中,该用户和好友共同参加的活动的相似度符合 设定规则的用户。
[0092] 步骤二:针对邻居节点集合中的任一邻居节点,确定该邻居节点参加该活动类型 中的活动的比率。
[0093] 步骤Η ;根据比率确定邻居节点集合的权重和值。
[0094] 步骤四;根据得到的权重和值,确定该用户参加所述活动类型的活动的第二概率。
[0095] 下面W-具体实例来详细阐述第二概率的计算方法。
[0096] 基于用户Ui的好友的活动历史数据,在当前提出的基于用户协同过滤推荐算法的 基础上,本发明实施例一提出的技术方案中,通过在某一类中与用户Ui最为相似的一些用 户(即用户Ui关于活动类型C h的邻居节点)来预测用户U 1在活动类型C h中会参加某活动 a,的第二概率,其具体处理如下述:
[0097] 首先,计算用户Ui关于活动类型C h的邻居节点。
[0098] 令用户Ui与用户U 1.共同参加的属于活动类型C h的活动集合为
则可W采用余弦相似性的方法来计算用户Ui与 用户Ui.在参加活动类型Ch的活动时的相似度
[0099]
[0100] 其中,,,(,&是相似度。
[0101] 一种较佳地实施方式,根据得到的相似度,取得到的相似度中最 大的m。个用户作为用户Ui关于活动类型Ch的最佳邻居节点该得到的最 佳邻居节点作为符合设定规则的邻居节点。
[0102] 在确定符合设定规则的邻居节点时,也可采用阔值过滤的方法,例如可W取
的所有用户作为符合设定规则的邻居节点,即最佳邻居节点 NBUwt 科 〇
[0103] 其次,预测用户Ui参加活动类型C h中某活动a,的第二概率。
[0104] 步骤一:计算邻居节点用户Ui.在活动类型Ch中参加了活动a ,的比率:
[0105]
[0106] 其中,该比率标识用户Ui.在活动类型Ch中对活动a ,的偏好。
[0107] 步骤二:用iVSt/w 中所有用户的权重和值,来预测用户Ui会 参加活动a,的第二概率:
[010 引
[0110] 步骤103,确定该用户在不同活动场景中参加不同活动类型的活动的第Η概率。
[0111] 确定用户在不同活动场景中参加不同活动类型的活动的第Η概率,包括:
[0112] 步骤一:针对任一活动类型,确定该用户在不同活动场景中参加该活动类型的频 率。
[0113] 步骤二:在任一活动场景中参加该活动类型的活动占参加全部类型活动的比值。
[0114] 步骤Η ;得到的比值作为用户在不同活动场景中参加不同活动类型的活动的第Η 概率。
[0115] 下面W-具体实例来详细阐述确定第Η概率的【具体实施方式】。
[0116] 首先,当前活动场景为任意活动场景和活动场景e 2,f的组合,根据活动场景, 情景化的计算用户Ui在该活动场景下参加属于活动类型C h的活动频率:
[0117]
[0118] 其中^ 是用户Ui在该活动场景下参加属于活动类型Ch的活动 频率。
[0119] 其次,计算在当前活动场景下参加该活动类型活动占全部活动类型的活动的比 值:
[0120]
[0121] 其中,f 是在当前活动场景下参加该活动类型活动占全部活动 类型的活动的比值。
[0122] 从而针对用户当前所处的活动场景,根据比值f >62 来针对性的推 荐属于不同活动类型的活动。
[0123] 下面W-具体实例来进行详细阐述:
[0124] 例如下述表1是某用户张 Η在活动场景为Ei= {中午,晚上},Ei= {工作日,周 末}两个维度,活动有C ={火锅,西餐,快餐} H种情况下的活动-活动场景分布表格:
[0125] 表 1
[0126]
[0127] 则张 Η在工作日的中午:
[0128] 选择吃火锅的次数:
[0129] R(火锅 / 工作日 * 中午)=12* 化/30) = 12/5。
[0130] 选择吃西餐的次数:
[0131] R(西餐 / 工作日 * 中午)=6*(4/10) = 12/5。
[0132] 选择吃快餐的次数:
[0133] R (快餐 / 工作日 * 中午)=40* (30/45) = 80/3。
[0134] 吃火锅的概率:
[0135] Ρ (火锅 / 工作日 * 中午)=12/5/(12/5+12/5+80/3) = 9/118。
[0136] 吃西餐的概率:
[0137] Ρ (西餐 / 工作日 * 中午)=12/5/(12/5+12/5+80/3) = 9/118。
[013引吃快餐的概率:
[0139] Ρ (快餐 / 工作日 * 中午)=80/3/(12/5+12/5+80/3) = 50/59。
[0140] 步骤104,根据第一概率、第二概率和第Η概率,确定用户在任一活动场景中参加 指定类型活动的第四概率。
[0141] 按照下述公式根据第一概率、第二概率和第Η概率,确定用户在任一活动场景中 参加指定类型活动的第四概率:
[014引 Ρ*= ?3*[ δ 冲1+(1-δ )冲2]
[0143] 其中,P4是第四概率,P 3是第Η概率,Pi是第一概率,δ是设定的权重值,P 2是第 二概率。
[0144] 下面W-具体实例来详细阐述本发明实施例提出的第四概率的确定方法。
[0145] 结合当前用户所处的活动情景,综合基于活动的协同过滤和基于用户的协同过滤 两个方面,预测用户Ui在当前活动场景下参加活动a ,的概率:
[0146] 假设当前活动场景为ei,f、e2,f,则用户Ui未参加过的任一活动a j,用户Ui会参加该 活动a,的概率为:
[0147]
[014引其中巧W,.,0/)/(^1 是当前活动场景为ei,r、e2,r,用户Ui会参加未参加过 的活动曰,的概率,Uy .
[0149] δ是设定的权重值,〇《σ《1,表示基于活动的协同过滤在结果中所占的权重, 即用户历史数据对当前推荐结果的影响程度;δ的取值根据推荐方法的策略,可动态灵活 调整;
[0150] 步骤105,根据第四概率,向该用户进行信息推送。
[0151] 本发明实施例提出的技术方案中,针对任一用户,和所有的活动类型,对该用户未 参加过的所有活动都确定第四概率值。
[0152] 也就是说,针对任一用户Ui,和所有的活动类型,首先对该用户Ui未参加过的所有 P 活动a部求概率^ (W/. ) ./ (勺,/.,&,/.) Q
[0153] 其次,针对活动类型集合C = {ci, C2, ... Ch, ... cj进行遍历,对每个活动类型都执 行上述求取过程,得到用户Ui在当前活动场景下,在所有活动类型集合中,会参加活动a ,的 P 概率 ^(1《,.,(://.)/'(叫.,,与,,)
[0154] 再次结合当前活动情景确定用户Ui的最佳候选活动节点 辟,r)取。)/k,e )最大的η。个活动作为用户Ui的候选活动 节点備心知,.,咕,) Ρ
[015引最后,结合当前活动场景对用户U进行活动推荐:从>中按 ^斬,apy (句:r妈r )从大到小的顺序选出活动节点,为用户u进行推荐。
[0156] 实施例二
[0157] 本发明实施例特提出一种信息的推送装置,如图2所示,该装置包括:
[015引获取单元201,用于获取用户标识和与所述用户标识对应的用户的活动历史数据, 其中所述活动历史数据包括用户参加活动的活动场景和活动类型。
[0159] 概率确定单元202,用于针对任一用户标识对应的用户,根据所述用户的活动历史 数据,针对任一活动类型,分别确定第一概率和第二概率,其中所述第一概率是用户未参加 过的活动的概率,所述未参加过的活动包含在所述活动类型中;所述第二概率是根据所述 用户的好友活动历史数据,确定出的用户参加过的活动的概率,所述参加过的活动包含在 所述活动类型中;并确定所述用户在不同活动场景中参加不同活动类型中的活动的第Η概 率;根据所述第一概率、第二概率和第Η概率,确定用户在任一活动场景中参加指定类型活 动的第四概率。
[0160] 具体地,上述概率确定单元202,具体用于针对任一活动类型,确定所述用户参加 过的属于所述活动类型的全部活动特征组成的活动集合;确定所述活动类型中,所述用户 之前未参加过的活动与所述活动集合的相似度;所述相似度作为所述用户参加所述活动类 型中之前未参加过的活动的第一概率。
[0161] 具体地,上述概率确定单元202,具体用于针对任一活动类型,根据所述用户的好 友活动历史数据,获得最邻居节点集合,其中所述邻居节点集合是在所述活动类型中,所述 用户和好友共同参加的活动的相似度符合设定规则的用户;针对邻居节点集合中的任一邻 居节点,确定所述邻居节点参加所述活动类型中的活动的比率;根据所述比率确定邻居节 点集合的权重和值;根据所述权重和值,确定所述用户参加所述活动类型的活动的第二概 率。
[0162] 具体地,上述概率确定单元202,具体用于针对任一活动类型,确定所述用户在不 同活动场景中参加所述活动类型的频率;W及在任一活动场景中参加所述活动类型的活动 占参加全部类型活动的比值;所述比值作为用户在不同活动场景中参加不同活动类型的活 动的第Η概率。
[0163] 具体地,上述概率确定单元202,具体用于按照下述公式根据第一概率、第二概率 和第Η概率,确定用户在任一活动场景中参加指定类型活动的第四概率:
[0164] 口4=?3*[5冲1+(1-5)冲2]
[0165] 其中,Ρ4是第四概率,Ρ 3是第Η概率,Pi是第一概率,δ是设定的权重值,Ρ 2是第 二概率。
[0166] 信息推送单元203,用于根据第四概率,向所述用户进行信息推送。
[0167] 基于内容的协同过滤推荐根据目标用户对内容的历史评价和喜化并分析内容之 间的相似性,为目标用户推荐和他过去喜欢的内容类似的内容。基于内容的推荐不依赖于 其他用户,可W有效避免有用户恶意作弊的情况;并且新的内容可W及时得到推荐。基于用 户的协同过滤推荐则根据目标用户与其他用户的相似性,为目标用户推荐和他最为相似的 一些用户喜欢的内容:即根据用户的历史评价信息计算两用户的相似性,选出目标用户的 最近邻居用户,利用他们对某一内容评价的加权平均值来预测目标用户对该内容的喜好程 度。该推荐方法能够挖掘用户潜在的喜好,为用户推荐与其历史喜好不同的新型内容,并且 无需对内容做复杂的特征处理。但是基于内容的推荐需要对内容的特征做抽取和处理,而 很多情况下很难从内容中抽取出能准确代表该内容的信息,且推荐的结果缺乏多样性,不 能挖掘用户的潜在兴趣。基于用户的推荐则需要依赖于其他用户,由于有用户评价的内容 往往只占全部内容的少数,所W能够用来计算用户相似性的数据极端稀疏,导致推荐的结 果有偏差;而且对于一个新的内容,缺乏历史用户评价数据,也很难得到推荐,导致可扩展 性不足。
[0168] 基于此,本发明实施例上述提出的技术方案中,综合送两种协同过滤推荐方法,为 每一种推荐方法赋予一定的权重并进行加权组合,能得到更为准确和丰富的推荐结果。
[0169] 并且,W上两种传统的协同过滤推荐方法只考虑了用户-内容评分送两个维度, 较少考虑到户当前所处的情景会对用户的喜好产生影响,导致推荐结果无法完全体现用户 的意图。用户对一个内容的喜好往往很大程度上依赖于当前的环境(时间、位置、天气等), 但是用户的选择会根据环境的不同而发生变化,例如用户在中午往往比在晚上更倾向于吃 快餐;所W推荐算法不仅需要采用历史数据和其他用户的数据来挖掘目标用户的喜好,更 需要根据目标用户所处的环境作为辅助判断。而传统的协同过滤推荐方法也没有考虑内容 所属的类别会对内容的相似性与用户最近邻居的选择产生影响。因为两个用户的相似性会 因为内容的类别而有所不同,例如对于餐厅送项内容,用户A和用户B都喜欢吃火锅类,但 是用户A还喜欢烧烤类,但是用户B不喜欢烧烤类,则对火锅类内容进行预测时,选择用户 B作为用户A的邻居节点较为合理,但是对烧烤类内容进行预测时,则不应选择用户B作为 用户A的邻居节点。故利用用户对同一个类别内容的评价计算用户对于该类别的相似性更 为合理。同理,对属于同一个类别的内容计算相似性也更为精确,例如对同属于火锅类的餐 厅来比较相似性。
[0170] 本发明综合使用了基于内容的协调过滤推荐和基于用户的协调过滤推荐两种方 法,并做了如下优化:
[0171] 一、将目标用户所处的情景信息作为一个影响因子,加入到推荐的过程中,得到在 当前场景下目标用户会选择某一类型内容的概率;从而根据不同的情景调整推荐结果,可 W进一步满足用户的必理需求。
[0172] 二、对每个类别的内容分别进行内容相似性和用户相似性的计算,使得内容的最 近邻居节点和用户的最佳邻居节点随着内容类别的变化而动态调整,即得出在某一类别 下,目标用户最可能喜好的内容;再结合在当前场景下用户选择该类别的概率,最后得到在 当面场景下用户选择该内容的概率,用该概率值为用户进行推荐,能够提高对用户喜好的 预测精确度。
[0173] 本发明实施例提出的技术方案,可W避免了单独基于内容协同过滤推荐和单独基 于用户协同过滤推荐的不足,而且由于推荐时考虑了不同类别内容的差异,使得推荐结果 更为准确;并根据目标用户所处的当前场景对推荐结果进行了个性化动态调整,使得推荐 结果更符合用户必理;最终对目标用户进行更精确、更符合当前场景的推荐。
[0174] 本领域的技术人员应明白,本发明的实施例可提供为方法、装置(设备)、或计算 机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方 面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的 计算机可用存储介质(包括但不限于磁盘存储器、只读光盘、光学存储器等)上实施的计算 机程序产品的形式。
[0175] 本发明是参照根据本发明实施例的方法、装置(设备)和计算机程序产品的流程 图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一 流程和/或方框、W及流程图和/或方框图中的流程和/或方框的结合。可提供送些计算 机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理 器W产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生 用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能 的装置。
[0176] 送些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备W特 定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指 令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或 多个方框中指定的功能。
[0177] 送些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计 算机或其他可编程设备上执行一系列操作步骤W产生计算机实现的处理,从而在计算机或 其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图 一个方框或多个方框中指定的功能的步骤。
[0178] 尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造 性概念,则可对送些实施例作出另外的变更和修改。所W,所附权利要求意欲解释为包括优 选实施例W及落入本发明范围的所有变更和修改。
[0179] 显然,本领域的技术人员可W对本发明进行各种改动和变型而不脱离本发明的精 神和范围。送样,倘若本发明的送些修改和变型属于本发明权利要求及其等同技术的范围 之内,则本发明也意图包含送些改动和变型在内。
【主权项】
1. 一种信息的推送方法,其特征在于,包括: 获取用户标识和与所述用户标识对应的用户的活动历史数据,其中所述活动历史数据 包括用户参加活动的活动场景和活动类型; 针对任一用户标识对应的用户,根据所述用户的活动历史数据,针对任一活动类型,分 别确定第一概率和第二概率,其中所述第一概率是用户未参加过的活动的概率,所述未参 加过的活动包含在所述活动类型中;所述第二概率是根据所述用户的好友活动历史数据, 确定出的用户参加过的活动的概率,所述参加过的活动包含在所述活动类型中;并 确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率; 根据所述第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型 活动的第四概率; 根据第四概率,向所述用户进行信息推送。2. 如权利要求1所述的方法,其特征在于,针对任一活动类型,确定第一概率,包括: 针对任一活动类型,确定所述用户参加过的属于所述活动类型的全部活动特征组成的 活动集合; 确定所述活动类型中,所述用户之前未参加过的活动与所述活动集合的相似度; 所述相似度作为所述用户参加所述活动类型中之前未参加过的活动的第一概率。3. 如权利要求1所述的方法,其特征在于,针对任一活动类型,根据所述用户的好友活 动历史数据,确定第二概率,包括: 针对任一活动类型,根据所述用户的好友活动历史数据,获得最邻居节点集合,其中所 述邻居节点集合是在所述活动类型中,所述用户和好友共同参加的活动的相似度符合设定 规则的用户; 针对邻居节点集合中的任一邻居节点,确定所述邻居节点参加所述活动类型中的活动 的比率; 根据所述比率确定邻居节点集合的权重和值; 根据所述权重和值,确定所述用户参加所述活动类型的活动的第二概率。4. 如权利要求1所述的方法,其特征在于,确定所述用户在不同活动场景中参加不同 活动类型的活动的第三概率,包括: 针对任一活动类型,确定所述用户在不同活动场景中参加所述活动类型的频率;以及 在任一活动场景中参加所述活动类型的活动占参加全部类型活动的比值; 所述比值作为用户在不同活动场景中参加不同活动类型的活动的第三概率。5. 如权利要求1所述的方法,其特征在于,按照下述公式根据第一概率、第二概率和第 三概率,确定用户在任一活动场景中参加指定类型活动的第四概率: Ρ4=Ρ3*[δ*Ρ1+(1-δ)*Ρ2] 其中,ρ4是第四概率,ρ3是第三概率,Pi是第一概率,S是设定的权重值,?2是第二概 率。6. -种信息的推送装置,其特征在于,包括: 获取单元,用于获取用户标识和与所述用户标识对应的用户的活动历史数据,其中所 述活动历史数据包括用户参加活动的活动场景和活动类型; 概率确定单元,用于针对任一用户标识对应的用户,根据所述用户的活动历史数据,针 对任一活动类型,分别确定第一概率和第二概率,其中所述第一概率是用户未参加过的活 动的概率,所述未参加过的活动包含在所述活动类型中;所述第二概率是根据所述用户的 好友活动历史数据,确定出的用户参加过的活动的概率,所述参加过的活动包含在所述活 动类型中;并确定所述用户在不同活动场景中参加不同活动类型中的活动的第三概率;根 据所述第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的 第四概率; 信息推送单元,用于根据第四概率,向所述用户进行信息推送。7. 如权利要求6所述的装置,其特征在于,所述概率确定单元,具体用于针对任一活动 类型,确定所述用户参加过的属于所述活动类型的全部活动特征组成的活动集合;确定所 述活动类型中,所述用户之前未参加过的活动与所述活动集合的相似度;所述相似度作为 所述用户参加所述活动类型中之前未参加过的活动的第一概率。8. 如权利要求6所述的装置,其特征在于,所述概率确定单元,具体用于针对任一活动 类型,根据所述用户的好友活动历史数据,获得最邻居节点集合,其中所述邻居节点集合是 在所述活动类型中,所述用户和好友共同参加的活动的相似度符合设定规则的用户;针对 邻居节点集合中的任一邻居节点,确定所述邻居节点参加所述活动类型中的活动的比率; 根据所述比率确定邻居节点集合的权重和值;根据所述权重和值,确定所述用户参加所述 活动类型的活动的第二概率。9. 如权利要求6所述的装置,其特征在于,所述概率确定单元,具体用于针对任一活动 类型,确定所述用户在不同活动场景中参加所述活动类型的频率;以及在任一活动场景中 参加所述活动类型的活动占参加全部类型活动的比值;所述比值作为用户在不同活动场景 中参加不同活动类型的活动的第三概率。10. 如权利要求6所述的装置,其特征在于,所述概率确定单元,具体用于按照下述公 式根据第一概率、第二概率和第三概率,确定用户在任一活动场景中参加指定类型活动的 第四概率: Ρ4=Ρ3*[δ*Ρ1+(1-δ)*Ρ2] 其中,ρ4是第四概率,ρ3是第三概率,Pi是第一概率,S是设定的权重值,?2是第二概 率。
【文档编号】G06F17/30GK105989005SQ201510041409
【公开日】2016年10月5日
【申请日】2015年1月27日
【发明人】刘娟
【申请人】中国移动通信集团公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1