一种产品信息过滤推荐方法和装置制造方法

文档序号:6509166阅读:114来源:国知局
一种产品信息过滤推荐方法和装置制造方法
【专利摘要】本发明提出了一种产品信息过滤推荐方法和装置,该方法包括步骤:预先获取用户对产品的多种评价数据;根据评价数据,训练推荐模型;输入用户的多种评价数据,应用训练后的推荐模型计算用户对产品的评分预测值,将评分预测值满足预设要求的产品添加到推荐列表。本发明还提供一种产品信息过滤推荐装置,包括数据库、模型训练模块和模型应用模块;数据库,用于预先获取用户对产品的多种评价数据;模型训练模块,用于根据评价数据,训练推荐模型;模型应用模块,用于输入当前用户的多种评价数据,应用训练后的推荐模型计算用户对产品的评分预测值,将评分预测值满足预设要求的产品添加到推荐列表。该方法和装置,能够提高产品信息过滤推荐的准确度。
【专利说明】一种产品信息过滤推荐方法和装置

【技术领域】
[0001] 本发明涉及网络信息【技术领域】,尤其是涉及一种产品信息过滤推荐方法和装置。

【背景技术】
[0002] 随着互联网技术的不断发展,越来越多的产品信息通过网络这一媒体进行传播, 大量产品信息存在于网络当中。当用户面临大量的物品,难以找到或选择适合自己的物品 时,推荐技术根据大量的历史数据和当前实时数据分析计算用户偏好,预测用户对物品的 喜好程度,从而帮助用户找到适合的物品。例如,图书推荐系统可以帮助用户选择合适的书 来阅读,而在线电影租赁网站可以推荐合适的电影提高用户满意度。推荐模型的数据来源 是用户和物品的相关属性和用户对物品的行为数据,比如用户的人口统计学属性、用户的 答题数据、用户对物品的评分、用户对物品的收藏、用户对物品的转发、用户购买记录等数 据。
[0003] 其中,现有技术中,一种应用较为广泛的推荐技术,是协同过滤推荐。协同过滤推 荐,也就是给定某用户,将和该用户具有相似偏好的用户群喜好的物品推荐给他。两个用户 之间的偏好相似度是基于他们对物品的评分记录。协同过滤推荐的算法中的一种是基于模 型的算法。而基于模型的算法是假设数据符合某种特定的模型,然后用历史数据对模型进 行训练,训练结果再用于推荐。基于模型的推荐算法中最著名的"矩阵因子化"算法。该算 法将用户对物品的评分数据投射到一个共同的有限维实数空间,在该空间中将每个用户和 每个物品分别对应到一个向量。基于这些向量,可以计算用户的推荐。
[0004] 传统的协同过滤算法,只考虑用户对物品的评分数据,由于评分数据仅能从一个 角度反应用户的意向,但是不能够全面反应,较为片面,因此,通过传统的协同过滤算法推 荐的产品信息往往具有较大的局限性。


【发明内容】

[0005] 本发明提出了一种产品信息过滤推荐方法和装置,以解决上述问题。
[0006] 为了达到上述目的,本发明的技术方案是这样实现的:
[0007] 本发明提供一种产品信息过滤推荐方法,包括步骤:
[0008] 步骤A,预先获取用户对产品的多种评价数据;
[0009] 步骤B,根据多种所述评价数据,训练推荐模型;
[0010] 步骤C,输入当前用户的多种评价数据,应用训练后的推荐模型计算用户对产品的 评分预测值,将评分预测值满足预设要求的产品添加到推荐列表。
[0011] 其中,所述评价数据,包括评分数据、收藏数据、转发数据和反馈数据;
[0012] 所述评分数据包括用户代号、项代号、评分值、评分时间;
[0013] 所述收藏数据包括用户代号、项代号、收藏时间;
[0014] 所述转发数据包括用户代号、项代号、转发时间;
[0015] 所述反馈数据包括用户代号、题号、用户选择的答案项代号、答题时间。
[0016] 其中,所述步骤B包括步骤:
[0017] 步骤B1,进行推荐模型设定,设定的推荐模型如下:
[0018]

【权利要求】
1. 一种产品信息过滤推荐方法,其特征在于,包括步骤: 步骤A,预先获取用户对产品的多种评价数据; 步骤B,根据多种所述评价数据,训练推荐模型; 步骤C,输入当前用户的多种评价数据,应用训练后的推荐模型计算用户对产品的评分 预测值,将评分预测值满足预设要求的产品添加到推荐列表。
2. 根据权利要求1所述的产品信息过滤推荐方法,其特征在于,所述评价数据,包括评 分数据、收藏数据、转发数据和反馈数据; 所述评分数据包括用户代号、项代号、评分值、评分时间; 所述收藏数据包括用户代号、项代号、收藏时间; 所述转发数据包括用户代号、项代号、转发时间; 所述反馈数据包括用户代号、题号、用户选择的答案项代号、答题时间。
3. 根据权利要求2所述的产品信息过滤推荐方法,其特征在于,所述步骤B包括步骤: 步骤B1,进行推荐模型设定,设定的推荐模型如下:
其中,U为当前用户,i为当前项,在为用户U对项i的预测评分,早为全部评分的平均 值,bu为用户U的基准评分偏移,bi为项i的基准评分偏移,q,X,yW,y?,S均为项i的因 子向量,R(u)为用户u已经评分的项集合,rw为用户u对项i的实际评分,弓为预计算的项 i的基准评分偏移,为预计算的用户U的基准评分偏移,5^,.为预计算的基准评分预测,nW (u)、N?(u)为隐性评分,(1)代表收藏,(2)代表转发,A(u)为用户反馈问题数据的代号集 合; 步骤B2,根据多种所述评价数据,计算出所述推荐模型中的未知参数。
4. 根据权利要求3所述的产品信息过滤推荐方法,其特征在于,所述B2包括步骤: 输入历史评分数据集合s^。,一巧因子的秩f ; 对每个项i,计算Qi,Xi ; 设定循环次数为 20,参数? << 0. 002, 1 << 0. 04, I2 << 25, I3 << 10 ;
计算总平均:
预计算基准评分预测:
初始化模型参数; 计算和项i无关的部分:
若i R(u),则是,11车卸々/ A,e山I在立' 为Xi梯度步累加信息,/皿Cw g; 对如bu,bi进行梯度步:
若j R(u)则对Xj.进行梯度步:
若j nW (U)则对收藏数据yW进行梯度步:
若j N? (U)则对转发数据y?进行梯度步:
若j A(u)则对答题数据S进行梯度步:




返回参数"F点是,与,卸,X,/>,y2),--,公的值。
5. 根据权利要求1所述的产品信息过滤推荐方法,其特征在于,所述步骤B中训练推荐 模型为按照预设频率在预设时间段进行训练。
6. 根据权利要求4所述的产品信息过滤推荐方法,其特征在于,所述步骤C包括步骤: 实时计算用户U对项i的评分预测值心?,输入用户U,项i,根据 声….《^ b" bi Qi Pu 输出u对项i的评分预测值元 计算项之间的相似性,输入项il和项i2,根据
输出项il和项i2的相似性; 计算用户i和用户j之间的相似性,输入用户Ui和用户U2,根据
输出用户Ui和用户U2的相似性。
7. 根据权利要求6所述的产品信息过滤推荐方法,其特征在于,所述步骤C还包括步 骤: 给定用户,计算该用户和所有其他用户的相似性,选出相似性为正数,且排名最靠前的 前第一预设数值个添加到相似的用户列表; 给定项,计算该项和所有其他项的相似性,选出相似性为正数,且排名最靠前的前第二 预设数值个添加到相似的项列表; 给定用户U,计算该用户对所有项的评分预测,选出评分大于早bu的前第H预设数值个 添加到项推荐列表。
8. 根据权利要求7所述的产品信息过滤推荐方法,其特征在于,所述步骤C之后还包括 步骤: 用户U登录后,当监测到该用户有评分、收藏、转发行为时,则更新当前用户的各种评 价数据,并更新该用户的项推荐列表和用户推荐列表。
9. 一种产品信息过滤推荐装置,其特征在于,包括数据库、模型训练模块和模型应用模 块; 所述数据库,用于预先获取用户对产品的多种评价数据; 所述模型训练模块,用于根据多种所述评价数据,训练推荐模型; 所述模型应用模块,用于输入当前用户的多种评价数据,应用训练后的推荐模型计算 用户对产品的评分预测值,将评分预测值满足预设要求的产品添加到推荐列表。
10. 根据权利要求8所述的产品信息过滤推荐装置,其特征在于,所述子模型训练模 块,用于: 进行推荐模型设定,设定的推荐模型如下:

其中,U为当前用户,i为当前项,;;,为用户u对项i的预测评分,为全部评分的平均 值,bu为用户U的基准评分偏移,bi为项i的基准评分偏移,q,X,yW,y?,S均为项i的因 子向量,R(u)为用户u已经评分的项集合,rw为用户u对项i的实际评分,&为预计算的项 i的基准评分偏移,4为预计算的用户U的基准评分偏移,gw为预计算的基准评分预测,N<" (u)、N?(u)为隐性评分,(1)代表收藏,(2)代表转发,A(u)为用户反馈问题数据的代号集 合; 根据多种所述评价数据,计算出所述推荐模型中的未知参数。
【文档编号】G06F17/30GK104424247SQ201310380269
【公开日】2015年3月18日 申请日期:2013年8月28日 优先权日:2013年8月28日
【发明者】康友三 申请人:北京闹米科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1