融入时间上下文信息的协同过滤推荐方法

文档序号:6551771阅读:386来源:国知局
融入时间上下文信息的协同过滤推荐方法
【专利摘要】一种融入时间上下文信息的协同过滤推荐方法,在原有的基于项目的协同过滤推荐算法和基于用户的协同过滤推荐算法的基础上,融入时间上下文信息,并将这两种算法结合到一个统一的算法中。对于基于用户的协同过滤算法,首先在用户相似度计算阶段融入时间衰减函数;然后对物品进行聚类,训练出一个用户对一个物品类别的兴趣衰减因子;最后在评分预测阶段融入时间衰减函数。针对基于物品的协同过滤算法,过程与基于用户的协同过滤算法类似,最后将两种算法结合到一个统一的算法中。由于在相似度计算阶段和评分预测阶段都引入了时间衰减函数,而且为不同用户对不同类别的物品使用不同的时间衰减因子,从而可以有效提高预测的准确度。
【专利说明】融入时间上下文信息的协同过滤推荐方法

【技术领域】
[0001] 本发明涉及个性化推荐系统技术,尤其涉及一种融入时间上下文信息的协同过滤 推荐方法。

【背景技术】
[0002] 推荐系统为解决信息过载(information overload)的问题而出现,广泛应用于电 子商务、电影、视频、音乐、设计网络、阅读、基于位置的服务、个性化邮件和广告等领域。通 过分析大量的用户行为日志,推荐系统能够给不同的用户展示不同的个性化页面,提高了 网站的点击率和转化率。
[0003] 协同过滤(Collaborative Filtering)算法是推荐系统领域最早提出来的算法, 该算法已经在学术界和工业界得到深入的研究和广泛的应用。协同过滤算法分为基于用户 (user-based)的协同过滤算法和基于物品(item-based)的协同过滤算法两大类。基于用 户的协同过滤算法为用户推荐和该用户兴趣相似的用户喜欢的物品,而基于物品的协同过 滤算法则为用户推荐和他/她之前喜欢的物品相似的物品。但现有的协同过滤算法准确率 较差。


【发明内容】

[0004] 本发明解决的问题是提供一种融入时间上下文信息的协同过滤推荐方法,更加客 观地反映了用户对物品的兴趣的变迁,推荐结果精确。
[0005] 为解决上述问题,本发明实施例提供了一种融入时间上下文信息的协同过滤推荐 方法,包括:
[0006] 收集用户对物品的评分;
[0007] 建立用户-物品评分矩阵;
[0008] 计算用户、物品的评分平均值;
[0009] 计算融入时间衰减函数的用户相似度和物品相似度;
[0010] 分别对用户和物品进行聚类;
[0011] 计算用户对物品聚类的时间衰减系数和学习用户聚类对物品的时间衰减系数;
[0012] 混合基于物品的协同过滤算法和基于用户的协同过滤算法进行评分预测。
[0013] 可选的,基于用户的协同过滤算法通过下面的公式预测用户U对物品i的评分:

【权利要求】
1. 一种融入时间上下文信息的协同过滤推荐方法,其特征在于,包括: 收集用户对物品的评分; 建立用户-物品评分矩阵; 计算用户、物品的评分平均值; 计算融入时间衰减函数的用户相似度和物品相似度; 分别对用户和物品进行聚类; 计算用户对物品聚类的时间衰减系数和学习用户聚类对物品的时间衰减系数; 混合基于物品的协同过滤算法和基于用户的协同过滤算法进行评分预测。
2. 如权利要求1所述的融入时间上下文信息的协同过滤推荐方法,其特征在于,基于 用户的协同过滤算法通过下面的公式预测用户u对物品i的评分:
其中IT是用户u的平均评分,F是与用户u相似 的用户V的平均评分。
3. 如权利要求1所述的融入时间上下文信息的协同过滤推荐方法,其特征在于,基于 物品的协同过滤算法通过下面的公式预测用户u对物品i的评分:
?其中?是物品i获得的平均评分是和物品i相 似的物品j的平均评分。
4. 如权利要求1所述的融入时间上下文信息的协同过滤推荐方法,其特征在于,在计 算用户、物品的评分平均值的同时,计算系统所有评分的均方根误差、每个用户评分的均方 根误差和每个物品评分的均方根误差。 如权利要求1所述的融入时间上下文信息的协同过滤推荐方法,其特征在于,使用 公式
计算用户之间的皮尔逊系数相似度,使用公式
十算物品之间的皮尔逊系数相似度,同时在相似度计 算公式中融入时间衰减函数,时间衰减函数见公式
5. 如权利要求4所述的融入时间上下文信息的协同过滤推荐方法,其特征在于,融入 时间衰减函数的方式是直接和时间衰减函数相乘,其中时间衰减函数中的α是时间衰减 系数,表示相似度随时间变化的速度。
6. 如权利要求1所述的融入时间上下文信息的协同过滤推荐方法,其特征在于,所述 时间衰减系数的学习方法包括:每次忽略一个评分,然后利用该忽略的评分来度量预测函 数能否反映用户对物品的评分行为,使用最小化后的平均绝对误差度量。
7. 如权利要求6所述的融入时间上下文信息的协同过滤推荐方法,其特征在于,最小 化平均绝对误差的方法包括:设置上限和下限;使用几个离散的计算平均绝对误差,选择 平均绝对误差最小的值作为最优值。
【文档编号】G06F17/30GK104391849SQ201410307707
【公开日】2015年3月4日 申请日期:2014年6月30日 优先权日:2014年6月30日
【发明者】尹建伟, 王成文, 李莹, 邓水光 申请人:浙江大学苏州工业技术研究院, 苏州龙唐信息科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1