融入时间上下文信息的协同过滤推荐方法

文档序号：6551771阅读：386来源：国知局

融入时间上下文信息的协同过滤推荐方法
【专利摘要】一种融入时间上下文信息的协同过滤推荐方法，在原有的基于项目的协同过滤推荐算法和基于用户的协同过滤推荐算法的基础上，融入时间上下文信息，并将这两种算法结合到一个统一的算法中。对于基于用户的协同过滤算法，首先在用户相似度计算阶段融入时间衰减函数；然后对物品进行聚类，训练出一个用户对一个物品类别的兴趣衰减因子；最后在评分预测阶段融入时间衰减函数。针对基于物品的协同过滤算法，过程与基于用户的协同过滤算法类似，最后将两种算法结合到一个统一的算法中。由于在相似度计算阶段和评分预测阶段都引入了时间衰减函数，而且为不同用户对不同类别的物品使用不同的时间衰减因子，从而可以有效提高预测的准确度。
【专利说明】融入时间上下文信息的协同过滤推荐方法

【技术领域】
[0001] 本发明涉及个性化推荐系统技术，尤其涉及一种融入时间上下文信息的协同过滤推荐方法。

【背景技术】
[0002] 推荐系统为解决信息过载（information overload)的问题而出现，广泛应用于电子商务、电影、视频、音乐、设计网络、阅读、基于位置的服务、个性化邮件和广告等领域。通过分析大量的用户行为日志，推荐系统能够给不同的用户展示不同的个性化页面，提高了网站的点击率和转化率。
[0003] 协同过滤（Collaborative Filtering)算法是推荐系统领域最早提出来的算法，该算法已经在学术界和工业界得到深入的研究和广泛的应用。协同过滤算法分为基于用户 (user-based)的协同过滤算法和基于物品（item-based)的协同过滤算法两大类。基于用户的协同过滤算法为用户推荐和该用户兴趣相似的用户喜欢的物品，而基于物品的协同过滤算法则为用户推荐和他/她之前喜欢的物品相似的物品。但现有的协同过滤算法准确率较差。

【发明内容】

[0004] 本发明解决的问题是提供一种融入时间上下文信息的协同过滤推荐方法，更加客观地反映了用户对物品的兴趣的变迁，推荐结果精确。
[0005] 为解决上述问题，本发明实施例提供了一种融入时间上下文信息的协同过滤推荐方法，包括：
[0006] 收集用户对物品的评分；
[0007] 建立用户-物品评分矩阵；
[0008] 计算用户、物品的评分平均值；
[0009] 计算融入时间衰减函数的用户相似度和物品相似度；
[0010] 分别对用户和物品进行聚类；
[0011] 计算用户对物品聚类的时间衰减系数和学习用户聚类对物品的时间衰减系数；
[0012] 混合基于物品的协同过滤算法和基于用户的协同过滤算法进行评分预测。
[0013] 可选的，基于用户的协同过滤算法通过下面的公式预测用户U对物品i的评分：

【权利要求】
1. 一种融入时间上下文信息的协同过滤推荐方法，其特征在于，包括：收集用户对物品的评分；建立用户-物品评分矩阵；计算用户、物品的评分平均值；计算融入时间衰减函数的用户相似度和物品相似度；分别对用户和物品进行聚类；计算用户对物品聚类的时间衰减系数和学习用户聚类对物品的时间衰减系数；混合基于物品的协同过滤算法和基于用户的协同过滤算法进行评分预测。
2. 如权利要求1所述的融入时间上下文信息的协同过滤推荐方法，其特征在于，基于用户的协同过滤算法通过下面的公式预测用户u对物品i的评分：
其中IT是用户u的平均评分，F是与用户u相似的用户V的平均评分。
3. 如权利要求1所述的融入时间上下文信息的协同过滤推荐方法，其特征在于，基于物品的协同过滤算法通过下面的公式预测用户u对物品i的评分：
?其中?是物品i获得的平均评分是和物品i相似的物品j的平均评分。
4. 如权利要求1所述的融入时间上下文信息的协同过滤推荐方法，其特征在于，在计算用户、物品的评分平均值的同时，计算系统所有评分的均方根误差、每个用户评分的均方根误差和每个物品评分的均方根误差。如权利要求1所述的融入时间上下文信息的协同过滤推荐方法，其特征在于，使用公式
计算用户之间的皮尔逊系数相似度，使用公式
十算物品之间的皮尔逊系数相似度，同时在相似度计算公式中融入时间衰减函数，时间衰减函数见公式
5. 如权利要求4所述的融入时间上下文信息的协同过滤推荐方法，其特征在于，融入时间衰减函数的方式是直接和时间衰减函数相乘，其中时间衰减函数中的α是时间衰减系数，表示相似度随时间变化的速度。
6. 如权利要求1所述的融入时间上下文信息的协同过滤推荐方法，其特征在于，所述时间衰减系数的学习方法包括：每次忽略一个评分，然后利用该忽略的评分来度量预测函数能否反映用户对物品的评分行为，使用最小化后的平均绝对误差度量。
7. 如权利要求6所述的融入时间上下文信息的协同过滤推荐方法，其特征在于，最小化平均绝对误差的方法包括：设置上限和下限；使用几个离散的计算平均绝对误差，选择平均绝对误差最小的值作为最优值。
【文档编号】G06F17/30GK104391849SQ201410307707
【公开日】2015年3月4日申请日期:2014年6月30日优先权日:2014年6月30日
【发明者】尹建伟, 王成文, 李莹, 邓水光申请人:浙江大学苏州工业技术研究院, 苏州龙唐信息科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：尹建伟;王成文;李莹;邓水光;
技术所有人：浙江大学苏州工业技术研究院;苏州龙唐信息科技有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。