基于关联规则预测的协同过滤推荐方法

文档序号:6517097阅读:1453来源:国知局
基于关联规则预测的协同过滤推荐方法
【专利摘要】基于关联规则预测的协同过滤推荐方法,它涉及互联网个性化推荐领域。根据用户的搜索、浏览行为等反馈,挖掘并获取网站上用户对项目的评分数据;对无法挖掘等项目,通过挖掘用户特征与项目特征之间的关联规则来预测;利用用户和项目之间的关联规则,构造用户评分的偏好矩阵;根据用户偏好矩阵,对稀疏的用户评分矩阵进行预测;改进传统相似度度量的方法,计算用户ui与用户uj之间的相似性,通过用户相似性方法获得目标用户最近邻用户BNS,最终通过BNS获得推荐评分;评估基于关联规则预测的协同过滤推荐方法。本发明有效的提高了用户相似度的计算准确性,在稀疏数据的条件下保持较高的推荐质量,对新用户的推荐质量也具有较高准备度。
【专利说明】基于关联规则预测的协同过滤推荐方法
所属【技术领域】
[0001]本发明涉及互联网个性化推荐领域,尤其涉及一种基于关联规则的协同过滤推荐方法。
【背景技术】
[0002]信息过载是互联网应用的重要特征和主要挑战,每天有大量的信息发布到网上,使得传统的搜索技术不能满足用户对信息发现的需求,而推荐系统的出现可以更好地帮助用户发现和获取更符合个人需要的信息。个性化推荐根据用户特点和个人偏好,其主要任务是从海量的信息中为目标用户推送感兴趣的内容,随着互联网技术和电子商务的发展,诸如Amazon,淘宝,eBay等都采用了不同形式的推荐系统,针对不同的推荐系统的要求,研究者提出了不同的推荐算法,如协同过滤,聚类方法,关联规则技术等。
[0003]协同过滤是一种在推荐系统中广泛应用的推荐方法,算法基于“物以类聚”的假设,即目标用户感兴趣的内容可以利用与该用户具有偏好相似的其他用户的感兴趣的内容进行推荐,基于协同过滤的推荐方法在用户评分系统中得到了很好的应用,物品之间的关联直接通过用户建立,省去了对项目的处理过程,当前的协同过滤方法具有两种不同的类型,分别是基于用户的推荐和基于物品的推荐。
[0004]基于关联规则的推荐更常见于电子商务系统中,并且也被证明行之有效,其实际的意义为购买了一些物品的用户更倾向于购买另一些物品,基于关联规则的推荐系统的首要目标是挖掘出关联规则,也就是那些同时被很多用户购买的物品集合,这些集合内的物品可以相互进行推荐。基于关联规则的推荐系统一般转化率比较高,因为当用户已经购买了频繁集合中的若干项目后,购买该频繁集合中的其他项目的可能性更高。然而挖掘项目集合的关联规则计算量较大,同时也存在用户数据的稀疏性问题,降低了推荐的准确率。

【发明内容】

[0005]本发明提供了一种基于关联规则预测的协同过滤推荐方法,它针对协同过滤方法用户数据稀疏性的问题,通过所有用户对项目或者信息的偏好,发现用户和物品的特征之间的关联规则对用户未评分项目进行预测,构建用户的偏好矩阵,在此基础上,利用偏好矩阵设计最近邻相似度度量方法,最后通过实际数据验证了算法的有效性。
[0006]为了解决【背景技术】所存在的问题,本发明包括如下步骤:
[0007]101根据用户的搜索、浏览行为以及用户的实际反馈,挖掘并获取网站上用户对项目(或产品)的评分数据;
[0008]102对于无法挖掘或者用户未评分的项目,通过挖掘用户特征与项目特征之间的关联规则来进行预测;
[0009]103利用用户和项目之间的关联规则,构造用户评分的偏好矩阵;
[0010]104根据用户偏好矩阵,对稀疏的用户评分矩阵进行预测;
[0011]105通过改进传统相似度度量的方法,计算用户Ui与用户Uj之间的相似性,进一步通过用户相似性方法获得目标用户的一组最近邻用户BNS,最终通过BNS获得用户Ui对项目tk的推荐评分;
[0012]106实验评估基于关联规则预测的协同过滤推荐方法。
[0013]本发明采用上述技术方案,具有以下有益效果:本发明使用关联规则的方法,通过挖掘所有用户对项目或者信息的偏好,发现用户和项目的特征之间的关联规则,此发明一方面避免了传统挖掘项目集合的关联规则计算较大的问题,另一方面利用挖掘出的用户与项目特征之间的关联规则,从根本上解决了协同过滤推荐方法中普遍存在的用户数掘稀疏的问题,有效的提高了用户相似度的计算准确性,在稀疏数据的条件下保持较高的推荐质量,对新用户的推荐质量也具有较高准备度。
【专利附图】

【附图说明】
[0014]图1为本发明实施具体实例的方法流程图;
[0015]图2为本发明利用用户和项目的关联规则生成的用户评分偏好矩阵示意图,其中不同属性值的用户对不同类型的项目具有不同的偏好值;
[0016]图3为本发明在GroupLens站点的MovieLens Data Set实验结果示意图。
[0017]实施方式
[0018]参见图1-2,本发明方法包括以下步骤:
[0019]101根据用 户的搜索、浏览行为以及用户的实际反馈,挖掘并获取网站上用户对项目(或产品)的评分数据;具体包括:
[0020]101-1提取网站中具体注册用户对某一项目(或产品)阅读、购买或使用后,对该项目(或产品)实际的评价反馈得分数据,将数据映射到用户评分矩阵中;
[0021]101-2对于用户未实际反馈评分数据的项目(或产品),分析和挖掘网站日志文件中,用户对该项目的搜索频率、浏览时间等预测用户评分数据。
[0022]102对于无法挖掘或者用户未评分的项目,通过挖掘用户特征与项目特征之间的关联规则来进行预测;在推荐系统中,用户和项集的不同特征之也存在相应的关系,通过关联规则分析能够发现其中隐含的关联;
[0023]用户和项目的特征抽象为两组变量J=U1, X2, xk} Y={y1; y2,..., yj
[0024]Xi和Ji分别是用户特征变量和项目特征变量,相应的关联规则可以表示为蕴含式Xi^yi支持度和置信度是衡量关联规则强度的基本标准,支持度s反映了在所有数据中同时出现XjPyi的概率,而置信度c反映了在出现Xi的情况下出现yi的概率。令\和(^.分别表示关联规则XiOyi的支持度和置信度,则特征Xjtyi的偏好表示为=Pu=CuXsij
[0025]利用用户和项目的关联规则生成的用户评分偏好矩阵如图2,不同属性值的用户对不同类型的项目具有不同的偏好值。
[0026]103利用用户和项目之间的关联规则,构造用户评分的偏好矩阵。
[0027]104根据用户偏好矩阵,对稀疏的用户评分矩阵进行预测。
[0028]步骤103及步骤104基于用户偏好矩阵,对稀疏的用户评分矩阵进行预测。
[0029]令用户u对项目t的评分预测值为dpM,Xu £ X和I; £ 7分别是u和t对应的属性特征,[0030]dpre 可以表示为:
【权利要求】
1.基于关联规则预测的协同过滤推荐方法,其特征在于,包括如下步骤: 101根据用户的搜索、浏览行为以及用户的实际反馈,挖掘并获取网站上用户对项目(或产品)的评分数据; 102对于无法挖掘或者用户未评分的项目,通过挖掘用户特征与项目特征之间的关联规则来进行预测; 103利用用户和项目之间的关联规则,构造用户评分的偏好矩阵; 104根据用户偏好矩阵,对稀疏的用户评分矩阵进行预测; 105通过改进传统相似度度量的方法,计算用户Ui与用户Uj之间的相似性,进一步通过用户相似性方法获得目标用户的一组最近邻用户BNS,最终通过BNS获得用户+对项目tk的推荐评分; 106实验评估基于关联规则预测的协同过滤推荐方法。
2.根据权利要求1所述的方法,其特征在于,所述101还包括包括以下步骤: 101-1提取网站中具体注册用户对某一项目(或产品)阅读、购买或使用后,对该项目(或产品)实际的评价反馈得分数据,将数据映射到用户评分矩阵中; 101-2对于用户未实际反馈评分数据的项目(或产品),分析和挖掘网站日志文件中,用户对该项目的搜索频率、浏览时间等预测用户评分数据。
3.根据权利要求1所述的方法,其特征在于,步骤102中,所述关联规则挖掘主要为挖掘用户特征与项目特征之间的关联规则,在所述步骤103中对于步骤102的关联规则,通过用户特征到项目特征的支持度和置信度,来计算用户特征对项目特征的偏好表示,进而构造用户评分偏好矩阵,不同属性值的用户对不同类型的项目具有不同的偏好值。
4.根据权利要求1或3所述的方法,其特征在于,所述104根据步骤103构造的用户评分偏好矩阵,对稀疏的用户评分矩阵进行预测,通过用户共同评分的项目的数量,从根本上解决稀疏矩阵的问题。
5.根据权利要求1所述的方法,其特征在于,所述105包括采用改进传统相似度度量的方法,计算用户Ui与用户+之间的相似性,并且通过用户相似性方法获得目标用户的一组最近邻用户BNS,最终通过BNS获得用户Ui对项目tk的推荐评分。
6.根据权利要求1所述的方法,其特征在于,所述106包括准备数掘集;采用平均绝对偏差MAE作为评价标准;不同的最近邻集合数量下进行试验比较不同算法的性能;分析试验结果。
【文档编号】G06Q30/00GK103593417SQ201310525778
【公开日】2014年2月19日 申请日期:2013年10月25日 优先权日:2013年10月25日
【发明者】吴雷, 阮怀伟, 昌磊 申请人:安徽教育网络出版有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1