融合偏好和信任关系的协同过滤推荐方法

文档序号:6372467阅读:423来源:国知局
专利名称:融合偏好和信任关系的协同过滤推荐方法
技术领域
本发明属于信息检索领域,尤其涉及一种融合偏好信任关系的协同过滤推荐方法。
背景技术
推荐系统可以帮助用户从海量信息中更容易的找到最感兴趣的内容(如新闻、图书、电影和音乐等),是解决互联网信息过载的主要途径之一,已广泛应用在电子商务中。目前,已提出了多种推荐方法,如协同过滤推荐方法、基于内容的推荐方法及混合推荐方法等。其中,协同过滤算法由于其容易理解、实现简单,已成功应用于大型商业推荐系统中。基于用户的协同过滤方法的基本原理是寻找与目标用户偏好相似的其他用户,然 后将其感兴趣的内容推荐给目标用户。因而,寻找与目标用户偏好相似的用户是基于用户的协同过滤的关键。目前,Pearson相关性、余弦相似度等是计算用户偏好相似度的主要方法,这些方法都是利用两个用户之间的共同评分项目信息。然而,通常用户-项目评分矩阵是非常稀疏的,导致与目标用户有共同评分的用户很少。此外,两个用户共同评分的项目数量一般很少。因此,现有的协同过滤推荐方法面临着偏好相似用户定位不准确问题,从而影响了评分预测的准确度和推荐质量。针对评分数据稀疏问题,目前已提出一些方法减少其对推荐结果的影响,但效果并不理想。例如,利用奇异值分解方法删除不重要的或噪音用户和项目,降低用户-项目评分矩阵的维数;利用潜在语义索引技术将两个用户投影到一个低维的空间上,再计算两者的相似度等。现实生活中,人与人之间自然地形成不同类型的社会关系网络(如朋友关系、同事关系、合作关系),并通过这些关系网络传递信息。其中,相互间的信任对信息的交流发挥着重要作用,如人们更乐意与他所信任的人交流,也更容易被他所信任的人影响,而这种信任关系可从社会网络中发现,我们称之为信任关系。随着web2.0的发展,人们(用户)之间的社会关系网络,可以更容易的挖掘出来。因此,利用社会关系网络中的信任关系,解决推荐系统的数据稀疏性问题,开始受到关注。2006年,Golbeck等人采用社会信任网络,根据目标用户信任的用户对项目的评分来估计目标用户对项目的评分值。2007年,Avesani等人基于用户的社会信任网络,采用有限步长的信任传播方法,得到目标用户对其他用户的估计信任值,基于信任估计值产生评分估计。2010年,Jebrin等人通过用户之间的信任关系和用户对项目的评分信息来计算每个用户的“全局信誉”值,基于“全局信誉”值较高的用户对项目的评分来估计目标用户对项目的评分。但以上方法将用户间的信任关系和用户对项目的评分信息隔离开来或者进行简单的线性融合,仍未能有效解决数据稀疏性对推荐系统的影响
发明内容
针对用户评分数据稀疏导致推荐系统产生的推荐结果不准确问题,本发明的目的是提供一种融合偏好信任关系的协同过滤推荐方法。该方法将互联网上的多种信息源有效融合到图模型中,利用马尔可夫随机游走方法,计算用户间的相似度,进行评分预测,可以获得更准确的推荐结果。本发明提供了一种融合偏好信任关系的协同过滤推荐方法,所述方法包括如下步骤 SI,基于用户-项目评分数据,计算用户间的相似度,构建用户偏好关系网络;S2,融合偏好关系网络与信任关系网络,构建用户偏好信任关系网络;S3,基于马尔可夫随机游走方法,利用用户偏好信任关系网络,计算用户间的相似度,确定目标用户的相似近邻;S4,根据目标用户的相似近邻对某一项目的评分值,为目标用户预测其对相应项目的评分值。


图I给出了融合偏好信任关系的协同过滤推荐方法的流程示意图。图2用户-项目评分数据的矩阵示意3用户偏好关系网络示意4用户信任关系数据的矩阵示意5用户信任关系网络示意6用户偏好信任关系网络示意7平均绝对误差与P的关系8均方根与P的关系图。
具体实施例方式以下实施例用于说明本发明,但不用来限制本发明的范围。现通过附图和实施例对本发明作进一步的详细描述。本发明实施例的前提是已获得了用户-项目评分数据与用户信任关系数据。图I为本发明实施例提供的融合偏好信任关系的协同过滤推荐方法流程示意图,如图I所示,本实施例主要包含以下步骤步骤SI,根据用户-项目评分数据,按公式⑴计算用户间的相似度Simin,构建用户偏好关系网络Gp,计算出的Simij作为网络Gp的边权重
rlike ^ Tlike\ 丄 I Tdislike ^ Tdislike
njj | + |7,· CMj.半』Simij = jI IiKJlj I,⑴
0, i = j其中,Simij表示网络Gp的节点(用户)i和j间的边权重,Ii表示被用户i评分的项目集合,/广(f)表示被用户i(j)评分大于设定阀值的项的集合,和广'te (f )表示被用户i(j)评分小于设定阀值的项的集合。图2为用户-项目评分数据的矩阵示意图,U1,..., U5表示用户,I1, . . .,I6表示项目,用户评分有5个等级,分别为I、2、3、4、5,如果用户对某项目评分,则在相应位置标出评分等级,如图2,用户U1对I1评分为3,对I3评分为2.用户偏好关系网络为带权网络,根据用户-项目数据构建,网络的权重根据用户-项目评分数据,通过步骤SI计算得到。图3为用户偏好关系网络示意图,有向边上的权重表示用户间的偏好程度,如图3用户U1对U2的偏好程度(权重)为1/4,用户U3对U4的偏好程度(权重)1/3。步骤S2,将步骤SI所得到的偏好关系网络Gp与信任关系网络Gt相融合,构建用户偏好/[目任关系网络G。图4为用户信任关系数据的矩阵示意图,U1,…,U5分别为5个用户,用户I如对用户2信任,则U12= I。如图4中,用户U1对队、U3存在信任关系。图5为用户信任关系网络示意图,用户信任关系网络是通过用户信任关系数据构建的带权有向图,有向边上的权重表示用户间是否存在信任关系。如图5中,用户U5信任U2,但用户U2不信任U5。偏好关系网络Gp与信任关系网络Gt按照如下公式(2)进行融合,得到用户偏好信任关系网络G
权利要求
1.一种融合偏好和信任关系的协同过滤推荐方法,其特征在于,包括如下步骤 Si,基于用户-项目评分数据,计算用户间的相似度,构建用户偏好关系网络; S2,融合偏好关系网络与信任关系网络,构建用户偏好信任关系网络; S3,基于马尔可夫随机游走模型,利用用户偏好信任关系网络,计算用户间的相似度,确定目标用户的相似近邻; S4,根据目标用户的相似近邻对某一项目的评分值,为目标用户预测对相应项目的评分值。
2.根据权利要求I所述的融合偏好信任关系的协同过滤推荐方法,其特征在于,该方法采用如下基本原理预测用户对项目的评分值 存在共同信任关系或偏好关系的用户,一般都有共同的习惯与爱好,融合两种关系,可得到相对稠密的用户相似度关系图,基于这种稠密图的相似度计算,能得到更为准确的相似近邻,进而产生更准确的评分预测值。
3.根据权利要求I所述的融合偏好信任关系的协同过滤推荐方法,其特征在于,基于用户-项目评分数据,按照如下方法构造用户偏好关系网络Gp
4.根据权利要求I所述的融合偏好信任关系的协同过滤推荐方法,其特征在于,将用 户信任关系网络Gt和偏好关系网络Gp通过如下方法融合为带权重的偏好信任关系网络G
5.根据权利要求I所述的融合偏好信任关系的协同过滤推荐方法,其特征在于,基于偏好信任关系网络G,按照如下方法计算目标用户节点i对其他用户节点的相似度 设向量
6.根据权利要求I所述的融合偏好信任关系的协同过滤推荐方法,其特征在于,按照如下方法计算目标用户i对项目ο的评分预测值
全文摘要
一种融合偏好和信任关系的协同过滤推荐方法,包括下列主要步骤根据用户-项目评分数据,挖掘用户间的偏好关系,构建偏好关系网络;融合偏好关系与信任关系,构建偏好信任关系网络;基于偏好信任关系网络,利用马尔可夫随机游走方法,定位目标用户的相似近邻;基于相似近邻对某一项目的评分值,为目标用户预测相应项目的评分值。本发明为推荐系统预测用户对项目的评分提供了一种全新和高效的方法,与现有方法比较,本发明具有如下主要优点(1)方法简单,易于实现,并且能产生更准确的评分预测值。(2)该方法只有一个参数,推荐结果对该参数不敏感,便于选择。
文档编号G06F17/30GK102779182SQ201210223579
公开日2012年11月14日 申请日期2012年7月2日 优先权日2012年7月2日
发明者刘大有, 杨博, 赵学华, 赵鹏飞 申请人:吉林大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1