用户可信度和项目最近邻相结合的互联网推荐方法

文档序号:6655030阅读:238来源:国知局
专利名称:用户可信度和项目最近邻相结合的互联网推荐方法
技术领域
本发明属于数据挖掘领域,具体地说是一种用户可信度和项目最近邻相结合的互 联网推荐方法。
背景技术
在过去的近十年里,推荐系统己成为解决信息过载重要途径,在研究和应用领域 都获得了极大的关注。推荐系统根据用户的兴趣爱好,推荐符合用户兴趣爱好的对象,现在 推荐算法广泛应用于电影、书籍和音乐等电子商务推荐系统中。目前已有的推荐算法多使 用协作过滤算法,该算法的推荐方法大多基于用户-项目矩阵(User-Item Matrix)进行推 荐,该算法的优点是可对多种类型的资源进行过滤,并能为用户发现新的感兴趣的信息,缺 点是存在两个很难解决的问题一个是稀疏问题,即用户-项目矩阵稀疏,由于系统资源未 获得足够多的评价系统很难利用这些评价来发现相似的用户;另一个是冷启动问题,即一 个新的用户可能没有或很少的用户评分,该用户很难选择到其相似用户集合,所以很难获 得该用户的预测评分。为了解决基于协作过滤的推荐系统的稀疏性问题,最简单的解决方法是给每个未 评分项目设定一个初始值,该方法对推荐系统的准确性提高很小,另一种方法是使用机器 学习的方法来解决,如使用评价矩阵的奇异值分解降维方法来提高平均矩阵的密度,该方 法优于以前的推荐系统,但使用该方法每当有新的用户或项目时需再次使用奇异值分解降 维,降低了系统的性能和可复用性。而对于冷启动问题,最简单的解决方法是推荐最热门的 项目给新的使用者,该方法未考虑用户行为,推荐结果可能不受用户喜欢;另一种方法是花 一段时间搜集使用者的数据,待过了这一段时间后再来予以推荐,该方法在用户不愿提供 个人信息的情况下无法提高系统推荐的准确性;还有一种方法是建立一种适合于在用户评 分稀少情况下的相似性度量方法,该方法一定层度上解决了冷启动问题,但推荐准确性还 有待提高。为了同时解决推荐系统稀疏性和冷启动问题,现有研究提出了基于可信网络的推 荐算法,在系统中让用户选择自己的可信用户,指出他所可信的用户的可信等级,这些可信 度关系组成了一个可信网络,可以用可信传播方法进一步扩充自己的可信用户数量,然后 通过基本公式来预测活动用户的评分值,现有的推荐算法多是基于用户模型,也就是说,如 果A信任B,就意味着A要信任B对每一个项目的推荐。显然,在一个用户多兴趣的情况下, 仅仅指望某可信推荐者在所有的类别中都是与自己兴趣相似的可信赖的推荐邻居,这是不 符合现实的。

发明内容
鉴于现有的基于可信网络的推荐算法存在的问题,本发明的目的是提供一种用户 可信度和项目最近邻相结合的互联网推荐方法,该方法不仅考虑可信用户的评分,同时考 虑该项目的相似邻居,推荐结果准确。
本发明的目的是通过以下技术方案来实现的
一种用户可信度和项目最近邻相结合的互联网推荐方法,其特征在于该方法首 先建立用户间的可信度DAG图,接着计算第S步在用户 停止随机漫步的概率,然 后设定随机漫步的结束条件,并根据随机漫步条件预测用户《对目标项目i的评分
Pii-,最后根据预测的评分将用户《最有可能感兴趣的#个项目推荐给该用户,具体实施步
骤如下
1)输入用户-项目评分矩阵和可信网络,其中用户-项目评分矩阵是根据用户集合V 和项目集合/,用户集合V和项目集合/构成一个 */ 阶矩阵Wfe ),其中ι表示用户u 对项目i的评分,如果用户u未对项目i评分,则将其评分值设定为0,每个用户u评分的 项目集合用表示;对于可信网络,如果用户《对用户r信任,则to, r表示代表了用户“对 用户r的可信值,0表示不信任,而1表示完全信任;定义U\ tu, ν =1},该集合定 义了用户"直接可信的用户集合,则可信网络可定义成一个DAG图G=<m, 71/>,其中Tu= {{u, ν)\we.L ν -Ξ 7Ζ4/ },其中该图的顶点表示每一个用户,而边表示两顶点的信任关系;
2)将u作为源点,计算停留在用户Ii上的停止概率,然后随机判定是否停留在用户U 上,如果选择停留,则跳转到步骤5),否则执行步骤3);停留在用户u上的停止概率的计算 公式如式(1)所示
权利要求
1. 一种用户可信度和项目最近邻相结合的互联网推荐方法,其特征在于该方法 首先建立用户间的可信度DAG图,接着计算第S步在用户u停止随机漫步的概率,然 后设定随机漫步的结束条件,并根据随机漫步条件预测用户《对目标项目i的评分Pii-,最后根据预测的评分将用户《最有可能感兴趣的#个项目推荐给该用户,具体实施步骤如下1)输入用户-项目评分矩阵和可信网络,其中用户-项目评分矩阵是根据用户集合V 和项目集合/,用户集合V和项目集合/构成一个 */ 阶矩阵Wfe ),其中i表示用户u 对项目i的评分,如果用户u未对项目i评分,则将其评分值设定为0,每个用户u评分的 项目集合用表示;对于可信网络,如果用户《对用户r信任,则to, r表示代表了用户“对 用户r的可信值,0表示不信任,而1表示完全信任;定义U\ tu, ν =1},该集合定 义了用户"直接可信的用户集合,则可信网络可定义成一个DAG图G=<m, 71/>,其中Tu= {{u, v) \u'E U, VE TZ/" },其中该图的顶点表示每一个用户,而边表示两顶点的信任关系;2)将u作为源点,计算停留在用户Ii上的停止概率,然后随机判定是否停留在用户U 上,如果选择停留,则跳转到步骤5),否则执行步骤3);停留在用户u上的停止概率的计算 公式如式(1)所示
2.根据权利要求1所述的用户可信度和项目最近邻相结合的互联网推荐方法,其特征 在于使用均方根误差(RMSE)作为评估度量,对在线用户u的未评分项目进行预测,RMSE 的计算公式如式(10)所示
全文摘要
本发明公开了一种用户可信度和项目最近邻相结合的互联网推荐方法,该方法首先建立用户间的可信度DAG图,接着计算第s步在用户u停止随机漫步的概率,然后设定随机漫步的结束条件,并根据随机漫步条件预测用户u对目标项目i的评分,最后根据预测的评分将用户u最有可能感兴趣的N个项目推荐给该用户。该方法不仅考虑可信用户的评分,同时考虑该项目的相似邻居,推荐结果准确。
文档编号G06F17/30GK102135999SQ20111007267
公开日2011年7月27日 申请日期2011年3月25日 优先权日2011年3月25日
发明者伍之昂, 曹杰, 李秀怡, 王有权 申请人:南京财经大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1