一种融合社交网络和项目内容的协同推荐系统的制作方法

文档序号:9787418阅读:496来源:国知局
一种融合社交网络和项目内容的协同推荐系统的制作方法
【技术领域】
[0001]本发明属于个性化推荐技术领域,特别是涉及一种融合社交网络和项目内容的协 同推荐系统。
[0002] 背景介绍
[0003] 推荐系统是从海量信息中提取过滤出用户最喜欢或者与用户最相关的项目(比如 照片,视频,音乐,文章,新闻,评论,标签等等)从而缓解信息超载所带来的问题,使得用户 更容易找到相关的项目。推荐系统通常是采用个性化技术或者集体智能来找到用户感兴趣 的内容。众多信息推荐算法,比如基于邻居关系的协同过滤、矩阵因式分解、基于网络方法 等,都已被用来自动预测用户的兴趣。
[0004] 社会媒体和推荐系统能够相辅相成,彼此受益。一方面,社会媒体引进了大量日益 增长的信息以及元信息,比如标签,评分,评论以及用户之间的关系,来增强推荐效果;另一 方面,推荐技术能够更好的结合社交网络的新老用户,从而使得社交媒体应用更加的成功。 因此,将推荐系统技术和社交网络相结合,利用社交媒体的海量信息去提高推荐模型效果 已经成为诸多科研工作者的研究热点。此外,项目的内容信息也能够用来解决以往的数据 稀疏问题,提高推荐系统的预测能力。
[0005] 现在大部分的推荐系统的研究都会利用到推荐项目内容或者社交网络信息,但是 将两者相结合的方法却很少。

【发明内容】

[0006] 为了解决上述问题,本发明提出一种结合用户社交网络信息和项目内容信息的协 同推荐方法,基于分解评分矩阵的策略来进行评分预测,提出在矩阵分解过程中,将项目的 内容信息和用户的社交网络信息作为额外的信息源,来构建评分矩阵的分解方法,提出用 户隐含向量和项目隐含向量的学习方法,利用学习的最优隐变量进行评分预测和实施推 荐,该方法具体包括:
[0007] 步骤1,将每个项目的内容表示成文本向量形式,设定隐含主题的数目K,利用LDA 主题模型生成项目-主题的分布Θ和主题-词的分布Φ ;
[0008] 步骤2,利用用户历史评分记录数据构成的评分矩阵R,建立预测模型R = UTV,其中 用户i对项目j的预测模型% =碎今srW轉+ ??
[0009] 步骤3,利用评分矩阵R,用户之间的社交网络数据,项目-主题的分布Θ,构建参数 学习方法,求解拟合评分矩阵R的最优参数U和V;
[0010] 步骤4,对于用户i,使用步骤3所得参数对所有未知的项目进行评分预测,按照评 分降序排列候选项目,形成推荐列表。
[0011] 进一步地,步骤1中,将每个项目内容表示成文本向量,LDA主题模型的一般生成过 程如下:
[0012] 对于项目集合中的任意项目j,
[0013] SI · 1:主题发生概率Θ」~Dirichlet(a);
[0014] SI. 2:对于每个词Wjn,
[0015] a)主题分布Zjn~Mult(Q);
[0017] 进一步地,步骤2中,建立用户对项目的预测模型,用户i对项目j的评分预测值可 表不为两个隐含向量的内积%二=
[0018] 进一步地,步骤3中,参数学习方法的构建如下:
[0019] S3. 1 :假设Ul、q、rij服从正态分布,则对于每个用户i,其隐含变量 巧? 对于每个项目j,项目隐含偏移量:?~#(????对于每个用户-项目对(i, j),评分巧:??其中Cij反映了rij的置信度
[0021 ] 其中a和b为调节参数,并且有a?b>0,缺省设置为a=l,b = 0.01。建立一种基于EM 原理的参数学习方法,来求解参数m,e」。求解最优的参数,等价于最大化下列目标优化函 数:
[0023] S3.2:由于在社交网络中,用户经常会被周围朋友所影响。在做出某项选择的时 候,用户会征求信任朋友的意见,使得朋友之间兴趣会趋向一致。因此,本专利提出了一种 基于用户的社交网络的正规化项来描述此种情况:
[0025]其中Ar为权重调节参数,Sll为用户i和用户1之间的信任度评分规范化项,并且有,
[0027] sim(i,1)表不用户i和用户1之间的相似度,丨表不用户i所信任的用户数量, 轉1表示信任用户1的用户数量。
[0028] S3.3:将上述提出的正规化项(3)与S3.1中提出的求解参数Ui,e」的方法相结合, 则可得到融合社交网络和项目内容的新的目标优化函数:
[0030]对£(??求解关于U1和巧的梯度值,令梯度值等于零,从而得到U1和W的更新解析 式,
[0033] 其中C1Sclj对角元素的对角矩阵,
[0034] S3.4:通过循环方法,迭代更新隐含参数,使目标函数最大化,确定优化的隐含参 数。
[0035] 进一步地,于步骤4中,对于用户i,使用步骤3所得结果,基于 % +对所有未知的项目进行评分预测,按照评分降序排列项目,形成推荐 列表,从而进行项目推荐。
[0036]本发明提出的一种结合用户社交网络和项目内容的协同推荐系统,有效地整合了 评分数据、社交网络、项目内容多种信息源,通过机器学习算法寻找最优的表征用户兴趣的 隐含变量,基于用户和项目变量实施个性化推荐,能够更好地优化用户和项目的隐含变量, 提高了预测的可靠性以及推荐系统的精准性。
【附图说明】
[0037]图1为本发明一种融合社交网络和项目内容的协同推荐系统步骤流程图;
[0038]图2为本发明更新预测模型流程图。
【具体实施方式】
[0039]图1为本发明一种融合社交网络和项目内容的的协同推荐系统的步骤流程图。如 图1所示,本发明一种融合社交网络和项目内容的协同推荐系统,包括以下步骤:
[0040] 步骤1,将每个项目的内容表示成文本向量形式,设定隐含主题的数目K,利用LDA 主题模型生成项目-主题的分布Θ和主题-词的分布Φ ;
[0041] 步骤2,利用用户历史评分记录数据构成的评分矩阵R,建立预测模型R = UTV,其中 用户用户i对项目j的预测模
[0042] 步骤3,利用评分矩阵R,用户之间的社交网络数据,项目-主题的分布Θ,构建参数 学习方法,求解拟合评分矩阵R的最优参数U和V;
[0043] 步骤4,对于用户i,使用步骤3所得参数对所有未知的项目进行评分预测,按照评 分降序排列候选项目,形成推荐列表。
[0044]进一步地,于步骤1中,将每个项目内容表示成文本向量,LDA主题模型的一般生成 过程如下:
[0045]对于项目集合中的任意项目j,
[0046] SI · 1:主题发生概率Θ」~Dirichlet(a);
[0047] SI · 2:对于每个词Wjn,
[0048] a)主题分布Zjn~Mult(Q);
[0050]进一步地,于步骤2中,建立用户对项目的预测模型,用户i对项目j的评分预测值 可表示为两个隐含向量的内积:% = #1 + %3。
[0051 ]进一步地,于步骤3中,参数学习方法的构建如下:
[0052] S3. 1 :假设U1、e 服从正态分布,则对于每个用户i,其隐含变量 埯~双#, 对于每个项目j,项目隐含偏移量今~对于每个用户-项目对(i, j),评分,其中Cij反映了 rij的置信度
[0054] 其中a和b为调节参数,并且有a>>b>0,缺省设置为a = I,b = 0.01。基于上述分析, 给定可观测数据R、S和Θ,以及预设参数AU、AV,未知参数U,V的条件概率分布可表示为:
[0056] 为了寻找11,¥的最大后验估计(1&?;[1]1111113?〇8丨61';[01';0,建立一种基于期望最大化 原理(Expectation Maximization)的参数学习方法,来求解参数Ui、。求解最优的参数, 等价于最大化下列目标优化函数:
[0058] S3.2:由于在社交网络中,用户经常会被周围朋友所影响。在做出某项选择的时 候,用户会征求信任朋友的意见,使得朋友之间兴趣会趋向一致。因此,本专利提出了一种 基于用户的社交网络的正规化项来描述此种情况:
[0060]其中Ar为权重调节参数,Sll为用户i和用户1之间的信任度评分规范化项,并且有,
[0062] sim(i,1)表示用户i和用户1之间的相似度,丨表示用户i所信任的用户数量, _ 一丨表示信任用户1的用户数量。
[0063] S3.3:将上述提出的正规化项(3)与S3.1中提出的求解参数Ui,e」的方法相结合, 则可得到融合社交网络和项目内容的新的目标优化函数:
[0065] 公式(5)中的函数可以通过梯度上升的方法来优化,对£||/,.妁分别求解关于出和~ 的梯度值,令梯度值等于零,从而得到Ui
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1