社交网络中的潜在好友推荐方法

文档序号:6620012阅读:491来源:国知局
社交网络中的潜在好友推荐方法
【专利摘要】本发明通过两层模型实现对潜在好友的推荐。第一层首先是对每个用户的文章进行主题分类,构建出用户关注度向量,计算用户的余弦(cosine)相似度,获得粗略潜在好友推荐列表。第二层将用户随时间的兴趣变化计入考虑,将变化因素考虑到相似度计算中,再基于第一层的粗化推荐表进一步细化好友推荐。由于利用了文章反映用户兴趣这一特征,从相似兴趣度出发,绕过了现有社交网络基于用户原有好友关系的限制,实现了基于兴趣相似度的好友推荐方法,拓展了好友推荐的范围,进而在大范围中更准确有效地实现好友的推荐。
【专利说明】社交网络中的潜在好友推荐方法

【技术领域】
[0001] 本发明涉及计算机程序领域,尤其涉及一种社交网络中的潜在好友推荐方法。

【背景技术】
[0002]Web2. 0的兴起让越来越多的网络使用者参与到社交网络中,他们热衷于进行资源 分享与信息互换,通过在线社交网络的相互交流越来越多。针对用户产生内容的研究不仅 可以帮助商家了解各类不同用户群对商品的喜好趋势,也能改善多种网络服务,对于提升 用户体验具有重要的意义。
[0003] 由于网络用户渐渐已经不满足于现实中的朋友圈形成的社交圈,在社交网络中找 到拥有共同兴趣爱好的陌生用户成了众多用户的需求。在社交网络中,扩大用户的交友圈 是社交网络发展的主要方式之一,有效地找到感兴趣的联系人可以给予用户交友或者职业 上的帮助。然而,现有系统提供的好友推荐功能并不十分理想。因此,提出一种有效的好友 推荐机制具有很强的现实意义。
[0004]经文献检索发现,ChenW和FongS在文章"Socialnetworkcollaborating filteringframeworkandonlinetrustfactors:AcasestudyonFacebook,'("通过石开究 Facebook数据,结合信任因素的社交网络协同过滤过滤模型")(2010fifthinternational conferenceonΙΟΠΜ,ΙΕΕΕ2010:266-273)中提出信任因素与协同过滤模型相结合的推荐 方法,具体为:首先,利用数据挖掘的方法(决策树和关联规则)分析用户数据,得出社交活 动中各要素对用户信任度的影响。然后将这些信任度影响因素量化,作为协同过滤模型的 一部分输入。最后,结合用户特征进行协同过滤推荐。但是该方法在量化信任度各要素的 权重时存在一定的困难,不能很好的确定各要素的权重,这势必对最终的推荐结果带来一 定的影响。
[0005]经文献检索发现,NitaiΒ.Silva和Ing-RenTsang等人在文章"Agraph-based friendrecommendationsystemusinggeneticalgorithm,'( "利用遗传算法的基于图结 构的好友推荐系统")(2010IEEEcongressonEvolutionaryComputation, 2010:1-7)提 出利用网络拓扑结构来推荐好友。具体为:首先,分割出当前用户一定距离内的本地子图, 然后利用遗传算法分析用户的好友以及好友的好友的网络结构特征,过滤出成为好友概率 较大的节点推荐给用户。但是,该推荐系统是一种熟人推荐机制,对用户拓展交友圈贡献不 是很显著。


【发明内容】

[0006] 本发明要解决的技术问题是如何拓展好友推荐的范围,进而在大范围中更准确有 效地实现好友的推荐。
[0007] 为了解决这一技术问题,本发明提供了两种相类似的社交网络中的潜在好友推荐 方法,其中一种方法包括如下步骤:
[0008] SOl :从社交网络服务器上获得每位用户在一年内发表的所有文章,并进行存储记 录;
[0009]S02 :统计每位用户在每个主题下的文章总数;
[0010] 完成步骤S02后,分别进行步骤S03和S04,完成步骤S04后,实施步骤S05,其中:
[0011]S03 :利用余弦定理依据以下公式计算用户间的粗略相似度:

【权利要求】
1. 一种社交网络中的潜在好友推荐方法,包括如下步骤: 501 :从社交网络服务器上获得每位用户在一年内发表的所有文章,并进行存储记录; 502 :统计每位用户在每个主题下的文章总数; 完成步骤S02后,分别进行步骤S03和S04,完成步骤S04后,实施步骤S05,其中: 503 :利用余弦定理依据以下公式计算用户间的粗略相似度: k …_ Ση_χη_ similarity,. ., = t?_1 . -/n(U)2+ n(l,2)2+ - + n(U)2 λ/Π ^)2+ n(l^)2+ - + η?,^)2 其中,similarity(i;j)为用户i与用户j的粗略相似度,k为主题的数量,Πμ表示用户 i在主题t下发表的文章数,ηρ表示用户j在主题t下发表的文章数; 对于一个特定的用户,对其他用户依据其与该特定的用户之间粗略相似度 similarity (ij的大小进行排列,选出相似度最高的X个用户作为该特定的用户的潜在用 户粗略推荐表; 504 :根据每个用户每个月在k个主题下发表的文章数,依据以下公式计算第m月与第 m+Ι月之间的差异difilim]: k = 1 --/ ^ =--I ^ 进而依据以下公式计算X个用户中每个用户在一年中的兴趣变化敏感度入i : 又,-=^- 1 11 505 :统计文章的发表时间,通过以下公式计算主题t中两个用户的相似度simt(i,j): simt(Lj)= 丄=丨L- nax> x t) 其中,nat)与nat)分别为主题t中用户i、用户j各自拥有的文章总数,λ为敏感因 子,所述敏感因子λ通过以下公式计算得到: 2 最终,通过以下公式获得两个用户间的细化相似度sim(i,j) sim{i. ι]二----Γ-;- 完成S03和S05后,实施以下步骤: S06 :对于该特定的用户,将其粗略推荐列表中的X个用户依据其与该特定的用户之间 的细化相似度sim(i,j)的大小进行排列,获得最终的推荐列表,从而向该特定的用户提供 该最终的推荐列表。
2. -种社交网络中的潜在好友推荐方法,包括如下步骤: 501 :从社交网络服务器上获得每位用户在一年内发表的所有文章,并进行存储记录; 502 :统计每位用户在每个主题下的文章总数; 503 :利用余弦定理依据以下公式计算用户间的粗略相似度: k Zn(U)xnc,o similarity, y) - f 2 2 卜1,/~~~ 2 2 士灿 +n(i,2) +…+ n(UrVn(j,l) +n(j,2> 十…+ tV) 其中,similarity(i;j)为用户i与用户j的粗略相似度,k为主题的数量,Πμ表示用户 i在主题t下发表的文章数,ηρ表示用户j在主题t下发表的文章数; 对于一个特定的用户,对其他用户依据其与该特定的用户之间粗略相似度 similarity(u的大小进行排列,选出相似度最高的X个用户作为该特定的用户的潜在用 户粗略推荐表; 504 :根据该特定用户和潜在用户粗略推荐表中的每个用户每个月在k个主题下发表 的文章数,依据以下公式计算第m月与第m+1月之间的差异difi [m]: k V'V坩+u> 十1,2> +…+ ~,? + l,A ) X 进而依据以下公式计算X个用户中其中每个用户在一年中的兴趣变化敏感度λi : Λ, - 1 11 505 :统计该特定用户和潜在用户粗略推荐表中的每个用户文章的发表时间,通过以下 公式计算主题t中两个用户的相似度sim t(i,j): na,t) n(j,t) -X^ime^a^-timeijy)^ -(,,j)=厶/?=丄=丨g- η?Λ) X ^j.t) 其中,nat)与nat)分别为主题t中用户i、用户j各自拥有的文章总数,λ为敏感因 子,所述敏感因子λ通过以下公式计算得到: x_{xi^xj) _ ^2^ 最终,通过以下公式获得两个用户间的细化相似度sim(i,j) sun{" j)二-=-Γ?- S06 :对于该特定的用户,将其粗略推荐列表中的x个用户依据其与该特定的用户之间 的细化相似度sim(i,j)的大小进行排列,获得最终的推荐列表,从而向该特定的用户提供 该最终的推荐列表。
3. 如权利要求1或2所述的社交网络中的潜在好友推荐方法,其特征在于:在所述步 骤SOI中,每位用户在一年内发表的所有文章以以下方式存储: Blog(useri) = {b^ b2,......,bj 其中,Blogbseri)表示用户i的所有文章集合,bq指的是Blogbseri)中第q篇文章。
4. 如权利要求1或2所述的社交网络中的潜在好友推荐方法,其特征在于:在所述步 骤S01和S02之间还包括如下步骤: 对于每位用户的文章,基于预设的分类标签,利用多标签主题分类模型进行分类,经过 分类后,每篇文章获得三个标签,每个标签对应一个主题。
5. 如权利要求4所述的社交网络中的潜在好友推荐方法,其特征在于:所述多标签主 题分类模型包括第一层模型和第二层模型; 所述第一层模型,用于通过分词工具为每篇文章进行分词处理,随后通过词性过滤与 停止词的过滤获得每篇文章的有效词,之后使用词频-逆文档频率来计算每个词的权重, 从而获得每篇文章的关键词; 所述第二层模型,用于依据语义知识库将所述第一层模型中获得的关键词与标签进行 语义匹配,之后,对每篇文章的关键词获得的标签使用多源证据融合的方法计算出每篇文 章最终的标签。
6. 如权利要求5所述的社交网络中的潜在好友推荐方法,其特征在于:所述多源证据 融合的方法采用了 Dempster合成规则。
7. 如权利要求5所述的社交网络中的潜在好友推荐方法,其特征在于:所述分词工具 为ICTCLAS分词工具。
8. 如权利要求5所述的社交网络中的潜在好友推荐方法,其特征在于:所述语义知识 库为《知网》与《同义词词林拓展版》。
9. 如权利要求1或2所述的社交网络中的潜在好友推荐方法,其特征在于:在所述步 骤S03中,先依据用户每个主题下的文章总数,得到用户的文章主题关注度向量: userj = ((topics, nia),(topic2, nij2),......, (topick, nijk)) 其中,useri表示用户i, topict表示第t个主题,k为主题的数量; 进而依据该主题关注向量进行粗略相似度similarityuj。
10. 如权利要求1或2所述的社交网络中的潜在好友推荐方法,其特征在于:在所述步 骤S04中,先依据用户每个月每个主题下的文章总数,得到一年中每个月份中主题关注分 布表: user^m] = {(topic^ nijDljl), (topic2, nijIIlj2),......, (topick, nijIIljk)} 其中,m表示月份,n^t表示用户i在第m月、主题t下发表的文章数,k为主题的数 量。
【文档编号】G06F17/30GK104239399SQ201410333744
【公开日】2014年12月24日 申请日期:2014年7月14日 优先权日:2014年7月14日
【发明者】陈秀真, 李建华, 李生红, 史辰烨, 周泉 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1