一种社交网络中的朋友关系传递树的建立方法

文档序号:6584842阅读:905来源:国知局
专利名称:一种社交网络中的朋友关系传递树的建立方法
技术领域
本发明涉及一种社交网络中的朋友关系传递树的建立方法,属于计算机数据挖掘技术领域。
背景技术
社交网络在近些年得到了飞速的发展,也受到了许多研究人员的重视。其中社交网络的形成与演化过程研究一直都是一项有意义而且有挑战的工作。已有的工作主要从两个方面来研究社交网络的形成与演化。一方面,人们以社交网络演化中在某一时刻的快照或者多个时刻的快照为对象,研究社交网络的宏观结构特征变化;另一方面,人们关注社交网络发展的微观模式,并发现了许多的模式用以解释和分析人们如何交朋友。这样的模式包括偏好依附(Preferential Attachment)、三元闭合(triadic closure)、互惠(Reciprocity)、同质性(Homophily)等等,其中三元闭合(triadic closure)是社交网络的链接形成中最普遍的现象之一,其社会学原理是朋友关系的传递性(the transitivity offriendship),即两个有公共朋友的人更可能成为朋友。朋友关系的传递性已经被证明可以用于对网络演化过程进行建模以及预测未来的链接形成,然而这一性质在网络演化过程中所起的作用并没有得到很深的探究。学者Simmel分析了在这样三元结构中三个参与者的角色,并且指出第三个人一般扮演着中介人或者协调者的作用。然而,其中还是不清楚第三个人是如何影响、促使另外两个人成为朋友的。学者D. Yin等人在链接预测问题中考虑了中介人的作用,并且把链接产生看作是中间人“潜在的推荐”的结果。他们在矩阵分解中引入了中介人潜在推荐这一潜在的维度,然而这一分析是对于静态网络进行的,没有考虑到网络的发展以及中介人在微观上对于网络中每一条链接形成的影响。好友推荐是交友网站中的一项重要的功能,许多交友网站依靠为用户推荐好友来吸引用户、增强用户对交友网站的依赖性。目前研究者已经提出了许多算法来解决好友推荐的问题,比如随机游走算法、有监督的随机游走算法、矩阵分解算法等等,然而这些算法都把社交网络当作一个图来处理,并没有考虑到用户的动机和行为在好友推荐中的重要作用。

发明内容
本发明的目的是提出一种社交网络中的朋友关系传递树的建立方法,通过对用户的行为进行建模,基于朋友关系的传递性来推测和表达社交网络的形成和演化过程,从而便于对社交网络未来发展情况进行预测。本发明提出的社交网络中的朋友关系传递树的建立方法,包括以下步骤(I)设社交网络中有多个用户,每个用户有多个朋友,将用户记为自我节点U,将该用户的朋友记为朋友节点V,为社交网络中的自我节点U,创建一个自我节点u的朋友关系传递树,在该朋友关系传递树中添加自我节点u和自我节点u的所有朋友节点;
(2)按照时间,将自我节点与朋友节点之间的交互数据按交互的时间划分为N段,对于与第i段交互对应的时间段Ti,执行步骤
权利要求
1.一种社交网络中的朋友关系传递树的建立方法,其特征在于该方法包括以下步骤: (1)设社交网络中有多个用户,每个用户有多个朋友,将用户记为自我节点U,将该用户的朋友记为朋友节点V,为社交网络中的自我节点U,创建一个自我节点u的朋友关系传递树,在该朋友关系传递树中添加自我节点u和自我节点u的所有朋友节点; (2)按照时间,将自我节点与朋友节点之间的交互数据按交互的时间划分为N段,对于与第i段交互对应的时间段Ti,执行步骤(3)- (9),i=l,2,……,N; (3)对于时间段Ti,建立如下社交行为概率生成模型: (3-1)设社交网络中的总用户数为U,社交网络中每个自我节点u的交互行为数为\,社交网络中每个自我节点u的新交朋友数为Nu ; (3-2)分别用先验参数为/Jfi)的狄利克雷分布表示社交网络中每个自我节点u的好友关系强度分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的好友关系强度分布 (3-3)从上述好友关系强度分布中,采样得到社交网络中每个自我节点u的每次交互对象X ; (3-4)分别用先验参数为的狄利克雷分布表示社交网络中每个自我节点u的中介偏好概率分布的先验分布,从该狄利克雷分布中采样得到社交网络中自我节点u在时间段Ti的中介偏好概率分布 (3-5)分别从上述中介偏好概率分布0^^中采样得到社交网络中每个自我节点u的中 介人z,从与中介人z对应的好友关系强度分布中采样得到社交网络中自我节点u的新朋友节点I ; (3-6)用/7(^)(吣表示社交网络中自我节点u在时间段Ti的朋友节点集合,用丨/3;5)表示在时间段Ti社交网络自我节点u选择z作为中介人的次数,用表示在时间段Ti中介人z选择z的朋友y'交互的次数,用¥^;丨)表示在时间段Ti中介人z将朋友y'推荐给别人的次数; (4)对于时间段Ti: 若上一时间段IV1之前,社交网络自我节点u和朋友节点V已经是朋友,则先验参数 和先验参数PS 分别为:(Ti) I (Ti1) I η (T1-1)^UfV — 2.^UfV + ^UtV β(Τ — I.β(Τ -ι) I 4Cr1-1) _L ψ(Τι-ι)Hu,v —八 Hu,V 1 Ilu,v 1 1 u,v 其中,表示在时间段Th自我节点u选择朋友V作为中介人的次数,O)表示在时间段IV1自我节点u作为中介人与朋友节点V交互的次数,表示在时间段IV1自我节点u作为中介人将朋友节点V推荐给社交网络中其他用户的次数,λ为衰减系数,取值范围为O 1,为在IV1时间段自我节点u的中介偏好概率分布的先验参数中与朋友节点V相应的先验值,βΖ^1)为在TV1时间段自我节点u的好友关系强度分布先验参数中与朋友节点V相应的先验值; 若自我节点u和朋友节点V是上一时间段IV1中的新朋友,则先验参数和先验参
全文摘要
本发明涉及一种社交网络中的朋友关系传递树的建立方法,属于计算机数据挖掘技术领域。为每个自我节点建立朋友关系传递树,添加自我节点和朋友节点。在每个时间段,建立社交行为概率生成模型,初始化自我节点的中介偏好概率分布和好友关系强度分布的先验参数以及每个自我节点和新朋友节点的候选中介人,并不断迭代更新候选中介人,将迭代过程中被采样次数最多的候选中介人z指定为自我节点u和新朋友节点y之间的中介人,并在自我节点u的社交网络中添加z→y。本发明方法基于好友关系传递性对用户在社交网络中的行为进行建模,提供扁平社交网络的层次化呈现方法,便于深入分析社交网络的成因与内在结构,预测社交网络未来的发展与变化。
文档编号G06F17/30GK103077247SQ20131002696
公开日2013年5月1日 申请日期2013年1月17日 优先权日2013年1月17日
发明者王建民, 王朝坤, 张君 申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1