动态社会网络用户行为的预测方法

文档序号:6652819阅读:634来源:国知局
专利名称:动态社会网络用户行为的预测方法
技术领域
本发明涉及互联网技术领域,特别涉及一种动态社会网络用户行为的预测方法。
背景技术
随着互联网的普及和Web 2. 0时代的来临,许多大规模的在线社会网络都取得了 巨大的成功,比如Facebook,MySpace, Ning禾口 Twitter。其中,Facebook己经有了 4亿的 活跃用户,如果当作一个国家的话,已经成为世界上第三大的国家。越来越多的关注使得社 会网络的研究成为了一个非常热门的研究课题。来自各个学科的研究者都对社会网络表现 出浓厚的兴趣。这些学科包括数学,生物,物理,计算机和社会学等等。过去很多研究都集 中在社会网络的宏观层面,比如图中节点度的分布,图的直径,聚类因子,群组结构和小世 界效应。然而,这些方法并没有为动态社会网络微观层面的研究提供太多的帮助。对动态社会网络中的用户行为建模与预测是重要的问题,不仅需要通过各种计算 机技术手段分析用户行为的特点,还要通过先进的技术对用户行为进行准确的建模和预 测。准确地预测用户的行为可以帮助很多应用。宏观层面,可以预测社会网络中完成某行 为的用户比例。这对于民意调查和企业的市场分析是至关重要的。微观层面,可以预测单 个用户将来的行为,从而了解每个用户行为乃至心理的变化过程,推动用户分析进入更加 深入的阶段。另外,用户动态行为建模直接的应用还有预测好友关系,从而预测社会网络的 变化趋势。总之,研究社会网络中的用户行为是社会网络研究的重要环节。社会网络中用户的动态行为会受到各种各样复杂而微妙的因素所影响。这是社会 学中公认的事实。比如,过去的社会学研究关注了朋友间的强弱联系如何影响人们的行为。 Granovetter等分析了社会网络中的弱联系对于人们行为的影响,并发现弱联系在找工作 的过程中起了非常重要的作用。而Krackhardt等分析了强联系对于人们的影响,主要分析 的是在社团演化的过程中强联系所起到的作用。除了朋友行为所带来的影响,用户自己的 属性和历史记录也会影响到将来的行为。社会网络相关的研究已经取得了一些成果,目前的相关工作可以主要按以下三个 方面划分动态社会网络分析,社会影响力分析和群组行为分析。在动态社会网络分析研 究方面,Sarkar和Moore提出了一个隐空间模型来分析社会网络的动态变化。Yang等提 出了一个动态随机块模型来分析群组以及群组在动态社会网络中的变化模式。Scripps 等的研究更加深入,探讨了属性变化对于动态社会网络分析的影响。该研究的焦点集中 在属性和朋友关系的影响上,主要贡献包括他们研究了不同的预处理决定和不同的网 络力量(如选择和影响)如何影响动态社会网络的建模,并通过实验验证一些建模过程 中假设的正确性,进一步地,研究了边和属性在动态网络中的相互影响;在社会影响力分 析研究方面,又可以分为两个方面定性分析和定量分析。定性分析的主要工作集中在 验证社会影响确实存在,并结合社会学的理论去分析在线的社会网络是否具有类似的性 质,如Anagnostopoulos等试图验证和理解社会影响力,将社会网络中用户行为趋同的 现象归结为三个原因(即共性、环境因素和影响)。而定量分析则试图分析社会影响的
5强弱,分析社会网络中不同用户之间影响的差异性,如Tang等提出了 Topical Affinity Propagation(TAP)模型来衡量社会网络中话题级别的社会影响力,希望能发现不同人之间 在不同话题上不同的影响力。又如,Goyal等提出模型来计算用户影响的概率,希望通过用 户的历史行为来学习影响发生的概率,并提出用户影响概率和行为影响概率的概念;在群 组行为分析研究方面,其基于的想法是如果用户加入群组是经过认真考虑的,群组行为可 以带来深入而长久的变化。这样一个群组中的成员将反映社会中更广泛的范式。关于群组 行为分析的研究集中在群组成员与其他群组成员关系的强弱,以及一个更好的将个人和其 所在群组,家庭,社会网络联系起来的方法。研究成果包括Shi等研究了用户参加群组行 为的模型。在线的论坛代表了一种重要的社会媒体。Tang和Liu采用关系学习的方法来解 决数据样例间的相关性,利用网络中部分标注过的用户,来预测其他用户的群组信息。

发明内容
(一)要解决的技术问题本发明要解决的技术问题是如何从微观层面对社会网络中用户动态行为进行建 模和预测,并能够使其满足社会网络复杂性和处理大规模数据的需求。( 二 )技术方案一种动态社会网络用户行为的预测方法,包括以下步骤Sl 从社会影响力、时间相关性和网络相关性方面对动态社会网络的用户行为进 行概率统计分析;S2:采用图论、集合和矩阵理论等计算机技术手段对动态社会网络中用户行为进 行形式化定义动态社会网络中用户行为的建模问题,具体包括用户行为定义为用户\在1时刻的行为,用一个三元组来表示(y,Vi,t)即为乂 , y为用户行为,定义Yt为所有用户t时刻行为的集合,将所有用户的全部行为定义成行为的 历史记录 Y = {(y, Vi, t)}ijt ;动态属性矩阵Xt定义为NXd的矩阵,N表示用户数,d表示属性个数,表示的是t 时刻网络中全部用户属性的矩阵,其中每一行Xi表示的是用户Vi的全部属性,而每一列表 示属性的全部值,元素Xu表示的是用户Vi的第j个属性;属性加强网络定义为Gt = (Vt, Et, Xt, Yt),其中Vt是t时刻用户的集合,而Et是t 时刻边的集合,边表示用户间的好友关系;S3 根据步骤S2中的建模建立动态抗噪音因子图模型,给定连续T时刻的属性加 强网络 G = (Gt = (Vt, Et, Xt, YtM,t e {1,. · ·,T},V = V1 U V2 U . · · U Vt,V = N,定 义G中历史记录Y的联合分布
权利要求
1. 一种动态社会网络用户行为的预测方法,其特征在于,包括以下步骤·51从社会影响力、时间相关性和网络相关性方面对动态社会网络的用户行为进行概 率统计分析;·52采用图论、集合和矩阵理论等计算机技术手段对动态社会网络中用户行为进行形 式化定义动态社会网络中用户行为的建模问题,具体包括用户行为定义为用户Vi在t时刻的行为,用一个三元组来表示(y,Vi,t)即为乂,y为 用户行为,定义Yt为所有用户t时刻行为的集合,将所有用户的全部行为定义成行为的历 史记录 Y= {(y,vi;t)}ijt ;动态属性矩阵Xt定义为NXd的矩阵,N表示用户数,d表示属性个数,表示的是t时刻 网络中全部用户属性的矩阵,其中每一行Xi表示的是用户Vi的全部属性,而每一列表示属 性的全部值,元素表示的是用户Vi的第j个属性;属性加强网络定义为Gt = (VtiEtUt),其中Vt是t时刻用户的集合,而Et是t时刻 边的集合,边表示用户间的好友关系;·53根据步骤S2中的建模建立动态抗噪音因子图模型,给定连续T时刻的属性加强网 络 G = (Gt = (Vt, Et, Xt, YtM,t e {1,...,T},V = V1 U V2 U ... U Vt,V = N,定义 G 中历史记录Y的联合分布
2.如权利要求1所述的动态社会网络用户行为的预测方法,其特征在于,所述步骤S4 中从所述历史记录Y里估计参数的值θ = ((QiIiakK^ijI(AjJ)具体步骤包括·S4. 1 输入迭代H的个数和学习率η ;·S4.2 初始化归一化因子q,权重a,β和λ,其中,q是Qi构成的向量,α是a k构成 的向量,β是由^ij构成矩阵,λ是由Xji构成的矩阵; S4. 3 如果q已收敛则转到S4. 8,否则转到S4. 4 ; S4. 4 固定q使用梯度下降的方法更新a,β和λ ; S4. 5 对于计数器i从1增加到H,进行以下操作 “计算梯度1。肿,▽¥#▽!。_ ; -更新 log a k 为log^ + vIogai ; -更新 log β ,J^loS/^y +^x vIog^; -更新 IogXji 为Iogi + WVl0g ;·54.6 固定a,β和λ求解q ;S4.7:输出学习后的参数 θ = ((QiIiaJ(^ijKAjJ)0
3.如权利要求2所述的动态社会网络用户行为的预测方法,其特征在于,步骤S4中从 所述历史记录Y里估计参数的值θ = ({qj { a k} { β { λ jJ )具体步骤包括·55.1 输入迭代H的个数和学习率η ;·S5.2 初始化归一化因子ζ,权重a,β和λ,其中,α是a k构成的向量,β是由^ij 构成矩阵,λ是由Xji构成的矩阵,q表示Q或qi; S5. 3 如果q已收敛则转到S5. 9,否则转到S5. 4 ; S5. 4 主服务器广播q ;·S5. 5 固定q使用梯度下降的方法更新α,β和λ ;·S5. 6 对于计数器i从1增加到H,进行以下操作“主服务器广播α,β和λ ;“分别计算梯度Vi。抖V log岛禾日Vlog、,-从服务器发回该计算结果;-主服务器简化该计算结果;-主服务器更新α,β和λ ;·S5. 7 固定α,β和λ来求解ζ ;·S5.8:输出学习后的参数 θ = ((QiIiaJ(^ijKAjJ)0
4.如权利要求2或3所述的动态社会网络用户行为的预测方法,其特征在于,步骤S5 具体包括计算隐状态zf+1,然后利用这个隐行为状态来估计Jf+1,计算zf+1的公式如下 T+l = Ztl^A +Σ Jf=I zJ
全文摘要
本发明公开了一种基于计算机概率图模型的动态社会网络用户行为的预测方法,该方法包括S1从社会影响力、时间相关性和网络相关性方面对动态社会网络的用户行为进行客观地统计分析;S2采用图论、集合和矩阵理论等计算机技术手段对动态社会网络中用户行为进行形式化定义;S3根据步骤S2中的定义建立动态抗噪音因子图模型;S4对所述动态抗噪音因子图模型进行学习,从给定的历史记录里估计一系列参数的值θ;S5根据所述θ预测用户行为得到预测结果。本发明从微观层面对社会网络中用户动态行为进行建模和准确预测。
文档编号G06F17/30GK102117325SQ20111004589
公开日2011年7月6日 申请日期2011年2月24日 优先权日2011年2月24日
发明者唐杰, 谭宸浩 申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1