一种微博网络中用户影响力度量的方法

文档序号:6632206阅读:619来源:国知局
一种微博网络中用户影响力度量的方法
【专利摘要】本发明公开了一种微博网络中用户影响力度量的方法,包括以下步骤:1)编写获取微博用户信息及所发布微博内容的程序,再通过微博平台提供的API接口获取真实的微博用户信息,从所述真实的微博用户信息中提取用户所发微博被阅读、转发及评论的数量信息;2)得到用户的微博影响力It(u)值;3)获取用户的信息传播影响力Id(u)值;4)根据用户的微博影响力It(u)值及用户的信息传播影响力Id(u)值得用户的影响力初始权值W(u);5)根据用户的影响力初始权值W(u)迭代计算用户的影响力值I(u),以用户的影响力值I(u)度量用户在微博网络中的影响力。本发明能够更加准确的发现和识别微博网络中的影响力个体。
【专利说明】一种微博网络中用户影响力度量的方法

【技术领域】
[0001]本发明属于网络数据挖掘技术与社交网络研究领域,涉及一种用户影响力度量的 方法,具体涉及一种微博网络中用户影响力度量的方法。

【背景技术】
[0002]微博服务目前已经成为最受欢迎的社交网络工具之一。截止2013年2月,微博服 务站点twitter注册用户数超过5亿,月活跃用户达到2亿,截止2〇13年12月,最大的中文 微博平台新浪微博注册用户数超过5亿,月度活跃用户数达到1. 291亿。数以亿计的活跃 用户来自不同的社会文化背景,遍布全球,每时每刻都在这个平台上发布和传播各类政策、 商业、文化、教育等社会生活相关的信息,这些信息包含着用户的各种观点、情绪、态度和状 态等,并且能在短时间内传播到大范围的人群。
[0003]随着社交网络服务的快速普及,人们越来越习惯通过网络进行交流、参与公众话 题、市场营销等。所以研究和理解微博平台中的消息传播机制,识别具有话题影响力的用户 变得非常重要。比如市场营销中,企业希望通过少数几个甚至一个具有影响力的用户来最 大化的提升品牌和广品的推广效果。摇言控制中,政府或企业希望能快速定位信息传播中 有影响力的用户并进行信息的有效阻断。但是,如何快速发现和识别这些影响力个体,是一 个困难并且具有挑战性的研究。


【发明内容】

[0004]本发明的目的在于克服已有影响力个体识别方法的不足,提供了一种微博网络中 用户影响力度量的方法,该方法可以有效度量微博网络中用户的影响力。
[0005]为达到上述目的,本发明所述的微博网络中用户影响力度量的方法,其特征在于, 包括以下步骤:
[0006] 1)编写获取微博用户信息及用户所发布微博的程序,通过微博平台提供的API接 口获取真实的微博用户信息,从所述真实的微博用户信息中提取用户在微博网络中的关注 关系及粉丝关系,并提取用户所发微博被阅读、转发及评论的数量信息;
[0007] 2)根据用户U所发微博被阅读、转发及评论的数量信息计算得到用户U的微博影 响力值I? ;
[0008] 3)在微博粉丝关系网络中,计算得到用户u的信息传播影响力值Id( u);
[0009] 4)将步骤2)得到的用户U的微博影响力值It (u)及步骤3)得到的用户u的信息 传播影响力值Id(u)相加作为用户u的影响力初始权值W(u); _0] 5)根据步骤4)得到的用户U的影响力初始权值W(U)迭代计算用户u的影响力值 I (u),然后以用户u的影响力值I (u)作为用户u在微博网络中影响力的度量。
[0011]步骤2)中所述用户u的微博影响力值Σ + 其中,Rr(x) 为微博X的转发数量与阅读数量的比值,Cr(x)为微博x的评论数量与阅读数量的比值, TweetsOi)是用户u发布的原始微博的集合,当阅读数量为零,则Rr(x)及Cr(x)均为0。 [0012] 步骤3)中用户u的信息传播影响力值Id(u) =D(u)+B(u)+C(u),其中,D(u)为用 户u在微博粉丝关系网络中的度中心度,B(u)为介中心度,C(u)是接近中心度,所述微博粉 丝关系网络通过步骤1)得到的用户关系信息抽取粉丝关系形成。
[0013] 步骤5 )中 所述用 户u的 影 响 力 值 雄^ =喊。,的简讀' _咖續· v关注的用户集合,Followers (u)为用户u关注的用户集合,U为微博网络中所有用户的集 合。
[0014] 本发明具有以下有益效果:
[0015]本发明所述的微博网络中用户影响力度量的方法在度量用户影响力时,先获取用 户的微博影响力以及用户的信息传播影响力,再根据用户的微博影响力以及用户的信息传 播影响力得到用户的影响力初始权值,然后根据所述用户的影响力初始权值得到用户的影 响力值,最后通过用户的影响力值来度量用户在微博网络中的影响力,从而能够更加准确 的发现和识别微博网络中的影响力个体以及个体在微博网络中的影响力,识别的准确率和 召回率好。

【专利附图】

【附图说明】
[0016] 图1为本发明的流程图。

【具体实施方式】
[0017] 下面结合附图对本发明做进一步详细描述:
[0018] 参考图1,本发明所述的微博网络中用户影响力度量的方法包括以下步骤:
[0019] 1)编写获取微博用户信息及用户所发布微博的程序,通过微博平台提供的API接 口获取真实的微博用户信息,从所述真实的微博用户信息中提取用户在微博网络中的关注 关系及粉丝关系,并提取用户所发微博被阅读、转发及评论的数量信息;
[0020] 微博网络中用户是通过关注其他用户来获取信息的,关注的用户就是被关注用户 的粉丝,这种关注和被关注关系就形成了微博网络中的关注关系网络和粉丝关系网络。
[0021] 用户对某个微博阅读后可以进行转发、评论和收藏等操作,转发操作会引起微博 的二次传播,评论操作发表用户对此微博的观点,评论的同时可以选择是否同时转发,收藏 操作只是对微博进行记录,不发表观点,也不引起二次传播。
[0022] 2)根据用户u所发微博被阅读、转发及评论的数量信息得到用户u的微博影响力 It(u)值;
[0023]需要说明的是,步骤2)中所述用户u的微博影响力值 7 (w)=+,其中,Rr(x)为微博X的转发数量与阅读数量的比值, Cr(X) 为微博X的评论数量与阅读数量的比值,Tweets (u)是用户u发布的原始微博的集合,当阅 读数量为零,则Rr(x)及Cr(x)均为0。
[0024]微博本身所包含的信息和观点越有用,越有价值,其被转发、评论、支持和复制的 可能性就越高,用户的交互也就越频繁。反过来,如果某个微博带来了更多的转发、评论、支 持和复制等行为,那么这个微博的影响力就越大,也就是微博用户的影响力越大。微博的转 发行为直接表明读者支持微博所包含的观点并愿意与自己的粉丝分享,传播观点。评论行 为是读者对微博所包含观点、情绪等发表自己的看法,并不一定是支持,但有明确意愿与自 己的粉丝进一步讨论和传播这个观点。一条微博被转发和评论的越多,其传播就越快,话题 持续时间就越久,被阅读的机会就越多,影响力自然就越大。
[0025] 3)在微博粉丝关系网络中,计算得到用户u的信息传播影响力Id( u)值;
[0026]需要说明的是,步骤3)中用户u的信息传播影响力值Id(u) =D(U)+B(U)+C(u)j 中,D(u)为用户u在微博粉丝关系网络中的度中心度,D(u)在"Freeman L C. Centrality in social networks conceptual clarification[J]. Social Networks, 1979,1 (3) :215-239w 中给出了定义和计算方法;B(u)为介中心度,其在"Freeman,Linton. A set measures of centrality based upon betweenness[J]_Sociometry,1977,40:35-41" 中给出了定义和 计算方法,C(u)是接近中心度(出度),C(u)在"Sabidussi,G.The centrality index of graph[J]_ Psychometriks,1966,31 :581-6〇3"给出了定义和计算方法,所述微博粉丝关系 网络通过步骤1)得到的用户关系信息抽取粉丝关系形成。
[0027]其中,在用户粉丝关系网络中,用户的度中心度越大,表明用户发布的微博信息将 会有更高的概率被阅读到,快速传播的可能性就越大。如果用户的介中心度越大,表明用户 对消息传播的掌控能力就越强,将会有更大的机会将消息放大,更快传播消息,也更容易将 信息截断。接近中心度越大,表明用户可以依赖较少或不依赖其他节点就能将信息快速传 播到整个网络,消息传播的速度更快,范围更广。
[0028] 4)将步骤2)得到的用户u的微博影响力It(u)值及步骤3)得到的用户u的信息 传播影响力Id(u)值相加,得用户u的影响力初始权值W(u);
[0029] 5)根据步骤4)得到的用户u的影响力初始权值w(u)迭代计算用户u的影响力值 I(u),然后以用户u的影响力值作为用户u在微博网络中的影响力的度量。
[0030] 需要说明的是,步骤5)中所述用户u的影响力值 7 (誦續(v)); iFo/Wr 韻 v关注的用户集合,Followers(u)为用户u关注的用户集合,u为微博网络中所有用户的集 合。
【权利要求】
1. 一种微博网络中用户影响力度量的方法,其特征在于,包括以下步骤: 1) 编写获取微博用户信息及用户所发布微博的程序,通过微博平台提供的API接口获 取真实的微博用户信息,从所述真实的微博用户信息中提取用户在微博网络中的关注关系 及粉丝关系,并提取用户所发微博被阅读、转发及评论的数量信息; 2) 根据用户u所发微博被阅读、转发及评论的数量信息计算得到用户u的微博影响力 值I? ; 3) 在微博粉丝关系网络中,计算得到用户u的信息传播影响力值Id(u); 4) 将步骤2)得到的用户u的微博影响力值It (u)及步骤3)得到的用户u的信息传播 影响力值Id(u)相加作为用户u的影响力初始权值W(u); 5) 根据步骤4)得到的用户u的影响力初始权值W(u)迭代计算用户u的影响力值 I (u),然后以用户u的影响力值I (u)作为用户u在微博网络中影响力的度量。
2. 根据权利要求1所述的微博网络中用户影响力度量的方法,其特征在于,步骤2)中 所述用户u的微博影响力值=
+ '其中,Rr(x)为微博X的转发数 量与阅读数量的比值,Cr(x)为微博X的评论数量与阅读数量的比值,TweetsOi)是用户u 发布的原始微博的集合,当阅读数量为零,则Rr (X)及Cr(x)均为0。
3. 根据权利要求1所述的微博网络中用户影响力度量的方法,其特征在于,步骤3)中 用户11的信息传播影响力值1?=0(11)+8(11)+(:(11),其中,0(11)为用户11在微博粉丝关 系网络中的度中心度,B(u)为介中心度,C(u)是接近中心度,所述微博粉丝关系网络通过 步骤1)得到的用户关系信息抽取粉丝关系形成。
4. 根据权利要求1所述的微博网络中用户影响力度量的方法,其特征在于,步骤5)中 所述用户 u 的影响力值 /(") =
(/(v)* W'(v))/|/^//m?,r.v(v)|+ min(f^/)),其中, Followers (v)表示用户v关注的用户集合,Followers (u)为用户u关注的用户集合,U为 微博网络中所有用户的集合。
【文档编号】G06F17/30GK104298767SQ201410594290
【公开日】2015年1月21日 申请日期:2014年10月29日 优先权日:2014年10月29日
【发明者】桂小林, 赵建强 申请人:西安交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1