一种基于信息交互网络的微博用户影响力计算方法_2

文档序号:9506283阅读:来源:国知局
是一段时间区间,用来刻画用户发布微博的时间范围,窗 口是随时间推进向前顺次滑移的,即上一个窗口结束的时间就是下一个窗口开始的时间, m. Time e Wk表示微博内容m在时间窗口 k内所发布的,为简化起见,用正整数表示时间窗 口,数字越大表示距离当前时间越近,即分别用1,2,···,!!表示第1,第2,…,第η个时 间窗口,其中第η个时间窗口是当前时间所在窗口,f为衰减函数,f(k)表示第k个时间窗 口内发布微博的内容影响力相比第η窗口的折扣幅度函数称为衰减函数,衰减函数表示为 /(.々X Λ,0 <供< I,1彡k彡η,#表示的是衰减的大小比例,具体值可以在使用时指 定,k表不的是时间窗口的序号;
[0024] ④、根据步骤①和步骤③按照下列公式计算用户的直接影响力:
[0025] IFdir= 〇 IFdir user+(I-Q)IFdirjlb
[0026] 其中,IF此为用户的直接影响力,IF dll^_USCT为用户属性决定的影响力,IF 为用 户微博内容决定的影响力,α和(l-α)分别为用户属性决定的影响力和用户微博内容决 定的影响力所占的权重比例系数,〇< α <1。
[0027] (7)计算用户的间接影响力,其中用户的间接影响力是指用户通过其粉丝对其他 用户产生的社交影响,用户的间接影响力由其粉丝的影响力决定,主要包括以下内容:首先 需要先计算该用户每个粉丝的影响力,即用户间接影响力的计算过程是个迭代计算过程, 迭代深度(次数)可根据计算精度的需求决定,然后根据获取的用户粉丝名单信息分别计 算每个粉丝的影响力,其中以微博平台的用户关系网络模型为基础,参考PageRank算法的 迭代投票思想,所述计算用户的间接影响力具体按照下列公式进行迭代计算:
[0029] 其中
为所有用户间接影响力值组成的向量,即更新后所有用户的间接影响 力值向量,为更新前所有用户的影响力值向量,c为阻尼系数,^为单位行向量,Y为投 票矩阵,其中投票矩阵中的元素 U1,表示投票权重,所述其投票矩阵Y中的元素 y u计算方法 如下
[0031] 其中,E为表示微博用户关系网络的带权有向图中连接节点间关系的有向边的集 合,Vp vjP V k均为带权有向图中的节点,p ;表示节点V ;的权重,e u表示连接节点V ;和节 点Vj的有向边,w。表示有向边e。的权重,e ik表示连接节点V ;和节点V k的有向边,w ik表 示有向边eik的权重,W。的计算公式为Wu= nT+(l_n)Q,其中,T为节点vj/f代表的用户 对节点V]所代表用户的微博进行转发的累计转发次数,Q为节点V i所代表的用户对节点V ] 所代表用户的微博进行评论的累计评论次数,η和a-η)分别为累计转发次数和累计评 论次数所占的权重比例系数,〇 < η < 1。
[0032] 所述其计算用户的综合影响力公式如下:
[0033] IF= P IFdir+(Ι-p) IFindir (0 ^ P ^ 1)
[0034] 其中,IF为微博用户的综合影响力,IFdir为用户的直接影响力,IF indir为用户的间 接影响力,P和(I-P)分别为用户的直接影响力IFdir和间接影响力IF indir所占的权重比 例系数,若P = 1,则用户影响力完全为直接影响力,不考虑任何间接影响力。
[0035] 本发明的有益效果:本发明基于信息交互网络模型的微博用户影响力计算方法在 计算用户直接影响力时,首先通过网络爬虫技术采集用户的属性信息(包括认证标志、粉 丝数、总微博数、总转发数和总评论数等)和用户所发布的微博信息(包括每篇微博的内 容、发布时间、微博的点赞数、转发数和评论数,以及对微博进行转发和评论的用户列表信 息等),再以微博为中心,建立信息交互网络模型,分别计算用户属性决定的影响力和用户 微博内容决定的影响力,再根据用户的粉丝列表计算出用户的间接影响力。本发明基于信 息交互网络模型的微博用户影响力计算方法综合考虑的用户的被关注度、活跃度和其微博 内容的影响力,相比其它同类方法,不但提供了计算的准确性,更体现用户影响力的时效性 和动态性,更加能够对用户的影响力进行有力度量和对微博系统中的用户进行合理排序, 从而为微博的拓展应用提供理论基础,如微博的舆情监控与预警和微博营销推广。
【附图说明】
[0036] 图1为本发明微博用户影响力计算流程示意图。
【具体实施方式】
[0037] 下面结合图1对本发明的【具体实施方式】进行描述,以便本领域的技术人员更好地 理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许 会淡化本发明的主要内容时,这些描述在这里将被忽略。
[0038] -种基于信息交互网络的微博用户影响力计算方法,包括以下几个部分:数据采 集单元,对微博平台上用户的属性信息、用户发布的微博信息以及用户的粉丝列表等数据 进行采集;信息交互网络构建单元,根据数据采集单元获取的用户微博信息,建立微博信息 交互网络模型;用户属性决定的影响力计算单元,根据数据采集单元采集到的用户属性信 息计算用户属性决定的影响力;用户发布的微博内容决定的影响力计算单元,根据数据采 集单元采集到的用户微博信息以及信息交互网络构建单元构建的微博信息交互网络模型, 计算用户微博内容决定的影响力,从而计算用户的直接影响力;用户间接影响力计算单元, 根据数据采集单元采集到的用户粉丝信息,计算用户每个粉丝的影响力,再计算用户的间 接影响力,最终通过用户的直接影响力和间接影响力计算出用户的综合影响力。其具体步 骤如下:
[0039] (1)在微博平台上通过网络爬虫技术采集用户的属性信息、用户的微博信息和用 户的粉丝列表,所述用户的属性信息包括实名认证标志、关注数、粉丝数、总微博数、总转发 数和总评论数,所述用户的微博信息包括其所发布的每篇微博的内容和发布时间、微博的 转发数、评论数、点赞数以及对微博进行转发和评论的用户名单;
[0040] (2)根据步骤(1)采集的用户属性信息计算用户属性决定的影响力;
[0041] (3)根据步骤(1)采集的用户微博信息来构建微博信息交互网络模型,通过构建 的微博信息交互网络模型来计算用户微博内容决定的影响力,所述定义微博信息交互网络 模型步骤为: a、在微博系统中将用户看作节点,用户之间的关注关系看作边,边的方向为从 用户到被关注对象,边不但有方向,也有权重,定义微博系统的用户关系网络为一带权有向 图:UR= (V,E,P,W),有向图中的节点代表微博系统中的用户,有向边代表微博系统中用户 之间的关系,所述该式中的V表示节点的集合,E表示有向边的集合,P表示节点权重的集 合,W表示边权重的集合,e F,该式表示在节点集合V中任取两个节点vjp V ^,若 3% =< V,,& > e £,该式表示在有向边集合E中存在一条连接节点Vi和节点V ^的有向边e i^, 边的方向为V1指向V ,即在微博系统中用户V1和用户V 之间存在关系,用户V 注用户 Vj,即用户Vi是用户V .j的粉丝,P # P表示节点V ;的权重为p i,WuG W表示有向边e 的 权重为Wl j;b、微博系统中的微博元素定义为一个8元组:
[0042] m = (ID, Content, Author, Type, Time, FN, CN, PN),其中 ID 为微博编号,Content 为微博内容,Author为微博作者,Type为微博的类型(原创博文、转发博文),Time为微 博发布的时间戳,FN为微博被转发的次数,CN为微博获得的评论数,PN为微博获得的点赞 数;c、定义微博的传播关系,根据上述步骤a定义的用户关系网络为一带权有向图UR = (V,E, P, W),则用户发布微博的传播关系定义为sr = Oiii, < Vi, \> ),其中V ;和V 均表 示代表微博用户的节点,IHi表示用户V ;发布的微博,< V ;,'>表示节点V ;指向节点V (表 示信息传播方向),即用户V1发布的微博m i从节点V i传给了节点V ,,则表示用户V]是用户 V1的粉丝,或者是表示用户V i直接将微博m i推送给了用户V ,,即用户V1发布的微博m ^勺 内容中包含""的内容;d、定义微博的转发关系,根据步骤a将微博系统中的微博转发关 系可以定义为fr =<
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1