一种基于信息交互网络的微博用户影响力计算方法_3

文档序号:9506283阅读:来源:国知局
η^,π^>,Iiii表示用户V i发布的微博,m_j表示用户V 发布的微博,该 式表示微博!!!,是对微博m 1进行转发的微博,微博转发关系的方向为m i指向m ];e、在微博系 统中,用户对微博信息的主要动作包括:发布、转发、主动推送(@用户名)、评论等,信息的 发布和转发都是在用户关系网络上进行,沿着关系网络中边的反方向进行信息传播,信息 的主动推送对象可以是其粉丝,也可以是其他用户,信息评论是围绕被评论微博展开,评论 内容的传播范围就是原微博的传播范围,根据步骤a将微博系统中的微博评论关系可以定 义为cr =< Vj, Iiii>,该式表示用户V 对微博Iiii进行了评论,微博评论关系的方向为V 指 向m1;f、定义微博信息交互网络模型为H = (M,U,SR, FR, CR, WM),其中M为用户发布微博的 集合(发布微博包括用户编写的微博和转发的微博),U为发布和转发微博及评论微博的用 户的集合,且砭&Γ (表示的是发布和转发微博及评论微博的用户集合属于微博用户的集 合),SR为微博传播关系的集合,FR为微博转发关系的集合,CR为微博评论关系的集合,WM 为用户发布的微博内容影响力权重的集合,对于微博集合M中的微博m,Author (m)表示微 博m的作者,即微博m的发布者,wm(m)表示微博m的内容影响力权重,根据上述d步骤的 定义,对微博m进行转发的用户集合表示为:
[0044] 根据上述e步骤的定义,对微博m进行评论的用户集合表示为:
[0046] (4)根据步骤⑵和步骤(3)分别得到用户属性决定的影响力和用户微博内容决 定的影响力来计算用户的直接影响力;
[0047] (5)根据步骤(1)采集的用户粉丝列表来获取其每个粉丝的影响力,再根据所述 每个粉丝的影响力综合计算出用户的间接影响力;
[0048] (6)根据步骤(4)和步骤(5)得到用户的直接影响力和用户的间接影响力来计算 用户的综合影响力,所述计算用户的直接影响力步骤具体如下:所述计算用户的直接影响 力步骤具体如下:
[0049] ①、用户属性决定的影响力具体按照下面公式表述:
[0050] IFdir user= β 〇Ν〇+ β jNj+ β 2N2+ β 3N3+ β 4N4+ β 5N5
[0051] 其中,IFdll^USCT为所述用户属性决定的影响力,N。为5用户的微博账号实名认证标 志,即通过实名认证的用数值1表示,未通过实名认证的用数值〇表示,N 1为用户的关注数, N2为用户的粉丝数,N3为用户的总微博数,N4为用户的总转发数,N 5为用户的总评论数,β。, βρ β2, β3, β4, β5分别为相应子属性的权重比利系数,且β 0+β1+β2+β3+β4+β5= 1 ;
[0052] ②、计算用户发布的微博m的内容影响力,计算方法如下:
[0054] 其中,m表示用户发布的微博,且m已在微博系统中的微博元素定义为一个8元组: m= (ID, Content, Author, Type, Time, FN, CN, PN),其中 ID 为微博编号,Content 为微博内 容,Author为微博作者,Type为微博的类型(原创博文、转发博文),Time为微博发布的时 间戳,FN为微博被转发的次数,CN为微博获得的评论数,PN为微博获得的点赞数,丽i(m)为 微博m的内容影响力,PN为微博m获得的点赞数,'和V k均为微博系统中的用户,FU (m)为 对微博m进行转发的用户集合,w(V])表示对微博m进行转发的用户V]的权重,即用户v ,的 影响力值,CU (m)为对微博m进行评论的用户集合,w(vk)表示对微博m进行评论的用户vk 的权重,即用户Vk的影响力值,γ i,γ2, γ3分别为点赞、转发和评论属性的权重比例系数, 且 Yi+Y^Y3= 1;
[0055] ③、计算用户所发布的全部微博的内容影响力,计算方法如下:
[0057] 其中,IFdll^nib为用户所发布的全部微博的内容影响力,丽i(m)为微博m的内容影 响力,W k为时间窗口 k,时间窗口就是一段时间区间,用来刻画用户发布微博的时间范围,窗 口是随时间推进向前顺次滑移的,即上一个窗口结束的时间就是下一个窗口开始的时间, m. Time e Wk表示微博内容m在时间窗口 k内所发布的,为简化起见,用正整数表示时间窗 口,数字越大表示距离当前时间越近,即分别用1,2,···,!!表示第1,第2,…,第η个时 间窗口,其中第η个时间窗口是当前时间所在窗口,f为衰减函数,f(k)表示第k个时间窗 口内发布微博的内容影响力相比第η窗口的折扣幅度函数称为衰减函数,衰减函数表示为 /(幻,. Ocpcls 1彡k彡η,辦表示的是衰减的大小比例,具体值可以在使用时指定, k表不的是时间窗口的序号;
[0058] ④、根据步骤①和步骤③按照下列公式计算用户的直接影响力:
[0059] IFdir= 〇 IFdir user+(I-Q)IFdirjlb
[0060] 其中,IF此为用户的直接影响力,IF dluSCT为用户属性决定的影响力,IF 为用 户微博内容决定的影响力,α和(l-α)分别为用户属性决定的影响力和用户微博内容决 定的影响力所占的权重比例系数,〇< α <1。
[0061] 计算用户的间接影响力,其中用户的间接影响力是指用户通过其粉丝对其他用户 产生的社交影响,用户的间接影响力由其粉丝的影响力决定,主要包括以下内容:首先需要 先计算该用户每个粉丝的影响力,即用户间接影响力的计算过程是个迭代计算过程,迭代 深度(次数)可根据计算精度的需求决定,然后根据获取的用户粉丝名单信息分别计算每 个粉丝的影响力,其中以微博平台的用户关系网络模型为基础,参考PageRank算法的迭代 投票思想,所述计算用户的间接影响力具体按照下列公式进行迭代计算:
[0063] 其中
为所有用户间接影响力值组成的向量,即更新后所有用户的间接影响 力值向量,/Tjf '为更新前所有用户的影响力值向量,c为阻尼系数,^为单位行向量,Y为投 票矩阵,其中投票矩阵中的元素 U1,表示投票权重,所述其投票矩阵Y中的元素 y u计算方法 如下
[0065] 其中,E为表示微博用户关系网络的带权有向图中连接节点间关系的有向边的集 合,Vp vjP V k均为带权有向图中的节点,p ;表示节点V ;的权重,e u表示连接节点V ;和节 点Vj的有向边,w。表示有向边e。的权重,e ik表示连接节点V ;和节点V k的有向边,w ik表 示有向边eik的权重,W。的计算公式为Wu= nT+(l_n)Q,其中,T为节点vj/f代表的用户 对节点V]所代表用户的微博进行转发的累计转发次数,Q为节点V i所代表的用户对节点V ] 所代表用户的微博进行评论的累计评论次数,η和a-η)分别为累计转发次数和累计评 论次数所占的权重比例系数,〇 < η < 1。
[0066] 所述其计算用户的综合影响力公式如下:
[0067] IF= P IFdir+(I-P) IFindir (0 ^ P ^ 1)
[0068] 其中,IF为微博用户的综合影响力,IFdir为用户的直接影响力,IF indir为用户的间 接影响力,P和(I-P)分别为用户的直接影响力IFdir和间接影响力IF indir所占的权重比 例系数,若P = 1,则用户影响力完全为直接影响力,不考虑任何间接影响力。
【主权项】
1. 一种基于信息交互网络的微博用户影响力计算方法,其特征在于,包括以下步骤: (1) 在微博平台上通过网络爬虫技术采集用户的属性信息、用户的微博信息和用户的 粉丝列表; (2) 根据步骤⑴采集的用户属性信息计算用户属性决定的影响力; (3) 根据步骤(1)采集的用户微博信息来构建微博信息交互网络模型,通过构建的微 博信息交互网络模型来计算用户微博内容决定的影响力; (4) 根据步骤(2)和步骤(3)分别得到用户属性决定的影响力和用户微博内容决定的 影响力来计算用户的直接影响力; (5) 根据步骤(1)采集的用户粉丝列表来获取其每个粉丝的影响力,再根据所述每个 粉丝的影响力综合计算出用户的间接影响力; (6) 根据步骤⑷和步骤(5)得到用户的直接影响力和用户的间接影响力来计算用户 的综合影响力。2. 根据权利要求1
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1