一种基于信息交互网络的微博用户影响力计算方法_4

文档序号:9506283阅读:来源:国知局
所述的一种基于信息交互网络的微博用户影响力计算方法,其特征 在于,所述用户的属性信息包括实名认证标志、关注数、粉丝数、总微博数、总转发数和总评 论数。3. 根据权利要求1所述的一种基于信息交互网络的微博用户影响力计算方法,其特征 在于,所述定义微博信息交互网络模型步骤为: a、 定义微博系统的用户关系网络为一带权有向图:UR= (V,E,P,W),有向图中的节点 代表微博系统中的用户,有向边代表微博系统中用户之间的关系,所述该式中的V表示节 点的集合,E表示有向边的集合,P表示节点权重的集合,W表示边权重的集合,eK, 该式表示在节点集合V中两个节点vJPvj,若3% 该式表示在有向边集合E 中存在一条连接节点Vi和节点v_j的有向边e^,边的方向为Vi指向,即在微博系统中用户Vl和用户v,之间存在关系,用户vi关注用户v,,即用户Vl是用户v,的粉丝,PP表示节 点 '的权重为Pi,W表示有向边e。的权重为w b、 定义微博系统中用户发布的微博元素为一个8元组: m= (ID,Content,Author,Type,Time,FN,CN,PN),其中,m表示用户发布的微博,ID为 微博编号,Content为微博内容,Author为微博作者,Type为微博的类型,Time为微博发布 的时间戳,FN为微博被转发的次数,CN为微博获得的评论数,PN为微博获得的点赞数; c、定义微博的传播关系,根据上述步骤a定义的用户关系网络为一带权有向图UR= (V,E,P,W),贝lj用户发布微博的传播关系定义为sr =(nii,<Vi,'> ),其中v;和v均表示 代表微博用户的节点,1^表示用户v;发布的微博,<vi, '>表示节点v;指向节点v,即用 户Vl发布的微博mi从节点vi传给了节点v,,则表示用户V]是用户vi的粉丝,或者是表示 用户Vl直接将微博送给了用户v,,即用户Vl发布的微博mi的内容中包含"iv/'的内 容; d、 定义微博的转发关系,根据步骤a将微博系统中的微博转发关系定义为fr= < ffll,m] >,1^表示用户Vi发布的微博,m表示用户V发布的微博,该式表示微博m是对微博m;进 行转发的微博,微博转发关系的方向为1?指向m e、 定义微博的评论关系,根据步骤a将微博系统中的微博评论关系定义为cr= <V],ffll >,该式表示用户V]对微博mi进行了评论,微博评论关系的方向为v,指向m1; f、定义微博信息交互网络模型为H= (M,U,SR,FR,CR,WM),其中Μ为用户发布微博的 集合,U为发布和转发微博及评论微博的用户的集合,且C/ £;Γ,SR为微博传播关系的集合, FR为微博转发关系的集合,CR为微博评论关系的集合,WM为用户发布的微博内容影响力权 重的集合,对于微博集合Μ中的微博m,Author(m)表示微博m的作者,即微博m的发布者, wm(m)表示微博m的内容影响力权重,根据上述d步骤的定义,对微博m进行转发的用户集 合表不为:根据上述e步骤的定义,对微博m进行评论的用户集合表示为:α,,("〇 = {匕.| 3 匕.e(人 < 匕.,川 >eC/?,}。4. 根据权利要求1所述的一种基于信息交互网络的微博用户影响力计算方法,其特征 在于,所述用户的微博信息包括其所发布的每篇微博的内容和发布时间、微博的转发数、评 论数、点赞数以及对微博进行转发和评论的用户名单。5. 根据权利要求1和3所述的一种基于信息交互网络的微博用户影响力计算方法,其 特征在于,所述计算用户的直接影响力步骤具体如下:①、用户属性决定的影响力具体按照 下面公式表述: IFdir_user= ^ 〇Ν〇+β^!+β2Ν2+β3Ν3+β4Ν4+β5Ν5 其中,IFdlySCT为所述用户属性决定的影响力,Ν。为用户的微博账号实名认证标志,即 通过实名认证的用数值1表示,未通过实名认证的用数值0表示,Κ为用户的关注数,Ν2为 用户的粉丝数,N3为用户的总微博数,N4为用户的总转发数,N5为用户的总评论数,β。,βρ β2,β3,β4,β5分别为相应子属性的权重比利系数,且β0+β1+β2+β3+β4+β5= 1 ; ② 、计算用户发布的微博m的内容影响力,计算方法如下:其中,m表示用户发布的微博,wm(m)为微博m的内容影响力,PN为微博m获得的点赞 数,v,vk均为微博系统中的用户,FU(m)为对微博m进行转发的用户集合,w(V])表示对 微博m进行转发的用户'的权重,即用户"的影响力值,CU(m)为对微博m进行评论的用 户集合,w(vk)表示对微博m进行评论的用户%的权重,即用户^的影响力值,γργ2,γ3 分别为点赞、转发和评论属性的权重比例系数,且1 ; ③ 、计算用户所发布的全部微博的内容影响力,计算方法如下:其中,为用户所发布的全部微博的内容影响力,wm(m)为微博m的内容影响 力,Wk为时间窗口k,时间窗口就是一段时间区间,用来刻画用户发布微博的时间范围,窗 口是随时间推进向前顺次滑移的,即上一个窗口结束的时间就是下一个窗口开始的时间, m.Timee?1'表示微博m是在时间窗口k内所发布的,f为衰减函数,f(k)表示第k个时间 窗口内所发微博的内容影响力相比第η个窗口的折扣幅度函数,也称衰减函数,衰减函数 表示为/'(幻=Ο<W<i,1d?; 〃丨④、根据步骤①和步骤③按照下列公式计算用户 的直接影响力: IFdir=aIFdir-user+(l-a)IFdir-mb 其中,IFdir为用户的直接影响力,IFdirusCT为用户属性决定的影响力,IFdirnib为用户微 博内容决定的影响力,α和(l-α)分别为用户属性决定的影响力和用户微博内容决定的 影响力所占的权重比例系数,〇<α<1。6. 根据权利要求1所述的一种基于信息交互网络的微博用户影响力计算方法,其特征 在于,所述计算用户的间接影响力具体按照下列公式进行迭代计算:其中τ?Γ7"为所有用户间接影响力值组成的向量,即更新后所有用户的间接影响力值 向量,#$为更新前所有用户的影响力值向量,c为阻尼系数,^为单位行向量,Υ为投票矩 阵。7. 根据权利要求6所述的一种基于信息交互网络的微博用户影响力计算方法,其特征 在于,所述其投票矩阵Υ中的元素yij计算方法如下:其中,E为表示微博用户关系网络的带权有向图中连接节点间关系的有向边的集合,Vi、Vj和V k均为带权有向图中的节点,P i表示节点v i的权重,e i_j表示连接节点V i和节点V 的有向边,Wi.j表示有向边e^的权重;eik表示连接节点v;和节点vk的有向边,wik表示有向 边eik的权重,w。的计算公式为: ηΤ+(1-η)(>) 其中,T为节点Vl所代表的用户对节点v,所代表用户的微博进行转发的累计转发次 数,Q为节点Vl所代表的用户对节点^所代表用户的微博进行评论的累计评论次数,η和 (l-π)分别为累计转发次数和累计评论次数所占的权重比例系数,〇 <π< 1〇8. 根据权利要求1所述的一种基于信息交互网络的微博用户影响力计算方法,其特征 在于,所述其计算用户的综合影响力公式如下: IF=pIFdir+(l-p)IFindir 其中,IF为微博用户的综合影响力,IF此为用户的直接影响力,IFιη此为用户的间 接影响力,P和(1-P)分别为用户的直接影响力和间接影响力所占的权重比例系数, Ο ^ P ^ 1〇
【专利摘要】本发明公开了一种基于信息交互网络的微博用户影响力计算方法,步骤为:第一,在微博平台上用网络爬虫技术采集用户的属性信息、微博信息和粉丝列表;第二,根据采集用户属性信息计算用户属性决定的影响力,根据用户微博信息构建微博信息交互网络模型,用微博信息交互网络模型来计算用户微博内容决定的影响力,通过用户属性决定的影响力和用户微博内容决定的影响力来计算用户的直接影响力;第三,用采集的用户粉丝列表来计算每个粉丝的影响力,通过每个粉丝的影响力综合计算用户的间接影响力;第四,通过用户的直接影响力和用户的间接影响力来计算用户的综合影响力。本发明提高了微博影响力计算的准确性,还突出了用户影响力的时效性和动态性。
【IPC分类】G06F17/30
【公开号】CN105260474
【申请号】CN201510725236
【发明人】俞定国
【申请人】俞定国
【公开日】2016年1月20日
【申请日】2015年10月29日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1