一种基于消退机制的微博用户影响力排名方法与流程

文档序号:15934474发布日期:2018-11-14 02:10阅读:130来源:国知局

本发明涉及互联网领域,具体涉及一种基于消退机制的微博用户影响力排名方法。

(二)背景技术

微博用户影响力排名的目的是在网络中识别并挖掘出对信息传播及改变他人思想能力突出的用户。随着社会网络的不断发展,微博用户数量迅速增长,短时间内平台中会产生大量的历史数据,使得通过历史数据预测用户影响力的算法性能降低。此外,用户在网络中的影响力并非固定不变,用户的威望度随时间的变化而波动。因此,基于消退机制计算用户影响力不仅能减少对历史数据的冗杂计算而且能够体现用户影响力随时间的波动规律。

目前,微博用户影响力排名研究中主要方法是基于网页排名的pagerank算法,并引入用户属性和社交关系等因素对用户的影响力进行研究,忽略了用户影响力随时间变化的实际情况。基于消退机制的影响力计算方法可以监控用户每周的行为,仅需要计算当前一周用户的被提及、信息被转发、信息被评论行为出现的次数并记录,每隔一定时间更新用户的影响力便可以将用户的最近影响为主、以往影响力为辅计算用户当前时段内的影响力排名。

(三)

技术实现要素:

本发明的目的是提供一种基于消退机制的微博用户影响力排名方法。该方法将用户的被提及、信息被转发、信息被评论行为作为用户在平台中的威望度衡量指标,以周为周期统计用户的威望度,将时间分为三个时间段,计算用户第二时间段和第三时间段平均每周的威望度,然后将后两个时间段的平均威望度及第一时间段的影响力进行权值和计算,得到当前时段内用户影响力的排名结果。

为了达到上述目的,本发明采用这样的方案实现:

用户每周的威望度记为用户的被提及、信息被转发、信息被评论行为每周出现的次数和,以周为周期统计用户的周威望度。初始时刻通过对用户粉丝数量取对数并归一化计算用户的影响力值,每隔一定的时间更新一次用户影响力排名。更新过程需要从初始时刻起将时间分为三个时间段,计算用户第二时间段和第三时间段的平均每周的威望度并与用户更新前的影响力值进行权值相加作为用户的当前影响力值,其中第三时间段威望度权值大于第二时间段威望度的权值,目的是让用户的历史影响力随时间不断消退,然后根据所有用户当前影响力重新排名,得到最终排名结果。

排序过程中涉及到如下参数:t为初始时刻标志,fi为初始时刻用户i的粉丝数量,ii,t为用户i在初始时刻t的初始影响力值,log(fi)为初始时刻用户i粉丝数量的对数,log(fmin)为初始时刻网络中粉丝数量最少的用户粉丝数量的对数,要求fmin>0,log(fmax)为初始时刻网络中粉丝数量最多的用户粉丝数量的对数,要求fmax>fmin,aci为用户i的威望度记录值,ai,m为用户i在第m周的威望度,n为时间节点更新标志,n=0,1,2,3,…,w1为第一时间段影响力权值,w2为第二时间段平均威望度权值,w3为第三时间段平均威望度权值,δw为影响力权值波动量,tn为时间节点标记,为用户i在t0时刻的影响力,为用户i在t1时刻的影响力,为用户i在tn时刻的影响力,[t,tn-1]为第一时间段,[tn-1,(tn+tn-1)/2]为第二时间段,[(tn+tn-1)/2,tn]为第三时间段,为用户i在时间段[tn-1,(tn+tn-1)/2]内的平均威望度,为用户i在时间段[(tn+tn-1)/2,tn]内的平均威望度,α为威望度信息指数,α目的是将用户影响力和平均威望度保持在同一数量级。

本方法中涉及到的模块如下:

存储模块:用于存储用户的粉丝数量、威望度记录值、用户每周的威望度、影响力权值及时间节点更新标志等信息。

监控模块:用于监控用户的被提及、信息被转发和信息被评论行为及影响力更新的时间节点。

计算模块:用于计算用户在不同时间段内的平均威望度、各时间段的用户影响力值、影响力权值和平均威望度权值、时间节点更新标志等。

其具体方法步骤为:

(1)初始时刻t=0,记网络结构中用户i的粉丝数量为fi,并将fi存入存储模块;

(2)计算模块计算t=0时用户i的影响力值

(3)初始时刻t=0,初始化用户i的威望度记录值aci=0,并将aci存入存储模块;

(4)监控模块实时监控网络中用户i的被提及、信息被转发和信息被评论行为,监控到任何一种行为该用户的威望度记录值aci加1,并将aci存入存储模块;

(5)以周为单位计算用户每周的威望度,监控模块监控至每周结束后,统计用户i的第m周的威望度ai,m=aci,并将ai,m存入存储模块;

(6)用户i的第m周的威望度统计结束后,重置aci=0;

(7)从初始时刻t=0开始,初始化时间节点更新标志n=0,并将n存入存储模块;

(8)n=0时,初始化影响力计算权值w1,w2=(1-w1)/3,w3=2(1-w1)/3,且w1>w2+w3,并将w1,w2,w3存入存储模块;

(9)通过监控模块监控时间节点,每至2n周结束,时间节点标记为tn,tn=2n周,用户影响力排名更新一次,更新机制转向步骤(10);

(10)若n≥2,则转向步骤(13),否则转向步骤(11);

(11)若n=0,则用户i的影响力为ii,t0=w1ii,t+w2ai,1α,并将ii,t0存入存储模块,转向步骤(16),否则转向步骤(12);

(12)n=1时,用户i的影响力为并将存入存储模块,转向步骤(16);

(13)n≥2时,通过计算模块将时间段[t,tn]分为三段,第一时间段[t,tn-1]、第二时间段[tn-1,(tn+tn-1)/2]和第三时间段[(tn+tn-1)/2,tn];

(14)通过计算模块计算用户i在第二时间段和第三时间段的平均威望度,每个时间段的平均威望度为该时间段内每周威望度的平均值,时间段[tn-1,(tn+tn-1)/2]的平均威望度为时间段[(tn+tn-1)/2,tn]的平均威望度为

(15)计算用户i在tn时刻的影响力为并将存入存储模块,计算结束,转向步骤(16);

(16)计算模块将时间节点更新标志n增加1,若影响力计算权值w1>w2+w3,则w1=w1-δw,w2=(1-w1)/3,w3=2(1-w1)/3,否则不变,计算完成后将n,w1,w2,w3存入存储模块;

(17)根据更新后的用户影响力值由大到小排名,得到该时间段的用户影响力排名结果,若继续计算下一时段排名结果,则转向步骤(9)继续监控,否则计算结束。

本发明所阐述的基于消退机制的微博用户影响力排序方法,是结合当前时段用户的平均威望度和用户上一时段的影响力进行权值和,计算当前时段的用户影响力值并按大小排名。该方法考虑了用户影响力随时间不断波动的实际情况,通过分时间段更新用户的影响力排名,既避免了冗杂的历史数据计算,又真实地反映了用户当前时段的影响力。

本方法的创新性在于:

1.将时间按照总时段长度的1/2,1/4,1/4的长度进行分割成三段进行计算,能够减少一半的历史数据计算量,增加了该方法的计算速度;

2.用户影响力按照标记时间节点2n周进行更新,当n较小时,用户的影响力更新较快,随着n的不断增长,用户的影响力逐渐趋于稳定,影响力更新周期变长,该机制使用户影响力在随时间波动的同时逐渐趋于稳定,同时减少了用户平均威望度的重复计算;

3.初始时由于用户威望度计算机制尚未建立,影响力计算以基于粉丝数量计算的影响力为主,以用户的威望度为辅。随着时间的推进,最初的影响力权值逐渐减小,用户近期的平均威望度权重不断增加,且越接近最新更新节点的平均威望度所占比重越大,最终上一时间节点影响力和近期的平均威望保持一个稳定的权重比例,该调整能够让用户历史的影响力稳步消退。

(四)附图说明

图1为本发明所述方法示意图。

图2为本发明中时间节点更新和阶段划分示意图。

图3为本发明中影响力排名流程图。

(五)具体实施方式

下面结合附图举例对本发明做更详细地描述:

首先将粉丝数量取对数并归一化后的结果作为用户的初始影响力,通过监控网络中用户的被提及、信息被转发、信息被评论三种行为,一旦监控到任何一种行为,该用户的威望记录值加1。通过监控模块监控时间至每周结束时,记录用户每周的威望度,并将记录值重置为0。用户的影响力排名每隔2n周更新一次,初始时n=0,每更新完一次n加1。在更新过程中,分为n=0,n=1,和n≥2三种情况,n=0时,用户的影响力为初始影响力与用户第一周威望度的权值和;n=1时,用户的影响力为用户第一周的影响力与第二周威望度的权值和;n≥2时,需要将时间从初始时间节点到当前影响力更新时间节点分为三段,用户当前的影响力为第一时间段影响力、第二时间段威望度和第三时间段平均威望度的权值和,最终对网络中用户的当前影响力进行排名。在权值分配的过程中,开始用户上一阶段的影响力权重较大,用户的威望度占比较小,时间节点更新标志每增加1,上一阶段的影响力所占比重减少δw,后两时间段的平均威望度总和所占权重增加δw,其中第二时间段的平均威望度权重占平均威望度总和权重的1/3,第三时间段的平均威望度权重占平均威望度总和权重的2/3。随着n增加,上一阶段影响力所占权重与后两阶段平均威望度所占权重基本达到稳定状态,此后,权值分配不再变化。

本发明所述方法的特征在于:

(1)初始时刻t=0,记网络结构中用户i的粉丝数量为fi,并将fi存入存储模块;

(2)计算模块计算t=0时用户i的影响力值

(3)初始时刻t=0,初始化用户i的威望度记录值aci=0,并将aci存入存储模块;

(4)监控模块实时监控网络中用户i的被提及、信息被转发和信息被评论行为,监控到任何一种行为该用户的威望度记录值aci加1,并将aci存入存储模块;

(5)以周为单位计算用户每周的威望度,监控模块监控至每周结束后,统计用户i的第m周的威望度ai,m=aci,并将ai,m存入存储模块;

(6)用户i的第m周的威望度统计结束后,重置aci=0;

(7)从初始时刻t=0开始,初始化时间节点更新标志n=0,并将n存入存储模块;

(8)n=0时,初始化影响力计算权值w1,w2=(1-w1)/3,w3=2(1-w1)/3,且w1>w2+w3,并将w1,w2,w3存入存储模块;

(9)通过监控模块监控时间节点,每至2n周结束,时间节点标记为tn,tn=2n周,用户影响力排名更新一次,更新机制转向步骤(10);

(10)若n≥2,则转向步骤(13),否则转向步骤(11);

(11)若n=0,则用户i的影响力为,并将存入存储模块,转向步骤(16),否则转向步骤(12);

(12)n=1时,用户i的影响力为并将存入存储模块,转向步骤(16);

(13)n≥2时,通过计算模块将时间段[t,tn]分为三段,第一时间段[t,tn-1]、第二时间段[tn-1,(tn+tn-1)/2]和第三时间段[(tn+tn-1)/2,tn];

(14)通过计算模块计算用户i在第二时间段和第三时间段的平均威望度,每个时间段的平均威望度为该时间段内每周威望度的平均值,时间段[tn-1,(tn+tn-1)/2]的平均威望度为时间段[(tn+tn-1)/2,tn]的平均威望度为

(15)计算用户i在tn时刻的影响力为并将存入存储模块,计算结束,转向步骤(16);

(16)计算模块将时间节点更新标志n增加1,若影响力计算权值w1>w2+w3,则w1=w1-δw,w2=(1-w1)/3,w3=2(1-w1)/3,否则不变,计算完成后将n,w1,w2,w3存入存储模块;

(17)根据更新后的用户影响力值由大到小排名,得到该时间段的用户影响力排名结果,若继续计算下一时段排名结果,则转向步骤(9)继续监控,否则计算结束。

具体实施模式是这样的:

初始化用户的影响力值、威望度记录值、影响力分配权值、时间节点更新标志并存入存储模块,监控模块监控网络中的用户行为并记录每个用户每周的威望度,每周结束时存储用户每周的威望度,监控时间每至2n周更新用户影响力,更新过程中通过计算模块将时间段分为三段,将第一时间段的用户影响力与后两个时间段的用户的平均威望度进行权值相加,得到用户当前阶段的影响力值,最终对用户的影响力进行排序,得到当前用户影响力排名。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1