一种引入列维飞行的社交网络专家定位方法与流程

文档序号:12039175阅读:261来源:国知局
一种引入列维飞行的社交网络专家定位方法与流程
本发明涉及用于社交网络进行专家用户搜索的领域,具体来说就是一种在社交网络中找出专家型用户的用户定位方法。

背景技术:
基于专家定位的用户影响力研究普遍存在于社会科学、传播学、市场营销和政治科学领域的研究中,研究专家定位模式可以帮助我们更好地理解为什么某些新趋势或新创新可以被人们更快地接受,也可以帮助理解我们该如何帮助广告商和市场营销人员来设计更好的营销与推广策略。在社交网络专家定位系统中,传统的专家定位方法主要分为三种。第一种方法是基于PageRank思想的定位方法,主要分析了社交网络中用户之间的社交网络关系以及用户的统计数据,却没有考虑用户微博博文的转发关系;第二种方法是基于用户行为权值的定位方法,这种方法主要研究了用户之间的关注/被关注关系及博文的转发关系,但是这种方法没有考虑用户转发兴起所引起的信息传播机制所产生的影响力扩散效应,存在一定不合理性。第三种方法则是基于PageRank思想与用户行为权值的评价方法,对于社交网络中的用户来说,其所在的社交网络关系及其发布博文、转发博文的行为都应该作为专家定位方法的考量因素,但是传统的这种方法中一般认为用户的初始专业性权值是相同的,这是不合理的,因为一个用户在社交网络中越处于中心位置就越能促进信息的传播,而且用户的专家影响力也并非只能传播给其粉丝用户而消失,而这也是传统方法中所存在的不足之处。

技术实现要素:
本发明的目的是针对现有技术中忽略视频时长与观看时间的技术缺陷而提供一种引入列维飞行模式的社交网络专家定位方法,能够在考虑了用户与用户、用户与博文及博文与博文之间的行为关系的基础上,还分析了用户所处社交网络的中心性因素及博文的热度趋势因素,而且通过列维飞行模式的引入,使得存在博文转发关系而却没有关注关系的用户也被考虑了进来,扩大了用户的影响范围。本发明解决其技术问题所采用的技术方案是:一种引入列维飞行的社交网络专家定位方法,该方法包括如下步骤:a)确定社交网络中用户与用户、用户与博文及博文与博文之间的相互关系;具体包括:I)确定社交网络中用户之间的关系,即用户之间的关注或被关注关系;II)确定社交网络中用户与博文之间的关系,即用户与博文的发布或被发布关系;III)确定社交网络中博文与博文之间的关系,即博文对博文的转发或被转发关系,包括博文之间的一跳转发和二跳转发关系;IV)根据上述所有关系,确定用户博文行为关系图,作为步骤d)中计算用户专业性权值的拓扑关系图。b)基于用户之间的社交网络关系,计算微博用户的社交网络中心性值;具体包括:I)根据第j个用户与其粉丝用户之间的关注或被关注关系,获得其粉丝用户中与该用户存在相互关注关系的粉丝数目fj;II)根据该用户的粉丝用户与这些粉丝用户的粉丝用户之间的关注或被关注关系,获得该用户的粉丝用户的粉丝用户中与该用户之粉丝用户存在相互关注关系的粉丝数目sj;III)通过以下公式计算第j个用户的社交网络中心性值SNCj,其中M为用户总数;c)基于转发博文与原创博文之间的关系,计算博文热度趋势值;具体包括:I)根据指定时间D天内的原创博文转发关系,计算该原创博文在第t天的被转发次数|Vi,t|;II)计算该指定时间内的该原创博文的每天被转发次数的期望值μi,t和方差值σi,t;III)根据以下公式计算第i篇博文热度趋势值Trend(i),其中N为博文总数;d)确定用户和博文的最终专业性权值,并根据用户的专业性权值从大到小进行排序,同时取其中前10%的用户作为专家;具体包括:I)确定用户博文行为关系图中的边权值aij;II)根据用户博文行为关系图来生成用户与博文之间的邻接矩阵A;III)确定用户和博文的最终专业性权值,并根据用户的专业性权值从大到小进行排序,并同时取其中前10%的用户作为专家;其中步骤III)包括:ⅰ)根据如下公式分别计算用户和博文在第k次迭代中的专业性权值其中d是列维飞行模式跳转概率;ⅱ)根据该博文的博文热度趋势值Trend(i)调整博文的专业性权值ⅲ)对用户和博文的专业性权值进行归一化计算。本发明应用于社交网络的专家定位系统中;首先通过对社交网络中用户与用户、用户与博文、博文与博文之间的关注或被关注、发布或被发布、转发或被转发关系的分析来构建用户博文行为关系图,然后计算用户在社交网络中中心性值的同时也计算博文的热度趋势值,通过用户与博文之间的相互迭代计算方法,最后得到稳定的用户专业性权值排序,并取用户总数的前10%用户作为专家型用户。本发明在社交网络中进行专家定位计算时,考虑到了用户所处的社交网络的位置,较为合理地衡量了一个用户在社交网络中初始的专家影响力扩散能力,越靠近社交网络中心的用户,相互关注的粉丝用户越多,信息通过其传播的可能性更大。本发明在社交网络中进行专家定位计算时,考虑到了微博博文的热度趋势值,一篇博文的热度趋势不仅代表了一篇博文的受欢迎程度,还代表了该博文的生命力与延续力,与博文之间的转发或被转发关系一起能更好地反应博文内容的质量。本发明在社交网络中进行专家定位计算时,通过引入列维飞行模式计算来考虑到了不存在社交关系的用户之间也存在的博文转发或被转发关系,相较于随机游走模式的计算,覆盖的用户将更加全面。本发明通过分析用户的关注或被关注、用户与博文的发布或被发布、博文与博文之间的转发与被转发关系来更准确把握用户与博文之间的互动关系,通过引入社交网络中心性值来更准确地描述用户的初始专业性值,通过引入博文的热度趋势值进而更有效地衡量微博博文的内容质量,最后利用列维飞行模式的迭代计算可以更准确地评价用户在社交网络中的专业性权重,更高效便捷。附图说明图1为本发明流程示意图;图2为本发明实施例示意图。具体实施方式本发明根据用户所处社交网络的中心性来确定用户初始的专家影响力权值,更合理地表现一个用户在社交网络中对粉丝用户产生影响的专家能力;根据微博博文的热度趋势来调节博文的专业性权值,用于反映一篇博文的延续力与生命力,更合理地衡量一篇博文的质量;根据社交网络中用户行为特征,采用列维飞行因子来进行用户专业性权值的计算,更完善地覆盖了一些不存在社交网络关系却进行博文转发的用户。本领域技术人员可以参考图1示出的流程。以下详细叙述本发明:(1):分析社交网络中用户与用户、用户与博文和博文与博文之间的关注/被关注、发布/被发布和转发/被转发关系,并根据这些关系构建用户博文行为模式图;(2):根据用户与博文之间的特征关系,设定用户博文行为模式图中结点之间的边权值;(3):根据用户所处社交网络中与其粉丝之间相互关注的关系,记为fj,以及用户的粉丝用户与他们的粉丝之间的相互关注关系,记为sj,来计算用户的社交网络中心性值SNC:(4):通过如下公式计算博文在D天内的热度趋势值Trend,(5):生成邻接矩阵A,并根据如下公式计算用户与博文的专业性权值,其中d是列维飞行跳转概率,|V|是图中用户结点与博文结点的总数:(6):对用户与博文的专业性权值进行归一化计算;(7):将用户按照专业性权值从大到小排序,若此次排序与上一次排序的序列相一致,则至(8),否则就重复执行(5)和(6);(8):将用户专业性权值最大的前10%用户作为专家型用户进行输出。实施例假设用户博文行为模式图关系如图2所示,其中边权值分别赋为:发布0.8,被发布0.23,转发0.52,关注是0.2除以关注的用户数:1)、首先计算用户的社交网络中心性。A与其粉丝的相互关注数为1,A的粉丝与A的粉丝的粉丝进行相互关注的数目为0,B与其粉丝的相互关注数为1,B的粉丝与B的粉丝的粉丝之间相互关注的用户数为0,C与其粉丝的相互关注数为0,C的粉丝与C的粉丝的粉丝之间相互关注数为2,同理,D和E与其粉丝的相互关注数都为1,D/E的粉丝与D/E的粉丝的粉丝之间相互关注的用户数为0。所以s+f的最大值为2。所以根据公式进行计算得到中心性SNC分布为:A-0.5,B-0.5,C-1.0,D-0.5,E-0.5,故C更靠近该社交网络的中心位置。2)、计算博文的热度趋势值。假设图2中为2天内的博文转发情况,则D=2,原创博文1的被转发次数为4,而博文2-5都不是原创博文,所以转发次数计为0。假设博文1第一天被转发2次,第二天被转发2次,故平均值μi=(2+2)/4=1,方差故原创博文1的热度趋势值3)、通过用户行为关系权值构建用户博文矩阵,并初始化用户结点的专家性权值为该用户的SNC值,然后通过公式计算图中每个结点的专家性权值:计算完成一次,对于原创博文结点对应的r值进行trend调整,即r=r*trend,然后得到结点专家性权值的一个从大到小的排列,假如第一次排列为ABDEC,第二次迭代计算后排列为ABCED,则表示结果未稳定收敛,当下一次迭代计算后排列依然跟上一次的排列次序相同,即若第三次迭代结果排序后依然为ABCED,则算法收敛并结束,输出前10%的用户,在此为前1个用户作为专家型用户,即排在最前面的用户A。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1