一种基于社交网络用户行为的用户影响力分析方法

文档序号:6543565阅读:165来源:国知局
一种基于社交网络用户行为的用户影响力分析方法
【专利摘要】本发明提出了一种基于社交网络用户行为的用户影响力分析方法,涉及信息【技术领域】。本发明可以通过社交网络的数据集,从用户关系和用户活动两个方法,综合分析出影响力强的用户。针对于现有的基于社交网络分析影响力的方法,与基于PageRank的模型相比,本发明涉及更多数据关系,并且在影响力的扩散与初值有关,扩散过程中受到用户评论数目和内容的影响,更为合理。与基于IDM的模型相比,本发明对于用户之间的关系利用更加充分,不存在IDM模型中的断层现象。与传统的基于用户行为模型相比,本发明类比了人与人线下关系的模式,这样更加符合社交网络中将人与人线下关系移动的线上的初衷。
【专利说明】一种基于社交网络用户行为的用户影响力分析方法
【技术领域】
[0001]本发明涉及信息【技术领域】,特别是涉及一种基于社交网络用户行为的用户影响力分析方法。
【背景技术】
[0002]随着互联网的发展,用户已经从一个被动的通过浏览器从各大网站获取信息阅读信息的浏览者,转向了可以主动参与到互联网的发展之中的编辑者,使用者和传播者。在web2.0时代,用户拥有更多的话语权和主动权,可以直接参与和发布内容,极大加强了用户间的交流性。社交网络作为这个时代一个突出的产物,其具有用户规模大,话题种类多,信息传递迅速和影响范围广等特点。社交网络的迅速发展已经成为了一个新型了信息载体和转播媒介,对于日常工作和生活产生的影响也越来越大。在信息传播的过程中,意见领袖作为一种重要力量,在社会舆论的形成过程中发挥着不可忽视的作用,局部意见在意见领袖的引导下演化为舆论,影响力直接渗透到现实社会。
[0003]为了识别出社交网路中的意见领袖,需要分析社交网路中用户的影响力,找出影响力强的用户。现有的基于社交网络分析影响力的方法分为三大类。第一类是基于PageRank网页排名算法。基于PageRank的算法,多为对社交网络中的某一个因素,套用PageRank的思想,计算出用户影响力。其不足是所用的因素比较单一,没有针对内容分析。第二类基于影响力扩散模型(IDM),IDM模型主要是针对话题,根据帖子上下文词语出现的频率关系,得到话题的影响力。通过计算用户所有话题得到用户的影响力。这种方法的不足是用户之间的联系不太紧密。第三类是传统的基于用户行为模型。该模型通过统计用户的各种行为,例如跟随、转推、提及,来计算用户的影响力。这种方法比较简单,但是各种行为的归一化系数不好确定。

【发明内容】

[0004]本发明提供了一种基于社交网络用户行为的用户影响力分析方法。这个方法可以通过社交网络的数据集,从用户关系和用户活动两种方法,综合分析出影响力强的用户,包括如下步骤:
[0005]步骤1:统计分析相关数据信息
[0006]在社交网络中,数据量非常庞大,为了从庞大的数据量中分析用户影响力首先需要统计以下信息。第一,统计分析社交网络中用户之间的关注和被关注关系。第二,统计分析用户之间的评论数目和评论内容。
[0007]步骤2:用户关系影响力计算
[0008]用户关系影响力是实现过程借鉴了 PageRank网页排名算法的思想,以用户之间的关注情况类比PageRank中的链接情况。通过公式(I)计算出用户关系影响力。由于用户关系影响力算法是一收敛算法,所以其结果只与用户之间相互关注的关系有关,与用户初始值无关。[0009]
【权利要求】
1.一种基于社交网络用户行为的用户影响力分析方法,其特征在于包括如下步骤:步骤1:统计分析社交网络中用户之间的关注和被关注关系及评论数目和评论内容;步骤2:设置用户关系影响力初值为1,通过计算N次用户关系影响力,直到用户关系影响力趋于平稳,两次相邻计算的结果差小于结果值的百分之一,用户关系影响力计算方法如下:
【文档编号】G06F17/30GK103886105SQ201410146306
【公开日】2014年6月25日 申请日期:2014年4月11日 优先权日:2014年4月11日
【发明者】姜伟, 高梦迪, 张建标, 赖英旭, 李健, 庄俊玺, 张世翔 申请人:北京工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1