一种微博中人物关联关系分析方法

文档序号:9432549阅读:1361来源:国知局
一种微博中人物关联关系分析方法
【技术领域】
[0001]本发明涉及一种微博分析方法,具体来说涉及一种微博中人物关联关系分析方法。
【背景技术】
[0002]微博的出现使得互联网上的信息传播越来越快捷,微博的出现使得个人媒体走上互联网的历史舞台,这使得微博中的人际关系同时具有多元化、个人化、行业化、从众化、临时聚合化等复杂的特征,如何研究微博中的人际关系,是互联网信息传播研究中的重要一环。然而目前无相关技术方案分析微博中的人际关系,大多通过人工方式来判断特定的两个或几个博主之间是否有关注关系。

【发明内容】

[0003]本发明所要解决的技术问题在于克服上述现有技术中存在的缺陷,而提供一种微博中人物关联关系分析方法,针对微博博主进行互联网人际关系分析,从海量数据中抽取该博主在微博上的各类关联关系,从而为微博信息的传播提供分析依据。
[0004]为实现上述目的,本发明提供一种微博中人物关联关系分析方法,所述算法步骤包括:
[0005](I)通过原始信息,获得博主的基础微博信息,如注册地、粉丝数、关注数、微博数;
[0006](2)找出该博主的关注人信息;
[0007](3)找出该博主的相互关注人信息;
[0008](4)找出博主的所有博文信息;
[0009](5)找出微博上与博主具有相同博文的博主信息;
[0010](6)找出O博主的信息以及博主@其他人的微博信息;
[0011](7)找出博主微博中的地点信息,并获得微博中的相同时间范围内的相同地点信息;
[0012](8)对步骤2和3中的信息进行人物关系权重运算,对步骤4、5和6进行互动频度权重计算,对步骤7进行线下关系判断;
[0013](9)获得博主的微博关联关系列表。
[0014]优选地,所述微博中人物关联关系分析方法还包括:
[0015]Al,获取与目标微博用户具有互动行为的微博用户集合;
[0016]BI,依据互动行为关系,构造用户关系拓扑图,并基于构造的用户关系拓扑图挖掘得到全联通子图,计算挖掘得到的各全联通子图的效用值并分别存储;
[0017]Cl,针对每一全联通子图,依据互动行为关系生成每一全联通子图对应的扩充微博用户集合;
[0018]D1,在扩充微博用户集合中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,加入存储的扩充微博用户集合对应的全联通子图,形成社交圈候选集合;
[0019]E1,计算社交圈候选集合的效用值,确定社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值以及全联通子图;
[0020]F1,判断加入社交圈候选集合中的微博用户是否为扩充微博用户集合中的最后一个微博用户,如果不是,遍历扩充微博用户集合,返回执行步骤D1,否则,形成社交圈集合。
[0021]优选地,在所述形成社交圈集合的步骤之前,该方法进一步包括:
[0022]All,在微博互动行为日志中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,构建二级互动集合;
[0023]A12,将获取的微博用户加入存储的全联通子图,形成二级社交圈候选集合;
[0024]A13,计算二级社交圈候选集合的效用值,如果二级社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值,用二级社交圈候选集合更新存储的全联通子图;否则,不作处理;
[0025]A14,判断获取的微博用户是否为二级互动集合中的最后一个微博用户,如果不是,遍历二级互动集合,返回执行步骤A12 ;否则,获取存储的全联通子图信息,执行所述形成社交圈集合的流程。
[0026]优选地,每一所述二级社交圈候选集合以及该二级社交圈候选集合的效用值对应一个存储单元。
[0027]优选地,所述互动行为包括:转发微博、评论微博、私信以及O其它微博用户。
[0028]优选地,计算所述效用值的效用函数为=Utility(T)为全取通子图T的效用值;Weight(Ea)为全联通子图T中内部边a的效用值;ETin为全联通子图T中所有节点包含的内部边;Weight(Ei3)为全联通子图T中所有节点与全联通子图T之外的、且在微博用户集合S中的任意节点形成的边β的效用值;ETout为全联通子图T中所有节点与全联通子图T之外的、且在微博用户集合S中的任意节点形成的所有边。
[0029]优选地,所述确定社交圈候选集合的效用值大于或等于对应存储的效用值,其中,Utility(Z)为将微博用户W融合至全联通子图T中形成的社交圈候选集合Z的效用值;Weight (Eai )为社交圈候选集合Z中内部边a'的效用值;EZin为社交圈候选集合Z中所有节点包含的内部边;Weight(Ei3 ,)为社交圈候选集合Z中所有节点与社交圈候选集合Z之外的、且在微博用户集合S中的任意节点形成的边β '的效用值;EZout为社交圈候选集合Z中所有节点与社交圈候选集合Z之外的、且在微博用户集合S中的任意节点形成的所有边;Utility(T)为存储的效用值
[0030]本发明提供了一种微博中人物关联关系分析方法,针对微博博主进行互联网人际关系分析,从海量数据中抽取该博主在微博上的各类关联关系,从而为微博信息的传播提供分析依据。
【具体实施方式】
:
[0031]下面对发明的实施例进一步详述。
[0032]一种微博中人物关联关系分析方法,所述算法涉骤包括:
[0033](I)通过原始信息,获得博主的基础微博信息,如注册地、粉丝数、关注数、微博数;
[0034](2)找出该博主的关注人信息;
[0035](3)找出该博主的相互关注人信息;
[0036](4)找出博主的所有博文信息;
[0037](5)找出微博上与博主具有相同博文的博主信息;
[0038](6)找出O博主的信息以及博主@其他人的微博信息;
[0039](7)找出博主微博中的地点信息,并获得微博中的相同时间范围内的相同地点信息;
[0040](8)对步骤2和3中的信息进行人物关系权重运算,对步骤4、5和6进行互动频度权重计算,对步骤7进行线下关系判断;
[0041](9)获得博主的微博关联关系列表。
[0042]所述微博中人物关联关系分析方法还包括:
[0043]Al,获取与目标微博用户具有互动行为的微博用户集合;
[0044]BI,依据互动行为关系,构造用户关系拓扑图,并基于构造的用户关系拓扑图挖掘得到全联通子图,计算挖掘得到的各全联通子图的效用值并分别存储;
[0045]Cl,针对每一全联通子图,依据互动行为关系生成每一全联通子图对应的扩充微博用户集合;
[0046]D1,在扩充微博用户集合中,获取与微博用户集合中的任一微博用户具有互动行为、且不属于微博用户集合的微博用户,加入存储的扩充微博用户集合对应的全联通子图,形成社交圈候选集合;
[0047]E1,计算社交圈候选集合的效用值,确定社交圈候选集合的效用值大于或等于对应存储的效用值,更新对应存储的效用值以及全联通子图;
[0048]F1,判断加入社交圈候选集合中的微博用户是否为扩充微博用户集合中的最后一个微博用户,如果不是,遍历扩充微博用户集合,返回执行步骤D1,否则,形成社交圈
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1