1.一种基于好友圈子的动态微博转发行为预测系统,包括用户行为数据源获取模块,用于获取社交网络中的用户关系和用户行为数据,将发文用户的粉丝作为备选用户,其特征在于,还包括属性提取模块、模型构建模块及预测分析模块,其中,所述属性提取模块分别从用户间兴趣差异、备选用户的活跃度以及发文用户的影响力三方面提取相关属性向量作为预测模型的输入;微博转发行为预测模型构建模块,用于对备选用户构建微博转发行为预测模型,转发行为主要受备选用户与其好友的兴趣差异τ、备选用户在文章发布时段的活跃度s和其好友的网络影响力r参数决定,并对以上模型参数进行拟合;预测分析模块用于将拟合后获得的参数和任一时刻t的用户发文情况进行备选用户是否会转发该条微博的预测。
2.根据权利要求1所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述属性提取模块针对用户间兴趣差异,提取用户兴趣向量包括:利用用户的关注行为属性,获取每个用户的关注列表,定义用户v的兴趣向量为其中,ev,u表示用户v关注列表中的用户,u=1,2......|Ev|,|Ev|表示用户v关注列表中的用户总数。
3.根据权利要求1或2所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述属性提取模块针对备选用户的活跃度,提取用户状态向量包括:利用用户的交互行为属性和时间属性,获取每个用户在一段时间内的用户发布微博活跃度及转发微博活跃度,定义用户v的活跃度状态向量为其中,
表示用户v在时间片t上的发布微博活跃度,
表示用户v在时间片t上的转发微博活跃度,
和
分别代表用户v在时间片t上的发布微博数、转发微博数以及用户v平均每天发布微博数。
4.根据权利要求3所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述属性提取模块针对发文用户的影响力,提取用户特征向量包括:利用网络拓扑结构属性,获取每个用户节点的出度、入度和局部聚集系数,定义用户v的影响力特征向量为其中,dv,1表示用户v的粉丝数,dv,2表示用户v的好友数,
表示用户v的局部聚集系数,Ngv是节点v的邻居节点集合,edgij是它的相邻结点之间的连接。
5.根据权利要求1或2或4所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述微博转发行为预测模型从用户间兴趣差异、备选用户活跃度以及发文用户影响力三方面,对于用户间兴趣差异方面,从用户行为和用户关系信息中提取用户的兴趣向量,利用LDA模型训练所有用户,获取用户的兴趣主题分布;对于备选用户活跃度方面,从用户行为和时间信息中提取各个时间片上的用户的状态向量,针对用户状态向量中的元素是连续值,使用高斯分布改进LDA,再利用改进的LDA模型训练所有用户,获取用户在各个时间片上的活跃状态分布;对于发文用户影响力方面,从网络结构信息中提取用户的特征向量,同上述用户状态向量一样,使用高斯分布改进LDA,再利用改进的LDA模型训练所有用户,获取用户的网络角色分布;最后根据用户间兴趣是否一致、备选用户在各个时间片上所处的活跃状态、发文用户的网络角色以及用户的历史转发数据训练整个预测模型,得到用户转发行为的多项分布。
6.根据权利要求5所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述微博转发行为预测模型获取用户的兴趣主题分布还包括:在用户关系网络的基础上再利用用户之间的交互行为,对用户的兴趣向量I(v)进行加权得到加权用户兴趣向量为其中,wv,n表示用户v发生第n次交互行为的交互对象,n=1,2......Nv,Nv为用户v交互总次数,再利用LDA模型训练所有用户,便可得到用户的兴趣主题分布。
7.根据权利要求3所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,所述获取用户在各个时间片上的活跃状态分布还包括:针对用户发布活跃度xv,t,1和转发活跃度xv,t,2是连续变量,使用高斯分布改进LDA模型,使得发布活跃度和转发活跃度的取值分别服从不同的高斯分布:其中,xv,t,m表示用户v在时间片t上的第m个属性值,μs,m和σs,m分别是用户活跃状态为s时第m个属性的均值和标准差。
8.根据权利要求7所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,通过时间切片方法,将每天从夜间0点开始切割成4个时段,即t=1,2,3,4,将用户的活跃状态分为三个等级,即非常活跃、一般活跃和不活跃,利用改进的LDA模型训练所有用户,便可得到用户在各个时间片上的活跃状态分布。
9.根据权利要求7所述的基于好友圈子的动态微博转发行为预测系统,其特征在于,基于网络拓扑结构将用户节点分为三种角色类型,即意见领袖、信息传播者和普通用户,同样,使用高斯分布改进LDA模型后,利用此模型训练所有用户,便可得到用户的网络角色分布。
10.一种基于权利要求1所述系统的好友圈子的动态微博转发行为预测方法,
其特征在于,包括以下步骤:
获取社交网络中的用户关系和用户行为数据,将发文用户的粉丝作为备选用户;分别从用户间兴趣差异、备选用户的活跃度以及发文用户的影响力三方面获取三个用户向量作为预测模型的输入;
构建微博转发行为预测模型,并对模型参数进行拟合;
将拟合后获得的参数和任一时刻t的用户发文情况输入到预测模型进行备选用户是否会转发该条微博的预测。