1.一种基于关键用户的微博信息传播预测方法,其特征是:
步骤1:数据采集;
步骤2:数据处理;
步骤3:利用线性模型预测;
步骤4:基于关键用户挖掘的模型调整,进行后续预测。
2.根据权利要求1所述的基于关键用户的微博信息传播预测方法,其特征是所述数据采集具体包括:
步骤1.1:在微博网络中实时获取给定消息id的转发用户;
步骤1.2:获取微博用户的配置信息,所述配置信息包括关注数、粉丝数。
3.根据权利要求2所述的基于关键用户的微博信息传播预测方法,其特征是所述数据处理具体包括:
步骤2.1:根据给定的时间间隔将步骤1.1与1.2所获得的数据划分为多个时间窗口;
步骤2.2:选取前k个时间窗口作为训练数据窗口,第k+1时间窗口为预测窗口。
4.根据权利要求3所述的基于关键用户的微博信息传播预测方法,其特征是所述利用线性模型预测具体包括:
步骤3.1:首先根据训练集的时间窗口内用户的转发量确定时间窗口内的关键用户;
步骤3.2:根据用户的转发数对线性函数进行拟合,迭代的确定线性函数的待估参数值,确定预测函数;
步骤3.3:将预测时间窗口的窗口值代入预测函数,生成预测值。
5.根据权利要求4所述的基于关键用户的微博信息传播预测方法,其特征是所述基于关键用户挖掘的模型调整具体包括:
步骤4.1:根据预测值和实际值的差异确定是否需要进行关键用户检测;
步骤4.2:当预测差异大于阈值时,根据该时间窗口的用户转发数确定关键用户;
步骤4.3:利用关键用户的粉丝数,以及之前其他关键用户的粉丝数来确定关键用户的数值,来对线性模型进行调整。
步骤4.4:利用新生成的线性模型对下一时间窗口进行预测。