用户在线活动爆发时间的可预测度计算方法及系统与流程

文档序号:11929890阅读:来源:国知局

技术特征:

1.一种用户在线活动爆发时间的可预测度计算方法,其特征在于,包括以下步骤:

从用户的历史在线活动时间记录中提取爆发簇结构;

利用爆发簇结构获取用户爆发时间间隔序列;

对用户的爆发时间间隔序列进行离散化,得到爆发时间间隔符号序列;

计算用户爆发时间间隔符号序列的熵率;

根据用户爆发时间间隔符号序列的熵率计算用户在线活动爆发时间可预测度。

2.如权利要求1所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述从用户的历史在线活动时间记录中提取爆发簇结构之前,包括,

获取所述用户在指定平台的所有活动时间记录。

3.如权利要求1所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述从用户的历史在线活动时间记录中提取爆发簇结构步骤,包括,

设置相关活动的时间间隔门限,将用户的所有活动时间记录划分成爆发簇结构。

4.如权利要求3所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述设置相关活动的时间间隔门限,将用户的所有活动时间记录划分成爆发簇结构步骤,包括,

设置一个相关活动时间间隔门限,判断两个活动的时间间隔是否小于门限,

若是,则判定这两个活动是相关的,并将两个活动作为同一爆发簇;

若否,则判定这两个活动是不相关的。

5.如权利要求3所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述设置相关活动的时间间隔门限,将用户的所有活动时间记录划分成爆发簇结构步骤,还包括,

将用户的第一条活动时间记录设置为第一个爆发簇内的第一个活动,从用户的第二条活动时间记录开始,逐个进行如下判断,若其与前一条活动的时间间隔小于设置的相关活动时间间隔门限,则将其划入到前一条活动记录所在簇中,若其与前一条活动的时间间隔大于设置的相关活动时间间隔门限,则将其作为一个新的爆发活动簇的第一个活动,并且将其标记为该爆发活动簇的开始时间。

6.如权利要求1所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述对用户的爆发时间间隔序列进行离散化,得到爆发时间间隔符号序列,包括,

采用等频率离散化方法进行离散化。

7.如权利要求6所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述采用等频率离散化方法进行离散化步骤,包括:

在得到所述用户所有的爆发时间间隔序列后,先划分出离散区间,将用户的各个爆发时间间隔放置于对应的离散区间当中,放置的规则是使爆发时间间隔大于等于放入区间的左端点值,同时小于放入区间的右端点值,放置一个爆发时间间隔后,其对应离散区间的序号即为该爆发时间间隔对应的离散化结果。

8.如权利要求7所述的用户在线活动爆发时间的可预测度计算方法,其特征在于,所述在得到所述用户所有的爆发时间间隔序列后,先划分出离散区间步骤,包括,

在爆发时间间隔的最大值和最小值之间划分k个离散区间,区间的划分使得所有爆发时间间隔落入各个区间内的频数相等,依据上述方法可以得到由小到大排列的第1,2,…,k共k个离散区间。

9.一种用户在线活动爆发时间的可预测度计算系统,其特征在于,包括:

提取单元,用于从用户的历史在线活动时间记录中提取爆发簇结构。

获取单元,用于利用爆发簇结构获取用户爆发时间间隔序列。

离散单元,用于对用户的爆发时间间隔序列进行离散化,得到爆发时间间隔符号序列。

计算单元,用于计算用户爆发时间间隔符号序列的熵率,根据用户爆发时间间隔符号序列的熵率计算用户在线活动爆发时间可预测度。

10.如权利要求9所述的基于互联网用户数据的在线活动爆发时间可预测度计算系统,其特征在于,所述提取单元包括,

划分模块:设置相关活动的时间间隔门限,将用户的所有活动时间记录划分成爆发簇结构。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1