一种获取群组中个体用户活跃度的方法和装置与流程

文档序号:15025144发布日期:2018-07-27 17:24阅读:177来源:国知局

本发明涉及即时通信技术领域,特别涉及一种获取群组中个体用户活跃度的方法和装置。



背景技术:

随着关于Web2.0的相关研究与应用的迅速发展,Web2.0更注重用户的交互性,即为用户构建一个参与表达、创造、沟通和分享的群组环境,由用户上网到用户织网,用户既是发起群组内容的关注者、浏览者,也是发起群组内容的生产者和传播者。

对群组的研究主要集中在两个方面,一方面为结构研究,包括社会网络、信息交流模式等;另一方面为活跃内容研究,体现在个体驱动群组活跃生成内容的原因,这一部分直接影响用户对群组的态度、行为意图和实际行为。目前,对于即时通讯群组的研究,业界已经从个体角度出发做了不少研究,但对于群体性研究相对较少,无法从群组中获取到能调动群组活跃的成员。



技术实现要素:

本发明实施例提供了一种获取群组中个体用户活跃度的方法和装置,从而能够方便的从群组中获取到能调动群组活跃的成员。

为了达到上述目的,本发明实施例采用的技术方案如下:

一方面,本发明实施例提供一种获取群组中个体用户活跃度的方法,包括:

获取观测时间内的群组数据,根据所述群组数据获取所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布;其中,消息量间隔时间为群组中连续两条消息量记录的间隔时间,消息量长度为群组中发送消息量每一次记录的字符长度;

基于群组响应在受到个体用户扰动后的调整变化率与当前状态和平衡状态之间的差值成正比的规律,建立群组响应模型;

根据所述群组响应模型得到群组响应的多步递推计算模式;其中所述多步递推计算模式是指上一时间段的计算结果作为下一时间段的初始条件并逐时间段递推得到经过多个时间段后的群组响应值;

根据所述群组响应的多步递推计算模式和所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。

可选地,获得的群组消息量间隔时间的概率分布和群组消息量长度概率分布在双对数坐标下概率分布的主体部分都服从幂律分布。

可选地,在根据所述群组数据获取所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布之后,所述方法还包括:根据所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布的幂指数大小,确定出群组的活跃度。

可选地,所述群组响应模型为:其中,y为群组响应的当前状态,ye为群组响应的平衡状态,β为系数,dy/dt为群组响应的调整变化率,t为时间。

可选地,所述群组响应的多步递推计算模式为:

其中,Vt表示将观测时间T分割成n个均等时间段的间隔时间长度,yei为群组响应在第i个时间段的平衡值,y0群组响应的初始值,β为系数。

可选地,所述根据所述群组响应的多步递推计算模式和所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述观测时间内的活跃度包括:

将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布和/或消息量长度概率分布作为初始值输入所述多步递推计算模式中,得到每个时间段的群组响应值;

根据所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计获得每个时间段的活跃的个体用户及其活跃频次;

根据所述每个时间段的群组响应值、活跃的个体用户及其活跃频次,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。

可选地,所述将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布和/或消息量长度概率分布作为初始值输入所述多步递推计算模式中包括如下任一种情形:

将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布、消息量长度概率分布中的任一个作为初始值输入所述多步递推计算模式中;或者,

将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布与消息量长度概率分布之和作为初始值输入所述多步递推计算模式中;或者,

将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布与消息量长度概率分布的乘积作为初始值输入所述多步递推计算模式中。

可选地,所述根据所述每个时间段的群组响应值、活跃的个体用户及其活跃频次,统计得到所述群组中每个个体用户在所述观测时间内的活跃度包括:

根据所述每个时间段的群组响应值、活跃的个体用户及其活跃频次,得到每个个体用户在所述每个时间段的活跃数据,所述活跃数据包括:每个时间段的个体用户活跃频次及对应的群组响应值;

按照设定的方式分别对群组中每个个体用户的活跃数据做统计分析,得到所述群组中每个个体用户在所述观测时间内的活跃度。

可选地,所述方法还包括:获取另一观测时间内的群组数据,根据所述群组数据获取所述群组在所述另一观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布;根据所述群组响应的多步递推计算模式和所述群组在所述另一观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述另一观测时间内的活跃度。

可选地,所述方法还包括:将所述群组中每个个体用户在所述观测时间内的活跃度与在至少一个所述另一观测时间内的活跃度进行综合,得到所述群组中每个个体用户的综合活跃度。

另一方面,本发明实施例提供了一种获取群组中个体用户活跃度的装置,包括:

概率分布获取单元,用于获取观测时间内的群组数据,根据所述群组数据获取所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布;其中,消息量间隔时间为群组中连续两条消息量记录的间隔时间,消息量长度为群组中发送消息量每一次记录的字符长度;

模型建立单元,用于基于群组响应在受到个体用户扰动后的调整变化率与当前状态和平衡状态之间的差值成正比的规律,建立群组响应模型;

递推计算单元,用于根据所述群组响应模型得到群组响应的多步递推计算模式;其中所述多步递推计算模式是指上一时间段的计算结果作为下一时间段的初始条件并逐时间段递推得到经过多个时间段后的群组响应值;

个体活跃度统计单元,用于根据所述群组响应的多步递推计算模式和所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。

可选地,所述概率分布获取单元获得的群组消息量间隔时间的概率分布和群组消息量长度概率分布在双对数坐标下概率分布的主体部分都服从幂律分布。

可选地,所述装置还包括:

群组活跃度确定单元,适于根据所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布的幂指数大小,确定出群组的活跃度。

可选地,所述模型建立单元建立的群组响应模型为:

其中,y为群组响应的当前状态,ye为群组响应的平衡状态,β为系数,dy/dt为群组响应的调整变化率,t为时间。

可选地,所述递推计算单元得到的群组响应的多步递推计算模式为:

其中,Vt表示将观测时间T分割成n个均等时间段的间隔时间长度,yei为群组响应在第i个时间段的平衡值,y0群组响应的初始值,β为系数。

可选地,所述个体活跃度统计单元包括:

群组响应值计算模块,用于将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布和/或消息量长度概率分布作为初始值输入所述多步递推计算模式中,得到每个时间段的群组响应值;

个体用户统计模块,用于根据所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计获得每个时间段的活跃的个体用户及其活跃频次;

个体活跃度统计模块,用于根据所述每个时间段的群组响应值、活跃的个体用户及其活跃频次,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。

可选地,所述个体用户统计模块包括如下任一一个子模块:

第一统计子模块,用于将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布、消息量长度概率分布中的任一个作为初始值输入所述多步递推计算模式中;

第二统计子模块,用于将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布与消息量长度概率分布之和作为初始值输入所述多步递推计算模式中;

第三统计子模块,用于将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布与消息量长度概率分布的乘积作为初始值输入所述多步递推计算模式中。

可选地,所述个体活跃度统计模块包括:

活跃数据获取子模块,用于根据所述每个时间段的群组响应值、活跃的个体用户及其活跃频次,得到每个个体用户在所述每个时间段的活跃数据,所述活跃数据包括:每个时间段的个体用户活跃频次及对应的群组响应值;

个体活跃度统计子模块,用于按照设定的方式分别对群组中每个个体用户的活跃数据做统计分析,得到所述群组中每个个体用户在所述观测时间内的活跃度。

可选地,所述装置还包括:

第二概率分布获取单元,用于获取另一观测时间内的群组数据,根据所述群组数据获取所述群组在所述另一观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布;

第二个体活跃度统计单元,用于根据所述群组响应的多步递推计算模式和所述群组在所述另一观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述另一观测时间内的活跃度。

可选地,所述装置还包括:

综合单元,用于将所述群组中每个个体用户在所述观测时间内的活跃度与在至少一个所述另一观测时间内的活跃度进行综合,得到所述群组中每个个体用户的综合活跃度。

本发明实施例的有益效果是,通过获取观测时间内的群组数据,根据所述群组数据获取所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布;然后基于群组响应在受到个体用户扰动后的调整变化率与当前状态和平衡状态之间的差值成正比的规律,建立群组响应模型,接着再根据该群组响应模型得到群组响应的多步递推计算模式,最后根据所述群组响应的多步递推计算模式和所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。本发明的技术方案有助于挖掘个体行为与群体行为之间的关系,为研究个体用户活跃变化过程提供了解决方案,能够方便的从群组中获取到能调动群组活跃的成员,从而根据业务需求可以利用具有调动群组活跃度的成员发送扰动群组响应的群组信息来激励群组活跃。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本发明实施例提供的一种获取群组中个体用户活跃度的方法流程图;

图2示出了根据本发明实施例在一段时间内获得群组的群组信息示意图;

图3示出了根据本发明实施例的群组在双对数坐标下的群组消息量间隔时间概率分布示意;

图4示出了根据本发明实施例的群组在双对数坐标下的群组消息量长度概率分布示例;

图5示出了根据本发明实施例统计群组中每个个体用户在所述观测时间内的活跃度的方法示意图;

图6示出了根据本发明实施例的群组响应曲线四个阶段的示意图;

图7示出了根据本发明实施例的一种获取群组中个体用户活跃度装置结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

参见图1,本发明实施例提供了一种获取群组中个体用户活跃度的方法,包括如下步骤:

S11、获取观测时间内的群组信息,根据所述群组信息获取群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布。

其中,消息量间隔时间为群组中连续两条消息量记录的间隔时间,消息量长度为群组中发送消息量每一次记录的字符长度。

图2示出了获得的一段时间内群组的群组信息示意图。群组信息包括了群组的基本信息和观测表。其中,群组基本信息包括由群组名称、群内人数、建群目的、观测时段、是否自愿加入、群组类别、群简介以及群公告等,其中群组类别可以包括一级类和二级类;观测表中包括观测日期、发起对话时间、结束对话时间、参与对话人数、发起人、发起原因以及聊天话题等。

由于即时通信群组是一个聊天集体,所以个体用户发送消息量的异质性,如打字速度、上网频率、发消息的积极性等都可以得到很大程度的降低,从而获取的数据越有代表性,越能反映群里的个体用户特征。因此根据获得的群组信息,还需要获取观测时间T内的群组消息量间隔时间概率分布或/和群组消息量长度概率分布。

在本发明一个实施例中,通过对不同的群组获得的消息量间隔时间的概率分布或/和消息量长度概率分布进行研究,发现它们在双对数坐标下的概率分布呈现一致性,主体部分都服从幂律分布。

图3为群组在双对数坐标下的群组消息量间隔时间概率分布示例。尽管各个群记录数不同,群的个体用户组成人员不同,但是其双对数坐标下的概率分布却呈现一致性,都呈现明显的胖尾分布,即大多数发送消息量间隔时间较短,而少量间隔时间很长,去掉下垂的头部和长长的尾部,其概率分布的主体服从幂律分布,且幂指数集中在约1.85-2.11的范围内。这样的分布特征是符合群体性互动行为的潜在规律的,群体性消息传播常由一个话题引发,一个人发起话题而引起群内成员的共同参与,导致当话题发生时,扰动多且间隔时间短,而在话题结束后又会有很长时间的静默。

图4为群组在双对数坐标下的群组消息量长度概率分布示例。群作为一个即时通讯工具,交互具有即时性,其中每条消息的长度一般不会过长。字符数的累积分布具有一定的波动性,主体部分可用直线近似拟合,因此可以认为字符数的累积分布也服从幂律,幂指数在1.55-2.64之间。相对于间隔时间而言跨度范围较大,其原因可能在于每个群的组成主题不同,因此发送消息的内容有所区分。同事群如群B,其中消息往往比较简短,字符少的消息占总消息数的较大比重,因此斜率较大。而兴趣群A则因为有兴趣性的分享内容,往往消息中较长的相对更多,从而导致斜率上的差异。

在本发明的一个实施例中,根据所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布的幂指数大小,确定出群组的活跃度。

确定群组的活跃度的方式,可以仅根据群组在所述观测时间内的消息量间隔时间概率分布的幂指数大小或消息量长度概率分布的幂指数大小之一确定,也可以根据二者的幂指数大小之和或之乘积确定。

一般而言,幂指数越大群组的活跃度越高,因此可以根据群组的消息量间隔时间概率分布或/和消息量长度概率分布的幂指数大小,对不同群组的活跃度进行排序。根据不同群组的活跃度排序,优选出一定数量的群组进行研究。

S12、基于群组响应在受到个体用户扰动后的调整变化率与当前状态和平衡状态之间的差值成正比的规律,建立群组响应模型。

建立的群组响应模型,可以用一阶常微分方程描述:

其中,y为群组响应的当前状态,ye为群组响应的平衡状态,dy/dt为群组响应的调整变化率,t为时间,0≤t≤观测时间T;β为系数,原则上β是可以随时间变化的,但为了求解方便在此假定为常数。

以上公式为个体用户扰动群组响应的基本模型,可以用来描述群组调整和群组平衡随时间的变化过程,该群组响应模型具有普遍的适用性。

S13、根据所述群组响应模型得到群组响应的多步递推计算模式。

其中,所述多步递推计算模式是指上一时间段的计算结果作为下一时间段的初始条件并逐时间段递推得到经过多个时间段后的群组响应值。

求解上述一阶常微分方程(1)过程如下:

由于带入具体数值之后较复杂,为了便于求解可以将式(1)改写为如下的一般形式,得到:

显然式(2)为一阶非齐次线性方程,其通解为:

y=e-∫βdt[∫βyee-∫βdtdt+C1] (3)

其中,C1式中为积分常数。

将t=0时,y=y0代入上述式(3),得到所述式(2)的特解:

式中,y为群组响应,ye为群组响应的平衡值;y0是初始条件或初始值,t为时间;β为系数。原则上β是可以随时间变化的,假定为常数。

对式(4)右边的积分项直接求解由此得到

y=ye+(y0-ye)e-βt (5)

当t=0时y=y0

当t=∞时y=ye

y=(1-e-βt)ye+y0e-βt (6)

解析算式:

由于个体用户活跃对于群组调整阶段的结果,无论是否为平衡状态都将作为下一个时段的初始条件,对群组响应产生影响并由此使得前期的消息量长度和间隔时间条件对后期的群组响应产生影响,从而,可以将上一时段的计算结果作为下一时段的初始条件,并逐时段递推便可以得到经过多个时段后的响应状态值。

为此,将观测时间T等分成n个时间段,每个时间段记为Vt,式(6)在第一个时间段可以记为

y1=(1-e-βVt)ye1+y0e-βVt (7)

其中,ye1为在第一个时间段内所述群组的平衡值。

对应地,第2个时间段同样有

y2=(1-e-βVt)ye2+y1e-βVt (8)

合并(7)和(8)得到

y2=(1-e-βVt)[ye2+y1e-βVt]+y0e-2βVt (9)

由此递推到第n个时间段得到

式(10)即称为群组响应的多步递推计算模式,其中,yei为在第i个时间段内所述群组的平衡值,Vt表示将观测时间T分割成n个均等的时间段,y0群组响应的初始值。

S14、根据所述群组响应的多步递推计算模式和所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。

在本发明的一个实施例中,参见图5,步骤S14具体包括:

S51、将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布和/或消息量长度概率分布作为初始值输入所述多步递推计算模式中,得到每个时间段的群组响应值。

一种实施例,可以仅将群组在所述观测时间内初始时刻t=0的消息量间隔时间概率分布W0或消息量长度概率分布R0作为初始值输入所述多步递推计算模式中,即y0=W0,或者y0=R0。

一种实施例,可以将群组在所述观测时间内初始时刻t=0的消息量间隔时间概率分布W0与消息量长度概率分布R0之和作为初始值输入所述多步递推计算模式中,即y0=W0+R0。

再一种实施例,可以将所述群组在所述观测时间内初始时刻t=0的消息量间隔时间概率分布W0与消息量长度概率分布R0之积作为初始值输入所述多步递推计算模式中,即y0=W0*R0。

将上述初始值输入到所述多步递推计算模式中后,能够得到每个时间段的群组响应值yn,yn为离散点,对yn进行曲线拟合,可以得到个体用户活跃对群组扰动的响应曲线。

考虑到个体用户活跃对于群组时空变化的多样性和复杂性,个体用户活跃对群组扰动的响应曲线将会具有一系列不同形状,相应的反应时间和调整时间也各不相同;我们把反应时间和调整时间统称为响应时间,把个体用户活跃对群组扰动的响应过程称为个体用户对群组演变的活跃响应现象。

为此根据响应曲线的特性,获得群组响应y的反映阶段、调整阶段和平衡阶段;其中:反映阶段为个体用户活跃对于群组扰动所需要的反应时间段;调整阶段为个体用户活跃对于群组调整至平衡状态的时间段;平衡阶段为个体用户活跃对于群组维持平衡状态的时间段。

参见图6,图6为群组响应曲线四个阶段的示意图。群组在观测时间T内的响应曲线可以分为四个部分:①扰动前、②反映阶段、③调整阶段、以及④平衡阶段。

S52、根据所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计获得每个时间段的活跃的个体用户及其活跃频次。

例如,在群组消息量间隔时间概率分布图上,可以确定出在任一个时间段Vt内,每次发送的消息量间隔时间概率是多少,共发送的消息量数量是多少,分别是哪个个体用户发送了消息量(活跃),活跃的个体用户分别发送了几次消息量(频率),由此可以统计得到每个时间段Vt内活跃的个体用户及其活跃频率。

同样,在群组消息量长度概率分布图上,可以确定出在任一个时间段Vt内,每次发送的消息量长度概率是多少,共发送的消息量数量是多少,分别是哪个个体用户发送了消息量(活跃),活跃的个体用户分别发送了几次消息量(频率),由此也可以统计得到每个时间段Vt内活跃的个体用户及其活跃频率。

当然也可以结合着群组消息量间隔时间概率分布和群组消息量长度概率分布,共同统计得到每个时间段Vt内活跃的个体用户及其活跃频率。

S53、根据所述每个时间段的群组响应值、活跃的个体用户及其活跃频次,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。

该步骤包括两个子步骤:

第一步,根据所述每个时间段的群组响应值、活跃的个体用户及其活跃频次,得到每个个体用户在所述每个时间段的活跃数据,所述活跃数据包括:每个时间段的个体用户活跃频次及对应的群组响应值。

第二步,按照设定的方式分别对群组中每个个体用户的活跃数据做统计分析,得到所述群组中每个个体用户在所述观测时间内的活跃度。

统计方式示例:在每个时间段,将个体用户的活跃频率*对应时间段的群组响应值,得到每个时间段的个体用户活跃数据;然后将观测时间内的每个时间段的个体用户活跃数据进行累加或者累积得到每个个体用户的活跃度。

在本发明的另一实施例中,本发明实施例的方法还包括:

获取另一观测时间内的群组数据,根据所述群组数据获取所述群组在所述另一观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布;

根据所述群组响应的多步递推计算模式和所述群组在所述另一观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述另一观测时间内的活跃度。

获取群组中每个个体用户在所述另一观测时间内的活跃度的过程同于上述,在此不在赘述。该实施例能够得到不同观测时间内的群组中每个个体用户的活跃度,据此可以分析出每个个体用户活跃度高时集中的时间段。

可以选取一个或多个另一观测时间内的群组数据进行分析。

在本发明的再一实施例中,本发明实施例的方法还包括:

将所述群组中每个个体用户在所述观测时间内的活跃度与在至少一个所述另一观测时间内的活跃度进行综合,得到所述群组中每个个体用户的综合活跃度。

综合的方式例如可以是,将群组中每个个体用户在不同观测时间内的活跃度数据进行叠加或者求平均或者其他可行的方式进行综合,本发明不做限制。将所述群组中每个个体用户在所述观测时间内的活跃度与在至少一个所述另一观测时间内的活跃度进行综合后得到群组中每个个体用户的综合活跃度,该数据较一个观测时间内的活跃度数据更有普遍意义。

根据本发明实施例的方案统计得到群组中每个个体用户的活跃度之后,就可以根据用户活跃度对用户做区分,并进而可以根据业务需求利用具有调动群组活跃度的成员发送扰动群组响应的群组信息以激励群组活跃。

例如可以将群组中的用户分为领袖型、呼应者型、询问者型、分享者型;其中,领袖型为贡献频率和贡献数量极高的人,创建大量内容,吸引众多成员共鸣,对于群组的形成和发展起着非常重要的作用;呼应者型为经常对其他成员贡献的话题内容表示认同、追随或者反对,不提供深度内容,也不主动贡献内容;询问者型为将群组作为学习和咨询的场所,经常在此提出问题,寻求答案;分享者型为不主动创建话题内容,但积极参与群组的建设工作,包括热心回答信息询问者和学习者提出的问题,并交流相关的经验和心得。

基于上述方法实施例,本发明还提供了一种获取群组中个体用户活跃度的装置,如图7所示,本发明实施例的获取群组中个体用户活跃度的装置700包括:

概率分布获取单元710,用于获取观测时间内的群组数据,根据所述群组数据获取所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布;其中,消息量间隔时间为群组中连续两条消息量记录的间隔时间,消息量长度为群组中发送消息量每一次记录的字符长度;

模型建立单元720,用于基于群组响应在受到个体用户扰动后的调整变化率与当前状态和平衡状态之间的差值成正比的规律,建立群组响应模型;

递推计算单元730,用于根据所述群组响应模型得到群组响应的多步递推计算模式;其中所述多步递推计算模式是指上一时间段的计算结果作为下一时间段的初始条件并逐时间段递推得到经过多个时间段后的群组响应值;

个体活跃度统计单元740,用于根据所述群组响应的多步递推计算模式和所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。

其中,所述概率分布获取单元710获得的群组消息量间隔时间的概率分布和群组消息量长度概率分布在双对数坐标下概率分布的主体部分都服从幂律分布。

在本发明一个实施例中,装置700还包括:群组活跃度确定单元,适于根据所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布的幂指数大小,确定出群组的活跃度。

其中,所述模型建立单元720建立的群组响应模型为:

其中,y为群组响应的当前状态,ye为群组响应的平衡状态,β为系数,dy/dt为群组响应的调整变化率,t为时间。

其中,所述递推计算单元730得到的群组响应的多步递推计算模式为:

其中,Vt表示将观测时间T分割成n个均等时间段的间隔时间长度,yei为群组响应在第i个时间段的平衡值,y0群组响应的初始值,β为系数。

在本发明一个实施例中,所述个体活跃度统计单元740包括:

群组响应值计算模块,用于将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布和/或消息量长度概率分布作为初始值输入所述多步递推计算模式中,得到每个时间段的群组响应值;

个体用户统计模块,用于根据所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计获得每个时间段的活跃的个体用户及其活跃频次;

个体活跃度统计模块,用于根据所述每个时间段的群组响应值、活跃的个体用户及其活跃频次,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。

一个实施例,所述个体用户统计模块包括如下任一一个子模块:

第一统计子模块,用于将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布、消息量长度概率分布中的任一个作为初始值输入所述多步递推计算模式中;

第二统计子模块,用于将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布与消息量长度概率分布之和作为初始值输入所述多步递推计算模式中;

第三统计子模块,用于将所述群组在所述观测时间内初始时刻的消息量间隔时间概率分布与消息量长度概率分布的乘积作为初始值输入所述多步递推计算模式中。

另一个实施例,所述个体活跃度统计模块可以包括:

活跃数据获取子模块,用于根据所述每个时间段的群组响应值、活跃的个体用户及其活跃频次,得到每个个体用户在所述每个时间段的活跃数据,所述活跃数据包括:每个时间段的个体用户活跃频次及对应的群组响应值;

个体活跃度统计子模块,用于按照设定的方式分别对群组中每个个体用户的活跃数据做统计分析,得到所述群组中每个个体用户在所述观测时间内的活跃度。

在本发明另一个实施例中,装置700还包括:

第二概率分布获取单元,用于获取另一观测时间内的群组数据,根据所述群组数据获取所述群组在所述另一观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布;

第二个体活跃度统计单元,用于根据所述群组响应的多步递推计算模式和所述群组在所述另一观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述另一观测时间内的活跃度。

在本发明又一个实施例中,装置700还包括:

综合单元,用于将所述群组中每个个体用户在所述观测时间内的活跃度与在至少一个所述另一观测时间内的活跃度进行综合,得到所述群组中每个个体用户的综合活跃度。

本发明上述装置实施例中的各模块的具体工作方式,可以参见上述本发明方法实施例中的相关内容,在此不再赘述。

综上所述,本发明实施例提供的获取群组中个体用户活跃度的方法和装置,通过获取观测时间内的群组数据,根据所述群组数据获取所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布;然后基于群组响应在受到个体用户扰动后的调整变化率与当前状态和平衡状态之间的差值成正比的规律,建立群组响应模型,接着再根据该群组响应模型得到群组响应的多步递推计算模式,最后根据所述群组响应的多步递推计算模式和所述群组在所述观测时间内的消息量间隔时间概率分布或/和消息量长度概率分布,统计得到所述群组中每个个体用户在所述观测时间内的活跃度。本发明的技术方案有助于挖掘个体行为与群体行为之间的关系,为研究个体用户活跃变化过程提供了解决方案,能够方便的从群组中获取到能调动群组活跃的成员,从而根据业务需求可以利用具有调动群组活跃度的成员发送扰动群组响应的群组信息来激励群组活跃。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1