用户行为数据清理方法及装置与流程

文档序号:11279386阅读:318来源:国知局
用户行为数据清理方法及装置与流程

本公开涉及互联网应用技术领域,特别涉及一种用户行为数据清理方法及装置。



背景技术:

为满足计算机应用的用户行为数据需求,往往需要进行用户行为数据的积累,甚至于进行各种处理,以便于能够准确描述所发生的各种用户行为。

现有用户行为数据的获得过程为,当用户第一次触发进行用户行为后,便对进行数值化的记录,并保存为用户行为数据。例如当用户第一次触发进行用户行为后,将用户行为数据记录为1。当再次触发用户行为之前,所保存的用户行为数据保持不变,即仍然为1。当再次触发用户行为之后,用户行为数据定量增加,即将用户行为数据记录为2。

由上述过程可知,当再次触发用户行为之前,用户行为数据始终保持不变,当再次触发用户行为之后,用户行为数据进行定量增加。因此用户行为数据随着用户行为的触发而增加,但是实际情况经常是用户一开始有频繁的触发行为(例如登录),但是过一阵子该行为的次数就逐日衰减甚至很快就骤减,这样该用户实际上已经成为“僵尸”用户,不应该再统计在活跃用户中,虽然其积累的行为次数不少,但是现有方案没有能够有效的解决这个问题。



技术实现要素:

为了解决相关技术中存在的用户行为的次数逐日衰减甚至很快就骤减的非活跃用户仍统计在活跃用户中的技术问题,本公开提供了一种用户行为数据清理方法及装置。

一种用户行为数据清理方法,所述方法包括:

监视用户行为数据随时间衰减的程度;

若随时间衰减而更新的所述用户行为数据低于预设标准数据,则清理更新的所述用户行为数据。

一种用户行为数据清理装置,所述装置包括:

衰减监视模块,用于监视用户行为数据随时间衰减的程度;

清理模块,用于若随时间衰减而更新的所述用户行为数据低于预设标准数据,则清理更新的所述用户行为数据。

本公开的实施例提供的技术方案可以包括以下有益效果:

监视用户行为数据随时间衰减的程度;若随时间衰减而更新的用户行为数据低于预设标准数据,则清理更新的用户行为数据。由上述方法可知,该方法通过监视用户行为数据随时间衰减的程度,并当随时间衰减而更新的用户行为数据低于预设标准数据时,清理更新的用户行为数据,从而对进行用户行为次数衰减的非活跃用户的用户行为数据进行清理,解决了用户行为的次数逐日衰减甚至很快就骤减的非活跃用户仍统计在活跃用户中的技术问题。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并于说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种用户行为数据清理方法的流程图;

图2是图1对应实施例的监视用户行为数据随时间衰减的程度在一个实施例的流程图;

图3是图2对应实施例的接收用户行为数据的更新指令,并根据用户行为数据的更新指令,确定相对上一次更新用户是否再次触发用户行为在一个实施例的流程图;

图4是图2对应实施例的根据预先配置的时间衰减系数进行用户行为数据和新增用户数据之间的运算获得更新的用户行为数据,并根据更新的所述用户行为数据监视用户行为数据随时间衰减的程度在一个实施例的流程图;

图5是图4对应实施例的累计处理衰减数据和新增用户数据获得更新的用户行为数据在一个实施例的流程图;

图6是前21天的用户行为数据变化的示意图;

图7是第170~190天的用户行为数据变化的示意图;

图8是根据一示例性实施例示出的一种用户行为数据清理装置的框图;

图9是图8对应实施例的衰减监视模块在一个实施例的框图;

图10是图9对应实施例的数据更新单元在一个实施例的框图;

图11是图10对应实施例的处理单元在一个实施例的框图。

具体实施方式

这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种用户行为数据清理方法的流程图。如图1所示,该用户行为数据清理方法可以包括以下步骤。

在步骤110中,监视用户行为数据随时间衰减的程度。

其中,用户行为是指用户在应用中触发的各种操作行为,在一个实施例的具体实现中,用户行为可以是对网站信息的浏览行为,对网站数据的下载行为等。用户行为数据为表现用户进行用户行为的数据,用户行为数据对应于表明用户信息的用户标识号,每个用户标志号对应着用户行为的内容名称以及该用户行为对应的用户行为数据,并作为一组用户数据存储于服务器中。

监视用户行为数据随时间衰减的程度,即判断用户行为数据随时间衰减而获得更新的用户行为数据是否有效的过程。当用户行为数据无效时,则清理该用户行为数据。

在步骤130中,若随时间衰减而更新的用户行为数据低于预设标准数据,则清理更新的用户行为数据。

其中,预设标准数据为根据用户行为数据的有效性设置的数值,该预设标准数据用于设置为清理用户行为数据的阈值。

当用户行为数据超过设置的有效性时间时,用户行为数据随时间衰减而更新的用户行为数据小于设定阈值,此时判断更新的用户行为数据失去有效性,从而清理更新的用户行为数据。通过清理更新的用户行为数据,对进行用户行为次数衰减的非活跃用户的用户行为数据进行清理,从而实现用户行为数据对应的用户均为活跃用户。

此实施例通过清理更新的用户行为数据,从而对进行用户行为次数衰减的非活跃用户的用户行为数据进行清理,解决了用户行为的次数逐日衰减甚至很快就骤减的非活跃用户仍统计在活跃用户中的技术问题。

图2是根据一示例性实施例示出的对步骤110的细节进行描述。如图2所示,该步骤110可以包括以下步骤。

在步骤111中,接收用户行为数据的更新指令,并根据用户行为数据的更新指令,确定相对上一次更新用户是否再次触发用户行为。

其中当对用户行为数据进行更新时,实现用户行为的服务器或者终端向自身发出用户行为数据的更新指令,从而开始对用户行为数据的更新行为。

可设置进行用户行为数据更新的时间周期,从而在经过时间周期后,开始进行用户行为数据的更新,从而接收到用户行为数据的更新指令。

在一个示例性实施例的具体实现中,用户进行用户行为后,会在服务器或者终端上产生用户行为的历史记录,并存储到服务器上,从而根据是否存在用户行为的历史记录,判断用户是否进行过用户行为。用户行为的历史记录中包含着进行用户行为的时间。

当接收到用户行为数据的更新指令后,通过服务器上存储用户行为的历史记录,判断用户在上一次实现用户行为数据的更新之后,是否再次触发用户行为。

在步骤113中,根据用户行为是否再次被触发获取新增用户行为数据。

其中,新增用户行为数据为用于进行用户行为数据更新的数据。用户行为再次被触发时对应用户行为被触发的新增用户行为数据,用户行为没再次被触发时对应用户行为未被触发的新增用户行为数据。

判断用户行为是否再次被触发,并根据用户行为是否再次被触发的结果,获取对应的新增用户行为数据。

在步骤115中,根据预先配置的时间衰减系数进行用户行为数据和新增用户行为数据之间的运算获得更新的用户行为数据,并根据更新的用户行为数据监视用户行为数据随时间衰减的程度。

其中,时间衰减系数为服务器根据用户行为数据的有效性预先配置的。根据用户行为数据的有效性时间,来确定时间衰减系数的大小,当用户数据的有效性越长,时间衰减系数越小。在一个示例性实施例的具体实现中,当用户行为数据的半衰期,即根据时间衰减系数更新用户行为数据减半的时间为14天时,即α14=0.5,计算可得时间衰减系数α预先配置为0.95。对于本发明,本时间衰减系数仅供参考,并不局限于此。

根据时间衰减系数,用户行为数据和新增用户行为数据之间的运算,获得更新的用户行为数据。新增用户行为数据包括用户行为被触发的新增用户行为数据和用户行为未被触发的新增用户行为数据,并根据获取的更新的用户行为数据,对用户行为数据随时间衰减的程度进行监视。

此实施例实现了监视用户行为数据随时间衰减的程度。

图3是根据一示例性实施例示出的对步骤111的细节进行描述。如图3所示,该步骤111可以包括以下步骤。

在步骤1111中,根据接收到的用户行为数据的更新指令触发判断在上一次更新之后是否用户再次触发用户行为。

其中,当接收到用户行为数据的更新指令后,触发进行判断用户在上一次更新之后,是否再次触发用户行为。根据服务器上存储的上一次更新用户行为数据的时间和用户行为的历史记录中包含的进行用户行为的时间,判断在上一次更新用户行为数据之后,用户是否再次触发用户行为。

在步骤1113中,如果用户再次触发用户行为,则获取用户行为被触发的新增用户行为数据。

其中,用户行为被触发的新增用户行为数据用于更新用户行为数据,用户行为被触发的新增用户行为数据可根据需求设置。在一个实施例的具体实现中,用户行为被触发的新增用户行为数据可设置为1,便于统计和更新用户行为数据。

在步骤1115中,如果用户未再次触发用户行为,则获取用户行为未被触发的新增用户行为数据。

其中,用户行为未被触发的新增用户行为数据用于更新用户行为数据,与用户行为被触发的新增用户数据不同。用户行为未被触发的新增用户行为数据可根据需求设置。在一个实施例的具体实现中,与用户行为被触发的新增数据设置为1相对应,用户行为未被触发的新增用户行为数据设置为0,便于更新用户行为数据。

此实施例实现了确定上一次更新用户是否再次触发用户行为,从而获取相对应的新增用户行为数据。

图4是根据一示例性实施例示出的对步骤115的细节进行描述。如图4所示,该步骤115可以包括以下步骤。

在步骤1151中,根据预先配置的时间衰减系数获得用户行为数据在时间上的衰减数据。

其中,根据预先配置的时间衰减系数获得用户行为数据在时间上的衰减数据的计算公式如下。

其中,α为预先配置的时间衰减系数,为用户行为数据,通过时间衰减系数与用户行为数据相乘,得到用户行为数据在时间上的衰减数据。

在步骤1153中,累计处理衰减数据和新增用户数据获得更新的用户行为数据。

将得到的处理衰减数据和新增用户数据进行运算,获得更新的用户行为数据。

在步骤1155中,根据更新的用户行为数据与预设标准数据,监视用户行为数据随时间衰减的程度。

其中,比较获得的更新的用户行为数据与预设标准数据的大小,来监视用户行为数据随时间衰减的程度。当更新的用户行为数据低于预设标准数据时,则判断用户行为数据失去时效性,从而清理更新的用户行为数据。

此实施例通过累计处理衰减数据和新增用户数据,实现了更新用户行为数据,并监视用户行为数据随时间衰减的程度。

图5是根据一示例性实施例示出的对步骤1153的细节进行描述,如图5所示,该步骤1153可以包括以下步骤。

在步骤11531中,对衰减数据和新增用户数据进行累计获得用户数据更新的临时变量。

其中,对衰减数据和新增用户数据进行累计获得用户数据更新的临时变量计算公式如下

获得的temp值即为用户数据更新的临时变量,为获得新增用户行为数据,该新增用户行为数据可以包括用户行为被触发的新增用户行为数据和用户行为未被触发的新增用户行为数据。为用户行为数据在时间上的衰减数据。

将新增用户行为数据和用户行为数据在时间上的衰减数据相加,得到用户数据更新的临时变量。

在步骤11533中,判断临时变量是否超出记录用户行为发生的指定初值。

其中,用户行为发生的指定初值为预先配置的。该用户行为发生的指定初值用于限制用户行为数据的值,防止用户行为数据的数值过大,导致处理用户行为数据的难度增大的问题。在一个实施例的具体实现中,指定初值可配置为1,便于对用户数据进行归一处理。

在步骤11535中,如果临时变量超出记录用户行为发生的指定初值,则将指定初值置为更新的用户行为数据。

其中,当临时变量超出指定初值时,则将指定初值配置为更新的用户行为数据,从而限制用户行为数据的数值。保证用户行为数据的数值始终不超过指定初值。

在步骤11537中,如果临时变量未超出记录用户行为发生的指定初值,则临时变量置为更新的用户行为数据。

其中,当临时变量未超出指定初值时,则该临时变量为有效的用户行为数据。将临时变量配置为更新的用户行为数据。

此实施例实现根据临时变量和指定初值,实现用户行为数据的更新。

以应用场景为在服务器上,用户标识号为123的用户对内容名称为abc的内容进行下载的用户行为威力,结合具体应用场景,描述用户行为数据清理方法。

图6是前21天的用户行为数据变化的示意图。如图6所示,起始时间点t0,用户123未下载abc,其对应的用户行为数据为0,该起始数据不会保存在服务器上。

时间点t1=t0+1,其中1为设置的用户行为更新周期,用户初次下载abc,其对应的新增用户行为数据为1,此时更新的用户行为数据为1,该数据保存至服务器。

时间点t2=t1+1,用户123未下载abc,此时根据预先配置的时间衰减系数α=0.95,得到对应的新增用户行为数据为0,此时更新的用户行为数据=0+1*0.95=0.95。

时间点t3=t2+1,用户123未下载abc,新增用户行为数据为0,此时更新的用户行为数据=0+0.95*0.95=0.90。

时间点t4=t3+1,用户123更新下载abc,新增用户行为数据为1,此时用户行为数据为1+0.90*0.95=1.85,此时指定初值配置为1,1.85大于1,因此更新的用户行为数据为1。

时间点t5=t4+1,用户123未下载abc,新增用户行为数据为0,此时更新的用户行为数据=0+1*0.95=0.95。

该用户行为数据的有效性时间配置为180天,设定阈值为α180=0.0001。之后的178天中,用户123均未下载abc,t183=t4+179,则此时更新的用户行为数据为1*α179=1.03e-04。

图7是第170~190天的用户行为数据变化的示意图。如图7所示,时间点t184=t4+180,用户123未下载abc,新增用户行为数据为0,更新的用户行为数据=0+1.03e-04*0.95=9.78e-05,该值小于设定阈值。因此对该更新的用户行为数据进行清理。

图8是根据一示例性实施例示出的一种用户行为数据清理装置的框图。该装置执行图1任一所示的用户行为数据清理方法的全部或者部分步骤。如图8所示,该装置包括但不限于:衰减监视模块210和清理模块230。

衰减监视模块210用于监视用户行为数据随时间衰减的程度。

清理模块230用于若随时间衰减而更新的用户行为数据低于预设标准数据,则清理更新的用户行为数据。

图9是图8对应实施例的衰减监视模块在一个实施例的框图。如图9所示,该衰减监视模块210包括但不限于:用户行为确定单元211,数据获取单元213和数据更新单元215。

用户行为确定单元211用于接收用户行为数据的更新指令,并根据用户行为数据的更新指令,确定相对上一次更新用户是否再次触发用户行为。

数据获取单元213用于根据用户行为是否再次被触发获取新增用户行为数据。

数据更新单元215用于根据预先配置的时间衰减系数进行用户行为数据和新增用户行为数据之间的运算获得更新的用户行为数据,并根据更新的用户行为数据监视用户行为数据随时间衰减的程度。

在一个示例性实施例中,图9对应的用户行为确定单元包括但不限于:

判断单元,用于根据接收到的用户行为数据的更新指令触发判断在上一次更新之后是否用户再次触发用户行为,如果为是,则获取用户行为被触发的新增用户行为数据,如果为否,则

获取用户行为未被触发的新增用户行为数据。

图10是图9对应实施例的数据更新单元在一个实施例的框图。如图10所示,该数据更新单元215包括但不限于:衰减数据获取单元2151,处理单元2153和监视单元2155。

衰减数据获取单元2151用于根据预先配置的时间衰减系数获得用户行为数据在时间上的衰减数据。

处理单元2153用于累计处理衰减数据和新增用户数据获得更新的用户行为数据。

监视单元2155用于根据更新的用户行为数据与预设标准数据,监视用户行为数据随时间衰减的程度。

图11是图10对应实施例的处理单元在一个实施例的框图。如图11所示,该处理单元2153包括但不限于:临时变量获取单元21531和初值判断单元21533。

临时变量获取单元21531用于对衰减数据和新增用户数据进行累计获得用户数据更新的临时变量。

初值判断单元21533用于判断临时变量是否超出记录用户行为发生的指定初值,如果为是,则将指定初值置为更新的用户行为数据,如果为否,则

将临时变量置为更新的用户行为数据。

上述装置中各个模块的功能和作用的实现过程详见上述用户行为数据清理方法中对应步骤的实现过程,在此不再赘述。

应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1