一种数据处理方法及装置与流程

文档序号:11276384阅读:198来源:国知局
一种数据处理方法及装置与流程

本发明涉及计算机应用技术领域,尤其涉及一种数据处理方法及装置。



背景技术:

近年来,随着计算机网络技术的迅猛发展,互联网已经被广泛地使用。用户可以通过互联网方便、快捷地完成例如获取信息、购物、缴费、预定票务等各种日常所需,这使得用户对互联网的依赖日趋强烈。而对于网站来说,如何在第一时间了解各个用户的生命周期,以获取用户在整个生命周期对客户端的关注度,将为网站决策者在制定产品销售和宣传策略方面提供准确、及时的支持。生命周期是指用户通过互联网从与客户端建立关系开始到与客户端彻底脱离关系的整个发展过程。基于生命周期,用户可以分为4类:新用户、留存用户、回流用户以及流失用户,其中新用户为在某个时间段(一般为第一整天)新登录客户端的用户;留存用户为在某段时间内开始访问客户端,经过一段时间后仍然继续访问该客户端的用户;回流用户为暂停访问客户端,经过一段时间后重新访问该客户端的用户;流失用户为在某段时间内开始访问客户端,经过一段时间后不再访问该客户端的用户。传统的对于生命周期的确定方法为:将连续两个月访问客户端的用户确定为留存用户,将连续三个月不访问该客户端的用户确定为流失用户,将前两个月不访问但最近一个月访问该客户端的用户确定为回流用户。上述对于生命周期的确定方法未结合产品的实际运营情况,无法准确预测不同用户的生命周期。



技术实现要素:

本发明实施例所要解决的技术问题在于,提供一种数据处理方法及装置,可准确预测用户的生命周期。

为了解决上述技术问题,本发明实施例提供了一种数据处理方法,包括:

获取各个用户在预设时间段内对于预设客户端的用户行为数据,所述用户行为数据包括用户对所述预设客户端的访问信息;

对所述用户行为数据进行数据切片,得到至少两组数据单元,各组所述数据单元的数据长度相同;

在所述至少两组数据单元中确定目标数据单元;

根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数;

根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期。

相应地,本发明实施例还提供了一种数据处理装置,包括:

数据获取单元,用于获取各个用户在预设时间段内对于预设客户端的用户行为数据,所述用户行为数据包括用户对所述预设客户端的访问信息;

数据切片单元,用于对所述用户行为数据进行数据切片,得到至少两组数据单元,各组所述数据单元的数据长度相同;

数据单元确定单元,用于在所述至少两组数据单元中确定目标数据单元;

参数获取单元,用于根据所述目标数据单元所属用户的用户类型,获取所述目标数据单元对应的客户端状态参数;

生命周期确定单元,用于根据用户的目标数据单元对应的客户端状态参数,确定所述用户的生命周期。

实施本发明实施例,获取各个用户在预设时间段内对于预设客户端的用户行为数据,对用户行为数据进行数据切片,得到至少两组数据单元,在至少两组数据单元中确定目标数据单元,根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数,根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期,相对传统的数据处理方法中直接将连续两个月访问客户端的用户确定为留存用户,将连续三个月不访问该客户端的用户确定为流失用户,将前两个月不访问但最近一个月访问该客户端的用户确定为回流用户,本发明实施例可准确预测用户的生命周期。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图;

图1是本发明实施例中提供的一种数据处理方法的流程示意图;

图2a是本发明实施例中提供的一种用户行为数据的界面示意图;

图2b是本发明实施例中提供的一种用户在不同时间周期的用户流失率的界面示意图;

图3是本发明实施例中提供的一种数据处理装置的结构示意图;

图4是本发明实施例中提供的一种终端的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

上述数据处理方法可以运行在平板电脑、手机或个人计算机(personalcomputer,pc)等终端中,也可以运行在浏览器或网站等客户端中。

请参见图1,图1是本发明实施例中的一种数据处理方法的流程示意图,如图所示本发明实施例中的数据处理方法可以包括:

s101,获取各个用户在预设时间段内对于预设客户端的用户行为数据,用户行为数据包括用户对预设客户端的访问信息。

终端可以获取各个用户在预设时间段内对于预设客户端的用户行为数据。其中,用户行为数据可以包括用户对预设客户端的访问信息,访问信息可以用于指示用户是否访问预设客户端。预设时间段可以为预先设定的时间间隔,例如连续27个时间周期,时间周期为终端记录用户行为数据的频率,例如终端每天记录一次用户对于预设客户端的用户行为数据,则时间周期为一天,预设时间段为连续27天。预设客户端可以为用户浏览的网站或者应用程序(application,app)等,例如腾讯游戏公会网站,或者微信、qq等app。

示例性的,终端可以按照预设时间周期统计不同用户对预设客户端的用户行为数据,例如该时间周期内用户访问了预设客户端,则用户行为数据中的访问信息可以为1;该时间周期内用户未访问预设客户端,则用户行为数据中的访问信息可以为0。用户行为数据中的第x个元素用于指示用户在第x个时间周期是否访问预设客户端,x为正整数。当预设时间段为27个时间周期时,终端获取到的每个用户对预设客户端的用户行为数据可以包括27个元素,例如用户行为数据为11010011…10,用户行为数据中的第一个元素为1,终端可以确定用户在第一个时间周期访问了预设客户端,用户行为数据中的第27个元素为0,终端可以确定用户在第27个时间周期未访问预设客户端。

s102,对用户行为数据进行数据切片,得到至少两组数据单元,各组数据单元的数据长度相同。

终端可以针对每个用户对于预设客户端的用户行为数据,对用户行为数据进行数据切片,得到至少两组数据单元,各组数据单元的数据长度相同。例如,如果用户行为数据的数据长度为l,预设的数据单元的数据长度为a,终端可以对该用户行为数据进行数据切片得到l-a+1组数据单元。

在可选实施例中,终端可以获取用户行为数据的数据长度l,以及预设的数据单元的数据长度a,将用户行为数据中的第一个元素确定为数据单元的起始位置,从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元,对起始位置进行更新,其中更新后的起始位置与当前起始位置之间间隔n个元素,执行从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元。其中,l、a均为正整数,n为自然数,l>a。例如,当n=0时,终端将用户行为数据中的第一个元素确定为数据单元的起始位置,从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元,将起始位置更新为当前起始位置的下一个元素,执行从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元,直至得到l-a+1组数据单元。本发明实施例对用户行为数据进行数据切分,根据数据切分得到的数据单元确定用户的生命周期,可捕获更全面的用户的操作习惯,使得确定的用于标识用户的生命周期的曲线放大,用户在生命周期的不同阶段的变化率更明显。

以图2a所示的用户行为数据的界面示意图为例,终端获取到的用户行为数据为1101001,用户行为数据的数据长度为7,预设的数据单元的数据长度为4,则终端可以将用户行为数据中的第一个元素确定为数据单元的起始位置,从起始位置开始对用户行为数据进行数据切分,得到数据单元为1101;终端还可以将起始位置更新为用户行为数据中的第二个元素,从更新后的起始位置开始对用户行为数据进行切分,得到数据单元1010;终端还可以将起始位置更新为用户行为数据中的第三个元素,从更新后的起始位置开始对用户行为数据进行切分,得到数据单元0100;终端还可以将起始位置更新为用户行为数据中的第四个元素,从更新后的起始位置开始对用户行为数据进行切分,得到数据单元1001。

需要说明的是,终端对用户行为数据进行数据切分的方式包含但不局限于上述方式,例如原起始位置和更新后的起始位置之间可以间隔1个元素,示例性的,终端获取到的用户行为数据为1101001,终端可以将用户行为数据中的第一个元素确定为数据单元的起始位置,从起始位置开始对用户行为数据进行数据切分,得到数据单元为1101;终端还可以将起始位置更新为用户行为数据中的第三个元素,从更新后的起始位置开始对用户行为数据进行切分,得到数据单元0100。又如,终端可以将用户行为数据中的最后一个元素确定为数据单元的起始位置,从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元;对起始位置进行更新,其中更新后的起始位置与当前起始位置之间间隔n个元素;执行从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元。

在可选实施例中,如果用户在预设时间段内第一次访问预设客户端,则终端可以将该用户识别为新用户。例如用户在第三时间周期第一次访问预设客户端,则该新用户的用户行为数据中第一个及第二个元素均为空,而回流用户的用户行为数据中第一个及第二个元素有可能均为0,为了避免新用户和回流用户的干扰,终端可以区分新用户和老用户,删除新用户的用户行为数据。可选的,终端可以分别对新用户的用户行为数据和老用户的用户行为数据进行数据切分,其中终端可以获取新用户的用户行为数据,新用户的用户行为数据的数据长度小于老用户的用户行为数据的数据长度,例如,新用户在第三时间周期第一次访问预设客户端,新用户在7个时间周期内对于预设客户端的用户行为数据为11101,终端对该用户行为数据进行数据切分得到的数据单元可以为1110以及1101。

s103,在至少两组数据单元中确定目标数据单元。

终端获取到对于不同用户的至少两组数据单元之后,可以在对于所有用户的至少两组数据单元中确定目标数据单元,其中目标数据单元的数量为至少一组。

在可选实施例中,如果终端需要获取的目标数据单元对应的客户端状态参数为用户流失率,且数据单元的数据长度为a,则确定得到的目标数据单元可以满足以下条件:目标数据单元中第a个元素的访问信息用于指示用户未访问预设客户端;或者目标数据单元中第a个元素的访问信息用于指示用户未访问预设客户端,且目标数据单元中第a-1个元素的访问信息用于指示用户访问预设客户端;或者目标数据单元中第a个及第a-1个元素的访问信息用于指示用户未访问预设客户端,且目标数据单元中第a-2个元素的访问信息用于指示用户访问预设客户端。

例如,客户端状态参数为用户流失率,且数据单元的数据长度为4,则终端确定的满足第一条件的目标数据单元中的第四个元素可以为0,即目标数据单元为0000、1000、0100、0010、1100、1010、0110以及1110。终端确定的满足第二条件的目标数据单元中的第三个元素可以为1,第四个元素可以为0,即目标数据单元为0010、1010、0110以及1110。终端确定的满足第三条件的目标数据单元中的第二个元素可以为1,第三个以及第四个元素可以为0,即目标数据单元为0100以及1100。

需要说明的是,终端确定目标数据单元的方式包含但不局限于上述方式,例如目标数据单元中第a个及第a-1个元素的访问信息用于指示用户未访问预设客户端,研发人员可结合不同场景进行相应的修改,具体不受本发明实施例的限制。

需要说明的是,对于不同客户端状态参数,目标数据单元满足的条件不相同。例如,客户端状态参数为用户留存率时,目标数据单元满足的条件可以为:目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端;或者目标数据单元中第a个及第a-1元素的访问信息用于指示用户访问预设客户端;或者目标数据单元中第a~a-2个元素的访问信息用于指示用户访问预设客户端。又如,客户端状态参数为用户回流率时,目标数据单元满足的条件可以为:目标数据单元中第a个元素的访问信息用于指示用户访问所述预设客户端,且目标数据单元中第a-1个元素的访问信息用于指示用户未访问预设客户端;或者目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端,且目标数据单元中第a-1个及第a-2个元素的访问信息用于指示用户未访问预设客户端;或者目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端,且目标数据单元中第a-1~a-3个元素的访问信息用于指示用户未访问预设客户端。研发人员可结合不同场景进行相应的修改,具体不受本发明实施例的限制。

在可选实施例中,在每组数据单元中,终端可以依次将每两个元素作为一个子数据,当两个元素中任意一个元素的访问信息用于指示用户访问预设客户端时,确定两个元素对应的子数据的访问信息用于指示用户访问预设客户端,当两个元素的访问信息均用于指示用户未访问预设客户端时,确定两个元素对应的子数据的访问信息用于指示用户未访问预设客户端,将依次确定得到的子数据作为更新后的数据单元,在更新后的数据单元中确定目标数据单元。本发明实施例通过多维度确定目标数据单元,根据目标数据单元确定用户的生命周期,可准确预测生命周期。

例如,数据单元为1101,终端可以将数据单元中的第一个元素和第二个元素作为一个子数据,将数据单元中的第三个元素和第四个元素作为一个子数据,则更新后的数据单元为11。也就是说,数据单元0000对应的更新后的数据单元为00,数据单元0100、1000以及1100对应的更新后的数据单元均为10。

进一步可选的,如果终端需要获取的目标数据单元对应的客户端状态参数为用户流失率,原数据单元的长度为2a,则更新后的数据单元的数据长度为a,则确定得到的目标数据单元可以满足以下条件:目标数据单元中第a个及第a-1个元素的访问信息用于指示用户未访问预设客户端;或者目标数据单元中第a个及第a-1个元素的访问信息用于指示用户未访问预设客户端,且目标数据单元中第a-2个或者第a-3个元素的访问信息用于指示用户访问预设客户端;或者目标数据单元中第a~a-3个元素的访问信息用于指示用户未访问预设客户端,且目标数据单元中第a-4个或者第a-5个元素的访问信息用于指示用户访问预设客户端。

例如,更新后的数据单元为00、01、10以及11,终端可以确定满足第一条件的目标数据单元为更新后的数据单元00或者10对应的原数据单元,即0000、0100、1000以及1100。终端可以确定满足第二条件的目标数据单元为更新后的数据单元10对应的原数据单元,即0100、1000以及1100。

需要说明的是,本发明实施例中对数据单元进行更新的方式包含但不局限于上述方式,例如,终端可以依次将每三个元素作为一个子数据,当三个元素中任意一个元素的访问信息用于指示用户访问预设客户端时,确定两个元素对应的子数据的访问信息用于指示用户访问预设客户端,当三个元素的访问信息均用于指示用户未访问预设客户端时,确定三个元素对应的子数据的访问信息用于指示用户未访问预设客户端,将依次确定得到的子数据作为更新后的数据单元。研发人员可结合不同场景进行相应的修改,具体不受本发明实施例的限制。

s104,根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数。

终端可以根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数。其中,用户类型可以包括流失用户、留存用户或者回流用户等。客户端状态参数可以包括用户流失率、用户留存率或者用户回流率等。例如,终端可以根据目标数据单元所属用户中流失用户量和非流失用户量获取目标数据单元对应的用户流失率,根据目标数据单元所属用户中留存用户量和非留存用户量获取目标数据单元对应的用户留存率,根据目标数据单元所属用户中回流用户量和非回流用户量获取目标数据单元对应的用户回流率。

终端可以根据目标数据单元所属用户的用户类型,获取流失用户量以及非流失用户量,其中用户类型可以包括流失用户或者非流失用户,将流失用户量与非流失用户量进行相加,得到目标数据单元所属用户的访问用户量,将流失用户量除以访问用户量,得到目标数据单元对应的用户流失率。

例如,目标数据单元为0100,终端可以确定包含该目标数据单元的所有用户,获取各个用户处于最近时间周期的用户类型,如果存在1300个包含该目标数据单元的用户的用户类型为流失用户,则流失用户量为1300;如果存在1700个包含该目标数据单元的用户的用户类型为非流失用户,则非流失用户量为1700,终端可以获取到该目标数据单元所属用户的访问用户量为:1300+1700=3000,目标数据单元对应的用户流失率为:1300/3000=43.3%。

又如,满足第一条件的目标数据单元为更新后的数据单元10对应的原数据单元,即0000、0100、1000以及1100,终端可以确定包含上述任一目标数据单元的所有用户,获取各个用户处于最近时间周期的用户类型,将流失用户量与非流失用户量进行相加,得到上述更新后的数据单元所属用户的访问用户量,将流失用户量除以访问用户量,得到上述更新后的数据单元对应的用户流失率。

在可选实施例中,当客户端状态参数为用户留存率时,终端可以根据目标数据单元所属用户的用户类型,获取留存用户量以及非留存用户量,用户类型包括留存用户或者非留存用户,将留存用户量与非留存用户量进行相加,得到目标数据单元所属用户的访问用户量,将留存用户量除以访问用户量,得到目标数据单元对应的用户留存率。

在可选实施例中,当客户端状态参数为用户回流率时,终端可以根据目标数据单元所属用户的用户类型,获取回流用户量以及非回流用户量,用户类型包括回流用户或者非回流用户,将回流用户量与非回流用户量进行相加,得到目标数据单元所属用户的访问用户量,将回流用户量除以访问用户量,得到目标数据单元对应的用户回流率。

s105,根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期。

终端可以根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期,终端可根据用户的生命周期,对预设客户端对应的产品定制防流失策略等运营。具体的,终端可以根据用户的目标数据单元对应的用户流失率,确定该用户在下一个时间周期的用户流失率。终端可以根据用户的目标数据单元对应的用户留存率,确定该用户在下一个时间周期的用户留存率。终端可以根据用户的目标数据单元对应的用户回流率,确定该用户在下一个时间周期的用户回流率。例如,满足第一条件的目标数据单元为0010、1010、0110以及1110,该用户的用户行为数据进行数据切分得到的数据单元为1101、1010、0100、1001,则终端可以确定该用户的目标数据单元为1010,获取目标数据单元1010对应的用户流失率。可选的,当该用户的满足第一条件的目标数据单元为多个时,终端可以获取该用户的满足第一条件的目标数据单元对应的用户流失率的算术平均值。

在可选实施例中,终端可以获取满足不同条件下的用户的目标数据单元对应的用户流失率,将满足不同条件下的用户的目标数据单元对应的用户流失率作为预设流失率确定算法的输入,得到用户的用户流失率。

示例性的,预设流失率确定算法可以为:

其中,s为用户的用户流失率,n用于指示目标数据单元满足的条件的数量,n≥1,δn为满足第n条件的目标数据单元对应的用户流失率的权重,为用户的满足第n条件的目标数据单元对应的用户流失率。可选的,当该用户的满足第n条件的目标数据单元为多个时,xn为该用户的满足第n条件的目标数据单元对应的用户流失率的算术平均值。

在可选实施例中,终端可以获取满足不同条件下的用户的目标数据单元对应的用户留存率,将满足不同条件下的用户的目标数据单元对应的用户留存率作为预设留存率确定算法的输入,得到用户的用户留存率。

在可选实施例中,终端可以获取满足不同条件下的用户的目标数据单元对应的用户回流率,将满足不同条件下的用户的目标数据单元对应的用户回流率作为预设回流率确定算法的输入,得到用户的用户回流率。

需要说明的是,预设留存率算法、预设回流率算法和预设流失率算法可以相同,例如,xn为用户的满足第n种条件的目标数据单元对应的用户留存率,则通过上述公式的输出为用户的用户留存率;xn为用户的满足第n种条件的目标数据单元对应的用户回流率,则通过上述公式的输出为用户的用户回流率。预设留存率算法、预设回流率算法和预设流失率算法也可以不相同,研发人员可结合不同场景进行相应的修改,具体不受本发明实施例的限制。

在可选实施例中,当同时考虑原数据单元和更新后的数据单元时,预设流失率确定算法可以为:

其中,s为用户的用户流失率,n用于指示目标数据单元满足的条件的数量,n≥1,δn为满足第n条件的目标数据单元对应的用户流失率的权重,为基于原数据单元,用户的满足第n条件的目标数据单元对应的用户流失率,为基于更新后的数据单元,用户的满足第n条件的目标数据单元对应的用户流失率。可选的,当基于原数据单元,该用户的满足第n条件的目标数据单元为多个时,为基于原数据单元,该用户的满足第n条件的目标数据单元对应的用户流失率的算术平均值。当基于更新后的数据单元,该用户的满足第n条件的目标数据单元为多个时,为基于更新后的数据单元,该用户的满足第n条件的目标数据单元对应的用户流失率的算术平均值。

在可选实施例中,终端根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期之后,可以预测用户在不同时间周期的客户端状态参数。以图2b所示的用户在不同时间周期的用户流失率的界面示意图为例,图2b预测了对于预设客户端,用户在不同时间周期的用户流失率,则预设客户端可以根据图2b所示的用户在不同时间周期的流失率的绝对值以及变化值(当前时间周期的用户流失率相对上一个时间周期的用户流失率的变量),确定用户进入流失状态的时间周期。

本发明实施例中,获取各个用户在预设时间段内对于预设客户端的用户行为数据,对用户行为数据进行数据切片,得到至少两组数据单元,在至少两组数据单元中确定目标数据单元,根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数,根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期,可准确预测用户的生命周期。

请参见图3,图3是本发明实施例中提供的一种数据处理装置的结构示意图,本发明实施例中的数据处理装置可以包括平板电脑、手机或个人计算机等终端,也可以包括浏览器等客户端,如图所示本实施例中的数据处理装置至少可以包括数据获取单元301、数据切片单元302、数据单元确定单元303、参数获取单元304以及生命周期确定单元305,其中:

数据获取单元301,用于获取各个用户在预设时间段内对于预设客户端的用户行为数据,用户行为数据包括用户对预设客户端的访问信息。

数据切片单元302,用于对用户行为数据进行数据切片,得到至少两组数据单元,各组数据单元的数据长度相同。

数据单元确定单元303,用于在至少两组数据单元中确定目标数据单元。

参数获取单元304,用于根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数。

生命周期确定单元305,用于根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期。

在可选实施例中,数据切片单元302,具体用于:

获取用户行为数据的数据长度l,以及预设的数据单元的数据长度a。

将用户行为数据中的第一个元素确定为数据单元的起始位置。

从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元。

对起始位置进行更新,其中更新后的起始位置与当前起始位置之间间隔n个元素。

执行从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元,直至得到l-a+1组数据单元。

在可选实施例中,数据单元的数据长度为a,则当客户端状态参数为用户流失率时,目标数据单元中第a个元素的访问信息用于指示用户未访问预设客户端。或者目标数据单元中第a个元素的访问信息用于指示用户未访问预设客户端,且目标数据单元中第a-1个元素的访问信息用于指示用户访问预设客户端。或者目标数据单元中第a个及第a-1个元素的访问信息用于指示用户未访问预设客户端,且目标数据单元中第a-2个元素的访问信息用于指示用户访问预设客户端。

当客户端状态参数为用户留存率时,目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端;或者目标数据单元中第a个及第a-1个元素的访问信息用于指示用户访问预设客户端;或者目标数据单元中第a~a-2个元素的访问信息用于指示用户访问预设客户端。

当客户端状态参数为用户回流率时,目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端,且目标数据单元中第a-1个元素的访问信息用于指示用户未访问预设客户端;或者目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端,且目标数据单元中第a-1个及第a-2个元素的访问信息用于指示用户未访问预设客户端;或者目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端,且目标数据单元中第a-1~a-3个元素的访问信息用于指示用户未访问预设客户端。

在可选实施例中,数据单元确定单元303,具体用于:

在每组数据单元中,依次将每两个元素作为一个子数据。

当两个元素中任意一个元素的访问信息用于指示用户访问预设客户端时,确定两个元素对应的子数据的访问信息用于指示用户访问预设客户端。

当两个元素的访问信息均用于指示用户未访问预设客户端时,确定两个元素对应的子数据的访问信息用于指示用户未访问预设客户端。

将依次确定得到的子数据作为更新后的数据单元。

在更新后的数据单元中确定目标数据单元。

在可选实施例中,当客户端状态参数为用户流失率时,参数获取单元304,具体用于:

根据目标数据单元所属用户的用户类型,获取流失用户量以及非流失用户量,用户类型包括流失用户或者非流失用户。

将流失用户量与非流失用户量进行相加,得到目标数据单元所属用户的访问用户量。

将流失用户量除以访问用户量,得到目标数据单元对应的用户流失率。

在可选实施例中,当客户端状态参数为用户留存率时,参数获取单元304,具体用于:

根据目标数据单元所属用户的用户类型,获取留存用户量以及非留存用户量,用户类型包括留存用户或者非留存用户。

将留存用户量与非留存用户量进行相加,得到目标数据单元所属用户的访问用户量。

将留存用户量除以访问用户量,得到目标数据单元对应的用户留存率。

在可选实施例中,当客户端状态参数为用户流失率时,参数获取单元304,具体用于:

根据目标数据单元所属用户的用户类型,获取回流用户量以及非回流用户量,用户类型包括回流用户或者非回流用户。

将回流用户量与非回流用户量进行相加,得到目标数据单元所属用户的访问用户量。

将回流用户量除以访问用户量,得到目标数据单元对应的用户回流率。

在可选实施例中,生命周期确定单元305,具体用于:

获取满足不同条件下的用户的目标数据单元对应的用户流失率。

将满足不同条件下的用户的目标数据单元对应的用户流失率作为预设流失率确定算法的输入,得到用户的用户流失率。

在可选实施例中,生命周期确定单元305,具体用于:

获取满足不同条件下的用户的目标数据单元对应的用户留存率,将满足不同条件下的用户的目标数据单元对应的用户留存率作为预设留存率确定算法的输入,得到用户的用户留存率。

在可选实施例中,生命周期确定单元305,具体用于:

获取满足不同条件下的用户的目标数据单元对应的用户回流率,将满足不同条件下的用户的目标数据单元对应的用户回流率作为预设回流率确定算法的输入,得到用户的用户回流率。

本发明实施例中,数据获取单元301获取各个用户在预设时间段内对于预设客户端的用户行为数据,数据切片单元302对用户行为数据进行数据切片,得到至少两组数据单元,数据单元确定单元303在至少两组数据单元中确定目标数据单元,参数获取单元304根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数,生命周期确定单元305根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期,可提高生命周期预测的准确度。

请参见图4,图4为本发明另一实施例提供的一种终端的结构示意图,本发明实施例提供的终端可以用于实施上述图1所示的本发明实施例实现的方法,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照图1所示的本发明实施例。

如图4所示,该终端包括:至少一个处理器401,例如cpu,至少一个输入装置403,至少一个输出装置404,存储器405,至少一个通信总线402。其中,通信总线402用于实现这些组件之间的连接通信。其中,输入装置403具体可以为网络接口,用于检测用户对预设客户端的访问操作。其中,输出装置404具体可以为显示屏,用于响应用户的访问操作,显示用户界面。其中,存储器405可能包含高速ram存储器,也可能还包括非不稳定的存储器,例如至少一个磁盘存储器,具体用于存储用户行为数据。存储器405可选的可以包含至少一个位于远离前述处理器401的存储装置。处理器401可以结合图3所示的数据处理装置。存储器405中存储一组程序代码,且处理器401调用存储器405中存储的程序代码,用于执行以下操作:

输入装置403获取各个用户在预设时间段内对于预设客户端的用户行为数据,用户行为数据包括用户对预设客户端的访问信息。

处理器401对用户行为数据进行数据切片,得到至少两组数据单元,各组数据单元的数据长度相同。

处理器401在至少两组数据单元中确定目标数据单元。

处理器401根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数。

处理器401根据用户的目标数据单元对应的客户端状态参数,确定用户的生命周期。

在可选实施例中,处理器401对用户行为数据进行数据切片,得到至少两组数据单元,具体可以为:

获取用户行为数据的数据长度l,以及预设的数据单元的数据长度a。

将用户行为数据中的第一个元素确定为数据单元的起始位置。

从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元。

对起始位置进行更新,其中更新后的起始位置与当前起始位置之间间隔n个元素。

执行从起始位置开始对用户行为数据进行数据切分,得到数据长度为a的数据单元,直至得到l-a+1组数据单元。

在可选实施例中,数据单元的数据长度为a,当客户端状态参数为用户流失率时,目标数据单元中第a个元素的访问信息用于指示用户未访问预设客户端。或者目标数据单元中第a个元素的访问信息用于指示用户未访问预设客户端,且目标数据单元中第a-1个元素的访问信息用于指示用户访问预设客户端。或者目标数据单元中第a个及第a-1个元素的访问信息用于指示用户未访问预设客户端,且目标数据单元中第a-2个元素的访问信息用于指示用户访问预设客户端。

当客户端状态参数为用户留存率时,目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端;或者目标数据单元中第a个及第a-1个元素的访问信息用于指示用户访问预设客户端;或者目标数据单元中第a~a-2个元素的访问信息用于指示用户访问预设客户端。

当客户端状态参数为用户回流率时,目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端,且目标数据单元中第a-1个元素的访问信息用于指示用户未访问预设客户端;或者目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端,且目标数据单元中第a-1个及第a-2个元素的访问信息用于指示用户未访问预设客户端;或者目标数据单元中第a个元素的访问信息用于指示用户访问预设客户端,且目标数据单元中第a-1~a-3个元素的访问信息用于指示用户未访问预设客户端。

在可选实施例中,处理器401在至少两组数据单元中确定目标数据单元,具体可以为:

在每组数据单元中,依次将每两个元素作为一个子数据。

当两个元素中任意一个元素的访问信息用于指示用户访问预设客户端时,确定两个元素对应的子数据的访问信息用于指示用户访问预设客户端。

当两个元素的访问信息均用于指示用户未访问预设客户端时,确定两个元素对应的子数据的访问信息用于指示用户未访问预设客户端。

将依次确定得到的子数据作为更新后的数据单元。

在更新后的数据单元中确定目标数据单元。

在可选实施例中,客户端状态参数为用户流失率,则处理器401根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数,具体可以为:

根据目标数据单元所属用户的用户类型,获取流失用户量以及非流失用户量,用户类型包括流失用户或者非流失用户。

将流失用户量与非流失用户量进行相加,得到目标数据单元所属用户的访问用户量。

将流失用户量除以访问用户量,得到目标数据单元对应的用户流失率。

在可选实施例中,客户端状态参数为用户留存率,则处理器401根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数,具体可以为:

根据目标数据单元所属用户的用户类型,获取留存用户量以及非留存用户量,用户类型包括留存用户或者非留存用户。

将留存用户量与非留存用户量进行相加,得到目标数据单元所属用户的访问用户量。

将留存用户量除以访问用户量,得到目标数据单元对应的用户留存率。

在可选实施例中,客户端状态参数为用户回流率,则处理器401根据目标数据单元所属用户的用户类型,获取目标数据单元对应的客户端状态参数,具体可以为:

根据目标数据单元所属用户的用户类型,获取回流用户量以及非回流用户量,用户类型包括回流用户或者非回流用户。

将回流用户量与非回流用户量进行相加,得到目标数据单元所属用户的访问用户量。

将回流用户量除以访问用户量,得到目标数据单元对应的用户回流率。

具体的,本发明实施例中介绍的终端可以用以实施本发明结合图1介绍的方法实施例中的部分或全部流程。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1