一种预测日活跃对象数量的方法及设备与流程

文档序号:16062997发布日期:2018-11-24 12:23阅读:163来源:国知局
本发明涉及计算机领域,尤其涉及一种预测日活跃对象数量的方法及设备。
背景技术
日活跃用户终端数(dailyactiveuser,缩写:dau),通常统计一日(统计日)之内,登录或使用了某个产品的用户终端数(去除重复登录的用户终端),常用于反映网站、互联网应用或网络游戏的运营情况。对于不同的产品可能对于活跃的定义不完全相同,例如,如果是有账号的客户端产品,通常以账号登录作为活跃指标,如qq,im,网游。如果是某些工具应用,可以以启动作为活跃,例如,美图秀秀等,该类应用至少需要拍摄一张照片或者使用一次修图功能才能算活跃。dau是一个很重要的衡量一款应用的核心用户终端数的指标,因此对于dau的预测具有重要意义,通过对dau的预测可以预测某一款应用未来用户终端的数量,为产品的功能提升或者功能的改进提供参考数据。传统方法中,将一段时间内的dau分解成当天新增用户终端数量和存量老用户终端数量,通过对当天新增用户终端数量和存量老用户终端数量的数据进行分析,分别得到新增用户终端留存率和存量老用户终端留存率的线性模型,通过线性模型对未来某一日的新增用户终端数量和存量老用户终端数量进行预测,进而预测该日的dau。新增用户终端是指每一天第一次使用该应用的用户终端,而存量老用户终端是指新增用户终端中的留存用户终端,开始使用该应用后,经过一段时间后,继续使用该应用的用户终端。留存率是指首日新增后,在该首日后第n天还保持活跃的用户终端的数量除以首日新增用户终端的数量,就得到第n天的用户终端留存率。由于新增用户终端由于每天都是独立的,相互不耦合,所以新增留存率的预测精度较高。但由于老用户终端不纯粹,在一个相对成熟的互联网产品中,存量老用户终端可能包括投放期,震荡期,稳定期等周期,在存量老用户终端中每个阶段的存量老用户终端的趋势都不相同,因此通过获取在一段时间内存量老用户终端的数量来建立线性模型,该线性模型对于存量老用的预测并不准确,对成熟的产品而言,又由于老用户终端在dau中占比较高,所以整体的dau预测精度很低。技术实现要素:本发明实施例提供了一种预测日活跃对象数量的方法及设备,用于提高日活跃对象数量预测的准确性。第一方面,本发明实施例提供了一种预测日活跃对象数量的方法,包括:通过对象回流模型预测第(m+x)天的第一对象回流总量,所述对象回流模型为通过统计第m天至第(m-n)天连续(n+1)天的日活跃对象中第一对象的回流率进行分析后建模得到的,所述第一对象为在第(m-n)天之前新增的对象,所述x为大于或者等于1的正整数,所述n为大于或者等于1的正整数,所述m为大于所述n的正整数;通过对象留存模型预测第(m+x)天的第二对象的留存总量,所述对象留存模型为根据所述(n+1)天内的日活跃对象数量中的第二对象的留存量进行数据分析后得到的模型,所述第二对象为在第(m-n)天之后新增的对象;根据所述第(m+x)天的日活跃对象数量中第(m+x)天的第一对象的回流总量与第(m+x)天的第二对象的留存总量确定第(m+x)天的日活跃对象数量。第二方面,本发明实施例提供了一种预测日活跃对象数量的设备,包括:第一确定模块,通过对象回流模型预测第(m+x)天的第一对象回流总量,所述对象回流模型为通过统计第m天至第(m-n)天连续(n+1)天的日活跃对象中第一对象的回流率进行分析后建模得到的,所述第一对象为在第(m-n)天之前新增的对象,所述x为大于或者等于1的正整数,所述n为大于或者等于1的正整数,所述m为大于所述n的正整数;第二确定模块,通过对象留存模型预测第(m+x)天的第二对象的留存总量,所述对象留存模型为根据所述(n+1)天内的日活跃对象数量中的第二对象的留存量进行数据分析后得到的模型,所述第二对象为在第(m-n)天之后新增的对象;第三确定模块,根据所述第一确定模块所述第(m+x)天的日活跃对象数量中第(m+x)天的第一对象的回流总量与所述第二确定模块确定的所述第(m+x)天的第二对象的留存总量确定第(m+x)天的日活跃对象数量。第三方面,本发明实施例提供了一种预测日活跃对象数量的设备,包括:存储器,用于存储计算机可执行程序代码;输入/输出接口,以及处理器,与所述存储器和所述输入/输出接口耦合;其中所述程序代码包括指令,当所述处理器执行所述指令时,所述指令使所述确定装置执行上述第一方面所述的方法。第四方面,本发明实施例提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。第五方面,本发明实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。从以上技术方案可以看出,本发明实施例具有以下优点:本实施例中,可以通过对象回流模型预测第(m+x)天的第一对象回流总量,所述对象回流模型为通过统计第m天至第(m-n)天连续(n+1)天的日活跃对象中第一对象的回流率进行分析后建模得到的,所述第一对象为在第(m-n)天之前新增的对象;并且可以通过对象留存模型预测第(m+x)天的第二对象的留存总量,所述对象留存模型为根据所述(n+1)天内的日活跃对象数量中的第二对象的留存量进行数据分析后得到的模型;然后,根据所述第(m+x)天的日活跃对象数量中第(m+x)天的第一对象的回流总量与第(m+x)天的第二对象的留存总量确定第(m+x)天的日活跃对象数量。本发明实施例中对传统方式中的dau中的新增用户终端与老用户终端进行了重新定义,在第(m-n)天之前新增的对象为第一对象,在第(m-n)天之后新增的对象为第二对象。本实施例中,使用该对象回流模型和对象留存模型对未来dau进行预测,本模型不但具有很高的精度,提高了对日活跃对象数量预测的准确性而且有良好的可解析性,可以量化互联网产品关注的新增的对象的数量、第二对象的留存率、第一对象的回流率对日活跃对象数量的直接影响。附图说明为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,还可以根据这些附图获得其他的附图。图1为本发明实施例中一种预测日活跃对象数量的方法的步骤示意图;图2为本发明实施例中一种预测日活跃对象数量的方法的一个实施例的步骤示意图;图3为本发明实施例中第二对象的留存率的拟合曲线的示意图;图4为本发明实施例中第一对象的回流率的拟合曲线的示意图;图5为本发明实施例中对象回流模型和对象留存模型中表示天数的示意图;图6为本发明实施例中一种预测日活跃对象数量的方法的另一个实施例的步骤示意图;图7为本发明实施例中一种预测日活跃对象数量的设备的一个实施例的结构示意图;图8为本发明实施例中一种预测日活跃对象数量的设备的另一个实施例的结构示意图;图9为本发明实施例中一种预测日活跃对象数量的设备的另一个实施例的结构示意图;图10为本发明实施例中一种预测日活跃对象数量的设备的另一个实施例的结构示意图。具体实施方式本发明实施例提供了一种预测日活跃对象数量的方法及设备,用于提高日活跃对象数量预测的准确性。为了使本
技术领域
的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本发明保护的范围。本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。本发明实施例中提供了一种预测日活跃对象数量的方法,本发明实施例中的日活跃对象数量可以理解为日活跃用户终端数量(dailyactiveuser,缩写:dau),本发明实施例中的方法可针对相对成熟的互联网产品(如,网站,互联网应用或网络游戏等)在无人工干预的状态下对dau进行预测。为了方便理解,首先对本发明实施例中涉及的词语进行解释说明:日活跃对象数量:可以理解为日活跃用户终端数量(dailyactiveuser,缩写:dau),通常统计一日(统计日)之内,用户终端登录或使用了某个应用的用户终端数(去除重复登录的用户终端),常用于反映网站、互联网应用或网络游戏的运营情况。对象:使用或登录某个应用的用户终端。第一对象:为在第(m-n)天之前新增的对象,在应用场景中,本实施例中第一对象也可以理解为老用户终端。请结合下表1中的数据为例进行说明,若m为第110天,n为4,则在106天之前新增的对象均为老用户终端。第二对象:第(m-n)天之前新增的对象,请结合下表1进行理解:表1以上表1中的数据为例,例如,今天为第101天,上表1为今天之前近10天的dau的数据,该互联网产品以一款游戏为例进行说明,从上表1中的数据可以看出,该款游戏已经上线110天,在上表1中,黑体字的数据表示当天新增的用户终端的数量。例如,在第106天当天新增的用户终端数量为5000,当天新增的用户终端可以理解为在第106天当天新注册该款游戏的用户终端数量;在第107天当天新增的用户终端数量为5300,而第106天当天新增的用户终端数量到次日(也就是第107天变为2500);在第108天当天新增的用户终端数量为5000,而第106天当天新增的用户终端数量到第108天的用户终端数量变为1800,第107天当天新增的用户终端数量到次日(第108天)活跃的用户终端留存量为2700,上述表格中的当天新增的用户终端数量不一一赘述。本发明实施例中的新增的用户终端是指在第m天至第(m-n)天连续(n+1)天中的新增用户终端,还是以上表1为例,当m为101时,n为4时,则新增用户终端为第101天至第106天连续5天中新增的用户终端,也就是上述表1中双框线标识的区域的数据均为新增的用户终端的数量,在第(m-n)天之前新增的用户终端均为老用户终端,也就是上表中加粗用户终端黑框线标识的区域中的数据。需要说明的是,本发明实施例中的新增用户终端和老用户终端之间的区分点在于:第(m-n)天之前新增的对象为老用户终端,在第(m-n)天之后新增的对象为第二对象,也就是新用户终端。为了更好的理解第一对象和第二对象,下面举一个场景的例子,获取在今天之前的两个月之内的dau的数据,第一对象为两个月之前新增的对象,例如,今天是3月2日,以今天为参考点,则两个月之前为1月2日,终端a在1月1日下载了该应用并且注册,则该终端a就为第一对象,也就是说在1月2日之前新增(注册,第一次使用等等)的对象均为第一对象;在2月1日,终端b下载了该应用并且注册,则该终端b就为第二对象,也就是说在1月2日之后新增(注册,第一次使用等等)的对象为第二对象。需要说明的是,本发明实施例中对于新增用户终端和老用户终端的界定并不是固定的,而是根据获取历史dau数据所包括的天数来确定的,本实施例中表1中的数据为对新用户终端和老用户终端的示例性说明,并不造成对本发明的限定性说明。本发明实施例中的方法通过获取历史dau的数据,并对历史dau的数据进行分析,分别建立对象回流模型和对象留存模型,其中,对象回流模型是通过dau数据中的第一对象(老用户终端)的数据进行训练后建立的;而对象留存模型是通过dau数据中的第二对象(新用户终端)的数据进行训练后建立的。请结合图1进行理解,图1为本发明实施例中一种预测日活跃对象数量的方法的步骤示意图。1)通过对象回流模型预测第(m+x)天的第一对象的回流总量;2)通过对象留存模型预测第(m+x)天的第二对象的留存总量;3)根据该回流总量和留存总量确定第(m+x)天的日活跃对象数量。需要说明的是,上述步骤1)和步骤2)并没有时序上的限定。下面对本发明实施例提供的一种预测日活跃对象数量的方法进行详细说明,请参阅图2所示,本发明实施例提供了一种预测日活跃对象数量的方法的一个实施例包括:步骤201、获取第m天至第(m-n)天连续(n+1)天的日活跃对象数量的数据,n为大于或者等于60的正整数,每天的日活跃对象数量中包括第二对象数量和日活跃对象中除新增对象之外的第一对象留存量。假设第m天为今天,获取今天之前连续60天的日活跃对象数量(也可以理解为dau)的数据,以表1中的例子为例进行说明,m为110,n为4,第(m-n)为106,也就是说,在建立模型之前,需要获取dau的历史数据,本实施例中为了方便说明,以获取第110天至106天连续5天的dau的数据为例,本实施例中对于m,n的取值均为举例说明,并不造成对本发明的限定性说明。需要说明的是,在实际应用中,该n为大于或者等于59的正整数,也就是说,在实际应用中,获取大于或者等于60天的dau数据。例如,可以获取60天的dau数据,也可以获取90天的dau数据,在实际应用中,该n的值具体不限定。可以理解的是,以第110天为例,会发现在60天(第50天)新增的对象,沉默了59天后,在第110天活跃用户终端的用户终端对象在第110天中dau中的占比小于1%,在总体预测精度影响不大的情况下为降低复杂性,这部分用户终端就可以忽略。从实际的应用中,这个假设也是合理的,沉默很久的用户终端再重新活跃的可能性也很低。因此,在实际应用中,n可以为大于或者等于59的正整数,本实施例中为了方便说明,以n为4进行举例说明。步骤202、根据(n+1)天的日活跃对象中的第二对象的留存量计算第二对象的留存率。本实施例中,s为第106天至第110天中的任一数值,根据60天的dau数据中的第二对象数量计算第二对象的留存率,留存率顾名思义为新增的对象存留下来的概率,留存率常常用于表征用户的粘性。确定第s天当天第二对象的第一数量,s取遍第m天至第(m-n)天中的任一数值,然后,确定从第s天到第y天第一数量进行衰减后的第一存留量;根据第一数量和第一存留量计算在第s天当天新增对象的数量在第y天的新增留存率,y大于s,且y小于m;以表1中的数据为例,第109天当天新增的对象数量为5000,该5000为第一数量,到了第110天,用户终端为2500,该2500为5000衰减后的第一存留量。也就是说,本实施例中,第s天可以分别为第106天,第107天,第108天,第y天为第109天,在109天当天,新注册的用户终端数量为5000,可是到第二天(也就是第110天),只有2500个用户终端继续登录该款游戏,也就是说,次日留存率为:2500除以5000,次日留存率为50%。在本实施例中,以第106天至第110天新增的对象为第二对象,以第110天的留存率为例,计算第二对象的留存率如下表2所示:表2需要说明的是,本实施例中以一天,即第110天的dau计算第二对象的留存率,第109天,第108天等的dau中第二对象的留存率的计算方法可以结合第110天的dau的留存率进行理解,第106天当天新增的对象在第110天的留存率为0.12,第107天当天新增的对象在第110天的留存率为0.19,第108天当天新增的对象在第110天的留存率为0.36,第109天当天新增的对象在第110天的留存率为0.50。步骤203、对第二对象的留存率的数据进行数据分析,得到对象留存模型。通过步骤202计算的第二对象的留存率的数据进行曲线拟合,得到对象留存模型。本实施例中对第二对象的留存率的数据进行曲线拟合的方法可以为r语言,sigmaplot、spss、sas等,本实施例中曲线拟合的方法可以以r语言为例进行说明,r语言可以提供一些集成的统计工具,并提供各种数学计算、统计计算的函数,从而能够灵活机动的进行数据分析。请结合图3进行理解,图3为第二对象的留存率的拟合曲线的示意图,图3为60天的dau中的第二对象的留存率的拟合曲线示意图,需要说明的是,图3中拟合曲线的数据只是为了方便说明,而举的例子,并不造成对本发明的限定性说明。该第二对象的留存率曲线的表达公式1可以为:rni=a·ln(i)+b,其中,a,b常数系数,根据曲线拟合结果可以得到,上述表达式中i表示第i天。根据上述1可以得到对象留存模型如下:其中,ni表示第i天的新增对象,rni表示第i天的新增对象的留存率。本实施例中,对象留存模型只需要利用最近一段时间内的历史数据(如60天的dau数据)进行训练,关注最近一段时间的dau发展趋势,训练简单快速。步骤204、统计(n+1)天中每天的日活跃对象中第一对象的回流量。确定第m天至第(m-n)天中第y天的日活跃对象中回流的第一对象的数量,回流的第一对象为在第n天活跃但在第n天之后沉默了(y-n-1)天,在第y天活跃的对象,第一对象为在第(m-n)天之前的任一天新增的对象。在实际应用中,可以统计60天中每天的日活跃对象中第一对象的回流量,该第一对象为第(m-n)之前新增的对象。本实施例中,由于是为了举例说明,因此本实施例中的dau的数据量较少,还是以表1中的例子为例,在本实施例中,第一对象包括:在第105天当天新增的对象,在第104天当天新增的对象;在第103天当天新增的对象;在第102天当天新增的对象;在第101天当天新增的对象。举一个场景的例子,终端c是第105天新增的对象,沉默了两天之后,在第108天活跃,第y天为第108天,第n天为第105天,可以理解的是,终端c在第105天注册了该款应用后,沉默(没有再登录或者使用该款应用)了(y-n-1)天,也就是沉默了2天后,在第y天(第108天)活跃,像终端c这样的第一对象,均是回流的第一对象。可以理解的是,在第108天重新登录或者使用该款应用的对象的数量为第一对象的回流量,在第108天的dau中第105天的第一对象的回流量为400。再举一个例子,在第104天的第一对象中沉默了3天,在第107天活跃的对象的数量为500,在第107天的dau中第103天的第一对象的回流量为500。需要说明的是,上述对于第一对象的回流率中的数据均为举例说明,并不造成本发明的限定性说明,当然在实际应用中,可以统计每一天的dau中的第n天的第一对象的回流量。例如,统计在第107天中的dau中的第102天沉默了4天,在第107天活跃的第一对象的回流量;第107天中的dau中的第103天沉默了3天,在第107天活跃的第一对象的回流量;第107天中的dau中的第104天沉默了2天,在第107天活跃的第一对象的回流量等等。步骤205、对第一对象的回流量进行数据分析,得到对象回流模型。然后根据第一对象的回流量计算第一对象的回流率,在第n天当天活跃,但在第n天之后沉默了(y-n-1)天的所有第一对象的总数量与在第y天回流的第一对象的数量计算该第一对象的回流率。通过下述公式2计算第一对象的回流率:其中,bn为第一对象的回流量:第y天的dau中,在第n天之后沉默了(y-n-1)天,在第y天当天活跃的第一对象的数量;sn表示在第y天的dau中,在第n天之后沉默了(y-n-1)天的所有的第一对象的数量。该指标(第一对象的回流率)反映的是沉默了(y-n-1)天的对象中还会继续留存的对象的概率。按上述公式计算出最近(n+1)天(例如可以为60天,本实施例中为5天)的第一对象的回流率后,使用r语言对计算得到的回流率数据进行拟合,拟合曲线采用采用幂曲线,横坐标是是天数,纵坐标是老用户终端回流率。请结合图4所示,图4为第一对象的回流率的拟合曲线的示意图,图4为60天的dau中的第一对象的回流率的拟合曲线示意图,需要说明的是,图4中拟合曲线中的数据只是为了方便说明,而举的例子,并不造成对本发明的限定性说明。该第一对象的回流率曲线的表达公式3可以为:roi=a·ib,其中,roi表示第i天第一对象的回流率,a,b常数系数,根据曲线拟合结果得到。根据上述公式3得到第一对象的对象回流模型如下:其中,mi表示第i天的所有第一对象留存的数量,roi表示第i天的第一对象回流率。需要说明的是,步骤201至步骤205为建立对象留存模型和对象回流模型的步骤,当通过获取第m天至第(m-n)天连续(n+1)天的日活跃对象数量的数据,完成建立对象留存模型和对象回流模型之后,可以通过该对象留存模型和对象回流模型对dau进行预测,不需要重复执行建立对象留存模型和对象回流模型的步骤,因此,步骤201至步骤205为可选步骤,可以不执行,而直接执行步骤206。步骤206、通过对象回流模型预测第(m+x)天的第一对象回流总量,对象回流模型为通过统计第m天至第(m-n)天连续(n+1)天的日活跃对象中第一对象的回流率进行分析后建模得到的,第一对象为在第(m-n)天之前新增的对象,x为大于或者等于1的正整数,n为大于或者等于1的正整数,m为大于n的正整数。通过上述对象回流模型预测第一对象的回流总量:其中,mi表示第i天前的所有第一对象留存的数量,roi表示第i天的第一对象回流率;(n+1)表示获取dau数据的总天数。当i=(m+x)时,预测第(m+x)天的第一对象的回流总量。请结合图5进行理解,图5为对象回流模型和对象留存模型中表示天数的示意图。例如,第m天为今天,若以今天为参考日,则第(m+1)天未来的第一天,以该款应用的上线时间来计,则第(m+1)天为第111天,本实施例中,第i天为第(m+1)天,也就是计算从第101天到第110天的第一对象的回流总量。通过上述对象回流模型预测第i天的第一对象的回流总量,可以理解的是,第i天与该应用上线的时间及实际时间的举例如下表3如下:表3i12345678910上线天数第101天第102天第103天第104天第105天第106天第107天第108天第109天第110天日期3月1日3月2日3月3日3月3日3月4日3月5日3月6日3月7日3月8日3月9日当需要预测第111天(i=11)天时,则需要对第101天至第110天的第一对象的回流量进行求和计算,预测第111天的第一对象的回流总量。也就是说,i为第m天之后的任一数值,并不是一个定值,而是一个变量。需要说明的上,上述表3中的上线天数,i及日期均是为了方便理解,而举的例子,并不造成对本发明的限定性说明。步骤207、通过对象留存模型预测第(m+x)天的第二对象的留存总量,对象留存模型为根据(n+1)天内的日活跃对象数量中的第一对象数量进行数据分析后得到的模型,第一对象为在第m天至第(m-n)天连续(n+1)天内新增的对象。通过如下模型预测第二对象的留存总量:其中,ni表示第i天的新增的第二对象的留存量,rni表示第i天的第二对象的留存率;当i=(m+x)时,预测第(m+x)天的第二对象的留存总量。请结合图5进行理解,例如,第m天为今天,若以今天为参考日,则第(m+1)天未来的第一天,以该款应用的上线时间来计,则第(m+1)天为第111天,本实施例中,第i天为第(m+1)天,也就是计算从第101天到第110天的第二对象的留存总量。通过上述对象留存模型预测第i天的第二对象的留存总量。步骤208、根据第(m+x)天的日活跃对象数量中第(m+x)天的第一对象的回流总量与第(m+x)天的第二对象的留存总量确定第(m+x)天的日活跃对象数量。通过下面公式3确定第(m+x)天的日活跃对象数量。dau=p+q。本实施例中对传统方式中的dau中的新增用户终端与老用户终端进行了重新定义,在第(m-n)天之前新增的对象为第一对象,在第(m-n)天之后新增的对象为第二对象。本实施例中,通过获取的第m天至第(m-n)天连续(n+1)天的历史dau的数据,对第一对象按沉默天数作进一步结构化分解,再对第一对象的回流率进行曲线拟合,得到对象回流模型;并且对第二对象的留存率进行分析得到对象留存模型。使用该对象回流模型和对象留存模型对未来dau进行预测,本模型不但具有很高的精度,而且有良好的可解析性,可以量化互联网产品关注的新增的对象的数量、第二对象的留存率、第一对象的回流率对dau的直接影响。本实施例中经测试90天内的dau预测精度在4%内。在上述实施例的基础上,请参阅图6所示,本发明实施例中提供了一种预测日活跃对象数量的方法的另一个实施例包括:在步骤208中,可以通过dau=p+q对第(m+x)的dau进行预测,其中,但是若需要预测第(m+x+1)的dau,就需要对p中的mi进行更新,预测起点天后一天的dau时,因为之前第i天已经有roi的用户回来到当天,则第i天的第一对象总量需要重新更新为:m′=mi·(1-roi),可以理解的是,若以第(m+1)天为预测起点,在预测第(m+2)天的dau时,需要将p中的mi进行更新,然后进行迭代预测。通过如下模型预测第一对象的回流总量:当i=(m+x+1)时,预测第(m+x+1)天的第一对象的回流总量。上面对一种预测日活跃对象数量的方法进行了描述,下面对该方法应用的设备进行描述,由于本实施例中的设备获取的dau数据相对较少,因此对于设备的处理能力要求不高,该设备可以为pc机的形态存在,也可以以服务器的形态存在,请参阅图7进行理解,图7为本发明实施例中一种预测日活跃对象数量的设备700的一个实施例包括:第一确定模块701,通过对象回流模型预测第(m+x)天的第一对象回流总量,对象回流模型为通过统计第m天至第(m-n)天连续(n+1)天的日活跃对象中第一对象的回流率进行分析后建模得到的,第一对象为在第(m-n)天之前新增的对象,x为大于或者等于1的正整数,n为大于或者等于1的正整数,m为大于n的正整数;第二确定模块702,通过对象留存模型预测第(m+x)天的第二对象的留存总量,对象留存模型为根据(n+1)天内的日活跃对象数量中的第二对象的留存量进行数据分析后得到的模型,第二对象为在第(m-n)天之后新增的对象;第三确定模块703,根据第一确定模块701第(m+x)天的日活跃对象数量中第(m+x)天的第一对象的回流总量与第二确定模块702确定的第(m+x)天的第二对象的留存总量确定第(m+x)天的日活跃对象数量。在图7对应的实施例的基础上,请参阅图8所示,本发明实施例还提供了一种预测日活跃对象数量的设备800的一个实施例包括:获取模块704,计算模块705,第一模型建立模块706,统计模块707和第二模型建立模块708;获取模块704,用于获取第m天至第(m-n)天连续(n+1)天的日活跃对象数量,n为大于或者等于60的正整数,每天的日活跃对象数量中包括第二对象数量和日活跃对象中除新增对象之外的第一对象留存量;计算模块705,用于根据获取模块704获取的(n+1)天的日活跃对象中的第二对象的留存量计算第二对象的留存率;第一模型建立模块706,用于对计算模块705计算的第二对象的留存率的数据进行数据分析,得到对象留存模型;统计模块707,用于统计获取模块704获取的(n+1)天中每天的日活跃对象中第一对象的回流量;第二模型建立模块708,用于对统计模块707统计的第一对象的回流量进行数据分析,得到对象回流模型。可选的,计算模块705,还用于确定第s天当天新增对象的第一数量,s取遍第m天至第(m-n)天中的任一数值;确定从第s天到第y天第一数量进行衰减后的第一存留量;根据第一数量和第一存留量计算在第s天当天新增第二对象的数量在第y天的留存率,y大于s,且y小于m。可选的,第一模型建立模块706,还用于通过对第二对象的留存率的数据进行曲线拟合,得到对象留存模型。可选的,统计模块707,还用于确定第m天至第(m-n)天中第y天的日活跃对象中回流的第一对象的数量,回流的第一对象为在第n天活跃但在第n天之后沉默了(y-n-1)天,在第y天活跃的对象。可选的,第二模型建立模块708,还用于根据在第n天活跃但在第n天之后沉默了(y-n-1)天沉默了(y-n-1)天的所有第一对象的数量与在第y天回流的第一对象的数量计算第一对象的回流率;通过对回流率的数据进行曲线拟合,得到第一对象的对象留存模型。可选的,第一确定模块701,还用于通过如下模型预测第一对象的回流总量:其中,mi表示第i天的所有第一对象的留存量,roi表示第i天的第一对象回流率;当i=(m+x)时,预测第(m+x)天的第一对象的回流总量。可选的,第二确定模块702,还用于通过如下模型预测第二对象留存总量:其中,ni表示第i天的新增的第二对象,rni表示第i天的第二对象的留存率;当i=(m+x)时,预测第(m+x)天的第二对象的留存总量。可选的,第一确定模块701,还用于对mi表示第i天的第一对象的留存量进行更新,更新后的第一对象的留存数量为m′=mi·(1-roi);通过如下模型预测第一对象的回流总量:当i=(m+x+1)时,预测第(m+x+1)天的第一对象的回流总量。进一步的,图7和图8中的一种预测日活跃对象数量的设备是以功能模块的形式来呈现。这里的“模块”可以指特定应用集成电路(application-specificintegratedcircuit,asic),电路,执行一个或多个软件或固件程序的处理器和存储器,集成逻辑电路,和/或其他可以提供上述功能的器件。在一个简单的实施例中,图7和图8中的一种预测日活跃对象数量的设备可以采用图9所示的终端的形式。本发明实施例还提供了另一种预测日活跃对象数量的设备,如图9所示,图9中的设备以终端的形态存在,为了便于说明,仅示出了与本发明实施例相关的部分,具体技术细节未揭示的,请参照本发明实施例方法部分。该终端可以为pc为例。存储器920、输入单元930、显示单元940、音频电路960、处理器980、以及电源990等部件。本领域技术人员可以理解,图9中示出的结构并不构成对该设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。下面结合图9对设备的各个构成部件进行具体的介绍:存储器920可用于存储软件程序以及模块,处理器980通过运行存储在存储器920的软件程序以及模块,从而执行设备的各种功能应用以及数据处理。存储器920可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器920可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入单元930可用于接收输入的数字或字符信息,以及产生与设备的用户设置以及功能控制有关的键信号输入。其他输入设备932。具体地,其他输入设备932可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元940可用于显示由用户输入的信息或提供给用户的信息以及设备的各种菜单。显示单元940可包括显示面板941,可选的,可以采用液晶显示器(liquidcrystaldisplay,lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板941。音频电路960、扬声器961,传声器962可提供用户与设备之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号,传输到扬声器961,由扬声器961转换为声音信号输出;另一方面,传声器962将收集的声音信号转换为电信号,由音频电路960接收后转换为音频数据,再将音频数据输出处理器980处理后,将音频数据输出至存储器920以便进一步处理。处理器980是设备的控制中心,利用各种接口和线路连接整个设备的各个部分,通过运行或执行存储在存储器920内的软件程序和/或模块,以及调用存储在存储器920内的数据,执行设备的各种功能和处理数据,从而对设备进行整体监控。可选的,处理器980可包括一个或多个处理单元;优选的,处理器980可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器980中。上述处理器980,还用于执行如下步骤:通过对象回流模型预测第(m+x)天的第一对象回流总量,对象回流模型为通过统计第m天至第(m-n)天连续(n+1)天的日活跃对象中第一对象的回流率进行分析后建模得到的,第一对象为在第(m-n)天之前新增的对象,x为大于或者等于1的正整数,n为大于或者等于1的正整数,m为大于n的正整数;通过对象留存模型预测第(m+x)天的第二对象的留存总量,对象留存模型为根据(n+1)天内的日活跃对象数量中的第二对象的留存量进行数据分析后得到的模型,第二对象为在第(m-n)天之后新增的对象;根据第(m+x)天的日活跃对象数量中第(m+x)天的第一对象的回流总量与第(m+x)天的第二对象的留存总量确定第(m+x)天的日活跃对象数量。可选的,处理器980,还用于获取第m天至第(m-n)天连续(n+1)天的日活跃对象数量,n为大于或者等于60的正整数,每天的日活跃对象数量中包括第二对象数量和日活跃对象中除新增对象之外的第一对象留存量;根据(n+1)天的日活跃对象中的第二对象的留存量计算第二对象的留存率;对第二对象的留存率的数据进行数据分析,得到对象留存模型;统计(n+1)天中每天的日活跃对象中第一对象的回流量;对第一对象的回流量进行数据分析,得到对象回流模型。可选的,处理器980,还用于确定第s天当天新增对象的第一数量,s取遍第m天至第(m-n)天中的任一数值;确定从第s天到第y天第一数量进行衰减后的第一存留量;根据第一数量和第一存留量计算在第s天当天新增第二对象的数量在第y天的留存率,y大于s,且y小于m。可选的,处理器980,还用于通过对第二对象的留存率的数据进行曲线拟合,得到对象留存模型。可选的,处理器980,还用于确定第m天至第(m-n)天中第y天的日活跃对象中回流的第一对象的数量,回流的第一对象为在第n天活跃但在第n天之后沉默了(y-n-1)天,在第y天活跃的对象。可选的,处理器980,根据在第n天活跃但在第n天之后沉默了(y-n-1)天沉默了(y-n-1)天的所有第一对象的数量与在第y天回流的第一对象的数量计算第一对象的回流率;通过对回流率的数据进行曲线拟合,得到第一对象的对象留存模型。可选的,处理器980,还用于通过如下模型预测第一对象的回流总量:其中,mi表示第i天的所有第一对象的留存量,roi表示第i天的第一对象回流率;当i=(m+x)时,预测第(m+x)天的第一对象的回流总量。可选的,处理器980,还用于通过如下模型预测第二对象留存总量:其中,ni表示第i天的新增的第二对象,rni表示第i天的第二对象的留存率;当i=(m+x)时,预测第(m+x)天的第二对象的留存总量。可选的,处理器980,还用于对mi表示第i天的第一对象的留存量进行更新,更新后的第一对象的留存数量为m′=mi·(1-roi);通过如下模型预测第一对象的回流总量:当i=(m+x+1)时,预测第(m+x+1)天的第一对象的回流总量。本发明实施例还提供了一种计算机可读存储介质用于储存为上述图9所示的预测日活跃对象数量的设备所用的计算机软件指令,其包含用于执行上述方法实施例所设计的程序。通过执行存储的程序,可以实现对日活跃对象数量的预测。本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法实施例中的方法。本发明实施例还提供了另一种预测日活跃对象数量的设备1000,如图10所示,图10中的设备以服务器的形态存在,图10是本发明实施例提供的一种服务器结构示意图,该服务器可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器1022和存储器1032,一个或一个以上存储应用程序1042或数据1044的存储介质1030(例如一个或一个以上海量存储设备)。其中,存储器1032和存储介质1030可以是短暂存储或持久存储。存储在存储介质1030的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对服务器中的一系列指令操作。更进一步地,处理器1022可以设置为与存储介质1030通信,在服务器上执行存储介质1030中的一系列指令操作。服务器还可以包括一个或一个以上电源1026,一个或一个以上有线或无线网络接口1050,一个或一个以上输入输出接口1058,和/或,一个或一个以上操作系统1041,例如windowsserver,macosx,unix,linux,freebsd等等。上述实施例中由预测日活跃对象数量的设备所执行的步骤可以基于该图10所示的服务器结构。该处理器1022,用于执行上述方法实施例中预测日活跃对象数量的设备所执行的方法。本发明实施例还提供了一种计算机可读存储介质用于储存为上述图10所示的预测日活跃对象数量的设备所用的计算机软件指令,其包含用于执行上述方法实施例所设计的程序。通过执行存储的程序,可以实现对日活跃对象数量的预测。本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法实施例中的方法。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1