预测应用留存数据的方法、装置、设备及存储介质与流程

文档序号:16756813发布日期:2019-01-29 17:28阅读:172来源:国知局
预测应用留存数据的方法、装置、设备及存储介质与流程

本公开一般涉及数据处理领域,尤其涉及预测应用留存数据的方法、装置、设备及存储介质。



背景技术:

广告作弊成为影响互联网app(应用程序,application)推广的一个难题,移动广告业也不是世外桃源。大批的网赚类应用的出现以及appstore刷榜冲榜的强烈需求为作弊行为提供了动力。与此同时,移动广告投放的监测技术门槛较高,后台数据结构繁冗复杂,监测维度指标较多等情况的存在,又给移动广告投放过程中衍生的作弊行为提供了持续发展的空间。针对以移动应用的安装为目标的广告,广告主们会提出各种各样的关键绩效指标(keyperformanceindicator,kpi),其中最主要kpi是用户留存。提高获取用户留存数据准确性的成为亟待解决的问题。



技术实现要素:

鉴于现有技术中的上述缺陷或不足,期望提供一种可靠性高的预测应用留存数据的方法、装置、设备及存储介质。

第一方面,提供一种预测应用留存数据的方法,该方法包括:

获取每个用户在预定时段的特定操作事件,特定操作事件包括打开事件、加载事件、展示事件;

确定各特定操作事件的用户类型,用户类型包括自然用户和推广用户,自然用户和推广用户以是否以广告链接进入app进行区分;

根据自然用户的特定操作事件概率和推广用户的特定操作事件概率之间的关系,预测留存数据。

第二方面,提供一种预测应用留存数据的装置,该装置包括:

事件获取单元,配置用于获取每个用户在预定时段的特定操作事件,特定操作事件包括打开事件、加载事件、展示事件;

来源确定单元,配置用于确定各特定操作事件的用户类型,用户类型包括自然用户和推广用户,自然用户和推广用户以是否以广告链接进入app进行区分;

预测单元:配置用于根据自然用户的特定操作事件概率和推广用户的特定操作事件概率之间的关系,预测留存数据。

第三方面,提供一种设备,该设备包括:

一个或多个处理器;

存储器,用于存储一个或多个程序,

当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器执行本申请的各实施例提供的预测应用留存数据的方法。

第四方面、提供一种存储有计算机程序的计算机可读存储介质,该程序被处理器执行时实现如权利要求1-4中任一项预测应用留存数据的方法。

根据本申请实施例提供的技术方案,通过根据自然用户的特定操作事件概率和推广用户的特定操作事件概率之间的关系,预测留存数据,能够有效解决虚假推广带来的留存数据误差大的问题。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1示出了可以应用本申请实施例的示例性系统架构;

图2示出了根据本申请实施例的预测应用留存数据方法的示例性流程图;

图3示出了步骤s30的的示例性流程图;

图4示出了根据本申请一个实施例的预测应用留存数据装置的示例性框图;

图5示出了根据本申请实施例提供的一种设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

图1示出了可以应用本申请实施例的示例性系统架构100。

如图1所示,系统架构100可以包括终端设备101、102、网络103和服务器104。网络103用以在终端设备101、102和服务器104之间提供通信链路的介质。网络103可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户110可以使用终端设备101、102通过网络103与服务器104交互,以接收或发送消息等。

终端设备101、102可以是各种电子设备,包括但不限于个人电脑、智能手机、智能手表、平板电脑、个人数字助理等等。

服务器104可以是提供各种服务的服务器。服务器可以对接收到的数据进行存储、分析等处理,并将处理结果反馈给终端设备。

需要说明的是,本申请实施例所提供的预测应用留存数据的方法可以由服务器104执行。在一些实施例中,预测应用留存数据方法在服务器104中进行预测,终端设备101、102安装有各种app(application,应用程序)。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

图2示出了根据本申请实施例的预测应用留存数据方法的示例性流程图。如图所示,提供一种预测应用留存数据的方法,该方法包括:

步骤s10:获取每个用户在预定时段的特定操作事件,特定操作事件包括打开事件、加载事件、展示事件;

步骤s20:确定各特定操作事件的用户类型,用户类型包括自然用户和推广用户,自然用户和推广用户以是否以广告链接进入app进行区分;

步骤s30:根据自然用户的特定操作事件概率和推广用户的特定操作事件概率之间的关系,预测留存数据。

用户访问应用时,服务器中会存储有与用户相关的信息,对于注册用户,可以根据用户id等信息确认用户信息;对于非注册用户,可以通过终端id等信息确认用户信息,根据历史访问记录等可以判断该用户是否为首次访问应用的新用户。本申请的应用不仅可以指应用程序,也可以指网站、视频、直播、应用程序中的服务等,本申请对此不作限定。

首先将用户分为自然用户和推广用户,自然用户是指不是通过任何广告链接点击下载来的用户;推广用户是指通过任意广告链接点击下载来的用户。具体地,通过广告链接点击下载的用户,应用商店会告知终端相关的信息,终端接收到这些信息后,通过广播机制通知到所有的应用程序。因此,可通过sdk(softwaredevelopmentkit,软件开发工具包)的方式,接收来自终端的通知,并识别用户类型为自然用户或推广用户。

接着,选择一个或者多个特定的事件作为判断用户是否使用app。本申请选择三个事件作为计算留存数据的依据,分别为app_open,ad_load,ad_impression。其中,app_open为应用打开的第一个事件,表示应用被打开;ad_load事件表示用户通过应用发送了交互请求并接收到应答;ad_impression事件表示预览交互应答相关数据。这三种事件表示了用户使用应用的不同阶段,能够实际反映用户使用应用的真实情况。

接着计算确定自然用户的特定操作事件概率和推广用户的特定操作事件概率之间的关系。分为如下步骤:

第一步,根据获取的预定时段的上述特定操作事件和用户类型,分别计算自然用户数量uod、自然用户所选三个事件的数量eto(app_open)/eto(app_open)/eto(ad_impression);以及推广用户数量und、推广用户所选三个事件的数量etn(app_open)/etn(app_open)/etn(ad_impression)。需要说明的是,该预定时段可以为一天、一周或连续的几天,根据情况而定。

第二步,基于第一步的数据,分别计算如下概率:

自然用户打开事件概率a1=eto(app_open)/uod,

自然用户加载事件概率b1=eto(ad_load)/uod,

自然用户展示事件概率c1=eto(ad_impression)/uod,

推广打开事件概率a2=etn(app_open)/und,

推广用户加载事件概率b2=etn(ad_load)/und,

推广用户展示事件概率c2=etn(ad_impression)/und。

第三步,基于第二步的数据,确定自然用户的特定操作事件概率和推广用户的特定操作事件概率之间的关系,该关系包括如下的几个比值:

自然用户打开事件概率和推广用户打开事件概率之比λ1=a2/a1,

自然用户加载事件概率和推广用户加载事件概率之比λ2=b2/b1,

自然用户展示事件概率和推广用户展示事件概率之比λ3=c2/c1,如图3的步骤s25所示。

图3示出了步骤s30的的示例性流程图。如图所示步骤s30包括:

在步骤s31判断自然用户打开事件概率和推广用户打开事件概率之比λ1、自然用户加载事件概率和推广用户加载事件概率之比λ2和自然用户展示事件概率和推广用户展示事件概率之比λ3是否大于第一设定值:

若是,则执行步骤s32预测的留存数据为特定操作事件概率的平均值;

否则,根据步骤s33判断自然用户打开事件概率和推广用户打开事件概率之比λ1、自然用户加载事件概率和推广用户加载事件概率之比λ2和自然用户展示事件概率和推广用户展示事件概率之比λ3中的任意两项概率是否大于第一设定值:

若是,则执行步骤s34预测留存数据为特定操作事件概率的平均值×第一预测系数;

否则,则执行步骤s35预测留存数据为特定操作事件概率的平均值×第二预测系数,第二预测系数小于第一预测系数,第一预测系数和第二预测系数均小于1。

例如,当比值λ1、λ2和λ3都大于50%,则预测的留存数据为特定操作事件概率的平均值;当比值λ1、λ2和λ3中的任意两项大于50%,则预测留存数据为特定操作事件概率的平均值×0.8;出了上述情形以外的其余情形,预测留存数据为特定操作事件概率的平均值×0.5。需要说明的是,上述涉及到的数值50%、0.8、0.5仅是举例,可根据实际情况调整。

接下来,说明如何计算特定操作事件概率平均值retention。分别统计事件app_open,ad_load,ad_impression的如下指标:事件的来源的用户总数un,三个事件的数量ed(app_open)、ed(ad_load)和ed(ad_impression)。

再计算各事件概率:事件app_open的概率为retention(app_open)=ed(app_open)/un;事件ad_load的概率为retention(ad_load)=ed(ad_load)/un事件ad_impression的概率为retention(ad_impression)=ed(ad_impression)/un。

基于上述概率,计算特定操作事件概率平均值retention:retention=

(retention(app_open)+retention(ad_load)+retention(ad_impression))/3

其中,retention(app_open)为打开事件的概率,retention(ad_load)为加载事件概率,retention(ad_impression)为展示事件概率。

本申请还公开一种预测应用留存数据的装置。

图4示出了根据本申请一个实施例的预测应用留存数据的装置300的示例性框图。预测应用留存数据的装置300包括:

事件获取单元310,配置用于获取每个用户在预定时段的特定操作事件,特定操作事件包括打开事件、加载事件、展示事件;

来源确定单元320,配置用于确定各特定操作事件的用户类型,用户类型包括自然用户和推广用户,自然用户和推广用户以是否以广告链接进入app进行区分;

预测单元330:配置用于根据自然用户的特定操作事件概率和推广用户的特定操作事件概率之间的关系,预测留存数据。

在一些实施例中,自然用户的特定操作事件概率和推广用户的特定操作事件概率之间的关系包括:

自然用户打开事件概率和推广用户打开事件概率之比λ1、自然用户加载事件概率和推广用户加载事件概率之比λ2、自然用户展示事件概率和推广用户展示事件概率之比λ3。

在一些实施例中,预测单元还包括判断单元331,判断单元配置用于:

判断自然用户打开事件概率和推广用户打开事件概率之比λ1、自然用户加载事件概率和推广用户加载事件概率之比λ2和自然用户展示事件概率和推广用户展示事件概率之比λ3是否大于第一设定值:

若是,则预测的留存数据为特定操作事件概率的平均值;

否则,判断自然用户打开事件概率和推广用户打开事件概率之比λ1、自然用户加载事件概率和推广用户加载事件概率之比λ2和自然用户展示事件概率和推广用户展示事件概率之比λ3中的任意两项是否大于第一设定值:

若是,则预测留存数据为特定操作事件概率的平均值×第一预测系数;

否则,则预测留存数据为特定操作事件概率的平均值×第二预测系数,第二预测系数小于第一预测系数,第一预测系数和第二预测系数均小于1。

在一些实施例中,预测单元还包括平均值计算单元332,平均值计算单元332配置用于计算特定操作事件概率平均值,特定操作事件概率平均值retention的计算公式为:

retention=

(retention(app_open)+retention(ad_load)+retention(ad_impression))/3

其中,retention(app_open)为打开事件的概率,retention(ad_load)为加载事件概率,retention(ad_impression)为展示事件概率。

图5示出了根据本申请实施例提供的一种设备的结构示意图。

如图5所示,作为另一方面,本申请还提供了一种设备400,包括一个或多个中央处理单元(cpu)401,其可以根据存储在只读存储器(rom)402中的程序或者从存储部分408加载到随机访问存储器(ram)403中的程序而执行各种适当的动作和处理。在ram403中,还存储有系统400操作所需的各种程序和数据。cpu401、rom402以及ram403通过总线404彼此相连。输入/输出(i/o)接口405也连接至总线404。

以下部件连接至i/o接口1005:包括键盘、鼠标等的输入部分406;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分407;包括硬盘等的存储部分408;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分409。通信部分409经由诸如因特网的网络执行通信处理。驱动器410也根据需要连接至i/o接口405。可拆卸介质411,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器410上,以便于从其上读出的计算机程序根据需要被安装入存储部分408。

特别地,根据本公开的实施例,上文参考图x描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,计算机程序包含用于执行预测应用留存数据的方法。在这样的实施例中,该计算机程序可以通过通信部分409从网络上被下载和安装,和/或从可拆卸介质411被安装。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

作为又一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中所述装置中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本申请的预测应用留存数据的方法。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以通过执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以通过专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,各所述单元可以是设置在计算机或移动智能设备中的软件程序,也可以是单独配置的硬件装置。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1