用户价值的预测方法、装置、设备及计算机可读介质与流程

文档序号:32619348发布日期:2022-12-20 22:14阅读:36来源:国知局
用户价值的预测方法、装置、设备及计算机可读介质与流程

1.本技术涉及用户增长技术领域,尤其涉及一种用户价值的预测方法、装置、设备及计算机可读介质。


背景技术:

2.随着互联网技术的快速发展,依托互联网的企业如雨后春笋般快速爆发,企业生存需要依靠高价值用户的付费,如购买免费产品的衍生付费产品、会员等。企业需要从自己的用户中精准找出付费意愿较高且对广告投放非常敏感的高价值用户,然后将有限的广告资源优先投放给高价值用户,才能提升广告预算的利用率。在新用户拉取中,用户价值的预测也同样重要,精准预测用户价值才能最大程度提升广告预算的利用率。
3.目前,相关技术中,在用户增长领域,各大企业、产品往往会采用投放广告、发放优惠券等促活方法进行吸引用户付费,投放的对象往往偏向于对产品留存较高的人群,但有些用户不需要投放广告也会有非常高的留存,那如果将广告投放给这类“非广告敏感用户”,就相当于浪费了这一部分的广告预算,因此存在因用户价值的预测不精准而导致广告预算利用率不佳的问题,用户价值预测越准确,越能精确定位到投放广告留存率高而不投放广告留存率低这一类“广告敏感用户”,对这一类用户进行广告投放则能最大程度提升广告预算的利用率。
4.针对用户价值预测不精准导致广告预算利用率低的问题,目前尚未提出有效的解决方案。


技术实现要素:

5.本技术提供了一种用户价值的预测方法、装置、设备及计算机可读介质,以解决用户价值预测不精准导致广告预算利用率低的技术问题。
6.根据本技术实施例的一个方面,本技术提供了一种用户价值的预测方法,包括:
7.获取目标对象的元特征和实际行为特征,其中,元特征用于表征目标对象的用户属性,实际行为特征用于表征目标对象对目标产品的实际使用行为;
8.修改实际行为特征的数值得到第一行为特征和第二行为特征,并基于元特征和第一行为特征衍生出目标对象对应的第一虚拟对象、基于元特征和第二行为特征衍生出目标对象对应的第二虚拟对象,其中,第一行为特征用于表征第一虚拟对象在目标日期被投放广告且于目标日期使用了目标产品,第二行为特征用于表征第二虚拟对象在目标日期未被投放广告且于目标日期未使用目标产品;
9.分别将第一虚拟对象和第二虚拟对象的特征输入留存预测模型,得到留存预测模型预测得到的第一虚拟对象在目标日期后的目标时段内对目标产品的第一留存天数和第二虚拟对象在目标日期后的目标时段内对目标产品的第二存留天数,其中,留存预测模型为预先使用多个用户的元特征和实际行为特征作为训练数据训练得到的;
10.将第一留存天数与第二留存天数的差值确定为目标对象的用户价值。
11.可选地,分别将所述第一虚拟对象和所述第二虚拟对象的特征输入留存预测模型之前,所述方法还包括按照如下方式训练所述留存预测模型:
12.在历史日期中选定多个基准日期;
13.以每一个基准日期为基准构造训练样本,得到多组训练样本;
14.将多组训练样本合并输入至目标回归模型中进行训练,得到留存预测模型。
15.可选地,以每一个基准日期为基准构造训练样本,得到多组训练样本中,任一组训练样本按照以下方式进行构造:
16.基于用户属性信息和历史行为数据构造每个用户的元特征和以基准日期为基准的实际行为特征;
17.按照用户在基准日期之前的历史活跃时段对每个用户的元特征和实际行为特征进行分类、拼接,以构造推理样本;
18.以用户在基准日期之后的目标时段内的留存天数为标签,将每个用户的标签和对应的推理样本进行拼接,得到以基准日期为基准的一组训练样本。
19.可选地,目标产品包括视频流媒体平台,基于用户属性信息和历史行为数据构造每个用户的元特征和以基准日期为基准的实际行为特征包括:
20.利用用户性别、年龄、职业、常驻地区、设备型号、消费水平、教育程度、视频会员类型、视频会员起止时间以及视频偏好中至少之一作为元特征;
21.统计用户在基准日期之前的多个时段的视频累计播放次数、累计播放时长、平均完播率以及视频播放个数中的至少之一得到站内统计特征作为实际行为特征;
22.统计用户基准日期之前的预设时段的登录天数和沉默天数得到用户登录特征作为实际行为特征;
23.统计用户在基准日期之前的预设时段内对站外投放广告的历史点击次数得到广告点击特征作为实际行为特征;
24.统计用户在基准日期之前的预设时段中被站外广告拉起次数得到站外广告拉起特征作为实际行为特征。
25.可选地,按照用户的历史活跃时段对每个用户的元特征和实际行为特征进行分类、拼接,以构造推理样本包括:
26.确定每个用户的历史活跃时段;
27.从每个用户的多个时段站内统计特征中筛选出对应历史活跃时段的目标站内统计特征;
28.将每个用户的元特征、目标站内统计特征、用户登录特征、广告点击特征以及站外广告拉起特征进行拼接,得到对应用户的推理样本。
29.可选地,以用户在基准日期之后的目标时段内的留存天数为标签,将每个用户的标签和对应的推理样本进行拼接,得到以基准日期为基准的一组训练样本包括:
30.对在基准日期被投放广告且被拉起的用户、在基准日期被投放广告且未被拉起的用户以及在基准日期未被投放广告的用户的推理样本按照预设比例进行采样;
31.将采样后的推理样本与对应用户的标签进行拼接,得到训练样本。
32.可选地,得到留存预测模型之后,所述方法还包括按照如下方式对留存预测模型进行验证:
33.为验证样本中的每个用户构建第一虚拟对象和第二虚拟对象;
34.逐一将每个用户对应的第一虚拟对象和第二虚拟对象的特征输入留存预测模型,得到每个用户对应的第一虚拟对象在目标日期被投放广告后的目标时段内对目标产品的第三留存天数和每个用户对应的第二虚拟对象在目标日期未被投放广告后的目标时段内对目标产品的第四留存天数;
35.将每个用户的第三留存天数与第四留存天数的差值确定为对应用户的用户价值;
36.按照用户价值从高到低的顺序进行排序,并按照目标比例确定排序中的目标位置,以将目标位置之前的用户确定为高价值用户,将目标位置之后的用户确定为低价值用户;
37.将所有高价值用户的第三留存天数的平均值减去第四留存天数的平均值,得到第一增益,并将所有低价值用户的第三留存天数的平均值减去第四留存天数的平均值,得到第二增益;
38.在第一增益大于第二增益的情况,确定留存预测模型验证有效。
39.根据本技术实施例的另一方面,本技术提供了一种用户价值的预测装置,包括:
40.特征获取模块,用于获取目标对象的元特征和实际行为特征,其中,元特征用于表征目标对象的用户属性,实际行为特征用于表征目标对象对目标产品的实际使用行为;
41.对象衍生模块,用于修改实际行为特征的数值得到第一行为特征和第二行为特征,并基于元特征和第一行为特征衍生出目标对象对应的第一虚拟对象、基于元特征和第二行为特征衍生出目标对象对应的第二虚拟对象,其中,第一行为特征用于表征第一虚拟对象在目标日期被投放广告且于目标日期使用了目标产品,第二行为特征用于表征第二虚拟对象在目标日期未被投放广告且于目标日期未使用目标产品;
42.预测模块,用于分别将第一虚拟对象和第二虚拟对象的特征输入留存预测模型,得到留存预测模型预测得到的第一虚拟对象在目标日期后的目标时段内对目标产品的第一留存天数和第二虚拟对象在目标日期后的目标时段内对目标产品的第二存留天数,其中,留存预测模型为预先使用多个用户的元特征和实际行为特征作为训练数据训练得到的;
43.价值确定模块,用于将第一留存天数与第二留存天数的差值确定为目标对象的用户价值。
44.根据本技术实施例的另一方面,本技术提供了一种电子设备,包括存储器、处理器、通信接口及通信总线,存储器中存储有可在处理器上运行的计算机程序,存储器、处理器通过通信总线和通信接口进行通信,处理器执行计算机程序时实现上述方法的步骤。
45.根据本技术实施例的另一方面,本技术还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行上述的方法。
46.本技术实施例提供的上述技术方案与相关技术相比具有如下优点:
47.本技术技术方案为获取目标对象的元特征和实际行为特征,修改实际行为特征的数值得到第一行为特征和第二行为特征,并基于元特征和第一行为特征衍生出目标对象对应的第一虚拟对象、基于元特征和第二行为特征衍生出目标对象对应的第二虚拟对象;分别将第一虚拟对象和第二虚拟对象的特征输入留存预测模型,得到留存预测模型预测得到的第一虚拟对象在目标日期后的目标时段内对目标产品的第一留存天数和第二虚拟对象
在目标日期后的目标时段内对目标产品的第二存留天数;将第一留存天数与第二留存天数的差值确定为目标对象的用户价值。本技术通过对投放广告与不投放广告两种情况下用户的行为进行预估,从而获取对目标对象投放广告这种干预相比不投放广告能够带来的增益,将这种增益作为用户价值,能够精确定位到投放广告留存率高而不投放广告留存率低这一类“广告敏感用户”,保证广告预算能够达到最大利用率,解决了用户价值预测不精准导致广告预算利用率低的技术问题。
附图说明
48.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
49.为了更清楚地说明本技术实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
50.图1为根据本技术实施例提供的一种可选的户价值的预测方法硬件环境示意图;
51.图2为根据本技术实施例提供的一种可选的户价值的预测方法流程图;
52.图3为根据本技术实施例提供的一种可选的户价值的预测装置框图;
53.图4为本技术实施例提供的一种可选的电子设备结构示意图。
具体实施方式
54.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术的一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
55.在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本技术的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
56.相关技术中,在用户增长领域,各大企业、产品往往会采用投放广告、发放优惠券等促活方法进行吸引用户付费,投放的对象往往偏向于对产品留存较高的人群,但有些用户不需要投放广告也会有非常高的留存,那如果将广告投放给这类“非广告敏感用户”,就相当于浪费了这一部分的广告预算,因此存在因用户价值的预测不精准而导致广告预算利用率不佳的问题,用户价值预测越准确,越能精确定位到投放广告留存率高而不投放广告留存率低这一类“广告敏感用户”,对这一类用户进行广告投放则能最大程度提升广告预算的利用率。
57.为了解决背景技术中提及的问题,根据本技术实施例的一方面,提供了一种用户价值的预测方法的实施例。
58.可选地,在本技术实施例中,上述用户价值的预测方法可以应用于如图1所示的由终端101和服务器103所构成的硬件环境中。如图1所示,服务器103通过网络与终端101进行连接,可用于为终端或终端上安装的客户端提供服务(如数据采集服务、模型训练服务、用户价值预测服务等),可在服务器上或独立于服务器设置数据库105,用于为服务器103提供
数据存储服务,上述网络包括但不限于:广域网、城域网或局域网,终端101包括但不限于pc、手机、平板电脑等。
59.本技术实施例中的一种用户价值的预测方法可以由服务器103来执行,还可以是由服务器103和终端101共同执行,如图2所示,该方法可以包括以下步骤:
60.步骤s202,获取目标对象的元特征和实际行为特征,其中,元特征用于表征目标对象的用户属性,实际行为特征用于表征目标对象对目标产品的实际使用行为;
61.步骤s204,修改实际行为特征的数值得到第一行为特征和第二行为特征,并基于元特征和第一行为特征衍生出目标对象对应的第一虚拟对象、基于元特征和第二行为特征衍生出目标对象对应的第二虚拟对象,其中,第一行为特征用于表征第一虚拟对象在目标日期被投放广告且于目标日期使用了目标产品,第二行为特征用于表征第二虚拟对象在目标日期未被投放广告且于目标日期未使用目标产品;
62.步骤s206,分别将第一虚拟对象和第二虚拟对象的特征输入留存预测模型,得到留存预测模型预测得到的第一虚拟对象在目标日期后的目标时段内对目标产品的第一留存天数和第二虚拟对象在目标日期后的目标时段内对目标产品的第二存留天数,其中,留存预测模型为预先使用多个用户的元特征和实际行为特征作为训练数据训练得到的;
63.步骤s208,将第一留存天数与第二留存天数的差值确定为目标对象的用户价值。
64.通过步骤s202至s208,本技术通过对投放广告与不投放广告两种情况下用户的行为进行预估,从而获取对目标对象投放广告这种干预相比不投放广告能够带来的增益,将这种增益作为用户价值,能够精确定位到投放广告留存率高而不投放广告留存率低这一类“广告敏感用户”,保证广告预算能够达到最大利用率,解决了用户价值预测不精准导致广告预算利用率低的技术问题。
65.在步骤s202提供的技术方案中,目标对象即为待预测用户价值的目标用户,目标对象的元特征指的是用户的个人属性、社会属性等信息,如用户性别、年龄、常驻城市、手机型号、生活方式、消费水平、教育程度、职业等。进一步地,对应于目标产品,可以根据目标产品的不同按需扩展用户的元特征,如目标产品是视频流媒体平台,则扩展的元特征还包括用户是否购买视频会员、所购视频会员的类型、所购视频会员的起止时间以及用户的长短视频偏好、视频类型偏好等,又如目标产品是网络游戏,则可扩展的元特征还包括用户是否存在消费行为、其消费偏好是属性提升类道具还是服装类道具,是否购买游戏会员、所购买的游戏会员类型以及游戏会员的起止时间等。目标对象的实际行为特征则表示用户对目标产品的使用行为,以目标产品为视频流媒体平台为例,用户的实际行为特征包括视频播放次数、视频累计播放时长、平均完播率以及播放视频数量等站内统计特征,包括用户在过去一段时间内对视频流媒体平台的登录情况,如登录天数、沉默天数(即上次登录距今多少天)等用户登录特征,包括用户对站外投放的该目标产品的广告的历史点击次数的广告点击特征,还包括过去一段时间内用户因点击上述广告而被拉起(即点击广告后引流至该目标产品)的次数的广告拉起特征等。
66.在步骤s204提供的技术方案中,修改实际行为特征的数值得到第一行为特征具体可以是:沉默时间=0,用户类型=2,t日被广告拉起=1,t日登录=1,t日广告投放=1,即表示第一虚拟对象没有沉默时间,第一虚拟对象在目标日期被投放广告且于目标日期使用了目标产品(用户类型=1表示该用户被投放广告但未被拉起,用户类型=2表示该用户被
投放广告且被拉起,用户类型=3表示该用户未被投放广告)。修改实际行为特征的数值得到第二行为特征具体可以是:用户类型=3,t日被广告拉起=0,t日使用目标产品=0,t日登录=0,t日广告投放=0,即表示第二虚拟对象未被投放广告、未被广告拉起、在目标日期未使用目标产品,如未观看视频,在目标日期未登录目标产品的账号。
67.在步骤s206、s208提供的技术方案中,留存预测模型为预先使用多个用户的元特征和实际行为特征作为训练数据训练得到的,利用目标对象对应的第一虚拟对象的特征,可以预测对该目标对象投放广告后该目标对象接下来的行为,利用目标对象对应的第二虚拟对象的特征,可以预测未对该目标对象投放广告后该目标对象接下来的行为,从而获取对目标对象投放广告这种干预相比不投放广告能够带来的增益,将这种增益作为用户价值。
68.本技术实施例中所找寻的高价值用户,是上述增益大的用户,即投放广告时其留存得分非常高(第一留存天数),不投放广告时其留存得分则很低(第二留存天数),即对广告投放非常敏感的用户。因此本技术技术方案可以精准定位这一类“广告敏感用户”,保证广告预算能够达到最大利用率,解决了用户价值预测不精准导致广告预算利用率低的技术问题。
69.本技术实施例中,在计算投放广告增益时的推理取值上,同时改变多个特征值,用来模拟用户的两种情况,而不是只设置是否投放广告这单个特征,使预测结果更加贴合实际情况。
70.可选地,本技术还可使用其他指标进行用户价值预测,如dau(daily active user,日活跃用户数量),即:
71.分别将第一虚拟对象和第二虚拟对象的特征输入dau预测模型,得到dau预测模型预测得到的第一虚拟对象在目标日期后的目标时段内对目标产品的第一dau和第二虚拟对象在目标日期后的目标时段内对目标产品的第二dau,其中,dau预测模型为预先使用多个用户的元特征和实际行为特征作为训练数据训练得到的;
72.将第一dau与第二dau的差值确定为目标对象的用户价值。
73.本技术实施例还提出一种上述留存预测模型的训练方法,下面进行详细说明。
74.可选地,分别将所述第一虚拟对象和所述第二虚拟对象的特征输入留存预测模型之前,所述方法还包括按照如下方式训练所述留存预测模型:
75.步骤1,在历史日期中选定多个基准日期;
76.步骤2,以每一个基准日期为基准构造训练样本,得到多组训练样本;
77.步骤3,将多组训练样本合并输入至目标回归模型中进行训练,得到留存预测模型。
78.本技术实施例中,以一个基准日期构造一组训练样本,从而使用多组训练数据来保证用户价值预估的鲁棒性。上述目标回归模型可以选用xgboost回归模型等。
79.可选地,若将基准日期用t表示,则以每一个基准日期为基准构造训练样本,得到多组训练样本中,任一组训练样本按照以下方式进行构造:
80.步骤s1,基于用户属性信息和历史行为数据构造每个用户的元特征和以基准日期为基准的实际行为特征;
81.步骤s2,按照用户在基准日期之前的历史活跃时段对每个用户的元特征和实际行
为特征进行分类、拼接,以构造推理样本;
82.步骤s3,以用户在基准日期之后的目标时段内的留存天数为标签,将每个用户的标签和对应的推理样本进行拼接,得到以基准日期为基准的一组训练样本。
83.具体地,以目标产品为视频流媒体平台为例进行说明,步骤s1基于用户属性信息和历史行为数据构造每个用户的元特征和以基准日期为基准的实际行为特征包括:
84.利用用户性别、年龄、职业、常驻地区、设备型号、消费水平、教育程度、视频会员类型、视频会员起止时间以及视频偏好中至少之一作为元特征;
85.统计用户在基准日期之前的多个时段的视频累计播放次数、累计播放时长、平均完播率以及视频播放个数中的至少之一得到站内统计特征作为实际行为特征;
86.统计用户基准日期之前的预设时段的登录天数和沉默天数得到用户登录特征作为实际行为特征;
87.统计用户在基准日期之前的预设时段内对站外投放广告的历史点击次数得到广告点击特征作为实际行为特征;
88.统计用户在基准日期之前的预设时段中被站外广告拉起次数得到站外广告拉起特征作为实际行为特征。
89.本技术实施例中,以t为基准日期,则可以统计过去7日、30日、90日的累计播放次数、累计播放时长、平均完播率、播放视频个数等作为站内统计特征。可以以t日为基准,统计过去15日的每日登录情况(1为登录,0为未登录)。可以以t日为基准,统计过去15日用户对站外投放广告的历史点击次数作为广告点击特征。可以以t日为基准,统计过去15日用户被站外广告拉起情况作为站外广告拉起特征。还可以根据是否对用户投放广告以及是否被拉起的行为对用户进行分类,即用户类型=1表示该用户被投放广告但未被拉起,用户类型=2表示该用户被投放广告且被拉起,用户类型=3表示该用户未被投放广告。
90.具体地,步骤s2按照用户的历史活跃时段对每个用户的元特征和实际行为特征进行分类、拼接,以构造推理样本包括:
91.步骤1,确定每个用户的历史活跃时段;
92.步骤2,从每个用户的多个时段站内统计特征中筛选出对应历史活跃时段的目标站内统计特征;
93.步骤3,将每个用户的元特征、目标站内统计特征、用户登录特征、广告点击特征以及站外广告拉起特征进行拼接,得到对应用户的推理样本。
94.本技术实施例中,在样本构造和特征拼接上,使用了t-7日、t-30日、t-90日统计特征快照,有效避免了沉默时间较长用户统计特征均为空的情况;(比如30之外活跃过的用户,其在t日的统计特征均为0),以180日内活跃用户作为推理范围进行说明,推理样本构造时按时间圈定用户,将各项特征拼接起来,获得t日推理样本,即:
95.1)7日内活跃用户的推理样本为:t日元特征+t日站内统计特征+t日用户登录特征+t日广告点击特征+t日站外广告拉起特征;
96.2)8~30日内活跃用户的推理样本为:t日站内统计特征+t-7日用户登录特征+t日广告点击特征+t日站外广告拉起特征;
97.3)31~90日内活跃用户的推理样本为:t日站内统计特征+t-30日用户登录特征+t日广告点击特征+t日站外广告拉起特征;
98.4)91~180日内活跃用户的推理样本为:t日站内统计特征+t-90日用户登录特征+t日广告点击特征+t日站外广告拉起特征。
99.具体地,步骤s3以用户在基准日期之后的目标时段内的留存天数为标签,将每个用户的标签和对应的推理样本进行拼接,得到以基准日期为基准的一组训练样本包括:
100.步骤1,对在基准日期被投放广告且被拉起的用户、在基准日期被投放广告且未被拉起的用户以及在基准日期未被投放广告的用户的推理样本按照预设比例进行采样;
101.步骤2,将采样后的推理样本与对应用户的标签进行拼接,得到训练样本。
102.本技术实施例中,上述预设比例可以根据实际需要进行选择,如在基准日期被投放广告且被拉起的用户:在基准日期被投放广告且未被拉起的用户:在基准日期未被投放广告的用户=1:1:1。通过控制各类用户的采样比例,可以让模型有效学习到各类用户的预测,从而提升模型的预测精度。
103.可选地,得到留存预测模型之后,所述方法还包括按照如下方式对留存预测模型进行验证:
104.步骤1,为验证样本中的每个用户构建第一虚拟对象和第二虚拟对象;
105.步骤2,逐一将每个用户对应的第一虚拟对象和第二虚拟对象的特征输入留存预测模型,得到每个用户对应的第一虚拟对象在目标日期被投放广告后的目标时段内对目标产品的第三留存天数和每个用户对应的第二虚拟对象在目标日期未被投放广告后的目标时段内对目标产品的第四留存天数;
106.步骤3,将每个用户的第三留存天数与第四留存天数的差值确定为对应用户的用户价值;
107.步骤4,按照用户价值从高到低的顺序进行排序,并按照目标比例确定排序中的目标位置,以将目标位置之前的用户确定为高价值用户,将目标位置之后的用户确定为低价值用户;
108.步骤5,将所有高价值用户的第三留存天数的平均值减去第四留存天数的平均值,得到第一增益,并将所有低价值用户的第三留存天数的平均值减去第四留存天数的平均值,得到第二增益;
109.步骤6,在第一增益大于第二增益的情况,确定留存预测模型验证有效。
110.本技术实施例中,上述目标比例可以根据实际需要进行选择,如高价值用户:低价值用户=3:7,则在排序中,前30%为高价值用户,后70%为低价值用户。
111.本技术实施例中,在利用该留存预测模型确定高价值用户和低价值用户之后,还可以进行投放实验,以进一步验证模型有效性和准确性。投放实验可以将70%的广告预算投放高价值用户,30%的预算投放低价值用户,实验效果的验证方式同上述模型验证中的步骤5、步骤6。
112.本技术实施例中,由于时间不断推进,意味着每天都有新的训练样本产生,因此可以每天都可以使用最新的模型进行用户价值预测,预测精度也会越来越高。
113.本技术通过对投放广告与不投放广告两种情况下用户的行为进行预估,从而获取对目标对象投放广告这种干预相比不投放广告能够带来的增益,将这种增益作为用户价值,能够精确定位到投放广告留存率高而不投放广告留存率低这一类“广告敏感用户”,保证广告预算能够达到最大利用率,解决了用户价值预测不精准导致广告预算利用率低的技
术问题。
114.根据本技术实施例的又一方面,如图3所示,提供了一种用户价值的预测装置,包括:
115.特征获取模块301,用于获取目标对象的元特征和实际行为特征,其中,元特征用于表征目标对象的用户属性,实际行为特征用于表征目标对象对目标产品的实际使用行为;
116.对象衍生模块303,用于修改实际行为特征的数值得到第一行为特征和第二行为特征,并基于元特征和第一行为特征衍生出目标对象对应的第一虚拟对象、基于元特征和第二行为特征衍生出目标对象对应的第二虚拟对象,其中,第一行为特征用于表征第一虚拟对象在目标日期被投放广告且于目标日期使用了目标产品,第二行为特征用于表征第二虚拟对象在目标日期未被投放广告且于目标日期未使用目标产品;
117.预测模块305,用于分别将第一虚拟对象和第二虚拟对象的特征输入留存预测模型,得到留存预测模型预测得到的第一虚拟对象在目标日期后的目标时段内对目标产品的第一留存天数和第二虚拟对象在目标日期后的目标时段内对目标产品的第二存留天数,其中,留存预测模型为预先使用多个用户的元特征和实际行为特征作为训练数据训练得到的;
118.价值确定模块307,用于将第一留存天数与第二留存天数的差值确定为目标对象的用户价值。
119.需要说明的是,该实施例中的特征获取模块301可以用于执行本技术实施例中的步骤s202,该实施例中的对象衍生模块303可以用于执行本技术实施例中的步骤s204,该实施例中的预测模块305可以用于执行本技术实施例中的步骤s206,该实施例中的价值确定模块307可以用于执行本技术实施例中的步骤s208。
120.此处需要说明的是,上述模块与对应的步骤所实现的示例和应用场景相同,但不限于上述实施例所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在如图1所示的硬件环境中,可以通过软件实现,也可以通过硬件实现。
121.可选地,该用户价值的预测装置,还包括模型训练模块,用于:
122.在历史日期中选定多个基准日期;
123.以每一个基准日期为基准构造训练样本,得到多组训练样本;
124.将多组训练样本合并输入至目标回归模型中进行训练,得到留存预测模型。
125.可选地,所述模型训练模块,包括训练样本构造单元,用于按照以下方式构造任一组训练样本:
126.基于用户属性信息和历史行为数据构造每个用户的元特征和以基准日期为基准的实际行为特征;
127.按照用户在基准日期之前的历史活跃时段对每个用户的元特征和实际行为特征进行分类、拼接,以构造推理样本;
128.以用户在基准日期之后的目标时段内的留存天数为标签,将每个用户的标签和对应的推理样本进行拼接,得到以基准日期为基准的一组训练样本。
129.可选地,目标产品包括视频流媒体平台,所述训练样本构造单元还用于按照以下方式构造用户特征:
130.利用用户性别、年龄、职业、常驻地区、设备型号、消费水平、教育程度、视频会员类型、视频会员起止时间以及视频偏好中至少之一作为元特征;
131.统计用户在基准日期之前的多个时段的视频累计播放次数、累计播放时长、平均完播率以及视频播放个数中的至少之一得到站内统计特征作为实际行为特征;
132.统计用户基准日期之前的预设时段的登录天数和沉默天数得到用户登录特征作为实际行为特征;
133.统计用户在基准日期之前的预设时段内对站外投放广告的历史点击次数得到广告点击特征作为实际行为特征;
134.统计用户在基准日期之前的预设时段中被站外广告拉起次数得到站外广告拉起特征作为实际行为特征。
135.可选地,所述训练样本构造单元还用于按照以下方式构造推理样本:
136.确定每个用户的历史活跃时段;
137.从每个用户的多个时段站内统计特征中筛选出对应历史活跃时段的目标站内统计特征;
138.将每个用户的元特征、目标站内统计特征、用户登录特征、广告点击特征以及站外广告拉起特征进行拼接,得到对应用户的推理样本。
139.可选地,所述训练样本构造单元还用于:
140.对在基准日期被投放广告且被拉起的用户、在基准日期被投放广告且未被拉起的用户以及在基准日期未被投放广告的用户的推理样本按照预设比例进行采样;
141.将采样后的推理样本与对应用户的标签进行拼接,得到训练样本。
142.可选地,所述模型训练模块还用于按照以下方式对留存预测模型进行验证:
143.为验证样本中的每个用户构建第一虚拟对象和第二虚拟对象;
144.逐一将每个用户对应的第一虚拟对象和第二虚拟对象的特征输入留存预测模型,得到每个用户对应的第一虚拟对象在目标日期被投放广告后的目标时段内对目标产品的第三留存天数和每个用户对应的第二虚拟对象在目标日期未被投放广告后的目标时段内对目标产品的第四留存天数;
145.将每个用户的第三留存天数与第四留存天数的差值确定为对应用户的用户价值;
146.按照用户价值从高到低的顺序进行排序,并按照目标比例确定排序中的目标位置,以将目标位置之前的用户确定为高价值用户,将目标位置之后的用户确定为低价值用户;
147.将所有高价值用户的第三留存天数的平均值减去第四留存天数的平均值,得到第一增益,并将所有低价值用户的第三留存天数的平均值减去第四留存天数的平均值,得到第二增益;
148.在第一增益大于第二增益的情况,确定留存预测模型验证有效。
149.根据本技术实施例的另一方面,本技术提供了一种电子设备,如图4所示,包括存储器401、处理器403、通信接口405及通信总线407,存储器401中存储有可在处理器403上运行的计算机程序,存储器401、处理器403通过通信接口405和通信总线407进行通信,处理器403执行计算机程序时实现上述方法的步骤。
150.上述电子设备中的存储器、处理器通过通信总线和通信接口进行通信。所述通信
总线可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。
151.存储器可以包括随机存取存储器(random access memory,简称ram),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
152.上述的处理器可以是通用处理器,包括中央处理器(central processing unit,简称cpu)、网络处理器(network processor,简称np)等;还可以是数字信号处理器(digital signal processing,简称dsp)、专用集成电路(application specific integrated circuit,简称asic)、现场可编程门阵列(field-programmable gate array,简称fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
153.根据本技术实施例的又一方面还提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质。
154.可选地,在本技术实施例中,计算机可读介质被设置为存储用于所述处理器执行以下步骤的程序代码:
155.获取目标对象的元特征和实际行为特征,其中,元特征用于表征目标对象的用户属性,实际行为特征用于表征目标对象对目标产品的实际使用行为;
156.修改实际行为特征的数值得到第一行为特征和第二行为特征,并基于元特征和第一行为特征衍生出目标对象对应的第一虚拟对象、基于元特征和第二行为特征衍生出目标对象对应的第二虚拟对象,其中,第一行为特征用于表征第一虚拟对象在目标日期被投放广告且于目标日期使用了目标产品,第二行为特征用于表征第二虚拟对象在目标日期未被投放广告且于目标日期未使用目标产品;
157.分别将第一虚拟对象和第二虚拟对象的特征输入留存预测模型,得到留存预测模型预测得到的第一虚拟对象在目标日期后的目标时段内对目标产品的第一留存天数和第二虚拟对象在目标日期后的目标时段内对目标产品的第二存留天数,其中,留存预测模型为预先使用多个用户的元特征和实际行为特征作为训练数据训练得到的;
158.将第一留存天数与第二留存天数的差值确定为目标对象的用户价值。
159.可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
160.本技术实施例在具体实现时,可以参阅上述各个实施例,具有相应的技术效果。
161.可以理解的是,本文描述的这些实施例可以用硬件、软件、固件、中间件、微码或其组合来实现。对于硬件实现,处理单元可以实现在一个或多个专用集成电路(application specific integrated circuits,asic)、数字信号处理器(digital signal processing,dsp)、数字信号处理设备(dsp device,dspd)、可编程逻辑设备(programmable logic device,pld)、现场可编程门阵列(field-programmable gate array,fpga)、通用处理器、控制器、微控制器、微处理器、用于执行本技术所述功能的其它电子单元或其组合中。
162.对于软件实现,可通过执行本文所述功能的单元来实现本文所述的技术。软件代码可存储在存储器中并通过处理器执行。存储器可以在处理器中或在处理器外部实现。
163.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单
元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
164.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
165.在本技术所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
166.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
167.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
168.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
169.以上所述仅是本技术的具体实施方式,使本领域技术人员能够理解或实现本技术。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本技术的精神或范围的情况下,在其它实施例中实现。因此,本技术将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1