用户行为预测方法、装置、电子设备及可读存储介质与流程

文档序号:32519296发布日期:2022-12-13 18:23阅读:72来源:国知局
用户行为预测方法、装置、电子设备及可读存储介质与流程

1.本技术涉及数据处理技术领域,具体而言,涉及一种用户行为预测方法、装置、电子设备及可读存储介质。


背景技术:

2.目前的付费预测(比如预测发生下一次购买的概率)大多都是先获得一堆的用户行为特征,然后利用预先基于用户行为特征训练得到的分类模型来预测。由于付费的正样本比较稀疏,因此基于分类模型进行预测的准确性不能保证;并且,准确提取付费的相关的特征存在很大的难度,通常要提取几十个甚至上百个特征作为预测时使用的行为特征,使得导致特征加工上需要耗费很大的成本。


技术实现要素:

3.本技术实施例提供了一种用户行为预测方法、装置、电子设备及可读存储介质,其能够科学化地对用户未来的付费行为情况进行预测,并且预测时使用的特征不多,可以大大提高预测的速度。
4.本技术的实施例可以这样实现:
5.第一方面,本技术实施例提供一种用户行为预测方法,包括:
6.根据目标用户在预设时间段内的历史购买行为数据,获得所述目标用户的行为特征,其中,所述行为特征包括对购买日期进行去重统计后得到的购买总天数、所述预设时间段内首次购买到最后一次购买的第一时间差、及所述预设时间段内首次购买到所述预设时间段的终点的第二时间差;
7.基于贝塔几何bg模型,根据所述购买总天数、第一时间差及第二时间差,对所述目标用户在所述预设时间段之后的下一次购买情况进行预测,获得预测结果。
8.第二方面,本技术实施例提供一种用户行为预测装置,包括:
9.特征获取模块,用于根据目标用户在预设时间段内的历史购买行为数据,获得所述目标用户的行为特征,其中,所述行为特征包括对购买日期进行去重统计后得到的购买总天数、所述预设时间段内首次购买到最后一次购买的第一时间差、及所述预设时间段内首次购买到所述预设时间段的终点的第二时间差;
10.预测模块,用于基于贝塔几何bg模型,根据所述购买总天数、第一时间差及第二时间差,对所述目标用户在所述预设时间段之后的下一次购买情况进行预测,获得预测结果。
11.第三方面,本技术实施例提供一种电子设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器可执行所述机器可执行指令以实现前述实施方式中任意一项所述的用户行为预测方法。
12.第四方面,本技术实施例提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述实施方式中任意一项所述的用户行为预测方法。
13.本技术实施例提供的用户行为预测方法、装置、电子设备及可读存储介质,根据目
标用户在预设时间段内的历史购买行为数据,获得该目标用户在该预设时间段内的购买总天数、首次购买到最后一次购买的第一时间差、首次购买到该预设时间段的终点的第二时间差,其中,购买总天数是通过对购买日期进行去重统计后得到的;然后基于bg模型,根据上述购买总天数、第一时间差及第二时间差,对该目标用户在预设时间段之后的下一次购买行为进行预测,获得预测结果。由此,可科学化地对用户未来的付费行为进行预测,并且预测时使用的特征不多,可以大大提高预测的速度。
附图说明
14.为了更清楚地说明本技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
15.图1为本技术实施例提供的电子设备的方框示意图;
16.图2为本技术实施例提供的用户行为预测方法的流程示意图之一;
17.图3为本技术实施例提供的用户行为预测方法的流程示意图之二;
18.图4为本技术实施例提供的预测结果的显示示意图;
19.图5为本技术实施例提供的用户行为预测方法的流程示意图之三;
20.图6为本技术实施例提供的用户行为预测装置的方框示意图之一;
21.图7为本技术实施例提供的用户行为预测装置的方框示意图之二。
22.图标:100-电子设备;110-存储器;120-处理器;130-通信单元;200-用户行为预测装置;210-时长确定模块;220-特征获取模块;230-预测模块。
具体实施方式
23.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本技术实施例的组件可以以各种不同的配置来布置和设计。
24.因此,以下对在附图中提供的本技术的实施例的详细描述并非旨在限制要求保护的本技术的范围,而是仅仅表示本技术的选定实施例。基于本技术的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本技术保护的范围。
25.需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
26.下面结合附图,对本技术的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。
27.请参照图1,图1为本技术实施例提供的电子设备100的方框示意图。所述电子设备100可以是,但不限于,电脑、服务器等。所述电子设备100包括存储器110、处理器120及通信单元130。所述存储器110、处理器120以及通信单元130各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。
28.其中,存储器110用于存储程序或者数据。所述存储器110可以是,但不限于,随机存取存储器(random access memory,ram),只读存储器(read only memory,rom),可编程只读存储器(programmable read-only memory,prom),可擦除只读存储器(erasable programmable read-only memory,eprom),电可擦除只读存储器(electric erasable programmable read-only memory,eeprom)等。
29.处理器120用于读/写存储器110中存储的数据或程序,并执行相应地功能。比如,存储器110中存储有用户行为预测装置200,所述用户行为预测装置200包括至少一个可以软件或固件(firmware)的形式存储于所述存储器110中的软件功能模块。所述处理器120通过运行存储在存储器110内的软件程序以及模块,如本技术实施例中的用户行为预测装置200,从而执行各种功能应用以及数据处理,即实现本技术实施例中的用户行为预测方法。
30.通信单元130用于通过网络建立所述电子设备100与其它通信终端之间的通信连接,并用于通过所述网络收发数据。
31.应当理解的是,图1所示的结构仅为电子设备100的结构示意图,所述电子设备100还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
32.请参照图2,图2为本技术实施例提供的用户行为预测方法的流程示意图之一。所述方法可应用于上述电子设备100。下面对用户行为预测方法的具体流程进行详细阐述。该方法可以包括步骤s120及步骤s130。
33.步骤s120,根据目标用户在预设时间段内的历史购买行为数据,获得所述目标用户的行为特征。
34.在本实施例中,所述目标用户为需要被预测后续购买行为的用户,具体可以根据实际需求确定。比如,针对某个平台已经流失的用户,预测该用户在未来在该平台发生购买的可能性,也即在该平台付费的可能性,那么该平台已经流失的用户就是目标用户。
35.在确定目标用户的情况下,可获得该目标用户在预设时间段内的历史购买行为数据。该预设时间段的起点与当前时间的时间间隔,大于该预设时间段的终点与当前时间的时间间隔。该预设时间段的具体时长、起点及终点可以根据实际需求设置,比如,将所述预设时间点的终点设置为当前时间。
36.所述历史购买行为数据中可以包括在所述预设时间段内的购买记录,每条购买记录中可以至少包括购买日期。可以根据该历史购买行为数据,得到该目标用户的行为特征。
37.其中,所述行为特征包括对购买日期进行去重统计后得到的购买总天数、所述预设时间段内首次购买到最后一次购买的第一时间差、及所述预设时间段内首次购买到所述预设时间段的终点的第二时间差。对购买日期进行去重统计,是指在获得所述购买总天数的过程中,若一天内进行了多次购买,则只统计一次该日期。通过该方式获得购买总天数,可以保证后续预测下一次购买的时间点及概率的准确性。
38.比如,预设时间段为5.1~5.31,该目标用户在5月1日进行了两次购买,在5月10日进行了三次购买,则统计出的购买总天数为2天:5月1日、5.10日;所述第一时间差与5月1日与5.10两者的时间差:9天;所述第二时间差为5月1日与5月31日两者的时间差:30天。
39.步骤s130,基于贝塔几何bg模型,根据所述购买总天数、第一时间差及第二时间差,对所述目标用户在所述预设时间段之后的下一次购买情况进行预测,获得预测结果。
40.在获得所述行为特征后,可以利用bg模型拟合所述购买总天数、第一时间差及第二时间差,以构建出适用于该目标用户的模型——bgf模型,从而利用该bgf模型获得所述目标用户的预测结果。其中,所述预测结果为对所述目标用户在所述预设时间段之后的下一次购买情况进行预测的结果,接上述举例,则是预测该目标用户在5月31日之后进行的第一次购买的情况。
41.其中,将购买总天数作为frequency、第一时间差作为recency、第二时间差作为t,输入到上述bg模型中,从而获得所述预测结果。bg模型是基于假设设计的概率预测模型,用于描述非契约客户关系情境下重复购买行为,即用户可以随时购买产品,无时间约束。
42.由此,通过将目标用户的购买总天数、第一时间差及第二时间差输入到bg模型中,即可获得该目标用户下一次购买的预测情况。该方式可科学化地对用户未来的付费行为进行预测,并且预测时使用的特征不多,可以大大提高预测的速度。
43.请参照图3,图3为本技术实施例提供的用户行为预测方法的流程示意图之二。在步骤s120之前,所述方法还可以包括步骤s111及步骤s112。
44.步骤s111,预先获得多个用户的历史购买时间间隔。
45.步骤s112,对获得的多个历史购买时间间隔进行排序,并将位于预设位置处的历史购买时间间隔作为所述预设时间段的时长。
46.在本实施例中,可针对多个用户中的每个用户,计算该用户相邻两次付费的付费时间间隔,以作为该用户的历史购买时间间隔。其中,所述多个用户可以为任意的用户,也可以是与目标用户同类型的用户,比如,均为某平台的流失用户。
47.可选地,上述历史购买时间间隔可以是用户购买某个商品的时间间隔,也可以是用户购买某类商品的时间间隔,还可以是在目标平台进行付费的时间间隔等,具体可以根据实际需求设置。可以理解的是,所述历史购买行为数据与计算所述历史购买时间间隔时针对的对象相同。
48.比如,可计算多个用户各自在目标平台的历史购买时间间隔;在后续进行预测时,则获得所述目标用户在所述预设时间段内在目标平台的购买行为数据作为所述历史购买行为数据。由此,后续可预测出该目标用户在该目标平台发生下一次购买的相关情况。
49.在获得多个历史购买时间间隔后,可将多个历史购买时间间隔按照由小到大的顺序进行排序,然后将排序结果中预设位置处的历史购买时间间隔作为用户购买的周期。该周期为所述预设时间段的时长。其中,所述预设位置可以根据实际需求设置,比如,第90%的分位数。所述预设位置可以不是最后一位。通过该方式确定出的周期可以涵盖绝大多数的购买行为,同时减少将异常的历史购买时间间隔作为周期的概率。
50.在确定计算行为特征时使用的周期后,可针对目标用户执行上述步骤s120及步骤s130。其中,若目标用户为多个,则可以针对每个目标用户分别执行上述步骤s120及步骤s130。
51.在获得所述目标用户在所述预设时间段内的历史购买行为数据的情况下,可以根据所述历史购买行为数据,通过计算得到初始行为特征。其中,所述初始行为特征中包括初始购买总天数、初始第一时间差及初始第二时间差。所述初始购买总天数为直接对所述历史购买行为数据中的购买日期进行去重统计得到的天数。所述初始第一时间差为将所述历史购买行为数据中的最大购买日期减去最小购买日期得到的时间间隔。所述初始第二时间差为将所述历史购买行为数据中的最小购买日期减少所述预设时间段的终点日期得到的时间间隔。
52.在获得所述初始行为特征后,可判断所述初始行为特征中是否存在空置,也即基于所述历史购买行为数据直接得到的初始购买总天数、初始第一时间差及初始第二时间差中是否存在空值。若存在,则将该目标用户的行为特征删除,不对该目标用户进行预测。
53.在所述初始行为特征中不存在空值的情况下,可以判断该初始行为特征中是否包括异常值。也即,判断该目标用户的初始购买总天数、初始第一时间差及初始第二时间差中是否存在异常值。
54.可选地,可以将各值与该值所对应的预设范围进行比较。若某值不在所对应的预设范围内,则可以确定该值为异常值。比如,所述初始第一时间差不在对应的预设范围内,则可以确定该初始第一时间差为异常值。其中,所述预设范围可以是对正常值进行分析后设置的。
55.在所述初始行为特征中存在异常值的情况下,可对所述初始行为特征中的异常值进行调整,以获得所述行为特征,也即将调整后的初始行为特征作为预测时使用的行为特征。
56.作为一种可选的实施方式,针对异常值,可先获得该异常值与所对应的预设范围的偏离程度。若偏离程度在预设程度内,则可以对该异常值进行调整,比如将异常值与一确定的倍数值相乘,并将所得结果作为调整后的值。如,异常值为a,a大于预设范围的最大值,但偏离程度在预设程度内,则可以将a与所对应的倍数值b(b小于1)相乘,并将a*b作为调整后的值。或者,a小于预设范围的最小值,但偏离程度在预设程度内,则可以将a与所对应的倍数值c(c大于1)相乘,并将a*c作为调整后的值。
57.若偏离程度不在预设程度内,则可以删除该目标用户的行为特征删除,不对该目标用户进行预测,以避免得到可信度非常低的预测结果。
58.在所述初始行为特征中不存在空值、且不存在异常值的情况下,可直接将该初始行为特征作为预测时使用的行为特征。
59.在获得所述行为特征的情况下,可以基于bg模型,根据所述购买总天数、第一时间差及第二时间差,计算得到所述目标用户下一次购买的概率;和/或,基于bg模型,根据所述购买总天数、第一时间差及第二时间差,计算得到所述目标用户下一次购买的发生日期。由此,可以获得包括下一次购买的概率和/或下一次购买的发生日期的预测结果。
60.其中,bg模型的基本原理如下:(1)付费的用户的两次购买时间间隔服从交易率为τ的指数分布。基于原理(1)可以获得下一次购买与所述预设时间段内的最后一次购买的时间间隔:
[0061][0062]
其中,ti表示下一次购买的日期,
ti-1
表示所述预设时间段内的最后一次购买的日
期。基于上述时间间隔f(ti,t
i-1
τ)及所述预设时间段内的最后一次购买的日期,即可计算得到下一次购买的日期,即下一次购买的发生日期。
[0063]
bg模型的基本原理还包括:(2)经过任意购买次数后,用户不购买的概率为p,则用户经过购买i次后不继续购买的概率为:
[0064]
f(p,i)=p(1-p)
i-1
[0065]
其中,f(p,i)表示用户经过购买i次后不继续购买的概率为p。
[0066]
对应地,在本方案中,用户经过i-1次不继续购买的概率为:
[0067]
f(p,i-1)=p(1-p)
i-2
[0068]
基于上述概率f(p,i-1),即可计算得到下一次购买的概率为1-f(p,i-1),也即得到了第i次购买的概率。
[0069]
由此,可获得下一次购买的概率以及下一次购买的发生日期。
[0070]
在获得所述预测结果之后,可对该预测结果进行显示,以便相关人员可获得该信息。可选地,可以单独显示每个目标用户的预测结果,也可以对多个目标用户的预测结果进行汇总显示。在显示多个目标用户的预测结果时,可以对应显示各目标用户的用户标识,以便区别。作为一种可选的实施方式中,可如图4所示,对多个目标用户的预测结果进行汇总显示。其中,图4中的最后一列predicted_purchases表示用户在未来会去购买付费的可能性。
[0071]
请参照图5,图5为本技术实施例提供的用户行为预测方法的流程示意图之三。在步骤s130之后,所述方法还可以包括步骤s140。
[0072]
步骤s140,根据所述目标用户的预测结果,确定是否向该目标用户发放目标资源。
[0073]
在获得所述目标用户的预测结果的情况下,可根据该预测结果中的下一次购买的概率和/或下一次购买的发生日期,判断是否向该目标用户发送目标资源。在是的情况下,则向该目标用户发送目标资源。在不是的情况下,则不向该目标用户发送目标资源。
[0074]
其中,具体判断规则及目标资源具体可以根据实际情况确定。比如,所述判断规则为在下一次购买的概率及发生日期均满足一定要求(比如,概率大于一定概率且日期在未来十四天内)的情况下,确定该目标用户为需要发送目标资源的用户;若一目标用户的预测结果满足了上述要求,则可以向目标用户投放礼包,以对该目标用户进行召回。通过该方式,可以保证roi(return on investment,投资回报率)大于1。
[0075]
可选地,在获得大量目标用户的预测结果的情况下,可以对预测结果进行分析,以得到满足工作人员特定需求的分析结果,从而实现更深入洞察。比如,分析在未来具有不同付费可能性的用户当下的行为特征差异。
[0076]
本技术实施例可以基于bg模型、购买总天数、第一时间差及第二时间差,科学化地预测用户未来付费的可能性,并且使用的特征不多,可大大缩短预测的速度。在预测之后,可基于预测结果确定礼包投放对象,以大大缩短投放成本,最大化roi。同时,还可以基于得到的预测结果进行数据分析,得到相应的分析结果。
[0077]
为了执行上述实施例及各个可能的方式中的相应步骤,下面给出一种用户行为预测装置200的实现方式,可选地,该用户行为预测装置200可以采用上述图1所示的电子设备100的器件结构。进一步地,请参照图6,图6为本技术实施例提供的用户行为预测装置200的方框示意图之一。需要说明的是,本实施例所提供的用户行为预测装置200,其基本原理及
产生的技术效果和上述实施例相同,为简要描述,本实施例部分未提及之处,可参考上述的实施例中相应内容。所述用户行为预测装置200可以包括:特征获取模块220及预测模块230。
[0078]
所述特征获取模块220,用于根据目标用户在预设时间段内的历史购买行为数据,获得所述目标用户的行为特征。其中,所述行为特征包括对购买日期进行去重统计后得到的购买总天数、所述预设时间段内首次购买到最后一次购买的第一时间差、及所述预设时间段内首次购买到所述预设时间段的终点的第二时间差。
[0079]
所述预测模块230,用于基于贝塔几何bg模型,根据所述购买总天数、第一时间差及第二时间差,对所述目标用户在所述预设时间段之后的下一次购买情况进行预测,获得预测结果。
[0080]
可选地,在本实施例中,所述预测结果包括下一次购买的概率和/或下一次购买的发生日期,所述预测模块230具体用于:基于bg模型,根据所述购买总天数、第一时间差及第二时间差,计算得到所述目标用户下一次购买的概率;和/或,基于bg模型,根据所述购买总天数、第一时间差及第二时间差,计算得到所述目标用户下一次购买的发生日期。
[0081]
可选地,在本实施例中,所述特征获取模块220具体用于:根据所述历史购买行为数据,通过计算得到初始行为特征,其中,所述初始行为特征中包括初始购买总天数、初始第一时间差及初始第二时间差;判断所述初始行为特征中是否包括异常值;在不包括异常值的情况下,将所述初始行为特征作为所述行为特征;在包括异常值的情况下,对所述初始行为特征中的异常值进行调整,以获得所述行为特征。
[0082]
请参照图7,图7为本技术实施例提供的用户行为预测装置200的方框示意图之二。在本实施例中,所述用户行为预测装置200还可以包括时长确定模块210。
[0083]
所述时长确定模块210,用于:预先获得多个用户的历史购买时间间隔;对获得的多个历史购买时间间隔进行排序,并将位于预设位置处的历史购买时间间隔作为所述预设时间段的时长。
[0084]
可选地,在本实施例中,所述历史购买行为数据为所述目标用户在所述预设时间段内在目标平台的购买行为数据,所述时长确定模块210具体用于:预先获得在多个用户在所述目标平台的历史购买时间间隔。
[0085]
可选地,在本实施例中,所述用户行为预测装置200还可以包括显示模块,所述显示模块用于:对所述目标用户的预测结果进行显示。
[0086]
可选地,在本实施例中,所述用户行为预测装置200还可以包括处理模块,所述处理模块用于:根据所述目标用户的预测结果,确定是否向该目标用户发放目标资源。
[0087]
可选地,上述模块可以软件或固件(firmware)的形式存储于图1所示的存储器110中或固化于电子设备100的操作系统(operating system,os)中,并可由图1中的处理器120执行。同时,执行上述模块所需的数据、程序的代码等可以存储在存储器110中。
[0088]
本技术实施例还提供一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述的用户行为预测方法。
[0089]
综上所述,本技术实施例提供一种用户行为预测方法、装置、电子设备及可读存储介质,根据目标用户在预设时间段内的历史购买行为数据,获得该目标用户在该预设时间段内的购买总天数、首次购买到最后一次购买的第一时间差、首次购买到该预设时间段的
终点的第二时间差,其中,购买总天数是通过对购买日期进行去重统计后得到的;然后基于bg模型,根据上述购买总天数、第一时间差及第二时间差,对该目标用户在预设时间段之后的下一次购买行为进行预测,获得预测结果。由此,可科学化地对用户未来的付费行为进行预测,并且预测时使用的特征不多,可以大大提高预测的速度。
[0090]
在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本技术的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0091]
另外,在本技术各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
[0092]
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0093]
以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1