用户复购概率预测/用户质量确定方法、装置及电子设备与流程

文档序号:11200830阅读:383来源:国知局
用户复购概率预测/用户质量确定方法、装置及电子设备与流程

本发明实施例涉及互联网技术领域,尤其涉及一种用户复购概率预测方法、装置及电子设备。



背景技术:

在o2o(onlinetoofflin,在线离线/线上到线下)领域,新用户(买家)的复购率是衡量商户质量的一个重要指标,而商户质量又是平台确定如何对商户进行新用户补贴的重要依据。例如,某天在一个商户中有大量的新用户,而新用户的复购率较低,则说明这个商户中这天的新用户质量较差,不能为o2o电子商务平台带来有效的收益;这种情况下,平台可以限制对该商户的新用户补贴,以减少平台损失。

复购概率是指消费者在平台进行第2次购买行为的可能性。复购行为可以是按天确定的复购行为,也可以是按小时确定的复购行为,甚至按月确定的复购行为。在实际应用中,最为常见的是按天确定的复购行为。在按天确定复购行为时,不管用户第一次购买行为当天又进行了多少次购买,都只算作第一次购买;这种情况下,用户复购概率可以是3天复购概率、7天复购概率、15天复购概率等。

现有技术中,新用户的复购率通常采用如下两种方式确定:1)在实际复购行为发生后,根据用户实际复购行为确定;2)在用户的第一次购买行为发生后,平台运营人员根据用户特征,利用人工经验对该用户的复购概率进行预测,然后再根据各个新用户的复购概率的预测值确定新用户的复购率。然而,上述两种方式均存在一些缺点。其中,由于第一种方式只能在实际复购行为发生后才能计算获得,而无法提前得到,因而数据的时效性较低。例如,只能得到7天前新用户的7天复购率,而平台根据该数据限制商户新用户补贴的行为通常发生在小于7天的时间范围内(如3天),因此,该数据对平台而言已经失效。上述第二种方式虽可提前预测用户的复购概率,并依据用户的复购概率计算出新用户的复购率,但由于用户复购概率的预测要依赖人工经验,因此对人的要求比较高,且不同人预测的结果可能并不相同,因而预测的准确率及效率均无法保证,从而无法保证新用户复购率的准确率及效率。

从上述分析可以看出,现有技术存在预测准确率及预测效率均较低的问题。



技术实现要素:

本发明实施例提供了一种用户复购概率预测方法、装置及电子设备,以及一种用户质量确定方法、装置及电子设备,用以解决现有技术中用户复购概率的预测准确率及预测效率均较低的问题。

第一方面,本发明实施例提供了一种用户复购概率预测方法,该方法包括:从训练样本集中学习获得用户复购概率的预测模型;所述训练样本包括历史用户的特征数据集和复购标记之间的对应记录;获取待预测用户的特征数据集;将所述待预测用户的特征数据集作为所述预测模型的输入,通过所述预测模型获得所述待预测用户的复购概率预测值。

结合第一方面,本发明在第一方面第一种可能的实现方式中,通过迭代决策树gbdt模型与逻辑回归模型组合的方式,从所述训练样本集中学习获得所述预测模型。

结合第一方面的第一种实现方式,本发明在第一方面第二种可能的实现方式中,若所述预测模型的预测准确率低于预设阈值,则重新设置所述gbdt模型和/或所述逻辑回归模型的模型参数,并根据重置的模型参数重新学习获得所述预测模型。

结合第一方面、第一方面的第一种实现方式或第一方面的第二种实现方式,本发明在第一方面第三种可能的实现方式中,所述特征数据包括:订单特征数据,用户行为特征数据;所述获取待预测用户的特征数据集,包括:从所述待预测用户的订单数据中提取所述订单特征数据;从所述待预测用户的用户行为数据中提取所述用户行为特征数据。

第二方面,本发明实施例还提供了一种用户复购概率预测装置,所述装置包括:预测模型生成单元,用于从训练样本集中学习获得用户复购概率的预测模型;所述训练样本包括历史用户的特征数据集和复购标记之间的对应记录;特征数据获取单元,用于获取待预测用户的特征数据集;复购概率预测单元,用于将所述待预测用户的特征数据集作为所述预测模型的输入,通过所述预测模型获得所述待预测用户的复购概率预测值。

所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中,所述用户复购概率预测装置的结构中包括处理器和存储器,所述存储器用于存储支持所述用户复购概率预测装置执行上述第一方面中所述用户复购概率预测方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述用户复购概率预测装置还可以包括通信接口,用于所述用户复购概率预测装置与其他设备或通信网络通信。

第三方面,本发明实施例提供了一种计算机存储介质,用于储存所述用户复购概率预测装置所用的计算机软件指令,其包含用于执行上述第一方面中所述用户复购概率预测方法为所述用户复购概率预测装置所涉及的程序。

第四方面,本发明实施例提供了一种用户质量确定方法,该方法包括:获取待处理的第一用户的多个第二用户;根据所述第二用户的特征数据集,通过预先生成的预测模型获得所述多个第二用户的复购概率预测值;根据所述复购概率预测值,确定所述多个第二用户的用户质量;根据不同用户质量的所述第二用户的数量分别与所述第二用户的总数量的比值,确定所述第一用户的第二用户质量。

第五方面,本发明实施例还提供了一种用户质量确定装置,所述装置包括:第二用户获取单元,用于获取待处理的第一用户的多个第二用户;复购概率预测单元,用于根据所述第二用户的特征数据集,通过预先生成的预测模型获得所述多个第二用户的复购概率预测值;第一用户质量确定单元,用于根据所述复购概率预测值,确定所述多个第二用户的用户质量;第二用户质量确定单元,用于根据不同用户质量的所述第二用户的数量分别与所述第二用户的总数量的比值,确定所述第一用户的第二用户质量。

所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中,所述用户质量确定装置的结构中包括处理器和存储器,所述存储器用于存储支持所述用户质量确定装置执行上述第四方面中所述用户质量确定方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述用户质量确定装置还可以包括通信接口,用于所述用户质量确定装置与其他设备或通信网络通信。

第六方面,本发明实施例提供了一种计算机存储介质,用于储存所述用户质量确定装置所用的计算机软件指令,其包含用于执行上述第四方面中所述用户质量确定方法为所述用户质量确定装置所涉及的程序。

本发明实施例提供的用户复购概率预测方法,通过从训练样本集中学习获得用户复购概率的预测模型,并将待预测用户的特征数据集作为预测模型的输入,通过预测模型获得待预测用户的复购概率预测值;这种处理方式,使得可根据用户的较多特征维度的数据,通过预测模型自动获得待预测用户的复购概率预测值;因此,可以有效提高预测准确率及预测效率。

本发明实施例提供的用户质量确定方法,通过获取待处理的第一用户的多个第二用户,并根据第二用户的特征数据集,通过预先生成的预测模型获得多个第二用户的复购概率预测值;再根据复购概率预测值,确定多个第二用户的用户质量;又根据不同用户质量的第二用户的数量分别与第二用户的总数量的比值,确定第一用户的第二用户质量;这种处理方式,使得可自动确定第一用户的第二用户质量;因此,可以有效提高处理准确率及处理效率。

本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了根据本发明一个实施例的用户复购概率预测方法流程示意图;

图2示出了根据本发明一个实施例的用户复购概率预测方法预测模型示意图;

图3示出了根据本发明一个实施例的用户复购概率预测方法具体流程示意图;

图4示出了根据本发明一个实施例的用户复购概率预测装置的框图;

图5示出了根据本发明一个实施例的用户质量确定方法流程示意图;

图6示出了根据本发明一个实施例的用户质量确定装置的框图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。

在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1,为本发明的用户复购概率预测方法一个实施例的流程图,该方法包括如下步骤:

步骤101,用户复购概率预测装置从训练样本集中学习获得用户复购概率的预测模型。

所述训练样本集包括多个训练样本,所述训练样本的数量可根据具体业务需求确定。所述训练样本包括历史用户的特征数据集和复购标记之间的对应记录。

所述历史用户包括o2o平台的历史新用户,例如,过去一段时间(如,三个月)内的新用户即为历史新用户。所述训练样本集包括的多个历史用户可以是不同商户的历史新用户。

所述特征数据集包括用户的多个特征维度的数据。所述特征数据集可以包括用户的订单特征,也可以包括用户的行为特征,还可以同时包括用户的订单特征和行为特征。其中,订单特征包括但不限于:订单金额、优惠金额、配送时间、是否为物流订单、用户性别、所属城市、下订单的渠道来源,商户是否为重要商户(keyaccount,简称ka),是否在配送范围内等特征。用户的行为特征包括但不限于:进入o2o平台的入口来源,用户的下单时间、用户整个下单路径的时间等。

所述复购标记,是指历史用户在第一次购买行为后是否实际复购过的标记。如果历史用户在第一次购买行为后实际进行了复购,则所述复购标记被设置为是;如果历史用户在第一次购买行为后并未进行复购,则可将所述复购标记设置为否。

一个历史用户的特征数据集与该用户的复购标记之间的对应记录形成一个训练样本。请参见表1,其为由多个训练样本构成的训练样本示例集。

表1、训练样本示例集

用户复购概率预测装置要从训练样本集中学习获得所述预测模型,首先需要获取训练样本集,然后再根据选取的机器学习模型从训练样本集中学习获得所述预测模型。

下面首先以7天复购概率为例,说明训练样本集的生成方式。在生成训练样本集时,可采用如下过程实现:

1)首先收集过去一段时间(如,三个月或半年等)内新用户(即历史用户)的样本数据,以及这些新用户的复购情况。在收集到历史用户的样本数据后,根据历史用户的复购情况为各个历史用户样本打标签(即复购标记),标明哪些用户在7天内复购过,如果新用户曾经复购国,则将其复购标记设置为是(如,1表示是),如果没有复购,则将其复购标记设置为否(如,0表示否),由此可形成一个数据集,其中每条数据包括:用户标识,是否复购(值为0或1)。

2)在形成上述数据集后,需要分析上述历史用户的样本数据,确定需要的特征维度,如,特征维度包括订单特征和用户的行为特征,其中,订单特征包括:订单金额、优惠金额、配送时间、是否为物流订单、用户性别、所属城市、下订单的渠道来源,商户是ka,是否在配送范围内等特征;用户的行为特征包括:进入o2o平台的入口来源,用户的下单时间、用户整个下单路径的时间等。

3)根据分析出的特征维度信息,从历史用户的样本中提取出所需要的特征维度的数据,形成特征向量。特征向量的具体形成过程可以为:a)逐条读入历史用户的样本中的数据;b)对读入的数据逐个特征维度进行判断,如果命中某一个特征维度,则在当前的位置上置为1,如果没有命中,则置为0,如下单的商户为ka商户,则在当前位置上置为0,如果不是则为0;c)在经过逐个特征维度进行判断后,每一条历史用户样本会形成如(1,0,1,0,1,1,1,1,0,0,0……)的特征向量;d)将各个历史用户的特征向量保存成文件。

经过上述过程即可生成训练样本集,其中,用户实际复购过的样本为正样本,未实际复购过的样本为负样本,训练样本集包括多个正样本和多个负样本。

获取到训练样本集后,还需要选取合适的机器学习模型。所述机器学习模型可以为单一的机器学习模型,例如,决策树模型、逻辑回归模型、神经网络模型等;所述机器学习模型还可以为多个机器学习模型组合而成的机器学习模型,例如,迭代决策树模型(gradientboostdecisiontree,gbdt)结合逻辑回归模型的组合模型。

需要注意的是,在特征维度较少、而训练样本较多的情况下,如果采用单一的机器学习模型(如,决策树模型或逻辑回归模型等),则可能导致训练出的预测模型的准确率较低的情况出现,例如,特征维度的总数为30多个,而每天的新用户总数大概5万以上(即三个月的训练样本总量在450万以上)时。

为了提高预测模型的预测准确率,可运用特征工程的方法,尽可能的扩展出一些组合特征。参见图2,其为本实施例采用的机器学习模型,模型输入x为一个特征向量。在本实施例中,选用的机器学习模型是gbdt模型结合逻辑回归模型的组合模型。gbdt是一种常用的非线性模型。它基于集成学习中的boosting思想,每一次的计算是为了减少上一次的残差,而为了消除残差,可以在残差减少的梯度(gradient)方向上建立一个新的模型。所以说,在gradientboost中,每个新的模型的建立是为了使得之前模型的残差往梯度方向减少。gbdt的思想使其可以发现多种有区分性的特征以及特征组合,决策树的路径可以直接作为逻辑回归模型的输入特征使用,省去了人工寻找特征、特征组合的步骤。

具体实施时,用户复购概率预测装置执行的训练过程可包括如下步骤:1)读取上一阶段形成的特征向量;2)对预测模型进行训练,得到每个特征维度的权重;3)保存训练得到的各特征维度的权重。

需要说明的是,在实际应用中,可根据预设的时间间隔,定期从训练样本集中学习获得用户复购概率的预测模型,例如,每隔10天或每天训练一次,生成一个新的预测模型。预测模型的各个特征维度的权重保存在一个文件中,在利用该模型对新用户的复购概率进行预测时,可以从文件中读取到这些权重。

步骤102,获取待预测用户的特征数据集。

所述待预测用户是指需要对其未来是否会复购的可能性进行预测的用户。所述待预测用户的特征数据集与上述训练样本的特征数据集具有相同的特征维度,只是不同用户具有的特征数据可能并不相同。

要获取待预测用户的特征数据集,可包括如下具体步骤:从所述待预测用户的订单数据中提取所述订单特征数据;从所述待预测用户的用户行为数据中提取所述用户行为特征数据。

在提取所述订单特征数据和所述用户行为特征数据时,可对读入的订单数据和用户行为数据逐个特征维度进行判断,如果命中某一个特征维度,则在当前的位置上置为1,如果没有命中,则置为0,如下单的商户为ka商户,则在当前位置上置为0,如果不是则为0。

步骤103,将所述待预测用户的特征数据集作为所述预测模型的输入,通过所述预测模型获得所述待预测用户的复购概率预测值。

用户复购概率预测装置获取到待预测用户的特征数据集之后,就可以将待预测用户的特征数据集作为预测模型的输入,通过预测模型获得待预测用户的复购概率的预测值。

参见图3,其为本实施例的用户复购概率预测方法的具体流程示意图。通过该图,可直观地理解本发明实施例的用户复购概率预测方法。由图3可见,本实施例的用户复购概率预测方法包括两个阶段的处理过程,即:预测模型生成阶段的处理过程和新用户预测的处理过程。在预测模型生成阶段,首先需要收集过去三个月的新用户样本数据,然后通过分析特征确定特征维度,接下来再提取样本中的特征向量,最后从训练样本集中学习获得用户复购概率的预测模型。在新用户预测阶段,首先需要获取新用户的特征数据集,然后就可以通过预先生成的预测模型获得新用户的复购概率的预测值。

需要注意的是,由图3可见,本实施例为了保证预测模型达到一定的准确率,在训练生成一个新的预测模型后,将根据验证集计算模型预测的准确率,如果准确率达到预设阈值(如,90%),则可将该预测模型确定为实际可用的模型,如果准确率未达到预设阈值,则可通过人工调整的方式或机器自动调整的方式对模型参数(如,决策树的深度、决策树的数量等参数)进行调整,并根据调整后的模型参数,从训练样本集中重新学习获得用户复购概率的预测模型,直至准确率达到预设阈值,再保存模型。其中,预设阈值可根据经验确定。

从上述实施例可以看出,本发明实施例提供的用户复购概率预测方法,通过从训练样本集中学习获得用户复购概率的预测模型,并将待预测用户的特征数据集作为预测模型的输入,通过预测模型获得待预测用户的复购概率预测值;这种处理方式,使得可根据用户的较多特征维度的数据,通过预测模型自动获得待预测用户的复购概率预测值;因此,可以有效提高预测准确率及预测效率。

参见图4,为本发明的用户复购概率预测装置一个实施例的结构示意图。如图4所示,该用户复购概率预测装置包括:预测模型生成单元401,用于从训练样本集中学习获得用户复购概率的预测模型;特征数据获取单元402,用于获取待预测用户的特征数据集;复购概率预测单元403,用于将所述待预测用户的特征数据集作为所述预测模型的输入,通过所述预测模型获得所述待预测用户的复购概率预测值。

其中,所述预测模型生成单元401,可具体用于通过迭代决策树gbdt模型与逻辑回归模型组合的方式,从所述训练样本集中学习获得所述预测模型。

从上述实施例可以看出,本发明实施例提供的用户复购概率预测装置,通过从训练样本集中学习获得用户复购概率的预测模型,并将待预测用户的特征数据集作为预测模型的输入,通过预测模型获得待预测用户的复购概率预测值;这种处理方式,使得可根据用户的较多特征维度的数据,通过预测模型自动获得待预测用户的复购概率预测值;因此,可以有效提高预测准确率及预测效率。

在一个可能的设计中,用户复购概率预测装置的结构中包括处理器和存储器,所述存储器用于存储支持用户复购概率预测装置执行上述第一方面中用户复购概率预测方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理器调用执行。

所述处理器用于:从训练样本集中学习获得用户复购概率的预测模型;所述训练样本包括历史用户的特征数据集和复购标记之间的对应记录;获取待预测用户的特征数据集;将所述待预测用户的特征数据集作为所述预测模型的输入,通过所述预测模型获得所述待预测用户的复购概率预测值。

本发明实施例提供了一种计算机存储介质,用于储存用户复购概率预测装置所用的计算机软件指令,其包含用于执行上述第一方面中用户复购概率预测方法为用户复购概率预测装置所涉及的程序。

与上述实施例一提供的用户复购概率的预测方法相对应,本发明实施例还提供一种用户质量确定方法。

参见图5,为本发明的用户质量确定方法一个实施例的流程图,该方法包括如下步骤:

步骤501,获取待处理的第一用户的多个第二用户。

所述第一用户包括o2o平台商户。所述第二用户包括第一用户的新用户,例如,第一用户为商户a,其第二用户为商户a当天的所有新用户(买家)。

步骤502,根据所述第二用户的特征数据集,通过预先生成的预测模型获得所述多个第二用户的复购概率预测值。

具体实施时,本步骤可包括如下具体步骤:1)获取各个第二用户的特征数据集;2)针对各个第二用户,根据该第二用户的特征数据集,通过预先生成的预测模型获得该第二用户的复购概率预测值。

通过预先生成的预测模型获得第二用户的复购概率预测值的步骤与上述实施例一中的步骤s103相对应,相关说明请见实施例一中的相应说明,此处不在赘述。

步骤503,根据所述复购概率预测值,确定所述多个第二用户的用户质量。

不同复购概率预测值对应不同的用户质量,例如,复购概率预测值小于60%的新用户的质量较差,复购概率预测值大于等于80%的新用户的质量较好,复购概率预测值在60%至80%的新用户的质量一般。

步骤504,根据不同用户质量的所述第二用户的数量分别与所述第二用户的总数量的比值,确定所述第一用户的第二用户质量。

具体实施时,本步骤可包括如下具体步骤:1)计算获得不同用户质量的所述第二用户的数量分别与所述第二用户的总数量的比值;2)根据计算获得的比值和预设的用户质量确定规则,确定所述第一用户的第二用户质量。

在实际应用中,还可进一步根据第一用户的第二用户质量,确定对第一用户的处理方式。所述处理方式包括但不限于:限制对第一用户进行第二用户补贴,提高对第一用户进行第二用户补贴等方式。

所述用户质量确定规则,可以根据具体业务需求设置。例如,将用户质量确定规则设置为:若质量较差的新用户比值超过第一预设阈值,则将第一用户的第二用户质量确定为质量较差等。

在本实施例中,假设商户a在某天的所有新用户中,质量较差的新用户比值为40%,质量较好的新用户比值为35%,质量一般的新用户比值为25%,根据预设的用户质量确定规则,可确定该商户a的第二用户质量较差,再进一步根据预设的用户处理规则,可确定出对该商户a需要限制o2o平台对其进行新用户补贴的处理方式。

从上述实施例可以看出,本发明实施例提供的用户质量确定方法,通过获取待处理的第一用户的多个第二用户,并根据第二用户的特征数据集,通过预先生成的预测模型获得多个第二用户的复购概率预测值;再根据复购概率预测值,确定多个第二用户的用户质量;又根据不同用户质量的第二用户的数量分别与第二用户的总数量的比值,确定第一用户的第二用户质量;这种处理方式,使得可自动确定第一用户的第二用户质量;因此,可以有效提高处理准确率及处理效率。

参见图6,为本发明的用户质量确定装置一个实施例的结构示意图。如图6所示,该用户质量确定装置包括:第二用户获取单元601,用于获取待处理的第一用户的多个第二用户;复购概率预测单元602,用于根据所述第二用户的特征数据集,通过预先生成的预测模型获得所述多个第二用户的复购概率预测值;第一用户质量确定单元603,用于根据所述复购概率预测值,确定所述多个第二用户的用户质量;第二用户质量确定单元604,用于根据不同用户质量的所述第二用户的数量分别与所述第二用户的总数量的比值,确定第一用户的第二用户质量。

在一个可能的设计中,用户质量确定装置的结构中包括处理器和存储器,所述存储器用于存储支持用户质量确定装置执行上述第四方面中用户质量确定方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

所述程序包括一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理器调用执行。

所述处理器用于:获取待处理的第一用户的多个第二用户;根据所述第二用户的特征数据集,通过预先生成的预测模型获得所述多个第二用户的复购概率预测值;根据所述复购概率预测值,确定所述多个第二用户的用户质量;根据不同用户质量的所述第二用户的数量分别与所述第二用户的总数量的比值,确定第一用户的第二用户质量。

本发明实施例提供了一种计算机存储介质,用于储存用户质量确定装置所用的计算机软件指令,其包含用于执行上述第四方面中用户质量确定方法为用户质量确定装置所涉及的程序。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

本发明公开a1、一种用户复购概率预测方法,包括:

从训练样本集中学习获得用户复购概率的预测模型;

获取待预测用户的特征数据集;

将所述待预测用户的特征数据集作为所述预测模型的输入,通过所述预测模型获得所述待预测用户的复购概率预测值。

a2、如a1所述的方法,所述从训练样本集中学习获得用户复购概率的预测模型,采用如下方式:

通过迭代决策树gbdt模型与逻辑回归模型组合的方式,从所述训练样本集中学习获得所述预测模型。

a3、如a2所述的方法,还包括:

若所述预测模型的预测准确率低于预设阈值,则重新设置所述gbdt模型和/或所述逻辑回归模型的模型参数,并根据重置的模型参数重新学习获得所述预测模型。

a4、如a1至a3任一项所述的方法,所述特征数据包括:订单特征数据,用户行为特征数据;

所述获取待预测用户的特征数据集,包括:

从所述待预测用户的订单数据中提取所述订单特征数据;

从所述待预测用户的用户行为数据中提取所述用户行为特征数据。

a5、如a4所述的方法,所述订单特征数据包括:来源渠道,支付方式,物品特征,城市级别,时间特征。

a6、如a4所述的方法,所述用户行为特征数据包括:入口来源,点击特征,路径特征。

本发明还公开了b7、一种用户复购概率预测装置,包括:

预测模型生成单元,用于从训练样本集中学习获得用户复购概率的预测模型;

特征数据获取单元,用于获取待预测用户的特征数据集;

复购概率预测单元,用于将所述待预测用户的特征数据集作为所述预测模型的输入,通过所述预测模型获得所述待预测用户的复购概率预测值。

b8、如b7所述的装置,所述预测模型生成单元具体用于通过迭代决策树gbdt模型与逻辑回归模型组合的方式,从所述训练样本集中学习获得所述预测模型。

本发明还公开了c9、一种电子设备,包括存储器和处理器;其中,

所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理器调用执行;

所述处理器用于:

从训练样本集中学习获得用户复购概率的预测模型;获取待预测用户的特征数据集;将所述待预测用户的特征数据集作为所述预测模型的输入,通过所述预测模型获得所述待预测用户的复购概率预测值。

本发明还公开了d10、一种计算机存储介质,所述计算机存储介质存储有一条或多条计算机指令,所述计算机指令被执行时实现如a1-a6中任一项所述的方法。

本发明还公开了e11、一种用户质量确定方法,包括:

获取待处理的第一用户的多个第二用户;

根据所述第二用户的特征数据集,通过预先生成的预测模型获得所述多个第二用户的复购概率预测值;

根据所述复购概率预测值,确定所述多个第二用户的用户质量;

根据不同用户质量的所述第二用户的数量分别与所述第二用户的总数量的比值,确定所述第一用户的第二用户质量。

e12、如e11所述的方法,所述预测模型采用如下方式生成:

从训练样本集中学习获得所述预测模型。

e13、如e12所述的方法,其特征在于,所述从训练样本集中学习获得所述预测模型,采用如下方式:

通过迭代决策树gbdt模型与逻辑回归模型组合的方式,从所述训练样本集中学习获得所述预测模型。

本发明还公开了f14、一种用户质量确定装置,包括:

第二用户获取单元,用于获取待处理的第一用户的多个第二用户;

复购概率预测单元,用于根据所述第二用户的特征数据集,通过预先生成的预测模型获得所述多个第二用户的复购概率预测值;

第一用户质量确定单元,用于根据所述复购概率预测值,确定所述多个第二用户的用户质量;

第二用户质量确定单元,用于根据不同用户质量的所述第二用户的数量分别与所述第二用户的总数量的比值,确定所述第一用户的第二用户质量。

f15、如f14所述的装置,所述装置还包括:

预测模型生成单元,用于从训练样本集中学习获得所述预测模型。

f16、如f15所述的装置,所述预测模型生成单元具体用于通过迭代决策树gbdt模型与逻辑回归模型组合的方式,从所述训练样本集中学习获得所述预测模型。

本发明还公开了g17、一种电子设备,包括存储器和处理器;其中,

所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令供所述处理器调用执行;

所述处理器用于:

获取待处理的第一用户的多个第二用户;根据所述第二用户的特征数据集,通过预先生成的预测模型获得所述多个第二用户的复购概率预测值;根据所述复购概率预测值,确定所述多个第二用户的用户质量;根据不同用户质量的所述第二用户的数量分别与所述第二用户的总数量的比值,确定所述第一用户的第二用户质量。

本发明还公开了h18、一种计算机存储介质,所述计算机存储介质存储有一条或多条计算机指令,所述计算机指令被执行时实现如e11-e13中任一项所述的方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1