潜在用户预测转化方法及装置与流程

文档序号：11459079阅读：344来源：国知局

本发明实施例涉及数据处理技术领域，尤其涉及一种潜在用户预测转化方法及装置。

背景技术：

随着社会的不断发展，通过o2o(onlinetooffline，线上到线下)平台办理业务的用户也越来越多。很多商家都推出了自己的app(application，应用程序)平台，用户通过在相关app上注册，成为该app的注册用户，该注册用户就可以在该app上下单，如订购外卖、买衣服或食品等等。因此，对应商家而言，如何将众多潜在的普通用户拉新为该商家的注册用户，及将商家的注册用户转化为下单用户，完成用户在商家平台上的消费过程，成为商家亟待解决的问题。

相关技术中，通常采用基于规则的潜在用户筛选方式，即使用统计方法，通过分析平台中已有的用户数据，提取出这些用户数据中的被认为比较重要的一些主要特征，并通过这些主要特征从潜在用户群体中筛选出拉新用户。然而，相关技术中，由于过度依赖先验知识，通过简单的筛选方式得到的筛选结果不够准确，导致筛选出的拉新用户很可能转化率不高，进而增加商家的转化成本。

技术实现要素：

为克服相关技术中，由于过度依赖先验知识，通过简单的筛选方式得到的筛选结果不够准确，导致筛选出的拉新用户很可能转化率不高，进而增加商家的转化成本的问题，本发明实施例提供一种潜在用户预测转化方法及装置。

根据本发明实施例的第一方面，提供一种潜在用户预测转化方法，包括：

获取潜在用户中每一用户的画像数据；

提取所述画像数据中的目标特征；

获取预设转化概率；

根据所述目标特征，通过预设分类模型计算所述潜在用户中每一用户的转化概率；

将所述潜在用户中转化概率大于预设转化概率的用户作为目标用户。

根据本发明实施例的第二方面，提供一种潜在用户预测转化装置，包括：

画像数据获取模块，用于获取潜在用户中每一用户的画像数据；

第一目标特征提取模块，用于提取所述画像数据中的目标特征；

转化概率计算模块，用于根据所述目标特征，通过预设分类模型计算所述潜在用户中每一用户的转化概率；

预设转化概率获取模块，用于获取预设转化概率；

目标用户确定模块，用于将所述潜在用户中转化概率大于预设转化概率的用户作为目标用户。

本发明的实施例提供的技术方案可以包括以下有益效果：

本发明实施例中提供的潜在用户预测转化方法，通过获取潜在用户中每一用户的画像数据，将画像数据中提取的目标特征通过预设分类模型计算出潜在用户中，每一用户的转化概率，获取预设转化概率，将转化概率大于预设转化概率的用户作为目标用户。这样以便将得到的目标用户线上拉新，在满足转化成本的情况下，最大程度的将目标用户转化为转化用户。避免相关技术中，通过简单的筛选方式得到的筛选结果不够准确，导致筛选出的拉新用户很可能转化率不高，进而出现增加商家的转化成本的问题。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明实施例。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明实施例的原理。

图1是根据本发明一示例性实施例示出的一种潜在用户预测转化方法的流程示意图；

图2是根据本发明一示例性实施例示出的一种潜在用户预测转化方法的流程图；

图3是根据本发明一示例性实施例示出的图2中步骤s240的流程图；

图4是根据本发明一示例性实施例示出的一种潜在用户预测转化方法的流程图；

图5是根据本发明一示例性实施例示出的一种潜在用户预测转化方法的流程图；

图6是根据本发明一示例性实施例示出的一种潜在用户预测转化装置的结构示意图；

图7是图6中转化概率计算模块的示意图；

图8是图6中预设转化概率获取模块的示意图；

图9是根据本发明一示例性实施例示出的一种潜在用户预测转化装置的结构示意图；

图10是图7中目标特征获取子模块的示意图；

图11是图7中目标权重获取子模块的示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明实施例相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明实施例的一些方面相一致的装置和方法的例子。

由于相关技术中，过度依赖先验知识，通过简单的筛选方式得到的筛选结果不够准确，导致筛选出的拉新用户很可能转化率不高，进而增加商家转化成本的问题，本发明实施例提供了一种潜在用户预测方法，参见图1，可以包括三部分，一是调用历史数据训练预设分类模型；二是调用预设分类模型预测新的潜在用户转化概率，并将转化概率较高且符合转化成本的线上拉新处理；三是获取拉新后潜在用户的拉新转化率，将转化的用户作为正样本，未转化的用户作为负样本，对预设分类模型训练，优化该预设训练模型，以便提高调用预测训练模型得到的潜在用户转化概率的正确性。

首先，调用历史数据训练预设分类模型。

这里的预设分类模型，可以是调用已有的分类模型，如dnn(deepneuralnetworks，深层神经网络)模型、逻辑回归模型等等，本发明实施例中采用逻辑回归模型，但本发明实施例中不限于此。

实施例中的历史数据可以基于某类特定用户的数据，例如百度外卖业务中，建立全面的用户画像数据，并将画像数据中信息不完整或存在异常信息的画像数据去除，按照是否为当前o2o业务的用户，将用户分为：历史用户和未转化用户。历史用户为有通过该o2o业务下单记录的用户等，未转化用户可以是没有通过该o2o业务产生下单记录的用户等。

在获取到历史数据中用户的全面画像数据后，由于该画像数据中可能包括用户众多的特征数据，而有些特征数据可以是代表用户的显著特征，比较重要；而有些特征数据在对用户的转化概率预测时，不是很重要。因此，需要提取出该画像数据中的用户的目标特征，该目标特征为用户的较为重要的特征数据。例如，目标特征可以是用户的性别、年龄、人生阶段、资产状况、所在行业、教育水平、兴趣爱好及常访问地等中的一项或多项组合，可以根据实际的需要而定，本发明实施例中不限于此。

另外，在提取出用户画像数据中的目标特征后，对应存在多个特征值的目标特征，还需要将这些目标特征进一步展开，示例性的，将教育水平具体展开为：高中、大专和本科及以上学历等三个特征。并且还可以将目标特征做归一化处理，将其映射到0～1之间，最终得到目标特征序列f＝{f1，f2，f3，…fi…，fk}，其中，i、k均为正整数，k大于i。

在将用户画像数据中提取的目标特征处理完成后，就可以调用该目标特征对预设分类模型进行训练。从历史用户中随机提取部分用户，并将该部分用户的目标特征数据作为正样本(如n个)；从未转化用户中随机抽取部分用户，将该部分用户的目标特征数据作为负样本(如m个，其中，m与n大小相当)。本发明实施例中调用逻辑回归算法，通过正、负样本训练得到一组目标特征的权重，如w＝{w1，w2，w3…，wi，…，wk}。

获取历史用户中剩余用户的目标特征数据，及未转化用户中剩余用户的目标特征数据，计算这些用户的转化概率，对逻辑回归模型中的参数进行调整，以便优化该逻辑回归模型。

其次，调用预设分类模型预测新的潜在用户转化概率，并将转化概率较高且符合转化成本的线上拉新处理。

在通过上述历史用户数据训练出预设分类模型之后，该获取到新的潜在用户，通过上述方式提出该潜在用户的目标特征之后，就可以调用预设分类模型计算出潜在用户的用户转化概率，示例性的，在预设分类模型为逻辑回归模型时，分别获取每一目标特征中的目标特征值和目标权重，通过下述公式(1)来计算潜在用户的用户转化概率：

其中，pscored为转化概率；wi为第i个目标特征对应权重；fi为第i个目标特征对应的目标特征值；i为正整数；e为常数。

如果潜在用户为多个，可以按照转化概率(0～1)，以0.1为间隔将潜在用户分为10档，即：a1[0.9～1]，a2[0.8～0.9)，a3[0.7～0.8)，…，a10[0.1～0.2)。

可以计算各组对应的转化成本，如果对转化成本有要求，那么可以计算上述每组用户转化概率对应的转化成本，由于用户转化概率越高，用户转化成本越低，反之用户转化成本越高。因此，在有最高用户转化成本要求的情况下，计算该最高用户转化成本对应的目标用户转化概率，将大于该目标用户转化概率对应的潜在用户线上拉新，其余不大于该目标用户转化概率的潜在用户不做线上拉新处理，避免用户转化成本高于最高用户转化成本。

最后，获取拉新后潜在用户的拉新转化率，将转化的用户作为正样本，未转化的用户作为负样本，对预设分类模型训练，优化该预设训练模型，以便提高通过预测训练模型得到的潜在用户转化概率的正确性。

由于前述计算出的潜在用户转化概率毕竟是对用户转化概率的预测，可能与实际的用户转化率有差异。因此，在将潜在用户上线拉新后，获取潜在用户的实际用户转化率，如果该实际用户转化率与之前预测的用户转化概率有差异，可以将拉新后的潜在用户中转化的用户作为正样本，将拉新后为转化的用户作为负样本，对预设分类模型训练，以优化该预设分类模式，使得通过该预设分类模型预测的用户转化概率与实际的用户转化概率更接近，提高其正确性。

由于用于计算用户转化概率的预设分类模型训练是一个需要依赖线上反馈不断迭代，因此，示例性的，a1组(n1个用户)推送拉新后，转化用户s1，未转化用户n1-s1。将s1个转化用户随机作为预设分类模型的正样本，将n1-s1个未转化用户随机作为预设分类模型的负样本，并去除预设分类模型中，与新增这些正、负样本重复的样本。

为了详细阐述上述各部分的执行流程，结合图1及上述实施例，在本发明提供的又一实施例中，提供了一种潜在用户预测方法，可以应用在服务器中，如图2所示，该方法可以包括如下步骤：

在步骤s210中，获取潜在用户中每一用户的画像数据。

潜在用户一般为多个，可以为潜在用户中的每个用户预先建立全面的画像数据，如用户的性别、年龄、受教育程度、消费习惯等等。当然，如果潜在用户中只有一个用户，那么直接获取该用户的画像数据。

在步骤s220中，提取画像数据中的目标特征。

由于用户的画像数据中，一般包括多个用户特征，可以针对当前的o2o平台中的具体业务，根据需要，从用户的画像数据中，提取较为重要的特征数据，即目标特征。

在步骤s230中，根据目标特征，通过预设分类模型计算潜在用户中每一用户的转化概率。

结合上述实施例，在提取到用户的目标特征之后，分别获取与每一目标特征相对应的目标特征值、目标权重，就可以通过上述实施例中公式(1)来计算潜在用户中每一用户的转化概率，详细可以参加上述实施例，这里不再赘述。

在步骤s240中，获取预设转化概率。

在步骤s250中，将潜在用户中转化概率大于预设转化概率的用户作为目标用户。

由于在将潜在用户转化为转化用户的过程中，需要将潜在用户线上拉新处理等，需要投入一定的成本。由于转化概率越低，用户的转化成本越高，因此，在低于最高转化成本的情况下，可以将计算得到的用户转化概率较高的潜在用户作为目标用户，即用户转化概率大于预设转化概率的用户作为目标用户，将该目标用户线上拉新等处理，以便在满足成本的情况下最大程度的将目标用户转化为转化用户。

另外，在本发明提供的又一实施例中，图2中步骤s230还可以包括如下步骤：

步骤s231、分别获取与目标特征相对应的目标特征值、目标权重。

步骤s232、通过上述实施例中公式(1)的逻辑回归模型计算潜在用户的转化概率。

由于在上述实施例中已有较为详细的阐述，为了保持实施例中文字简洁，详细可以参见上述实施例中的相关描述，这里不再赘述。

为了详细阐述如何设置上述的预设转化概率，作为图2方法的细化，在本发明的另一实施例中，如图3所示，步骤s240还可以包括如下步骤：

在步骤s241中，获取转化潜在用户的预设转化成本。

由于在将潜在用户转化为转化用户时，需要线上拉新，都需要一定的成本，这里的预设转化成本为商家可以接受的最高用户转化成本，可以根据需要进行设定。

在步骤s242中，计算在潜在用户的转化成本等于预设转化成本时的第一转化概率。

在步骤s243中，将第一转化概率作为预设转化概率。

由于用户转化率越高，商家付出的转化成本越低；反之，商家付出的转化成本越高。因此，可以计算在用户的转化成本为最高转化成本(即预设转化成本)时对应的转化概率(即第一转化概率)。则第一转化概率即为预设转化概率。

作为图2方法的细化，在本发明的另一实施例中，如图4所示，该方法还可以包括如下步骤：

在步骤s201中，向所述目标用户发送注册邀请请求消息。

本发明实施例中的向目标用户发送注册邀请请求消息，是指通过各种宣传、激励等手段，为o2o平台争取新用户，即将潜在用户转化为注册用户。本发明实施例中的转化，是指通过特定手段，命中目标用户，使得目标用户在o2o平台完成消费过程。

在步骤s202中，获取所述目标用户中的注册用户和未注册用户。

本发明实施例中，很多时候受限于用户转化成本，需要将计算得到转化概率较高的潜在用户作为目标用户线上拉新。因此，线上拉新后的目标用户有一部分会转化为o2o平台的注册用户，即成为转化用户，目标用户中剩下的为未转化用户，即为注册用户。

在步骤s203中，将转化用户中提取的目标特征作为正样本，将未转化用户中提取的目标特征作为负样本。

在步骤s204中，通过所述正样本和所述负样本对原始分类模型训练，得到所述预设分类模型。

将目标用户中从转化用户提取的目标特征作为预设分类模型的正样本，将目标用户中从未转化的用户提取的目标特征作为负样本，通过不断的将上述线上拉新后得到的正、负样本对预设分类模型训练的过程，也是对预设分类模型不断优化的过程，使得通过预设分类模型计算出潜在用户的转化概率准确度越来越高。

在本发明提供的又一实施例中，如图5所示，上述步骤s231还可以包括如下步骤：

在步骤s2311中，分别获取历史转化用户、历史未转化用户的画像数据。

在步骤s2312中，分别提取历史转化用户、历史未转化用户画像数据中的目标特征。

在步骤s2313中，将历史转化用户中的目标特征作为正样本，将历史未转化用户中的目标特征作为负样本。

在步骤s2314中，通过正样本和负样本对预设分类模块训练，分别得到目标特征对应的目标特征值和目标权重。

在本实施例中，通过获取历史用户的画像数据，将历史转化用户作为正样本，将历史画像数据中的未转化用户作为负样本，对预设分类模型进行训练，以便后续过程中将潜在用户通过该预设分类模型计算出用户转化概率。由于该部分已在上述实施例中有详细的阐述，详细参见上述实施例中相关部分的描述，这里不再赘述。

本发明实施例中提供的潜在用户预测转化方法，通过获取潜在用户中每一用户的画像数据，将画像数据中提取的目标特征通过预设分类模型计算出潜在用户中，每一用户的转化概率，将转化概率大于预设转化概率的用户作为目标用户。这样以便将得到的目标用户线上拉新，在满足转化成本的情况下，最大程度的将目标用户转化为转化用户。避免相关技术中，通过简单的筛选方式得到的筛选结果不够准确，导致筛选出的拉新用户很可能转化率不高，进而出现增加商家的转化成本的问题。并且由于本发明实施例中采用逻辑回归算法，能够量化潜在用户的转化概率，便于线上精细化定向推送和转化的开展。同时，不断收集线上反馈，迭代模型，不断提高潜在用户转化率预测的准确率。从总体上能够更有效监控成本和收益，提升线上拉新的转化率。

通过以上的方法实施例的描述，所属领域的技术人员可以清楚地了解到本发明实施例可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：只读存储器(rom)、随机存取存储器(ram)、磁碟或者光盘等各种可以存储程序代码的介质。

另外，作为对上述各实施例的实现，本发明实施例还提供了一种潜在用户预测转化装置，该装置位于服务器中，如图6所示，该装置包括：

画像数据获取模块10，用于获取潜在用户中每一用户的画像数据；

第一目标特征提取模块20，用于提取所述画像数据中的目标特征；

转化概率计算模块30，用于根据所述目标特征，通过预设分类模型计算所述潜在用户中每一用户的转化概率；

预设转化概率获取模块40，用于获取预设转化概率；

目标用户确定模块50，用于将所述潜在用户中转化概率大于预设转化概率的用户，作为目标用户。

在本发明又一实施例中，基于图6，如图7所示，所述转化概率计算模块30，包括：

目标特征获取子模块31，用于获取与所述目标特征相对应的目标特征值；

目标权重获取子模块32，用于获取与所述目标特征相对应的目标权重；

转化概率计算子模块33，用于调用逻辑回归模型计算所述潜在用户的转化概率：

该逻辑回归模型为：

其中，pscored为转化概率；wi为第i个目标特征对应权重；fi为第i个目标特征对应的目标特征值；i为正整数；e为常数。

在本发明又一实施例中，基于图6，如图8所示，所述预设转化概率获取模块40，

预设转化成本获取子模块41，用于获取转化所述潜在用户的预设转化成本；

转化概率计算子模块42，用于计算在所述潜在用户的转化成本等于所述预设转化成本时的第一转化概率；

预设转化概率确定子模块43，用于将所述第一转化概率作为所述预设转化概率。

在本发明又一实施例中，基于图6，如图9所示，该装置还包括：

注册邀请请求消息发送模块81，用于向所述目标用户发送注册邀请请求消息；

用户获取模块82，用于获取所述目标用户中的注册用户和未注册用户；

第一正样本确定模块83，用于将所述转化用户中提取的目标特征作为所述预设分类模型的正样本；

第一负样本确定模块84，用于将所述未转化用户中提取的目标特征作为所述预设分类模型的负样本；

第一训练模块85，用于通过所述正样本和所述负样本对所述预设分类模型训练。

在本发明又一实施例中，基于图7，如图10所示，所述目标特征获取子模块31，包括：

历史画像数据获取子模块311，用于分别获取历史转化用户、历史未转化用户的画像数据；

第二目标特征提取子模块312，用于分别提取所述历史转化用户、所述历史未转化用户画像数据中的目标特征；

基于图7，如图11所示，所述目标权重获取子模块32，包括：

第二正样本确定子模块321，用于将所述历史转化用户中的目标特征作为正样本；

第二负样本确定子模块322，用于将所述历史未转化用户中的目标特征作为负样本；

第二训练子模块323，用于通过所述正样本和所述负样本对所述预设分类模块训练，分别得到所述目标特征对应的目标特征值和目标权重。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

本发明实施例中提供的潜在用户预测转化装置，通过获取潜在用户中每一用户的画像数据，将画像数据中提取的目标特征通过预设分类模型计算出潜在用户中，每一用户的转化概率，将转化概率大于预设转化概率的用户作为目标用户。这样以便将得到的目标用户线上拉新，在满足转化成本的情况下，最大程度的将目标用户转化为转化用户。避免相关技术中，通过简单的筛选方式得到的筛选结果不够准确，导致筛选出的拉新用户很可能转化率不高，进而出现增加商家的转化成本的问题。并且由于本发明实施例中采用逻辑回归算法，能够量化潜在用户的转化概率，便于线上精细化定向推送和转化的开展。同时，不断收集线上反馈，迭代模型，不断提高潜在用户转化率预测的准确率。从总体上能够更有效监控成本和收益，提升线上拉新的转化率。

可以理解的是，本发明实施例可用于众多通用或专用的计算系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。

本发明实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明实施例，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

需要说明的是，在本文中，诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本领域技术人员在考虑说明书及实践这里公开的发明实施例后，将容易想到本发明实施例的其它实施方案。本申请旨在涵盖本发明实施例的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本发明实施例的一般性原理并包括本发明实施例未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本发明实施例的真正范围和精神由下面的权利要求指出。

应当理解的是，本发明实施例并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本发明实施例的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蒋凡;徐明泉
技术所有人：北京小度信息科技有限公司
我是此专利的发明人

上一篇：异常用户识别方法及装置与流程
上一篇：基于二维码的农产品质量安全追溯监管系统及其实现方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。