一种潜在客户的预测方法及装置与流程

文档序号：14572302发布日期：2018-06-01 23:07阅读：369来源：国知局

本发明涉及大数据处理领域，尤其涉及一种潜在客户的预测方法及装置。

背景技术：

目前，很多银行和金融公司都存在资金贷款业务，通常情况下需要工作人员对客户进行贷款业务的营销，但是由于业务人员对客户的贷款需求不了解，无法实现精准营销。

现有技术中，为了实现精准营销，通过一些算法确定出潜在客户，并对潜在客户进行营销。现有技术中实现的对潜在客户的预测，大多通过用户的信用情况和资产情况确定的。

但是，即使用户的信用情况和资产情况良好，是可以具备发送贷款条件的客户，但是由于不同客户对贷款的使用情况是不同，有一些客户虽然办理了贷款业务，但对贷款的资金是使用率并不高，由此可知，这样的客户可能对贷款的饥渴度并不高，因此，通过现有技术对贷款客户进行预测，无法得知潜在客户对贷款的需求程度，不能实现对客户高精准的营销。

技术实现要素：

有鉴于此，本发明实施例公开了一种潜在客户的预测方法及装置，通过对客户的贷款饥渴度的预测，客户实现对客户的高精准营销，并且，根据该预测结果发送的贷款，也提升了贷款资金的使用效率。

本发明实施例公开了一种潜在客户的预测方法，包括：

获取用户的基本信息；

将所述用户的基本信息输入到机器学习模型中，输出预测的所述用户的贷款累计额度使用率；所述机器学习模型为已通过用户的基本信息和贷款累计额度使用率的关系对所述机器学习模型进行了训练；

判断预测的所述用户的贷款累计额度使用率是否超过了预设的额度使用率阈值；

若所述用户的贷款累计额度使用率超过了预设的额度使用率阈值，则表示所述用户为潜在客户。

可选的，所述通过用户的基本信息和贷款累计额度使用率的关系对所述机器学习模型进行训练的过程包括：

获取包含用户的基本信息和所述用户的累计额度使用率的样本集；

根据样本集中每个用户的基本信息和所述用户的累计额度使用率，对所述机器学习模型进行训练。

可选的，所述用户的基本信息包括：

所述用户的身份信息、交易信息、资产数据、授信数据、金融交易行为数据、网络行为数据、购买记录和浏览记录。

可选的，所述获取贷款累计额度使用率，包括：

获取所述用户对贷款的累计提款额度和所述用户的贷款额度；

计算所述用户的提款额度和所述贷款额度的比值，得到所述用户的贷款累计额度使用率。

可选的，还包括：

在训练出多个机器学习模型的情况下，计算每个机器学习模型的评价指标；

根据每个机器学习模型的评价指标，确定最优的机器学习模型。

本发明实施例还公开了一种潜在客户的预测装置，包括：

获取单元，用于获取用户的基本信息；

预测单元，用于将所述用户的基本信息输入到机器学习模型中，输出预测的所述用户的贷款累计额度使用率；所述机器学习模型为已通过用户的基本信息和贷款累计额度使用率的关系对所述机器学习模型进行了训练；

判断单元，用于判断预测的所述用户的贷款累计额度使用率是否超过了预设的额度使用率阈值；

确定单元，用于若预测的所述用户的贷款累计额度使用率超过了预设的额度使用率阈值，则表示所述用户为潜在客户。

可选的，还包括：

样本集获取单元，用于获取包含用户的基本信息和所述用户的累计额度使用率的样本集；

训练单元，用于根据样本集中每个用户的基本信息和所述用户的累计额度使用率，对所述机器学习模型进行训练。

可选的，所述用户的基本信息包括：

所述用户的身份信息、交易信息、资产数据、授信数据、金融交易行为数据、网络行为数据、购买记录和浏览记录。

可选的，所述样本集获取单元，包括：

获取子单元，用于获取所述用户对贷款的累计提款额度和所述用户的贷款额度；

第一计算子单元，用于计算所述用户的提款额度和所述贷款额度的比值，得到所述用户的贷款累计额度使用率。

可选的，还包括：

第二计算子单元，用于在训练出多个机器学习模型的情况下，计算每个机器学习模型的评价指标；

确定子单元，用于根据每个机器学习模型的评价指标，确定最优的机器学习模型。

本发明公开了一种潜在客户的预测方法及装置，包括：通过用户的基本信息和用户的贷款累计额度使用率对机器学习模型进行训练，从而得到可以通过用户的基本信息预测用户的贷款累计额度使用率的机器学习模型。这样，通过对用户的贷款额度使用率的预测，可以预测出用户对贷款的需求情况，若预测的用户的贷款额度使用率越高，表示用户对贷款的需求越高。由此可知，提高了预测潜在贷款客户的精准度，可以实现高精准的营销，同时根据该预测结果发送的贷款，也提升了贷款资金的使用效率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。

图1示出了本发明实施例提供的一种潜在客户的预测方法的流程示意图；

图2示出了本发明实施例提供的机器学习模型的训练方法的流程示意图；

图3示出了本发明实施例提供的一种潜在客户的预测装置的结构示意图；

图4示出了本发明实施例提供的机器学习模型的训练装置的结果示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参考图1，示出了本发明实施例提供的一种潜在贷款客户的预测方法的流程示意图，在本实施例中，该方法包括：

S101：获取用户的基本信息；

本实施例中，用户的基本信息包括：用户的身份信息、交易信息、资产数据、授信数据、金融交易行为、网络行为数据、购买记录、浏览记录等。

其中，用户的身份信息可以包括：用户的性别、年龄、户籍、居住地等；交易信息可以包括：通过用户的账户与商家发生的各种交易；资产数据：用户的存款情况、房产情况等。金融交易行为包括：信用卡、储蓄卡购买金融产品的类型、偏好、金额、周期等信息。网络行为数据包括：在手机银行中查询账单的信息、搜索理财产品的信息等。S102：将所述用户的基本信息输入到机器学习模型中，输出预测的所述用户的贷款累计额度使用率；所述机器学习模型为通过用户的基本信息和贷款累计额度使用率的关系对所述机器学习模型进行了训练；

本实施中，预测出的用户的贷款累计额度使用率可以表示用户对贷款的需求情况，贷款累计额度使用率越高，表示用户的贷款需求度更高，反之，贷款累计额度使用率越低，表示用户的贷款需求度越低。

本实施例中，在对用户的贷款额度使用率进行预测之前，需要先对机器学习模型进行训练，具体的训练过程会在下文中进行详细介绍，在这里就不再赘述。

本实施例中，训练好的机器学习模型可以对用户的贷款额度使用率进行预测，也就是可以预测用户的贷款需求度。

S103：判断预测的所述用户的贷款累计额度使用率是否超过了预设的额度使用率阈值；

S104：若预测的所述用户的贷款累计额度使用率超过了预设的额度使用率阈值，则表示所述用户为潜在客户。

本实施例中，预设的额度使用率阈值，可以是技术人员预先设置的，也可以是根据实际情况可以进行调整的。

本实施例中，通过已训练好的机器学习模型对用户的贷款累计额度使用率进行预测，从而确定出用户的贷款需要度。这样，通过对用户的贷款额度使用率的预测，可以得知用户对贷款的需求情况，若用户的预测贷款额度使用率越高，表示用户对贷款的需求越高。由此可知，提高了对潜在客户的预测的准确率，同时也提高了贷款资金的使用效率。

参考图2，示出了本发明实施例提供的机器学习模型的训练方法的流程示意图，在本实施例中，该方法包括：

S201：获取包含用户的基本信息和所述用户的贷款额度使用率的样本集；

本实施例中，用户的基本信息包括：本实施例中，用户的基本信息包括：用户的身份信息、交易信息、资产数据、授信数据、金融交易行为、网络行为数据、购买记录、浏览记录和通讯信息等。

其中，对用户基本信息的介绍如上文S101所示，在这里就不再赘述。

本实施例中，用户的贷款累计额度使用率表示用户对贷款的使用情况，贷款累计额度使用率越高，表示用户的贷款需求度更高，反之，贷款累计额度使用率越低，表示用户的贷款需求度越低，具体的，贷款额度使用率的获取方法包括：

获取用户对贷款的累计提款额度和所述用户的贷款额度；

计算所述用户的提款额度和所述贷款额度的比值，得到所述用户的贷款累计额度使用率。

举例说明：用户对贷款的提款额度为S_n贷款额度为M，则可以通过如下公式1)计算用户的贷款累计额度使用率：

本实施例中，在应用样本集中的数据对机器学习模型进行训练之前，可以将样本中的数据进行处理，具体的可以包括数据清洗、数据抽样、缺失值填充、特征值分析等。

其中，数据清洗可以理解为剔除一些异常信息等，例如：异常信息可以包括：身份信息不合法的用户的信息、缺失比例超过预设阈值的数据等。

数据抽样可以理解为将连续的数据转换为离散的数据的过程。

特征值分析可以包括：数据分箱、变量的筛选等。其中，数据分箱可以理解为按照不同的变量第数据进行分类处理。

其中，特征值分析的方法可以包括多种，在这里不进行限定，例如可以包括：相关系数法、IV值法、主成分分析法、卡方验证法等。

S202：根据样本集中每个用户的基本信息和所述用户的累计额度使用率，对所述机器学习模型进行训练。

本实施例中，对机器学习模型进行训练时，可以将样本集分成训练集和验证集。可以将训练集中的样本数据输入到机器学习模型中，对机器学习模型进行训练，在训练的过程中，可以通过验证集对训练的机器学习模型进行验证。

本实施例中，可以采用任何一种机器学习模型，也可以采用多种机器学习模型的组合方式，举例说明：可以采用逻辑回归模型、决策树模型等。

本实施例中，若训练出多个机器学习模型，可以通过对训练后的模型进行评价，从而选出最优的模型，具体的，包括：

在训练出多个机器学习模型的情况下，计算每个机器学习模型的评价指标；

根据每个机器学习模型的评价指标，确定最优的机器学习模型。

本实施例中，对训练后的机器学习模型的评价可以包括多种方法，例如包括：LIFI曲线、ROC(英文全称：receiver operating characteristic curve，中文全称：受试者工作特征曲线)曲线、AUC(英文全称：Area Under Curve，中文全称：ROC曲线下方的面积大小)值、gini值。

本实施例中，通过用户的基本信息和用户的贷款累计额度使用率对机器学习模型进行训练，从而得到可以通过用户的基本信息预测用户的贷款累计额度使用率的机器学习模型。这样，通过用户的贷款累计额度是使用率可以了解用户对贷款的饥渴度，也就是用户对贷款的需求程度，从而可以对用户进行针对性的营销。根据该预测结果发送的贷款，也提升了贷款资金的使用效率。

参考图3，示出了本发明实施例提供的一种潜在客户的预测装置的结构示意图，在本实施例中，该装置包括：

获取单元301，用于获取用户的基本信息；

预测单元302，用于将所述用户的基本信息输入到机器学习模型中，输出预测的所述用户的贷款累计额度使用率；所述机器学习模型为已通过用户的基本信息和贷款累计额度使用率的关系对所述机器学习模型进行了训练；

判断单元303，用于判断预测的所述用户的贷款累计额度使用率是否超过了预设的额度使用率阈值；

确定单元304，用于若预测的所述用户的贷款累计额度使用率超过了预设的额度使用率阈值，则表示所述用户为潜在客户。

通过本实施例的装置，提高了预测潜在贷款客户的精准度，可以实现高精准的营销，同时根据该预测结果发送的贷款，也提升了贷款资金的使用效率。

参考图4，示出了本发明实施例提供的机器学习模型的训练装置的结果示意图，在本实施例中，该装置包括：

样本集获取单元401，用于获取包含用户的基本信息和所述用户的累计额度使用率的样本集；

训练单元402，用于根据样本集中每个用户的基本信息和所述用户的累计额度使用率，对所述机器学习模型进行训练。

可选的，所述用户的基本信息包括：

所述用户的身份信息、交易信息、资产数据、授信数据、金融交易行为数据、网络行为数据、购买记录、浏览记录。

可选的，所述样本集获取单元，包括：

获取子单元，用于获取所述用户对贷款的累计提款额度和所述用户的贷款额度；

第一计算子单元，用于计算所述用户的提款额度和所述贷款额度的比值，得到所述用户的贷款累计额度使用率。

可选的，还包括：

第二计算子单元，用于在训练出多个机器学习模型的情况下，计算每个机器学习模型的评价指标；

确定子单元，用于根据每个机器学习模型的评价指标，确定最优的机器学习模型。

通过本实施例的装置，得到可以通过用户的基本信息预测用户的贷款累计额度使用率的机器学习模型。这样，通过对用户的贷款额度使用率的预测，可以得知用户对贷款的需求情况，若用户的预测贷款额度使用率越高，表示用户对贷款的需求越高。由此可知，提高了预测潜在贷款客户的精准度，可以实现高精准的营销，同时根据该预测结果发送的贷款，也提升了贷款资金的使用效率。

需要说明的是，本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

对所公开的实施例的上述说明，使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的，本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下，在其它实施例中实现。因此，本发明将不会被限制于本文所示的这些实施例，而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈丹;蒋诗伟;许佳;顾玉莲
技术所有人：中国银行股份有限公司
我是此专利的发明人

上一篇：一种用于铁路管理的电子登销记系统的制作方法
上一篇：一种四步耦合中长期水文预报方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。