基于人工智能和大数据进行智能产品推荐的方法及系统与流程

文档序号:16790919发布日期:2019-02-01 19:37阅读:1363来源:国知局
基于人工智能和大数据进行智能产品推荐的方法及系统与流程

本申请涉及金融行业的人工智能领域,尤其涉及一种人工智能和大数据对金融机构客户进行产品推荐的方法和线上系统。



背景技术:

金融产品品指的是各种具有经济价值,可进行公开交易或兑现的非实物资产,也叫有价证券。现有银行在金融产品营销中采用传统的广撒网的方式,不能利用客户历史数据的信息,不能找到对应金融产品的高购买潜力客户去营销,因此营销成本高,效果差。



技术实现要素:

针对以上缺点,本发明提出了基于人工智能和大数据进行智能产品推荐的方法及系统,利用金融客户特征和历史交易数据,匹配金融产品和购买产品的客户的特征,从全量客群中筛选出未来三个月购买金融产品的潜在客户名单。

本发明实施例提供了一种基于人工智能和大数据进行智能产品推荐的方法,所述的方法包括以下步骤:

步骤1:对历史金融产品交易数据和个人数据处理,删除空值过多的变量,对剩余变量进行空值填充;

步骤2:在数值变量和分类变量中分别选取最优特征;

步骤3:基于步骤1和步骤2中的数据和变量,利用梯度提升决策树构建模型;

步骤4:把已构建的模型应用于当前时点的目标客户,预测每位客户未来购买目标金融产品。

进一步的,步骤1中,历史金融产品交易数据和个人数据的采集粒度为月,并收集至少12个月的数据;然后,对每一个客户打标签“是否未来三个月会购买金融产品”,该标签的定义如下:对于在某一个月的客户,如果在未来三个月的任何一个月,该客户是某金融产品的持有者,该客户的标签为1;否则为0。

进一步的,步骤2中,数值变量选取最优特征的具体方法为:

首先,对数值变量进行离散处理或者通过z-score的归一化方式进行无量纲化处理;然后,基于pearson相关系数进行特征变量选取。

进一步的,步骤2中,分类变量选取最优特征的具体方法为:

首先,通过哑编码将分类变量转换为哑变量;然后,基于卡方检验,来得到特征和标签之间的相关性。

进一步的,在步骤2中,如果变量包含多个数值变量和分类变量,可以用递归特征消除法选取最优特征。

进一步的,步骤3的具体实现过程为:

s31:将全量客户数据按照80%和20%的比例分为训练数据集和测试数据集;

s32:使用梯度提升决策树算法针对训练数据集里的“是否未来三个月会购买金融产品”的标签和特征变量进行训练,得到代表标签和特征变量关系的模型;

s33:把测试数据集输入模型,得到客户购买金融产品的预测概率;

s34:对比预测值和测试数据集里的实际值,得到模型应用到测试数据集的准确率;

s35:重复步骤s31-s34,获取的准确率最高的模型。

进一步的,步骤4的具体实现过程为:

设定潜在目标客户的阈值,然后把已构建的模型应用于当前时点的目标客户,预测每位客户未来购买目标金融产品,当计算得到的购买概率高于设定的阈值时,该客户即为潜在目标客户,可以用于营销实施。

本发明实施例还提供了一种基于人工智能和大数据进行智能产品推荐的系统,所述的系统包括:

数据预处理模块:用于以月为粒度收集至少12个月的历史金融产品交易数据和个人数据,并对每一个客户打标签;

变量预处理模块,用于删除空值过多的变量,并对剩余变量进行空值填充;

最优特征选取模块,用于在数值变量和分类变量中分别选取最优特征;

模型建立模块,用于利用梯度提升决策树构建模型;

客户推荐模块,用于利用建立的模型计算实时客户购买金融产品的概率,并将概率高的潜在客户推荐给客户经理。

进一步的,所述的系统还包括:

营销信息采集模块,用于收集营销经理填写的反馈信息。

进一步的,所述的系统还包括:

评估模块,利用ab检验,通过比较有营销和无营销之间的差别,来衡量营销的效果。

发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:

在传统的营销体系下,潜在客户的属性及行为特征没有被充分挖掘,大撒网获取的存量客户只占潜在的大额存单客户的一小部分。使用用梯度提升决策树构建的模型,由于具备关联客户的特征和是否购买的功能,可以预测出未来将要购买大额存单的客户,对他们做营销。在预测的将要购买大额存单客户中,有一部分人是存量客户,而另一部分客户是在传统技术所不能找到的增量客户。

附图说明

图1是本发明实施例方法的整体流程图;

图2是本发明实施例系统的原理框图。

具体实施方式

为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。

实施例

如图1所示,本发明实施例提供了一种基于人工智能和大数据进行智能产品推荐的方法,本方法基于梯度提升决策树算法,利用金融客户特征和历史交易数据,匹配金融产品和购买产品的客户的特征,从全量客群中筛选出未来三个月购买金融产品的潜在客户名单。

所述的方法包括以下步骤:

步骤1,进行数据预处理操作,其中的数据包括历史金融产品交易数据和个人数据处理。数据经过预处理后,需要删除空值过多的变量,并对剩余变量进行空值填充。

历史金融产品交易数据和个人数据来自于银行核心业务系统的客户信息,存贷款,基金,理财子系统,分为七大维度包括330个变量,构成用户特征宽表如下:

数据的粒度是月,需要收集至少12个月的数据。同时,对每一个客户打标签(“是否未来三个月会购买金融产品”),用于下面的机器学习。标签的定义如下:对于在某一个月的客户,如果在未来三个月的任何一个月,该客户是某金融产品(例如,大额存单)的持有者,该客户的标签为1;否则为0。

空值处理包括以下方法:1)删除空值过多的变量;2)对剩余变量进行空值填充,空值填充的办法是对于数值型变量使用均值填充,对于分类变量使用最频繁值填充。

步骤2:在数值变量和分类变量中分别选取最优特征。用户特征宽表里的变量,有两类:数值变量,分类变量。根据变量的业务含义,数值型变量可以进行离散处理,例如把年龄变量的连续值按照分段阈值离散化为少年,青年,中年,和老年多个值。离散化有下列好处:1)更加贴近业务实践,2)简化信息,减少存储空间的占用,更快得到结果。数值型变量也可以不做离散处理,通过z-score的归一化方式进行无量纲化处理。z-score是基于原始数据的均值和标准差进行处理,公式是:处理后数据=(原始数据-均值)/标准差。对于分类变量,通过哑编码将分类变量转换为哑变量(只有0和1两个值)。

变量处理后,使用三种方法进行特征变量选取:对于数值型变量,基于pearson相关系数,可以帮助理解特征和标签之间的相关性。对于分类变量,我们可以基于卡方检验,来得到特征和标签之间的相关性。对于多个变量(数值和分类变量)之间的相关性,可以用递归特征消除法(recursivefeatureelimination)。该方法通过反复构建回归模型,选出最好和最差的特征。把选出特征放到一边,在剩余特征重复过程,直到所有特征都被覆盖。通过这些方法,我们选取了27个变量进入下一步,放入模型中。

步骤3:将全量客户数据按照80%和20%的比例分为训练数据集和测试数据集。使用梯度提升决策树算法针对训练数据集里的“是否未来三个月会购买金融产品”的标签和特征变量进行训练,得到代表标签和特征变量关系的模型。把测试数据集输入模型,得到客户购买金融产品的预测概率。对比预测值和测试数据集里的实际值,可以得到模型应用到测试数据集的准确率。

模型的输出还包括召唤率,召唤率是模型对某一个类别(购买产品客户)预测的准确率。在这种情况下,因为我们关心的是能否找到购买产品客户,对于不购买产品客户不关心,因此召唤率也很重要。例如,对于某城市商业银行的大额存单客户,模型在测试数据集的准确率达到95.1%,召唤率达到94.0%,这两者都接近最高值100%。因此模型可以用于进入下一步,用于预测目标客户。

步骤4:把已构建的模型应用于当前时点的目标客户,预测每位客户未来购买目标金融产品,例如大额存单的概率。然后选取阈值确定潜在目标客户名单,例如0.6概率为阈值,购买概率高于的客户为潜在目标客户,可以用于营销实施。

如图2所示,基于上述的方法,本发明实施例该提供了相应的系统,用于实现上述的方法,所述的系统包括数据预处理模块:用于以月为粒度收集至少12个月的历史金融产品交易数据和个人数据,并对每一个客户打标签;变量预处理模块,用于删除空值过多的变量,并对剩余变量进行空值填充;最优特征选取模块,用于在数值变量和分类变量中分别选取最优特征;模型建立模块,用于利用梯度提升决策树构建模型;客户推荐模块,用于利用建立的模型计算实时客户购买金融产品的概率,并将概率高的潜在客户推荐给客户经理。

除此之外,在实际应用中,为了更好的方便无技术背景的营销人员的使用,也方便后台服务人员根据反馈做营销实施评估,使服务成为闭环,构建了一个线上系统。

线上系统有三部分功能:

第一是传递营销名单给营销经理。通过线上系统传递的名单包括客户身份信息(客户名,年龄,性别,手机号,地址,所属机构号,所属机构名称),未来三个月购买产品的概率,概率的分档(大于等于0.8为1档,代表高概率;大于0.6小于0.8为2档,代表中等概率;低于0.6的不包含在名单中,不被营销)。

第二是收集营销经理的反馈信息。通过弹出的窗口,营销经理回答关于营销渠道(包括“上门拜访”、“厅堂营销”、“电话营销”,“其他”4个选项),是否触达(包括“是”,“否”2个选项),营销方式(包括“情感维系”、“礼品赠送”、“优惠活动”、“产品营销”、“沙龙活动”、“其他”6个选项),客户态度(包括“好”、“一般”、“抵触”3个选项。),是否需要二次跟进(包括“是”,“否”2个选项)一系列问题。

第三是综合反馈信息,尤其是其中的是否触达,和客户营销前后的资产和产品数据,来评估营销效果。评估的方法是基于ab检验,通过比较有营销和无营销之间的差别,来衡量营销的效果。假如有营销和无营销之间的有差别,则判定营销是有效的。

本技术在某银行试点后,金融产品购买率提高了3.5倍,人均购买额较非预测组高出5130元,有效提升了该行的营销成功率及提升该行客户价值。

尽管说明书及附图和实施例对本发明创造已进行了详细的说明,但是,本领域技术人员应当理解,仍然可以对本发明创造进行修改或者等同替换;而一切不脱离本发明创造的精神和范围的技术方案及其改进,其均涵盖在本发明创造专利的保护范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1