一种面向三农客户画像的精准营销构建方法与流程

文档序号:23386302发布日期:2020-12-22 13:51阅读:450来源:国知局

本发明涉及一种挖掘银行潜在客户的方法,尤其是面向三农客户画像的精准营销构建方法。



背景技术:

在现代经济生活中,银行零售业务已关联到个人生活的方方面面,包括投资理财、保险购买、出行出游、生活消费、网上购物、移动支付等。零售银行业务有以下特点:客户基数庞大;客户分布广泛;业务种类繁杂;交易量巨大。零售银行客户数的不断增加,对业务管理、风险控制、客户服务等提出了新的要求,同时,互联网金融的发展也给银行零售业务带来冲击,倒逼零售银行业加大对数据分析的研究与应用。

商业银行零售银行经过了多年的发展,建立了完善的信息系统,积累了庞大的个人金融交易数据,目前大多数商业银行的数据分析还处于初始阶段,客户细分主要围绕年龄、性别、职业、财富水平、持有产品等维度,更多的是根据业务经验对客户进行筛选分群,由于难以评估和验证数据分析的有效性,因此难以实现精准营销。零售银行开展精准营销的核心在于运用数学工具,通过聚类分析、回归分析、关联分析等数据手段进行数据建模,再运用客户经营等方式验证效果并完善模型,从而逐步提高数据分析的准确性,实现以数字“说话”。

现有常见分析模型包括以下几种:

k-means算法,k-means算法是一个聚类算法,把n的对象根据它们的属性分为k个分割,k<n。它与处理混合正态分布的最大期望算法相似,因为它们都试图找到数据中自然聚类的中心。其假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。

theapriorialgorithm,apriori算法是一种最有影响力的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集被称为频繁项集,简称频集。

cart:分类与回归树,cart即classificationandregressiontrees,其分类树下面有两个关键思想。第一个是关于递归地划分自变量空间的想法;第二个是用验证数据进行剪枝。

分类模型,分类模型包括决策树模型(decisiontreemodel)、朴素贝叶斯模型(naivebayesianmodel,nbc)、随机森林、隐马尔科夫模型和支持向量机等。

近年来,大型互联网企业对商业银行的金融中介功能发起了冲击,零售银行方面受到的冲击尤其大。线上理财、扫码支付、网络消费贷等银行传统业务被逐步攻占,这也促使银行加速转型。阿里巴巴、百度、腾讯、京东等大型互联网企业,先天具有科技优势,其掌握了亿级的用户基础,沉淀了海量的数据,在云计算、大数据、人工智能等领域遥遥领先,这促使了商业银行向金融科技转型,并加大了在大数据方面的研究与探索。

大数据所涵盖的数据规模巨大、复杂,无法通过人工的方式在合理时间内完成收集、加工、分析、管理、计算、并整理成为人类所能解读的信息这一系列工作,传统人工的数据挖掘的方式并不适用大数据分析,人工智能、机器学习或是成为实现大数据分析的真正路径。

目前对于客户的身份识别,大多数银行主要采取的是柜员或大堂经理人工识别、刷卡识别或者指纹仪识别等方法。这些方法都需要客户配合,存在识别不及时等问题。同时客户在到达现场后,客户经理又需要重新登记客户信息,调阅客户档案,不但让客户感觉繁琐,增加客户的等待时间,客户满意度大打折扣。



技术实现要素:

本发明针对现有技术的不足,提供一种面向三农客户画像的精准营销构建方法,解决现有技术存在的智能程度差、营销精准度低、用户体验感差的问题。

本发明的技术方案为:一种面向三农客户画像的精准营销构建方法,包括以下步骤:步骤1、对三农客户基本面貌、金融资产(包括总资产情况fa/aum及其变动情况等)、产品构成(包括活期存款指标、定期存款指标、投资理财情况指标、贷款情况指标、卡业务办理情况指标以及产品综合指标等)、资金往来(包括流入、流出情况、大小额转账、第三方及同名账户转账情况指标、借记卡消费场所情况指标等)等等数据进行预处理,得到惠农客户的行为习惯等数据;

数据预处理第一步是特征筛选,剔除缺失比例高于90%的特征。接下来处理缺失值,因为原始数据中存在某个特征的值缺失的情况,处理缺失值(也叫空值)的方法是使用均值替代,如果空值是数值型的,就根据该属性在其他所有对象的取值的平均值来填充该缺失的属性值;如果空值是非数值型的,就根据统计学中的众数原理,用该属性在其他所有对象的取值次数最多的值来补齐该缺失的属性值。对于连续型变量,做标准化处理。对于离散型变量,做独热编码。对金融类特征做对数处理。

步骤2、将客户的行为数据和银行产品的相关规则作为模型的输入,计算客户会签约银行产品概率,利用客户的行为数据来给客户标定各类标签,此步骤是为步骤s3中训练分类模型标定类标签;具体做法如下:

将客户在目前已有行为下的数据和银行产品的相关规则作为模型的输入,计算客户基于目前在银行的行为习惯(认为客户在一段时间内行为习惯不会有大改变)、银行产品规则的产品购买概率。例如:以客户承受风险能力来看,长期购买本金有保障利息低的定期性产品的客户为保守型,大概率会接受银利多、大额存单、国债等定期利息类存款产品;能够承受本金亏损概率低于某个值的、追求高于存款利息的成长型客户,大概率会接受账户贵金属、债券类基金、低分险类理财产品等;追求高利息且不惧成本损失的激进型客户,很大概率还购买股票类基金、高风险类理财产品等。

步骤3、利用客户的基本面貌、产品构成、资金往来和所标定的标签,训练xgboost模型;使用步骤sl处理过的客户数据和步骤2标定的类标签,训练xgboost模型。针对每个产品训练一个xgboost模型。

步骤4、通过xgboost模型筛选重要特征,得到重要特征集合以及每个客户的预测值;xgboost是集成学习方法的一种,对于xgboost的预测模型可以表示为:其中k为树的总个数,fk表示第k棵树,表示样本xi的预测结果。

其中,损失函数也同样表示为

其中为样本xi的训练误差,ω(fx)表示第k棵树的正则项。

xgboost是以cart树中的回归树作为基分类器,在给定训练数据后,其单个树的结构(叶子节点个数、树深度等等)基本可以确定了。但xgboost并不是简单重复的将几个cart树进行组合。它是一种加法模型,将模型上次预测(由t-1棵树组合而成的模型)产生的误差作为参考进行下一棵树(第t棵树)的建立。以此,每加入一棵树,将其损失函数不断降低。

往对于加法策略可以表示为:

模型中加入第t棵树:其中fk表示第k棵树,表示组合t棵树模型对样本xi的预测结果。

我们知道,每次往模型中加入一棵树,其损失函数便会发生变化。另外在加入第t棵树时,则前面第t-1棵树已经训练完成,此时前面t-1棵树的正则项和训练误差都成已知常数项。

如果损失函数采用均方误差时,其目标损失函数变为:

另外对于目标损失函数中的正则项(复杂度)部分,我们从单一的树来考虑。对于其中每一棵回归树,其模型可以写成:

ft(x)=wq(x),w∈rt,q:rd→{1,2,…t}

其中w为叶子节点的得分值,q(x)表示样本x对应的叶子节点,t为该树的叶子节点个数。

因此,在这里。我们将该树的复杂度写成:

此时,对于xgboost的目标函数我们可以写为:

现在我们只需要找到f(t)来优化上式目标,可以使用泰勒展开公式近似得到的目标函数为:

obj代表了当我们指定一个树的结构的时候,我们在目标上面最多减少多少。我们可以把它叫做结构分数(structurescore),这个分数越小,代表这个树的结构越好。

xgboost的核心算法思想不难,基本就是:

1>不断地添加树,不断地进行特征分裂来生长一棵树,每次添加一个树,其实是学习一个新函数f(t),去拟合上次预测的残差。

2>当我们训练完成得到k棵树,我们要预测一个样本的分数,其实就是根据这个样本的特征,在每棵树中会落到对应的一个叶子节点,每个叶子节点就对应一个分数。

3>最后只需要将每棵树对应的分数加起来就是该样本的预测值。

步骤5、利用重要特征和预测值构建银行产品的潜在客户的客户画像。根据步骤4得到的重要特征集可以构建客户画像,根据客户购买某项产品的概率预测值来进行精准营销。

步骤6、将模型得到的结果与贵宾客户迎客系统对接,在系统识别出客户后,给出精准营销策略,以便网点客户经理更大概率营销成功。

本发明的有益效果在于:

针对三农客群通过大数据挖掘、建模,针对客户规模、资产配置和产品偏好等情况对客户进行画像,并打通渠道,对接智能化的贵宾客户迎客系统。系统在第一时间识别出网点的三农客户,触发客户关联的营销预案,网点的营销人员根据营销预案进行针对性的营销活客。营销产品在符合客户需求和提高营销成功几率的同时,差异化营销提升客户体验,提高网点服务水平。一定程度上辅助实现客户分流,减轻大堂经理的工作压力,提升客户满意度。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护范围。

本实施例的一种面向三农客户画像的精准营销构建方法,包括以下步骤:

步骤1:三农客户的数据准备及数据预处理,通过设定时间和空间的复合条件进行样本选择,包括客户的基本信息、资金交易数据和资产使用信息,保留有效的惠农用户银行产品、资金处理的行为习惯数据;

步骤2:进行用户标签分类,并同时对用户进行分层,进一步从用户标签分类中引导出用户标签指标,从用户分层中引导出用户分层维度,通过对用户标签指标和用户分层维度的融合,结合为每个用户量化的用户价值指数,建立用户画像模型,通过建立单个用户的画像模型,对金融客户群进行整体用户分布画像,通过用户的一级标签或细分的二级标签进行整体分析;

步骤3:模型训练阶段,本发明选用xgboost集成分类器训练模型,对处理后的样本和标定的类标签进行训练,每个产品训练一个xgboost模型;

步骤4:通过xgboost模型筛选重要特征,得到重要特征集合以及每个客户的预测值;

步骤5:利用重要特征和预测值构建银行产品的潜在客户的客户画像,根据步骤4得到的重要特征集可以构建客户画像,根据客户购买某项产品的概率预测值来进行精准营销;

步骤6、将模型得到的结果与贵宾客户迎客系统对接,在系统识别出客户后,给出精准营销策略,以便网点客户经理更大概率营销成功。

其中:步骤1的预处理具体包括:

数据预处理第一步是特征筛选,剔除缺失比例高于90%的特征。接下来处理缺失值,因为原始数据中存在某个特征的值缺失的情况,处理缺失值(也叫空值)的方法是使用均值替代,如果空值是数值型的,就根据该属性在其他所有对象的取值的平均值来填充该缺失的属性值;如果空值是非数值型的,就根据统计学中的众数原理,用该属性在其他所有对象的取值次数最多的值来补齐该缺失的属性值。对于连续型变量,做标准化处理;对于离散型变量,做独热编码;对金融类特征做对数处理。

步骤2具体为:

将客户在目前已有行为下的数据和银行产品的相关规则作为模型的输入,计算客户基于目前在银行的行为习惯(认为客户在一段时间内行为习惯不会有大改变)、银行产品规则的产品购买概率。例如:以客户承受风险能力来看,长期购买本金有保障利息低的定期性产品的客户为保守型,大概率会接受银利多、大额存单、国债等定期利息类存款产品;能够承受本金亏损概率低于某个值的、追求高于存款利息的成长型客户,大概率会接受账户贵金属、债券类基金、低分险类理财产品等;追求高利息且不惧成本损失的激进型客户,很大概率还购买股票类基金、高风险类理财产品等。

基于银行惠农知识图谱和机器学习算法相结合挖掘银行潜在惠农客户的方法,利用将与三农相关的结构化关系数据构建三农知识图谱,再结合金融系统历史记录构建样本;运用高效的xgboost集成分类器训练潜在惠农客户预测模型,挖掘出具有营销更高成功率的潜在惠农客户,实现对客户进行精准营销;该发明的广泛应用和推广,将给予业务人员提供更加营销价值的授信客户,提高了一线业务人员的工作效率,为银行开展授信业务有着重大的意义和应用价值。

当然,上述说明也并不仅限于上述举例,本发明未经描述的技术特征可以通过或采用现有技术实现,在此不再赘述;以上实施例仅用于说明描述本发明的技术方案并非是对本发明的限制,参照优选的实施方式对本发明进行了详细说明,本领域的普通技术人员应当理解,本技术领域的普通技术人员在本发明的实质范围内所做出的变化、改型、添加或替换都不脱离本发明的宗旨,也应属于本发明的权利要求保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1