一种通过BP神经网络预测银行客户流失的方法与流程

文档序号:16756828发布日期:2019-01-29 17:28阅读:727来源:国知局
一种通过BP神经网络预测银行客户流失的方法与流程
本发明涉及银行客户智能营销应用,尤其涉及一种通过bp神经网络预测银行客户流失的方法。
背景技术
:客户营销是银行实现业绩、规模、收益最大化的根本途径。但规模并不等于收益,不是说有了规模就一定会有收益。主动性营销使得银行客户规模转变成银行业绩和银行收益。以天津渤海银行为例,其全行客户中,只有极少比例的客户属活跃客户,需将非活跃客户或睡眠客户进行筛选,增加标签,以便开展针对性客户激活营销。1)现有技术的主要的结构、原理、技术手段和方法步骤;目前的主动性营销主要采用数据分析挖掘技术手段,对现存客户生成统计分析报表。由银行的数据分析师对银行存量客户进行统计分析,分析数据包括客户基本信息情况,资产及负债情况,交易消费情况等。根据客户的信息来人工识别客户对金融方面的融资需求或投资需求,再通知一线营销人员对指定客户群进行营销。2)现有技术存在的问题和缺点。当前的主要问题是技术洞察手段陈旧、只统计静态结果,不能提前预判客户流失可能性。因其报表只反映了客户事后的真实情况,很难在事前采取主动客户挽留。很多情况下当客户大量资金转出到同业银行后报表才反映出客户已经流失,但在这个阶段再进行主动营销,效果已经不明显。技术实现要素:为了改善客户体验,降低银行客户流失,本发明提出了一种通过bp神经网络预测银行客户流失的方法,对银行存量的客户的特征分析能力,对可能流失的客户采取事前预警措施,提醒客户经理及时维护客户关系,挽留银行优质客户。本发明的技术方案是:一种通过bp神经网络预测银行客户流失的方法该,主要包含以下步骤:a、抽取并加工银行客户流失相关特征点数据;b、构建客户流失预警bp神经网络算法;c、客户流失预警bp神经网络算法参数设置。进一步的,a所述数据项为银行客户流失相关特征点,特征包括客户基本信息数据项和相关客户指标数据项。其中,基本信息数据项包括:bcif开卡等级(0-3)、性别(0,1)、教育程度(0-99)、年收入等级(1-10)、家庭月收入级别(1-8)指标数据项包括:活期存款余额、结构性存款余额、非结构性存款余额、贷款余额、不良贷款余额、活期存款发生额、结构性存款发生额、非结构性存款发生额、贷款发生额、不良贷款发生额、月消费金额、月消费笔数、月转入金额、月转入笔数。进一步的,a所述数据项为必须是数值型,非数值型数据项需加工成数值型数据项。进一步的,b所述客户流失预警bp神经网络算法。该算法采用矩阵乘法来计算出预测结果值x=sigmoid(np.dot(w,x)+b),激活函数采用sigmoid函数,w为权重矩阵,x为特征点数据,b为偏置矩阵。反馈更新函数:updata_parameter用来持续优化权重和偏置的变量值其中重要的子函数用来计算误差值并反向传递模型训练evaluate函数评估验证集和测试集的精度predict函数返回预测的准确度,对预测结果值进行输出进一步的,b所述客户流失预警bp神经网络算法的目标预测值分类,共分为5类客户,包括0代表流失客户、1代表预警客户、2代表正常客户、3代表良好客户、4代表积极客户;预测标签采用矩阵赋移位赋值方式index_date['flag_n1'][0:-1]=np.array(index_date['flag'][1:])进一步的,c所述客户流失预警bp神经网络算法参数设置。该算法参数设置,特征点数量,featurenum,设置为25;神经元数量,nervecell值设置等同特征点数量;分类数量,clsssfy分类是5类;训练数据块大小,min_batch_size设置为300;反向传导系数,eta设置为3.0;通过测试验证预测值准确率相对较高。本发明的有益效果是1、通过特征点和流失率的关联分析、可以分析出哪些因素对客户的流失产生较强影响。2、通过bp神经网络的训练,可以生成预测数据模型,并提升预测客户流失的准确度。3、通过客户流失的提前预警,方便了银行营销部门更精准的挽留预流失客户,降低客户流失率,同时提升部门业绩。模型训练结果在80%左右,预测结果的准确率在64%后达到一个稳定的状态。附图说明图1是bp神经网络神经元计算原理图;图2是bp神经网络预测银行客户流失率建模流程图。具体实施方式下面对本发明的内容进行更加详细的阐述:该技术方案方法是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络之一。加工预测流程如附图2所示。首先,分析采集用户的特征点数据;其次,按业务逻辑内容抽取加工特征点数据;再次,利用bp神经网络算法对基本数据进行训练,生成bp算法的内部模型;再次,训练模型度达到一定准确度后,采用预测数据对未来的客户流失进行预测。最后,通过算法实践对客户流失进行客观验证。特征点数据项如下:◆客户基本信息bcif开卡等级(0-3)、性别(0,1)、教育程度(0-99)、年收入等级(1-10)、家庭月收入级别(1-8)◆常用指标信息(月指标)余额:活期存款余额、结构性存款余额、非结构性存款余额、贷款余额、不良贷款余额、发生额:活期存款发生额、结构性存款发生额、非结构性存款发生额、贷款发生额、不良贷款发生额;金额|笔数:月消费金额、月消费笔数、月转入金额、月转入笔数◆贡献度指标存款效益(元)、中间业务效益(元)、贷款效益(元)◆忠诚度指标存款忠诚度=存款分值*存款权重理财忠诚度=理财分值*理财权重基金忠诚度=基金分值*基金权重算法如下:本方案的bp神经网络是在输入层与输出层之间增加一层隐性神经元,它们与外界没有直接的联系,但其状态的改变,则能影响输入与输出之间的关系,该单层神经元有25个节点。隐性神经元数量和特征点数量接近对预测准确度有所提升。神经元的计算原理如附图1,利用权重矩阵的权值变化来模拟非线性化取值问题。计算公式为:x=sigmoid(np.dot(w,x)+b)sigmoid为s型激活函数,是神经网络的阈值函数,将变量映射到0,1之间。np.dot为矩阵乘法函数,w为权重矩阵,x为特征点数据,b为偏置矩阵初始参数配置,采用高斯分布函数生成初始值。产生两个数组self.bias=[np.random.randn(a3,1)fora3insizes[1:]]#利用高斯分布,产生偏置数组(30l,1l)(10l,1l)反馈更新函数:updata_parameter用来持续优化权重和偏置的值其中重要的子函数evaluate函数评估验证集和测试集的精度predict函数返回预测的准确度,对预测结果值进行输出在训练过程中,样本需要按日期进行打乱,避免特定日期数据对样本的训练结果产生偏置影响。数据标准化避免因特征点之间数据差异过大影响预测结果流失客户打标签,目前只给历史流失客户打标签客户流失级别分为5个级别,0代表流失客户1代表预警客户、2代表正常客户、3代表良好客户、4代表积极客户0流失客户:判断逻辑为连续3个月内存款忠诚度、理财忠诚度、基金忠诚度持续下降;1预警客户:判断逻辑为环比上月存款忠诚度、理财忠诚度、基金忠诚度总和持续下降;2正常客户:判断逻辑为环比上月存款忠诚度、理财忠诚度、基金忠诚度总和的变动在5%以内;3良好客户:判断逻辑为环比上月存款忠诚度、理财忠诚度、基金忠诚度总和持续上升;4积极客户:判断逻辑为连续3个月内存款忠诚度、理财忠诚度、基金忠诚度总和持续上升;经过数据加工,生成流失客户标签。预测下个月的流失的标签数据加工index_date[’flag_n1’][0:-1]=np.array(index_date[’flag’][1:])数据拆分:分开训练数据和验证数据,以方便数据验证。print″==============================数据输出完毕==============================″sp=int(len(features)*9./10.)#对数据分类,分为训练数据集和测试数据集features_1=features[:sp]#训练数据特征点lables_1=lables[:sp]#训练数据标签features_2=features[sp:]#验证数据特征点lables_2=lables[sp:]#验证数据标签实施方式:调用程序及参数设置#!/usr/bin/envpython#-*-coding:utf-8-*-#@time:2018-08-2015:24#@author:liangwangjone#@file:net_test.pyimportnet_load_datafromnet_load_dataimport*importnet_networkasnetfeaturenum=25#特征点数量nervecell=25#神经元数量clsssfy=10net1=net.network([featurenum,nervecell,clsssfy])#特征点数量、隐藏层神经元数量、输出min_batch_size=300#最小切块大小eta=3.0#反向传导系数epoches=1000#训练次数nld=netloaddata()train_data,validation_data,pre_data=nld.data_transform(featurenum)netl.sgd(train_data,min_batch_size,epoches,eta,validation_data)#预测数据netl.predict(pre_data)print″complete″重要参数替代技术方案(无)第235次训练,准确率64.0,公式:16269/25320000000000000000000000000000000000第236次训练,准确率64.0,公式:16269/25320000000000000000000000000000000000第237次训练,准确率64.0,公式:16268/25320000000000000000000000000000000000第238次训练,准确率64.0,公式:16268/25320000000000000000000000000000000000第239次训练,准确率64.0,公式:16269/25320000000000000000000000000000000000第240次训练,准确率64.0,公式:16272/25320000000000000000000000000000000000第241次训练,准确率64.0,公式:16271/25320000000000000000000000000000000000第242次训练,准确率64.0,公式:16269/25320000000000000000000000000000000000第243次训练,准确率64.0,公式:16272/25320000000000000000000000000000000000第244次训练,准确率64.0,公式:16271/25320000000000000000000000000000000000第245次训练,准确率64.0,公式:16271/25320。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1