一种基于极限学习机的个人信用风险评估方法与流程

文档序号:11591484阅读:594来源:国知局

本发明涉及金融领域信用风险评估和机器学习领域,具体涉及一种基于极限学习机的个人信用风险评估方法及系统。



背景技术:

信用风险评估是银行风险管理的核心内容,世界银行对全球银行业危机的研究表明,导致银行破产的最常见的原因就是信用风险。个人信用风险评估是商业银行个人金融业务开展及信贷审批的关键环节,是个人信用风险管理的核心。对个人信用进行科学量化,建立起完善的个人信用评估体系及自动化的信用评估系统,是商业银行提高经营效益的迫切需要。目前,个人信用风险评估的方法主要包括统计学方法和非统计学方法两大类十几种评估方法,统计学方法包括决策方法、逻辑回归、线性回归、非线性回归等;非统计学方法包括线性规划、整数规划、神经网络、遗传算法、专家系统、分类树、支持向量机等。

极限学习机是一种简单易用、有效的单隐层前馈神经网络slfns学习方法,近年来在机器学习领域取得了良好的发展。由于传统的神经网络学习算法(如bp算法)需要人为设置大量的网络训练参数,并且很容易产生局部最优解,而极限学习机只需要设置网络的隐层节点个数,在算法执行过程中不需要调整网络的输入权值以及隐元的偏置,并且产生唯一的最优解,在回归和分类的问题上,极限学习机算法表现出了很好的泛化能力以及较高的精度。在确保网络具有良好的泛化性能的同时,极大地提升了训练速度,同时避免了传统神经网络算法的局部极小、迭代次数过多、学习时间长等问题。

利用极限学习机对个人信用进行风险评估,由于其不需要人为设置训练参数,只需要设置网络的隐层节点个数,且随机分配权值,因此既可以达到高精度,同时还可以减短分类时间。



技术实现要素:

为了解决上述问题,本发明提出一种基于极限学习机的个人信用风险评估方法和系统,避免了传统算法的局部极小、迭代次数过多、学习时间长以及人为设置大量网络训练参数等问题,只需要设置网络的隐层节点个数,而且在算法的执行过程中不需要调整网络输入权值,明显提高了分类的精度以及效率。

本发明是通过以下方案实现的:

本发明涉及一种基于极限学习机的个人信用风险评估方法,通过构建带标签的训练集作为样本集对极限学习机进行训练,并将训练好的极限学习机处理待分类的数据,最后根据极限学习机的输出判断识别结果进行比较得出结论。

本发明具体步骤如下:

步骤1,制作训练集并将数据进行预处理:根据可能出现的各种违约情况,不同的违约原因,尽可能全面的详细分析,制作有关个人信用数据的训练集和标签集,训练集为经过预处理之后的数据样本集合,首先将原始数据进行归一化预处理为0-1之间的数据;

步骤2,构造极限学习机:极限学习机包括:输入层、一个隐层、一个输出层,其中:输入层的数据是预处理之后的样本数据集,假设样本数据集有m个属性,n条数据,那么它就是一个m*1阶矩阵,输入层就拥有m个节点,中间的隐层有l个节点,需要人为设置,输出层就是分类之后的结果,假设分为t类,那么就有t个输出节点,即就得到一个t*l矩阵输出;

步骤3,训练极限学习机,极限学习机的基本参数和规格设置完成后,每次选取固定个数的样本输入到极限学习机中,随机初始化权重和偏置,具体过程如下:

步骤3.1:对极限学习机进行初始化,对输入权值和偏置进行随机初始化;

步骤3.2:将训练样本和标签集导入初始化之后的极限学习机进行训练,经过计算,最终得到实际输出。

步骤3.3:将实际输出与标签进行对比分析,得到结果。

步骤3.4,个人信用数据分类,提取某个人的个人信用数据信息,进行归一化处理之后,将其输入到训练好的极限学习机中,最终得到识别结果。

通过以上内容可知,本申请提供的是一种基于极限学习机的个人信用风险评估方法及系统,首先根据实际情况制作训练集和标签,然后设计极限学习机的输入节点个数、隐含层节点个数和输出节点个数等等,之后将训练集输入极限学习及中完成对极限学习机的训练,最后输入个人信用数据信息,预处理后输入到极限学习机中,完成对数据的风险评估分类。本申请通过极限学习机对个人信用数据进行评估分类,避免了人为评估个人信用风险,直接以数据形式作为输入,分类精度很高,而且可以反复被使用,处理效率高,训练时间短。

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种个人信用风险评估方法的流程图。

图2为本申请所使用的极限学习机结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。

实施例1

如图1所示,本实施例包括以下步骤:

步骤1,数据预处理:

步骤1.1:根据人们不同影响个人信用的因素,以及不同的违约情况等得到一定量的数据样本集合;

步骤1.2:将以上得到的数据样本集合进行归一化处理为0-1之间的数据,并保存为训练集,然后根据训练集制作相应的标签集;

步骤2,构建极限学习机:

本实施例中采用的极限学习机是一个单隐层的前馈神经网络,由输入层、中间层和输出层组成,输入层的节点个数对应数据样本属性个数,输出层的节点个数对应标签个数,中间隐层的节点个数是人为设置的;

步骤2.1:构造如图2所示的单隐层前馈神经网络,包括输入层,一个中间隐层,一个输出层;

例如:如图2所示的单隐层前馈神经网络,假设有n个任意的样本(xi,ti),其中xi=[xi1,xi2,…,xin]t∈rn,ti=[ti1,ti2,…,tim]t∈rm。对于一个有l个隐层节点的单隐层神经网络可以表示为:

其中,g(x)为激活函数,wi=[ωi,1,ωi,2,…,ωi,n]t为输入权重,βi为输出权重,bi是第i个隐层单元的偏置。wi·xj表示wi和xj的内积。

单隐层神经网络学习的目标是使得输出的误差最小,可以表示为:

即存在βi,wi和bi,使得

可以矩阵表示为:

hβ=t

其中,h是隐层节点的输出,β为输出权重,t为期望输出。

步骤3,训练极限学习机:

步骤3.1:对初始权重以及偏置进行初始化,设置中间隐层的节点个数;

步骤3.2:向图2中的极限学习机输入训练样本来训练网络,每条样本包括(输入向量和标签),输入经过中间隐层变幻变换,最后在输出层输出,得到输出向量;

步骤3.3:依据结果适当调整参数和偏置。

步骤4,个人信用风险评估:

步骤4.1:对个人信用数据信息根据制定的属性因素填充对应值,然后归一化预处理;

步骤4.2:得到预处理之后的数据,输入到已经训练保存好的极限学习机中,等待输出,取输出向量并与标签集合进行对比分析得到最终结果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1