基于支持向量机的信用风险预测方法及装置与流程

文档序号:35197031发布日期:2023-08-21 19:58阅读:27来源:国知局
基于支持向量机的信用风险预测方法及装置与流程

本技术涉及信用风险预测领域和金融领域,具体涉及一种基于支持向量机的信用风险预测方法及装置。


背景技术:

1、随着互联网、大数据和人工智能等技术的发展,金融行业数据量日益增大,数据类型越来越多,数据更新速度日益加快,这为金融机构的信用风险评估工作带来了挑战,传统的信用风险评估方式已经无法适应环境的不断变化,无法满足金融行业的发展需要。

2、目前,神经网络、专家系统等方法已被应用于信用风险评估中。然而,进行神经网络学习时需要提供许多高质量的训练样本,利用神经网络进行训练的过程收敛速率慢,所得到的结果往往是局部最好;专家系统也有知识难以获取、知识库维护不方便等问题。

3、利用支持向量机(svm)的方法进行数据训练能够很好的解决人工神经网络方法所存在的不足,在历史数据量少、非线性、高维度的情况下具有较强的处理能力和泛化能力,也能求解出全局最优解。但是支持向量机的分类性能在相当程度上是依赖于惩罚系数和核函数参数。

4、一些学者利用网格搜索等传统算法和群智能算法对svm进行参数优化,如通过遗传算法和蚁群算法等对支持向量机进行参数优化,取得了比较好的诊断效果,但是这些算法比较容易陷入局部最优,搜索到局部极小值,而非全局最优值。因此,如何优化支持向量机模型,找到寻找出最佳惩罚系数和核函数参数,提高信用风险预测准确率,是亟待解决的问题。


技术实现思路

1、为了解决现有技术中存在的上述问题的至少之一,本技术实施例提供一种基于支持向量机的信用风险预测方法及装置。

2、根据本技术实施例的第一方面,本技术提供一种基于支持向量机的信用风险预测方法,包括:

3、获取待评估客户的多个信用指标数据;

4、根据所述信用指标数据以及预先创建的信用风险预测模型进行信用评估,得到所述待评估客户对应的信用风险预测结果;

5、其中,所述信用风险预测模型是基于多个客户的历史信用数据训练以及基于改进遗传算法优化得到的。

6、在一实施例中,所述信用指标数据包括盈利能力数据、长期负债能力数据、短期偿债能力数据以及运营能力数据。

7、在一实施例中,创建所述信用风险预测模型的步骤包括:

8、根据多个历史客户的盈利能力数据、长期负债能力数据、短期偿债能力数据以及运营能力数据确定样本数据集;

9、基于改进遗传算法以及所述样本数据集对支持向量机模型的待优化参数进行优化,得到支持向量机模型的最优结构参数以及最优支持向量机模型;

10、基于所述样本数据集对最优支持向量机模型进行训练和验证,得到所述信用风险预测模型。

11、在一实施例中,所述根据多个历史客户的盈利能力数据、长期负债能力数据、短期偿债能力数据以及运营能力数据确定样本数据集,包括:

12、获取多个客户的历史信用数据,所述历史信用数据包括盈利能力数据、长期负债能力数据、短期偿债能力数据以及运营能力数据;

13、基于主成分分析法对各客户的历史信用数据进行降维分析,得到用于信用风险预测的多个信用指标;

14、基于所述信用指标获取各客户的历史信用指标数据,并对各历史信用指标数据进行标准化处理;

15、根据各客户标准化处理后的历史信用指标数据以及各客户对应的样本标签,生成样本数据集。

16、在一实施例中,所述基于改进遗传算法以及所述样本数据集对支持向量机模型的待优化参数进行优化,得到支持向量机模型的最优结构参数,包括:

17、根据待优化参数随机生成初始代种群;

18、根据改进后的交叉概率函数和变异概率函数生成多代种群;

19、根据改进后的适应度函数以及所述样本数据集分别计算所述初始代种群和各代种群各个体的适应度,并根据所述适应度确定所有种群中的最优个体;所述最优个体为所述最优结构参数。

20、在一实施例中,改进后的交叉概率函数为:

21、

22、改进后的变异概率函数为:

23、

24、其中,pc为交叉概率,pm为变异概率,fmax为当代种群中个体的最大适应度值,f1为当代种群中两个交叉个体中的最大适应度值,f2为当代种群中突变个体的适应度值,favg为当代种群中个体的平均适应度值,pcmax为最大的交叉概率,pcmin为最小的交叉概率,pmmax为最大的变异概率,pmmin为最小的变异概率,λ为预设参数。

25、在一实施例中,根据改进后的适应度函数以及样本数据集计算个体的适应度,包括:

26、将所述样本数据集划分为n组样本数据;

27、利用基于所述个体的支撑向量机分类器分别对n组样本数据进行分类,得到n组样本数据对应的分类结果;

28、根据各组样本数据对应的分类结果以及各组样本数据的样本标签确定与n组样本数据对应的n个分类准确率;

29、根据改进后的适应度函数以及所述n个分类准确率,确定所述个体的适应度。

30、根据本技术实施例的第二方面,本技术提供一种基于支持向量机的信用风险预测装置,包括:

31、数据获取模块,用于获取待评估客户的多个信用指标数据;

32、信用风险预测模块,用于根据所述信用指标数据以及预先创建的信用风险预测模型进行信用评估,得到所述待评估客户对应的信用风险预测结果;

33、其中,所述信用风险预测模型是基于多个客户的历史信用数据训练以及基于改进遗传算法优化得到的。

34、在一实施例中,所述基于支持向量机的信用风险预测装置还包括:

35、样本数据集确定模块,用于根据多个历史客户的盈利能力数据、长期负债能力数据、短期偿债能力数据以及运营能力数据确定样本数据集;

36、模型优化模块,用于基于改进遗传算法以及所述样本数据集对支持向量机模型的待优化参数进行优化,得到支持向量机模型的最优结构参数以及最优支持向量机模型;

37、模型训练模块,用于基于所述样本数据集对最优支持向量机模型进行训练和验证,得到所述信用风险预测模型。

38、在一实施例中,所述样本数据集确定模块包括:

39、数据采集单元,用于获取多个客户的历史信用数据,所述历史信用数据包括盈利能力数据、长期负债能力数据、短期偿债能力数据以及运营能力数据;

40、数据降维单元,用于基于主成分分析法对各客户的历史信用数据进行降维分析,得到用于信用风险预测的多个信用指标;

41、数据处理单元,用于基于所述信用指标获取各客户的历史信用指标数据,并对各历史信用指标数据进行标准化处理;以及根据各客户标准化处理后的历史信用指标数据以及各客户对应的样本标签,生成样本数据集。

42、在一实施例中,所述模型优化模块包括:

43、种群确定单元,用于根据待优化参数随机生成初始代种群;以及根据改进后的交叉概率函数和变异概率函数生成多代种群;

44、适应度确定单元,用于根据改进后的适应度函数以及所述样本数据集分别计算所述初始代种群和各代种群各个体的适应度,

45、最优结构参数确定单元,用于根据所述适应度确定所有种群中的最优个体;所述最优个体为所述最优结构参数。

46、在一实施例中,适应度确定单元具体用于:

47、将所述样本数据集划分为n组样本数据;

48、利用基于所述个体的支撑向量机分类器分别对n组样本数据进行分类,得到n组样本数据对应的分类结果;

49、根据各组样本数据对应的分类结果以及各组样本数据的样本标签确定与n组样本数据对应的n个分类准确率;

50、根据改进后的适应度函数以及所述n个分类准确率,确定所述个体的适应度。

51、根据本技术实施例的第三方面,本技术提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本技术提供的任一基于支持向量机的信用风险预测方法。

52、根据本技术实施例的第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本技术提供的任一基于支持向量机的信用风险预测方法。

53、本技术的基于支持向量机的信用风险预测方法及装置,通过改进遗传算法优化信用风险预测模型的参数组合,克服了群体智能算法在接近最优解时种群多样性减少,易陷入局部最优,搜索精度降低等不足,提高了信用风险预测模型的预测准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1