基于聚类群体的动态小额授信方法与流程

文档序号:33712905发布日期:2023-04-01 00:44阅读:49来源:国知局
基于聚类群体的动态小额授信方法与流程

1.本发明涉及授信额度技术领域,特别涉及一种基于聚类群体的动态小额授信方法。


背景技术:

2.贷款业务是借款人在购买消费类大额资金时支付一定比例金额的首期款项,不足部分由银行向其发放并直接支付给经销商的人民币贷款业务。借贷用户授信需要提供大量的资料,消耗大量的人力成本和时间成本,并且传统的经验法对用户类别进行划分,具有很强的主观性,细分的结果不客观,缺失说服力。并且随着市场的不断壮大,贷款业务增长迅猛,面对海量的数据,传统的用户细分方法更显得力不从心,因此用户贷款申请周期也越来越长,导致用户体验下降,成交转化率降低。


技术实现要素:

3.本发明提供了一种基于聚类群体的动态小额授信方法,采用k-means算法训练用户聚类模型,并根据聚类模型对待借款用户进行所属类别划分,进而根据待借款用户的信用评级确定最终授信额度,提高用户体验,且提高成交转化率。
4.本发明提供了一种基于聚类群体的动态小额授信方法,包括:
5.获取若干个借贷用户以及所述借贷用户的资质数据;其中,所述资质数据包括年龄数据、性别数据、职业数据和收入范围数据;
6.将所述若干个借贷用户及其资质数据作为训练数据,构建采用k-means算法进行训练的用户聚类模型;
7.获取待借款用户的资质数据,并将所述待借款用户的资质数据输入所述用户聚类模型,得到所述待借款用户的所属类别;
8.根据所述待借款用户的所属类别确定所述待借款用户的初始授信额度;
9.获取所述待借款用户的信用评分,并根据所述待借款用户的信用评分和若干个借贷用户的信用评分确定所述待借款用户的信用评级;
10.根据所述待借款用户的信用评级和初始授信额度确定所述待借款用户的最终授信额度,并根据所述最终授信额度对所述待借款用户进行授信。
11.进一步地,将所述若干个借贷用户及其资质数据作为训练数据,构建采用k-means算法进行训练的用户聚类模型的步骤,包括:
12.抽取所述若干个借贷用户的资质数据和外部数据;其中,所述外部数据包括fico分数据、征信数据、银联数据;
13.根据所抽取的资质数据和外部数据进行特征生成,特征生成的维度包括年龄、教育水平数据、婚姻状态、职业、贷款、信用卡、公积金、住房;
14.对特征生成所涉及的维度的数据进行缺失值和异常值处理;
15.判断离散变量的取值是否具有大小的意义,若有则使用数值映射方法进行替换,
means算法进行训练的用户聚类模型;
38.输入模块,用于获取待借款用户的资质数据,并将所述待借款用户的资质数据输入所述用户聚类模型,得到所述待借款用户的所属类别;
39.确定模块,用于根据所述待借款用户的所属类别确定所述待借款用户的初始授信额度;
40.第二获取模块,用于获取所述待借款用户的信用评分,并根据所述待借款用户的信用评分和若干个借贷用户的信用评分确定所述待借款用户的信用评级;
41.授信模块,用于根据所述待借款用户的信用评级和初始授信额度确定所述待借款用户的最终授信额度,并根据所述最终授信额度对所述待借款用户进行授信。
42.本发明还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
43.本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
44.本发明的有益效果为:
45.获取若干个借贷用户以及所述借贷用户的资质数据,并构建采用k-means算法进行训练的用户聚类模型,以确定待借款用户的所属类别,进而得到待借款用户的初始授信额度,获取所述待借款用户的信用评分,并根据若干个借贷用户的信用评分确定待借款用户的信用评级,最后,根据待借款用户的信用评级和初始授信额度确定待借款用户的最终授信额度,并进行授信,提高用户体验,且提高成交转化率。
附图说明
46.图1为本发明一实施例的方法流程示意图。
47.图2为本发明一实施例的装置结构示意图。
48.图3为本发明一实施例的计算机设备内部结构示意图。
49.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
50.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
51.如图1所示,本发明提供了一种基于聚类群体的动态小额授信方法,包括:
52.s1、获取若干个借贷用户以及所述借贷用户的资质数据;其中,所述资质数据包括年龄数据、性别数据、职业数据和收入范围数据;以便根据年龄数据、性别数据、职业数据和收入范围数据对若干个借贷用户进行聚类,同一类别的用户具有相近的年龄数据、性别数据、职业数据和处于同一收入范围。
53.s2、将所述若干个借贷用户及其资质数据作为训练数据,构建采用k-means算法进行训练的用户聚类模型;
54.步骤s2具体包括:
55.s21、抽取所述若干个借贷用户的资质数据和外部数据;其中,所述外部数据包括fico分数据、征信数据、银联数据;
56.s22、根据所抽取的资质数据和外部数据进行特征生成,特征生成的维度包括年
龄、教育水平数据、婚姻状态、职业、贷款、信用卡、公积金、住房;
57.s23、对特征生成所涉及的维度的数据进行缺失值和异常值处理;具体包括:当缺失比例高于预设比例阈值时,删除该特征维度;当缺失比例低于所述预设比例阈值时,采用插值方式进行数值填充,比如拉格朗日插值法、均值、众数填充等。通过箱型图进行异常值识别,一般大于或小于箱型图设定的上下界的数据认作异常点,识别后采用直接删除的方式。当缺失值有特殊含义时,单独将缺失值归纳为一类。这里的特殊含义是指特征维度的数据产生缺失是有原因的,比如fico分缺失一部分是由于未查,一部分是由于查了但未查得,这是两种不同的缺失,分别进行归类。
58.s24、判断离散变量的取值是否具有大小的意义,若有则使用数值映射方法进行替换,否则对离散变量进行one-hot编码;one-hot编码又称一位有效编码,其方法使用n位状态寄存器来对n个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效。这里所指的有效是,经过one-hot编码后,只有一位是1,其余都是0,比如客户的收入水平是高、中、低,经独热编码后变成{高:100,中:010,低:001},这里的1就是有效的,即在编码后只有一位为非零值。
59.s25、对特征数据采用pca算法进行数据降维至预设维度,并选取所述用户聚类模型的k值,完成所述用户聚类模型的构建。pca即主成分分析发,是一种广泛使用的数据降维方法,主要思想是将n维特征映射到k维上,这k维的全新正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。将降维后数据集(3维)采用k-means算法进行模型训练。k-means算法是一种无监督机器学习方法,其基本思想是在数据集中根据一定策略选择k个点作为每个簇的初始中心,然后观察剩余的数据,将数据划分到距离这k个点最近的簇中,在生成的新簇中,重新计算每个簇的中心点,然后再进行划分,直到每次划分的结果保持不变。训练用户聚类模型,最重要的是k值的选取,常见的确定聚类数k的方法有肘部法则和轮廓系数法。
60.s26、根据所述用户聚类模型的输出,分析同用户群类别的特征变量分布,并将用户的所属类别分为一类、二类、三类和四类。
61.s3、获取待借款用户的资质数据,并将所述待借款用户的资质数据输入所述用户聚类模型,得到所述待借款用户的所属类别;
62.s4、根据所述待借款用户的所属类别确定所述待借款用户的初始授信额度;
63.步骤s4具体包括:
64.s41、获取所述待借款用户所属类别的多个借贷用户的最高授信额度和最低授信额度;
65.s42、将所述最高授信额度和最低授信额度删除,并计算所述待借款用户所属类别的平均授信额度;即删除最高授信额度及其借贷用户、最低授信额度及其借贷用户,并计算剩余用户的平均授信额度。
66.s43、将所述平均授信额度作为所述结款用户的初始授信额度。
67.s5、获取所述待借款用户的信用评分,并根据所述待借款用户的信用评分和若干个借贷用户的信用评分确定所述待借款用户的信用评级;
68.步骤s5具体包括:
69.s51、获取所述若干个借贷用户的信用评分、借贷用户的个数、最高信用评分和最
低信用评分;
70.s52、根据所述若干个借贷用户的信用评分和所述借贷用户的个数计算所述若干个借贷用户的平均信用评分;
71.s53、根据所述最高信用评分、最低信用评分和平均信用评分将所述借贷用户的信用评级划分为第一等级、第二等级和第三等级;即,将最高信用评分到平均信用评分之间的评分差平均划分为3等份,记录最高信用评分减去2等份的值为第一中间值;将将最低信用评分到平均信用评分之间的评分差平均划分为3等份,记录最低信用评分加上2等份的值为第二中间值;最低信用评分到第二中间值的信用评分范围为第三等级,第二中间值到第一中间值的信用评分范围为第二等级,第一中间值到最高信用评分的信用评分范围为第一等级。
72.s54、根据所述待借款用户的信用评分确定所述待借款用户的信用评级;根据每个信用评级的信用评分范围即能够确定待借款用户的信用评级。
73.s6、根据所述待借款用户的信用评级和初始授信额度确定所述待借款用户的最终授信额度,并根据所述最终授信额度对所述待借款用户进行授信。
74.步骤s6具体包括:
75.s61、当所述待借款用户的信用评级为第一等级时,将所述初始授信额度上升设定额度作为所述待借款用户的最终授信额度;设定额度根据具体情况进行调整,在此不做限定。
76.s62、当所述待借款用户的信用评级为第二等级时,将所述初始授信额度作为所述待借款用户的最终授信额度;
77.s63、当所述待借款用户的信用评级为第三等级时,将所述初始授信额度下降设定额度作为所述待借款用户的最终授信额度;
78.s64、根据所述最终授信额度对所述待借款用户进行授信。
79.本发明的有益效果为:获取若干个借贷用户以及所述借贷用户的资质数据,并构建采用k-means算法进行训练的用户聚类模型,以确定待借款用户的所属类别,进而得到待借款用户的初始授信额度,获取所述待借款用户的信用评分,并根据若干个借贷用户的信用评分确定待借款用户的信用评级,最后,根据待借款用户的信用评级和初始授信额度确定待借款用户的最终授信额度,并进行授信,提高用户体验,且提高成交转化率。
80.如图2所示,本发明还提供了一种基于聚类群体的动态小额授信装置,包括:
81.第一获取模块1,用于获取若干个借贷用户以及所述借贷用户的资质数据;其中,所述资质数据包括年龄数据、性别数据、职业数据和收入范围数据;
82.训练模块2,用于将所述若干个借贷用户及其资质数据作为训练数据,构建采用k-means算法进行训练的用户聚类模型;
83.输入模块3,用于获取待借款用户的资质数据,并将所述待借款用户的资质数据输入所述用户聚类模型,得到所述待借款用户的所属类别;
84.确定模块4,用于根据所述待借款用户的所属类别确定所述待借款用户的初始授信额度;
85.第二获取模块5,用于获取所述待借款用户的信用评分,并根据所述待借款用户的信用评分和若干个借贷用户的信用评分确定所述待借款用户的信用评级;
86.授信模块6,用于根据所述待借款用户的信用评级和初始授信额度确定所述待借款用户的最终授信额度,并根据所述最终授信额度对所述待借款用户进行授信。
87.在一个实施例中,训练模块2,包括:
88.抽取单元,用于抽取所述若干个借贷用户的资质数据和外部数据;其中,所述外部数据包括fico分数据、征信数据、银联数据;
89.生成单元,用于根据所抽取的资质数据和外部数据进行特征生成,特征生成的维度包括年龄、教育水平数据、婚姻状态、职业、贷款、信用卡、公积金、住房;
90.处理单元,用于对特征生成所涉及的维度的数据进行缺失值和异常值处理;
91.判断单元,用于判断离散变量的取值是否具有大小的意义,若有则使用数值映射方法进行替换,否则对离散变量进行one-hot编码;
92.降维单元,用于对特征数据采用pca算法进行数据降维至预设维度,并选取所述用户聚类模型的k值,完成所述用户聚类模型的构建。
93.在一个实施例中,处理单元,包括:
94.填充子单元,用于当缺失比例高于预设比例阈值时,删除该特征维度;当缺失比例低于所述预设比例阈值时,采用插值方式进行数值填充。
95.在一个实施例中,训练模块2还包括:
96.分类单元,用于根据所述用户聚类模型的输出,分析同用户群类别的特征变量分布,并将用户的所属类别分为一类、二类、三类和四类。
97.在一个实施例中,确定模块4,包括:
98.第一获取单元,用于获取所述待借款用户所属类别的多个借贷用户的最高授信额度和最低授信额度;
99.第一计算单元,用于将所述最高授信额度和最低授信额度删除,并计算所述待借款用户所属类别的平均授信额度;
100.作为单元,用于将所述平均授信额度作为所述结款用户的初始授信额度。
101.在一个实施例中,第二获取模块5,包括:
102.第二获取单元,用于获取所述若干个借贷用户的信用评分、借贷用户的个数、最高信用评分和最低信用评分;
103.第二计算单元,用于根据所述若干个借贷用户的信用评分和所述借贷用户的个数计算所述若干个借贷用户的平均信用评分;
104.划分单元,用于根据所述最高信用评分、最低信用评分和平均信用评分将所述借贷用户的信用评级划分为第一等级、第二等级和第三等级;
105.确定单元,用于根据所述待借款用户的信用评分确定所述待借款用户的信用评级;
106.在一个实施例中,授信模块6,包括:
107.上升单元,用于当所述待借款用户的信用评级为第一等级时,将所述初始授信额度上升设定额度作为所述待借款用户的最终授信额度;
108.使用单元,用于当所述待借款用户的信用评级为第二等级时,将所述初始授信额度作为所述待借款用户的最终授信额度;
109.下降单元,用于当所述待借款用户的信用评级为第三等级时,将所述初始授信额
度下降设定额度作为所述待借款用户的最终授信额度;
110.授信单元,用于根据所述最终授信额度对所述待借款用户进行授信。
111.上述各模块、单元、子单元均是用于对应执行上述基于聚类群体的动态小额授信方法中的各个步骤,其具体实现方式参照上述方法实施例所述,在此不再进行赘述。
112.如图3所示,本发明还提供了一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储基于聚类群体的动态小额授信方法的过程需要的所有数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现基于聚类群体的动态小额授信方法。
113.本领域技术人员可以理解,图3中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定。
114.本技术一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任意一个基于聚类群体的动态小额授信方法。
115.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram通过多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
116.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
117.以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1