基于聚类分析的信贷风控预警方法及系统与流程

文档序号:33475281发布日期:2023-03-15 09:59阅读:53来源:国知局
基于聚类分析的信贷风控预警方法及系统与流程

1.本发明涉及数据处理技术领域,具体涉及基于聚类分析的信贷风控预警方法及系统。


背景技术:

2.信用评估主要用于信贷业务,信用评估等级越高进行对应的信贷额度越高。在现有技术中,对于信贷风控预警主要通过各客户的贷款记录标签进行信用评价,该评价方式存在一定的局限性,无法全面的对客户信用进行评价,导致客户信用评价结果不准确的问题。
3.因此,在现有技术中信用风控存在评价不全面,评价不准确的技术问题。


技术实现要素:

4.本技术提供基于聚类分析的信贷风控预警方法及系统,用于针对解决现有技术中信用风控存在评价不全面,评价不准确的技术问题。
5.鉴于上述问题,本技术提供了基于聚类分析的信贷风控预警方法及系统。
6.本技术的第一个方面,提供了基于聚类分析的信贷风控预警方法,所述方法应用于信贷风控预警系统,所述系统与云服务器通信连接,所述方法包括:连接信贷数据管理系统,获取标签客户的信息;基于所述标签客户的信息,获取各个标签客户的标签生成周期;将所述标签生成周期作为输入信息判断是否进行激活标签更新指令,若激活所述标签更新指令,获取待更新客户的信息;将所述待更新客户的信息输入标签更新模型中,根据所述标签更新模型,获取更新标签集合,其中,所述标签更新模型嵌于所述云服务器中;以所述更新标签集合对所述待更新客户的信贷标签进行更新,获取更新状态,当处于更新完成的状态时,对所述各个标签客户进行标签聚类,获取二次聚类结果;基于所述二次聚类结果对标签客户进行降维风险分析,生成信贷风险指数;根据所述信贷风险指数,生成预警提醒信息。
7.本技术的第二个方面,提供了基于聚类分析的信贷风控预警系统,所述系统与云服务器通信连接,所述系统包括:标签客户信息获取模块,用于连接信贷数据管理系统,获取标签客户的信息;标签生成周期获取模块,用于基于所述标签客户的信息,获取各个标签客户的标签生成周期;待更新客户信息获取模块,用于将所述标签生成周期作为输入信息判断是否进行激活标签更新指令,若激活所述标签更新指令,获取待更新客户的信息;更新标签集合获取模块,用于将所述待更新客户的信息输入标签更新模型中,根据所述标签更新模型,获取更新标签集合,其中,所述标签更新模型嵌于所述云服务器中;标签聚类模块,用于以所述更新标签集合对所述待更新客户的信贷标签进行更新,获取更新状态,当处于更新完成的状态时,对所述各个标签客户进行标签聚类,获取二次聚类结果;信贷风险指数获取模块,用于基于所述二次聚类结果对标签客户进行降维风险分析,生成信贷风险指数;预警提醒模块,用于根据所述信贷风险指数,生成预警提醒信息。
8.本技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:
9.本技术实施例提供的方法通过连接信贷数据管理系统,获取标签客户的信息。基于所述标签客户的信息,获取各个标签客户的标签生成周期。将所述标签生成周期作为输入信息判断是否进行激活标签更新指令,若激活所述标签更新指令,获取待更新客户的信息。将所述待更新客户的信息输入标签更新模型中,根据所述标签更新模型,获取更新标签集合,其中,所述标签更新模型嵌于所述云服务器中。以所述更新标签集合对所述待更新客户的信贷标签进行更新,获取更新状态,当处于更新完成的状态时,对所述各个标签客户进行标签聚类,获取二次聚类结果。基于所述二次聚类结果对标签客户进行降维风险分析,生成信贷风险指数。通过对标签客户进行聚类分析,根据聚类结果对标签客户进行聚类后的风险评估,由于聚类结果中包含具有相同或相似信用评价的标签客户,使得评估对象的信用数据比对参照更加明显,提高了信贷风险评估的准确性。解决了现有技术中信用风控存在评价不全面,评价不准确的技术问题。
10.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
11.图1为本技术提供的基于聚类分析的信贷风控预警方法流程示意图;
12.图2为本技术提供的基于聚类分析的信贷风控预警方法中生成标签更新模型的流程示意图;
13.图3为本技术提供的基于聚类分析的信贷风控预警方法中生成信贷风险指数的流程示意图;
14.图4为本技术提供了基于聚类分析的信贷风控预警系统结构示意图。
15.附图标记说明:标签客户信息获取模块11,标签生成周期获取模块12,待更新客户信息获取模块13,更新标签集合获取模块14,标签聚类模块15,信贷风险指数获取模块16,预警提醒模块17。
具体实施方式
16.本技术提供基于聚类分析的信贷风控预警方法及系统,用于针对解决现有技术中信用风控存在评价不全面,评价不准确的技术问题。
17.下面将参考附图对本技术中的技术方案进行清楚、完整地描述。所描述的实施内容例仅为本技术所能实现的部分内容,而不是本技术的全部内容。
18.实施例一
19.如图1所示,本技术提供了基于聚类分析的信贷风控预警方法,所述方法应用于信贷风控预警系统,所述系统与云服务器通信连接,所述方法包括:
20.步骤100:连接信贷数据管理系统,获取标签客户的信息;
21.步骤200:基于所述标签客户的信息,获取各个标签客户的标签生成周期;
22.步骤300:将所述标签生成周期作为输入信息判断是否进行激活标签更新指令,若激活所述标签更新指令,获取待更新客户的信息;
23.具体的,连接信贷数据管理系统,其中信贷数据管理系统中记录各个客户信息以及对应的信用信息,获取标签客户的信息,其中标签客户为信贷风控预警的评估客户。基于标签客户的信息,获取各个标签客户的标签生成周期,其中客户的标签为客户的信用标签,该信用标签为现有技术中用于评价客户信用的标签,获取标签的生成周期即标签的生成时长。随后,将标签生成周期作为输入信息判断是否进行激活标签更新指令,即判断标签的生成时长是否会激活标签更新指令,避免标签长时间不更新导致信用信息存在误差,若激活所述标签更新指令,获取待更新客户的信息。
24.本技术实施例提供的方法步骤300还包括:
25.步骤310:基于所述标签客户的信息对各个标签客户进行客户属性信息分析,获取预设标签生成周期;
26.步骤320:判断所述标签生成周期是否处于所述预设标签生成周期中;
27.步骤330:若所述标签生成周期处于所述预设标签生成周期中,以使所述标签更新指令处于未激活状态;
28.步骤340:若所述标签生成周期处于所述预设标签生成周期中,以使所述标签更新指令处于已激活状态。
29.具体的,基于标签客户的信息对各个标签客户进行客户属性信息分析,获取预设标签生成周期。判断标签生成周期是否处于预设标签生成周期中,其中预设标签生成周期为系统为客户预设的标签生成周期。当标签生成周期处于预设标签生成周期中时,此时标签还未达到预定的更新时间周期,则使得标签更新指令处于未激活状态。若所述标签生成周期处于所述预设标签生成周期中,此时标签已经达到预定的更新时间周期,则使得标签更新指令处于已激活状态,对标签客户的标签信息进行更新。
30.如图2所示,本技术实施例提供的方法步骤300还包括:
31.步骤350:将所述待更新客户的信息输入所述云服务器的云数据库中;
32.步骤360:基于所述信贷数据管理系统,获取用于进行数据特征识别的初始标签生成模型;
33.步骤370:将所述初始标签生成模型链接至所述云服务器的云处理器中;
34.步骤380:通过调用所述云处理器中的初始标签生成模型和所述云数据库中的所述待更新客户的信息,生成所述标签更新模型。
35.具体的,将待更新客户的信息输入所述云服务器的云数据库中,基于信贷数据管理系统,获取进行数据特征识别的初始标签生成模型,其中初始标签生成模型为现有技术中的标签生成模型。将所述初始标签生成模型链接至所述云服务器的云处理器中。进一步,调用云处理器中的初始标签生成模型和所述云数据库中的所述待更新客户的信息,生成所述标签更新模型。即根据云数据库中的所述待更新客户的信息,对初始标签生成模型进行更新,生成标签更新模型。
36.本技术实施例提供的方法步骤380还包括:
37.步骤381:获取用于进行消费降维分析的待采集指标集合;
38.步骤382:按照所述待采集指标集合对所述待更新客户进行数据采集,获取降维数据特征;
39.步骤383:以所述降维数据特征作为新增特征,对所述初始标签生成模型进行增量
学习,获取所述标签更新模型,其中,所述标签更新模型用于对各个客户的风险标签进行更新。
40.具体的,获取用于进行消费降维分析采集指标,其中消费降维分析中的采集指标,可以根据实际情况设定与消费相关的指标,如工资水平、债务水平、平均消费金额等采集指标,得到待采集指标集合。按照待采集指标集合对所述待更新客户进行数据采集,将采集的数据进行数据降维,获取降维数据特征。随后,以降维数据特征作为新增特征,对初始标签生成模型进行增量学习,即在初始标签生成模型的基础上增加新增特征并进行增量学习,获取增量学习完成后的标签更新模型,标签更新模型用于对各个客户的风险标签进行更新,增加对客户的消费降维分析,提高风险标签获取的准确性。
41.本技术实施例提供的方法步骤380还包括:
42.步骤384:获取用于进行模型性能测试的测试样本数据集;
43.步骤385:根据所述测试样本数据集,对所述标签更新模型进行ks模型测试,获取ks测试结果,其中,所述ks测试结果包括ks测试曲线;
44.步骤386:以所述ks测试曲线对所述标签更新模型的性能进行分析,获取模型性能评分;
45.步骤387:以所述模型性能评分将所述标签更新模型嵌入所述云服务器中,获取所述更新标签集合。
46.具体的,获取用于进行模型性能测试的测试样本数据集,其中模型性能测试的测试样本数据集通过人工标识的方式进行获取,将原有的标签客户的数据进行更新标签标记,获取测试样本数据集,其中测试样本数据集中包含正样本数据和负样本数据,如收入水平为正和收入水平为负的对应标记标签,其中收入水平为正的对应标记标签为正样本数据,收入水平为负的对应标记标签为负样本数据。得到测试样本数据集。根据所述测试样本数据集,将测试样本数据集输入标签更新模型中,对所述标签更新模型进行ks模型测试,其中ks模型为风控模型,其用于评估模型的区分能力,获取ks测试结果,其中,所述ks测试结果包括ks测试曲线。以ks测试曲线对所述标签更新模型的性能进行分析,获取模型性能评分。在现有技术中需要判断模型有没有区分度,常通过分正负样本数据来获取分布差异,若这正负样本数据ks测试曲线的重叠部分小,代表ks测试曲线的差异性大,模型则可以更好地进行区分,获取模型性能评分。以模型性能评分将标签更新模型嵌入云服务器中,获取所述更新标签集合。
47.步骤400:将所述待更新客户的信息输入标签更新模型中,根据所述标签更新模型,获取更新标签集合,其中,所述标签更新模型嵌于所述云服务器中;
48.步骤500:以所述更新标签集合对所述待更新客户的信贷标签进行更新,获取更新状态,当处于更新完成的状态时,对所述各个标签客户进行标签聚类,获取二次聚类结果;
49.步骤600:基于所述二次聚类结果对标签客户进行降维风险分析,生成信贷风险指数;
50.步骤700:根据所述信贷风险指数,生成预警提醒信息。
51.具体的,将待更新客户的信息输入标签更新模型中,根据所述标签更新模型,获取更新标签集合,其中标签更新模型嵌于所述云服务器中。随后,以更新标签集合对所述待更新客户的信贷标签进行更新,获取更新状态,当处于更新完成的状态时,对处于更新完成状
态的客户进行标签聚类,获取二次聚类结果,在二次聚类结果中聚类结果中包含具有相同或相似信用评价的标签客户,便于后续根据聚类结果对其中存在异常数据的客户进行提取。基于二次聚类结果对各聚类结果中的标签客户进行数据差异分析,获取各聚类结果中的标签客户数据中存在异常的数据,生成信贷风险指数。最后,根据信贷风险指数,生成预警提醒信息,在进行预警提醒信息获取时,通过设置多个不同等级的信贷风险指数阈值,当超出不同等级的信贷风险指数阈值时,则输出不同等级的预警提醒信息。通过对标签客户进行聚类分析,根据聚类结果对标签客户进行聚类后的风险评估,由于聚类结果中包含具有相同或相似信用评价的标签客户,使得评估对象的信用数据比对参照更加明显,提高了信贷风险评估的准确性。
52.如图3所示,本技术实施例提供的方法步骤600还包括:
53.步骤610:基于所述标签客户的信息对各个标签客户进行一次聚类,获取一次聚类结果;
54.步骤620:以所述一次聚类结果和所述二次聚类结果进行双曲线分析,获取聚类双曲线;
55.步骤630:根据所述聚类双曲线对各个标签客户进行降维数据采集,获取降维幅值和降维周期;
56.步骤640:以所述降维幅值和所述降维周期进行降维风险分析,生成所述信贷风险指数。
57.具体的,基于标签客户的信息对各个标签客户进行一次聚类,获取一次聚类结果,即根据标签客户的信息对客户进行一次聚类。其中,一次聚类和二次聚类采用的方式均为基于varclus方法的聚类,通过将所有的变量聚类成一簇,计算其相关系数矩阵的特征值、特征向量以及载荷矩阵,随后根据设置的阈值将所有变量拆分成2类。拆分的条件是已拆分好的簇能达到解释变异的最小百分比,或者满足第二特征根大于设置的阈值,其中阈值包括第二特征值阈值以及聚类簇中变量个数阈值,具体阈值根据实际的情况需要进行设置。初始分配后迭代变量,调整变量所在的簇,尝试最大化分簇带来的簇成分对总可解释方差的提升,直到一个簇里只有一个变量或者达到群簇个数上限的终止条件,完成一次聚类。
58.其中,具体的计算过程如下:步骤1,对每个划分特征进行特征分档并计算每个档位的woe值,分档方式为等频分档。woe的计算公式如下:
[0059][0060]
p
(yi)
为第i组中违约样本占所有违约样本的比例
[0061]
p
(ni)
为第i组未违约样本占所有未违约样本的比例
[0062]
步骤2,用woe值取代真实值,计算各特征之间的相关系数(如皮尔逊相关系数),得到相关系数矩阵corr。
[0063]
其中cov(x,y)表示特征x和y的协方差,σ
x
,σy分别表示特征x和y的标准差。
[0064]
步骤3,将所有变量聚类成一簇,计算该簇的相关系数矩阵corr的前m特征值λi且λ1≥λ2≥λ≥λm,i=1,λ,m以及对应的特征向量η1,η2,λ,ηm,i=1,λ,m。获取第二大特征值λ2和载荷因子矩阵a,载荷因子矩阵的每一列为前m个特征根开根号乘上对应的特征向量。
[0065][0066]
步骤4,计算原始变量与第一主成分之间的载荷因子矩阵a、权重以及相关性,对载荷因子矩阵a正交旋转,然后进行斜交旋转,获取旋转后的载荷因子矩阵、协方差矩阵、因子得分、方差贡献度等。根据协方差矩阵计算相关系数矩阵。
[0067]
首先对变量进行标准化变换,则
[0068]
r=aa
t
+d
[0069]r*
=aa
t
=r-d
[0070]
称r
*
为约相关系数矩阵,r
*
对角线上的元素是而不是1。
[0071][0072]
直接求r
*
的前m个特征值和对应的正交特征向量,得到如下矩阵
[0073][0074]
在实际应用中,特殊因子的方差一般都是未知的,可以通过一组样本来估计。通过求出r
*
的前m个特征根,得到a的估计,进而得到d的估计。反复迭代直到迭代前后d的差别很小就停止。
[0075]
对于标准化处理的变量x=(x1,x2,λ,x
p
),假设因子分析模型为x=a
·
f+ε有
[0076][0077]
其中,a
ij
为载荷因子,f1,λ,fm是公因子,εi为特殊因子,实际分析时可忽略不计。则公因子方差(变量共同度)为公因子的方差贡献,等于该因子有关的因子载荷的平方和,即
[0078]
对因子载荷矩阵a,用一个正交矩阵γ右乘a实现对因子载荷矩阵的旋转(一次正交变换即对应坐标系的一次旋转),旋转后因子载荷矩阵结构简化,更容易对公因子进行解释。结构简化就是重新分配每个因子所解释方差的比例,使每个变量仅在一个公因子上有较大的载荷,在其他公因子上的载荷较小,即是使因子载荷矩阵每行或者每列元素的平方值向0与1两极分化。
[0079]
现假设γ是一正交阵,因子载荷矩阵正交变换后:
[0080][0081]
可知正交变换后的公因子共同度不变,但因子方差的贡献发生变化:
[0082][0083]
然后计算标准化后载荷的方差。对于某个因子fa,可定义其上的载荷间的方差为:
[0084][0085]
全部公因子各自载荷之间的总方差为:
[0086][0087]
因此,寻找一个正交矩阵γ,对已知载荷矩阵a正交变换后,新的因子载荷矩阵b=aγ中的元素能使q取极大值。对正交旋转后载荷因子矩阵进行斜交旋转。斜交旋转方法与正交旋转类似,只是变换矩阵p的选择并非是正交矩阵,是一般的非奇异矩阵。
[0088]
计算因子得分。如果a是正交的,那么就用f=a

x,如果a不是正交的,可以通过回归的方法进行计算。公因子f对变量x做如下回归
[0089][0090]

[0091][0092]
即有
[0093][0094]
其中为原始变量相关系数矩阵,为第j个因子得分函数
的系数,为载荷矩阵的第j列。
[0095]
用矩阵表示有
[0096]
步骤5,判断该簇第二特征值λ2或者变量的个数是否大于阈值。
[0097]

判断该簇的第二特征值是否大于阈值,若小于阈值则直接输出该簇变量的结果,若大于阈值,则进入下一步;
[0098]

判断该簇的变量个数是否大于阈值,若小于阈值则直接输出该簇变量的结果,若大于阈值,则进入下一步;
[0099]

根据簇中原始变量经过正交旋转和斜交旋转后第一和第二成分的相关系数平方的大小,分成新的两簇;
[0100]

迭代变量,调整变量所在分群,尝试最大化分簇带来的簇成分对总可解释方差的提升。一般包括两种方式:
[0101]
1)保持谱系结构:
[0102]
调整变量所在组,仅在拆分后的两个组之间进行,先将第二组的各变量逐一调整至第一组,每次调整选择能够提高方差贡献度最大幅度的变量进行调整,直到不能够提升方差贡献度为止;再将第一组的各变量逐一调整至第二组,规则同上。
[0103]
2)无需保持谱系结构:
[0104]
首先将其他组的变量逐一调整至第二组,每次调整选择能够提高方差贡献度最大幅度的变量进行调整,直到不能够提升方差贡献度为止;再将其它组的各变量逐一调整至第一组,规则同上。
[0105]

筛选待拆分组。计算每个组的第二大特征值,筛选第二大特征值最大的组作为待拆分组。
[0106]

将待拆分的组重复步骤二到步骤五。
[0107]
利用斜交主成分分析的聚类方法,按照不同的风险维度(或者其它维度)对特征变量进行聚类,在模型训练时只需将不同类别的变量取出来组合在一起进行模型训练,不仅可以解决变量之间的共线性问题,还能提高模型训练效率和训练效果。保留各风险维度的变量可以让模型更具有说服力便于业务应用。同时,斜交主成分是在正交主成分的基础上再作一定旋转,一方面保留了主成分的优点(主成分变量相关程度较低),一方面又具备较强的解释性,达到对变量聚类的效果,使同类别的变量相关性尽可能高,不同类别的变量相关性尽可能低。
[0108]
采用上述方法可以将客户的不同信息特征进行分组归类且每类特征之间的共线性较低,在对客户进行聚类时,只需每次取不同类别下的特征进行聚类,得到客户最优的聚类结果作为一次聚类结果。当客户信息更新后,采用上述方法可以得到更新信息后的最优聚类结果作为二次聚类结果。
[0109]
根据一次聚类结果和所述二次聚类结果进行双曲线分析,即对各聚类结果中的标签客户信息数据进行曲线构建,由于各个聚类结果中包含的客户较为相似,可以便于获取
各聚类结果中的客户特点。在进行曲线构建时对标签客户的一次聚类和二次聚类信息进行降维并构建降维曲线,获得聚类双曲线。根据聚类双曲线对各个标签客户进行降维数据采集,获取数据的降维幅值和降维周期,其中降维幅值为各数据指标下降的幅值、降维周期为对应指标下降的周期。根据降维幅值和降维周期进行降维风险分析,得到信贷风险指数。
[0110]
本技术实施例提供的方法步骤640还包括:
[0111]
步骤641:获取降维标签客户对应的降维幅值集合和降维周期集合;
[0112]
步骤642:以所述降维幅值集合和所述降维周期集合,获取降维区间;
[0113]
步骤643:根据所述降维幅值和所述降维周期与所述降维区间进行比较,生成赋值因子;
[0114]
步骤644:根据所述赋值因子对所述降维幅值和所述降维周期进行降维风险分析,生成所述信贷风险指数。
[0115]
具体的,获取降维标签客户对应的降维幅值集合和降维周期集合,以降维幅值集合和所述降维周期集合,获取降维区间,其中降维区间为各聚类结果中对应降维幅值集合和降维周期集合的众数区间值,如某一聚类结果中降维幅值和降维周期均集中在一定的区间内,则处于该区间内聚类结果中的客户在一定程度上可以体现该聚类结果中的数据水平,当处于该聚类结果中的其他客户不满足该降维区间时则说明客户信用存在一定的异常。根据降维幅值和降维周期与降维区间进行比较,生成赋值因子,赋值因子中包含差异数据和对应的差异值。其中赋值因子为降维幅值和降维周期与降维区间比较存在差异的因子。根据赋值因子对所述降维幅值和所述降维周期进行降维风险分析,在进行降维风险分析时根据赋值因子中包含的差异数据和对应的差异值,其中风险指数由各差异比例叠加计算进行获取,首先通过各差异数据计算差异比例,差异比例为差异值与二次聚类结果中对应数据原值的比例,对各差异数据的差异比例进行叠加计算,生成所述信贷风险指数,实现对信贷的风险评估。
[0116]
综上所述,本技术实施例提供的方法通过连接信贷数据管理系统,获取标签客户信息,获取各个标签客户的标签生成周期。将标签生成周期作为输入信息判断是否进行激活标签更新指令,若激活标签更新指令,获取待更新客户的信息。根据标签更新模型,获取更新标签集合。以更新标签集合对待更新客户的信贷标签进行更新,获取更新状态,当处于更新完成的状态时,对各个标签客户进行标签聚类,获取二次聚类结果。基于二次聚类结果对标签客户进行降维风险分析,生成信贷风险指数。根据信贷风险指数,生成预警提醒信息。通过对标签客户进行聚类分析,根据聚类结果对标签客户进行聚类后的风险评估,由于聚类结果中包含具有相同或相似信用评价的标签客户,使得评估对象的信用数据比对参照更加明显,提高了信贷风险评估的准确性。解决了现有技术中信用风控存在评价不全面,评价不准确的技术问题。
[0117]
实施例二
[0118]
基于与前述实施例中基于聚类分析的信贷风控预警方法相同的发明构思,如图4所示,本技术提供了基于聚类分析的信贷风控预警系统,所述系统与云服务器通信连接,所述系统包括:
[0119]
标签客户信息获取模块11,用于连接信贷数据管理系统,获取标签客户的信息;
[0120]
标签生成周期获取模块12,用于基于所述标签客户的信息,获取各个标签客户的
标签生成周期;
[0121]
待更新客户信息获取模块13,用于将所述标签生成周期作为输入信息判断是否进行激活标签更新指令,若激活所述标签更新指令,获取待更新客户的信息;
[0122]
更新标签集合获取模块14,用于将所述待更新客户的信息输入标签更新模型中,根据所述标签更新模型,获取更新标签集合,其中,所述标签更新模型嵌于所述云服务器中;
[0123]
标签聚类模块15,用于以所述更新标签集合对所述待更新客户的信贷标签进行更新,获取更新状态,当处于更新完成的状态时,对所述各个标签客户进行标签聚类,获取二次聚类结果;
[0124]
信贷风险指数获取模块16,用于基于所述二次聚类结果对标签客户进行降维风险分析,生成信贷风险指数;
[0125]
预警提醒模块17,用于根据所述信贷风险指数,生成预警提醒信息。
[0126]
进一步地,所述待更新客户信息获取模块13还用于:
[0127]
基于所述标签客户的信息对各个标签客户进行客户属性信息分析,获取预设标签生成周期;
[0128]
判断所述标签生成周期是否处于所述预设标签生成周期中;
[0129]
若所述标签生成周期处于所述预设标签生成周期中,以使所述标签更新指令处于未激活状态;
[0130]
若所述标签生成周期处于所述预设标签生成周期中,以使所述标签更新指令处于已激活状态。
[0131]
进一步地,所述待更新客户信息获取模块13还用于:
[0132]
将所述待更新客户的信息输入所述云服务器的云数据库中;
[0133]
基于所述信贷数据管理系统,获取用于进行数据特征识别的初始标签生成模型;
[0134]
将所述初始标签生成模型链接至所述云服务器的云处理器中;
[0135]
通过调用所述云处理器中的初始标签生成模型和所述云数据库中的所述待更新客户的信息,生成所述标签更新模型。
[0136]
进一步地,所述待更新客户信息获取模块13还用于:
[0137]
获取用于进行消费降维分析的待采集指标集合;
[0138]
按照所述待采集指标集合对所述待更新客户进行数据采集,获取降维数据特征;
[0139]
以所述降维数据特征作为新增特征,对所述初始标签生成模型进行增量学习,获取所述标签更新模型,其中,所述标签更新模型用于对各个客户的风险标签进行更新。
[0140]
进一步地,所述待更新客户信息获取模块13还用于:
[0141]
获取用于进行模型性能测试的测试样本数据集;
[0142]
根据所述测试样本数据集,对所述标签更新模型进行ks模型测试,获取ks测试结果,其中,所述ks测试结果包括ks测试曲线;
[0143]
以所述ks测试曲线对所述标签更新模型的性能进行分析,获取模型性能评分;
[0144]
以所述模型性能评分将所述标签更新模型嵌入所述云服务器中,获取所述更新标签集合。
[0145]
进一步地,所述信贷风险指数获取模块16还用于:
[0146]
基于所述标签客户的信息对各个标签客户进行一次聚类,获取一次聚类结果;
[0147]
以所述一次聚类结果和所述二次聚类结果进行双曲线分析,获取聚类双曲线;
[0148]
根据所述聚类双曲线对各个标签客户进行降维数据采集,获取降维幅值和降维周期;
[0149]
以所述降维幅值和所述降维周期进行降维风险分析,生成所述信贷风险指数。
[0150]
进一步地,所述信贷风险指数获取模块16还用于:
[0151]
获取降维标签客户对应的降维幅值集合和降维周期集合;
[0152]
以所述降维幅值集合和所述降维周期集合,获取降维区间;
[0153]
根据所述降维幅值和所述降维周期与所述降维区间进行比较,生成赋值因子;
[0154]
根据所述赋值因子对所述降维幅值和所述降维周期进行降维风险分析,生成所述信贷风险指数。
[0155]
上述实施例二用于执行如实施例一中的方法,其执行原理以及执行基础均可以通过实施例一中记载的内容获取,在此不做过多赘述。尽管结合具体特征及其实施例对本技术进行了描述,但本技术不受这里描述的示例实施例的限制。基于本技术的实施例,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的范围,这样获取的内容也属于本技术保护的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1