本技术涉及一种信用风险管控系统和方法,利用本技术的方法和系统能够辅助金融机构进行更为准确的风险决策,增快其数字化转型进程。详细来说本技术涉及一种针对线上信贷业务构建零售信用风险预测模型的方法和针对线上信贷业务的零售信用风险预测模型。
背景技术:
1、在当前消费信贷蓬勃发展的大环境下,部分金融机构的人工审批机制已经无法应对逐渐增多的信贷需求,因此迫切地希望提升金融机构的智能化风控能力。金融机构希望构建从客户预筛选、贷前审查、贷中审批、贷后管理到早期催收阶段的信贷全流程风险缓释机制。
2、如果能够基于早识别、早预警、早发现、早处置的原则开发评分系统,快速便捷地对信贷业务进行监控管理,就能在在风险可控的基础上,提升金融机构自身业务体量、竞争优势和资产质量。
3、但是建设评分系统对于数据和技术层面的依赖性极强,数据维度的多样性和覆盖度、建模技巧及方法论直接影响着评分系统最终的稳定性及排序性。部分金融机构对于零售业务智能化风控经验积累较少,风控能力较弱。在实际的应用过程中,存在数据挖掘分析能力欠缺、风险建模技术薄弱等因素导致金融机构无法充分发挥内部数据价值、无法有效提高模型精准度及稳定性等管控技术难题。这也是中小型金融机构在进行数字化转型方向上的面临的主要障碍之一。
技术实现思路
1、线上信贷业务(也称互联网信贷业务),是一种方便快捷的线上化贷款业务,客户可通过电子渠道进行全流程线上自助贷款业务,包括实时申请、审批、签约、支用和还款等均可在线上渠道办理,无需通过任何第三方机构或者他人进行办理。银行虽然具备互联网化的明显优势:一是银行贷款业务积累的经验以及客户资源和系统优势,二是银行线上业务发展至今的覆盖率及认识度己形成一定规模。但要实现这些功能优势向网络贷款业务的转化还需要不断的完善,网上业务不仅仅是注册窗口移植网络,而是要实现预审、预提交均在网上进行,在无法面对面地核实客户真实信息的情况下,就需要借助具备预测客户互联网信贷风险的工具协助业务开展,不仅在贷前,包括贷中和贷后都需要引进全面的智能化风险管理工具。
2、在此背景下,本技术的信用风险预测方法和系统基于大型银行海量的数据,专门从海量数据中筛选有线上信贷业务的客户数据,以零售信贷客群中的线上信贷业务客户为样本,构建了预测线上信贷业务信用风险的模型,本技术构建的模型能够有针对性地应用在线上信贷业务当中。
3、目前市场上其他的流行的评分模型建设过程中往往困囿于建模样本数量较小、数据来源较为单一、数据维度同质性较高等不利因素。同时,由于目前市面上的风险评估模型大多使用弱金融属性的数据,即基于如智能终端设备数据、社交平台数据、网购商城数据等非信贷交易类数据及非逾期类预测目标进行建模,其预测结果与实际的信贷逾期情况往往存在较大偏差。
4、本技术的方法和系统是基于高稳定、高覆盖的数据样本进行的开发,并对目前已经相对成熟的信贷风控体系进行了系统性的创新,同时在样本选择时使用零售信贷中的互联网信贷客户作为建模样本,能够对金融机构零售业务潜在的信用风险进行有效预测,尤其是零售业务中的线上信贷业务,其信用风险预测效果更为突出。
5、具体来说,本技术还可以进一步以(1)已申请信贷业务的有稳定的收入的客户群体未来是否会发生信贷逾期的概率;(2)已申请信贷业务的无稳定收入的新客户群体预测其发生信贷逾期的概率;(3)已申请信贷业务的无稳定收入的存量客户且属于经济发达地区的客户群体预测其发生信贷逾期的概率;(4)已申请信贷业务的无稳定收入的存量客户且属于经济中等发达地区的客户群体预测其发生信贷逾期的概率;(5)已申请信贷业务的无稳定收入的存量客户且属于经济欠发达地区的客户群体预测其发生信贷逾期的概率;(6)未申请信贷业务的客户群体预测其发生信贷逾期的概率,这6种信用违约概率为预测目标(即目标变量)进行研发。
6、本技术的方法和系统与市场上现有的模型相比,在预测互联网信贷客群发生信贷逾期30天及以上的区分度和稳定性等方面都有着较大的提升。
7、本技术涉及如下的技术方案:
8、1.一种计算零售信用风险的方法,其包括:
9、数据采集步骤,其获取待预测样本的零售信用预测数据;
10、对待预测样本进行分类的步骤,其基于决策树方法将待预测样本进行分类以确定用于计算信用违约概率的子模型;
11、信用违约概率计算步骤,将零售信用预测数据代入信用违约概率子模型中以计算所述待预测样本的信用违约概率,优选所述信用违约概率为针对线上信贷业务的信用违约概率。
12、2.根据项1所述的方法,其还包括:
13、在计算出信用违约概率之后,计算所述待预测样本的信用评分的步骤,其用于将计算得到的信用违约概率校准至0-1000分的标准化分数。
14、3.根据项1或2所述的方法,其中,
15、所述零售信用预测数据包括待预测样本的原始零售信用预测数据以及基于原始的零售信用预测数据加工出衍生零售信用预测数据;
16、优选,所述原始零售信用预测数据包括:
17、信用卡类基础数据,其是基于样本用户的信用卡创建过程和使用过程中全部可获取的数据,
18、个人贷款类基础数据,其是基于样本用户的贷款申请情况及使用行为的全部可获取的数据,
19、客户基本信息类基础数据,其是基于样本用户本身的属性,但与在金融机构的行为不直接关联的数据,
20、个人金融资产类基础数据,其是样本用户在金融机构与信用卡和贷款不相关的其他全部金融资产和金融交易类数据。
21、4.根据项1~3中任一项所述的方法,其中,
22、基于原始的零售信用预测数据加工出衍生零售信用预测数据是指基于时间维度、空间维度、频率维度、统计信息维度对采集的原始的零售信用预测数据进行加工而得到的数据;
23、优选,衍生零售信用预测数据包括但不限于:
24、基于样本关系长度进行加工得到的衍生零售信用预测数据,
25、基于时间间隔类变量进行加工得到的衍生零售信用预测数据,
26、基于样本行为频率程度进行加工得到的衍生零售信用预测数据,
27、基于样本当前时间点情况进行加工得到的衍生零售信用预测数据,
28、基于样本持续行为进行加工得到的衍生零售信用预测数据,
29、基于统计信息维度对样本数据进行加工得到的衍生零售信用预测数据。
30、5.根据项1~4中任一项所述的方法,其中,
31、所述零售信用预测数据选自以下中的一种或两种或三种或四种或五种或六种或七种或八种:
32、过去12个月信贷账户最大预期数、当前信用卡剩余额度、当前月aum总值、过去12个月的工资最大值、个人贷款过去3个月平均额度使用率、个人贷款过去12个月应还金额连续增加月份数、信用卡过去12个月利息大于0的月数、过去12个月存款账户时点最小余额距今月数、循环贷过去3个月额度使用率平均值、过去3个月的aum最小值、过去3个月投资理财账户平均余额、过去3个月存款账户时点最小余额、当前时点存款账户余额、信用卡过去12个月逾期期数最大值、信贷过去12个月额度使用率最小值、过去3个月月均信贷本月最低应还款额与月均aum的差值、个人贷款过去12个月还款金额平均值、个人贷款过去3个月应还金额连续增加的月数占比、循环贷过去3个月额度使用率最小值、过去6个月存款账户时点最小余额、过去6个月存款账户时点平均余额、信用卡过去6个月账单余额连续增加月数、循环贷过去6个月额度使用率最小值、过去6个月月均信贷本月应还款额/月均aum、信贷过去12个月还款率>80%的月份数、信用卡过去12个月额度使用率>90%最多连续月数、个人贷款当月还款金额总和、当前额度使用率超过90%的个贷账户数、过去12个月个金账户持有月数、过去6月代发工资次数、过去12个月的工资最大值。
33、6.根据项1~5中任一项所述的方法,其中,
34、对待预测样本进行分类的步骤包括如下子步骤:
35、该待测样本是否是已在金融机构申请信贷业务的客户;
36、该待测样本是否为有稳定收入的客户;
37、该待测样本是否在m个月内新注册;
38、该待测样本办理业务归属的地理区域;
39、基于上述子步骤对待预测样本进行分类以确定用于计算信用违约概率的子模型,在保证业务逻辑合理的前提下,上述子步骤进行的顺序可以任意设定;
40、优选按照如下顺序对待预测样本进行分类:
41、首先判断该待测样本是否是已在金融机构申请信贷业务的客户;
42、然后判断该待测样本是否为有稳定的收入的客户;
43、再然后判断该待测样本是否在m个月内新注册;
44、再然后判断该待测样本办理业务归属的地理区域。
45、7.根据项1~6中任一项所述的方法,其中,
46、对零售信用预测数据进行特征转换后再代入信用违约概率子模型中计算所述待预测样本的信用违约概率,所述特征转换步骤包括:
47、基于需要代入信用违约概率子模型的零售信用预测数据的特征类型选择woe方式或连续型方式进行特征转换。
48、8.根据项7所述的方法,其中,
49、采用连续型方式进行特征转换包括如下方式:直接选取原始值、计算原始数据的平方、计算原始数据平方根、计算原始数据立方根或计算原始数据自然对数的方式进行连续型特征转换。
50、9.根据项1~8中任一项所述的方法,其中,
51、信用违约概率子模型为基于样本零售信用预测数据和信用违约概率采用逻辑回归基于已有用户人群构建的模型。
52、10.根据项1~9中任一项所述的方法,其中,
53、所述零售信用预测数据选自:过去12个月信贷账户最大逾期期数、当前信用卡剩余额度、当前月aum总值、过去12个月的工资最大值、个人贷款过去3个月平均额度使用率、个人贷款过去12个月应还金额连续增加月份数、信用卡过去12个月利息>0的月数的一个、两个、三个、四个、五个、六个或七个。
54、11.根据项10所述的方法,其中,信用违约概率计算步骤包括:
55、将过去12个月信贷账户最大逾期期数、当前信用卡剩余额度、当前月aum总值、过去12个月的工资最大值、个人贷款过去3个月平均额度使用率、个人贷款过去12个月应还金额连续增加月份数、信用卡过去12个月利息>0的月数进行特征转换,
56、优选对过去12个月信贷账户最大逾期期数采用woe方式进行转换;对当前信用卡剩余额度采用连续型转换方式;对前月aum总值采用连续型转换方式;对过去12个月的工资最大值采用连续型转换方式;对个人贷款过去3个月平均额度使用率采用连续型转换方式;对个人贷款过去12个月应还金额连续增加月份数采用woe方式进行转换;对信用卡过去12个月利息>0的月数采用woe方式进行转换;
57、进一步优选,对当前信用卡剩余额度采用连续型转换方式为对当前信用卡剩余额度取自然对数的计算方式;对前月aum总值采用连续型转换方式为对前月aum总值使用取平方根的计算方式;对过去12个月的工资最大值采用连续型转换方式为对过去12个月的工资最大值使用取立方根的计算方式;对个人贷款过去3个月平均额度使用率采用连续型转换方式为对个人贷款过去3个月平均额度使用取平方的计算方式。
58、12.根据项11所述的方法,其中,
59、将过去12个月信贷账户最大逾期期数、当前信用卡剩余额度、当前月aum总值、过去12个月的工资最大值、个人贷款过去3个月平均额度使用率、个人贷款过去12个月应还金额连续增加月份数、信用卡过去12个月利息>0的月数这七个特征转换后的数值代入基于样本零售信用预测数据和信用违约概率采用逻辑回归构建的子模型来计算该待预测样本的违约概率。
60、13.根据项12所述的方法,其中,
61、其中所述子模型如下公式1所示:
62、
63、其中,k为进入的模型的特征数量,优选k为7,
64、α为截距项,优选的数值范围为(4.5954,4.9098),最优为4.7526;
65、β1为过去12个月信贷账户最大逾期期数对应系数,优选的数值范围为(-0.7309,-0.7094),最优为-0.7201;
66、β2为当前信用卡剩余额度对应系数,优选的数值范围为(-0.3564,-0.3502),最优为-0.3533;
67、β3为当前月aum(金融资产)总值对应系数,优选的数值范围为(-0.241,-0.223),最优为-0.232;
68、β4为过去12个月的工资最大值对应系数,优选的数值范围为(-0.3124,-0.2744),最优为-0.2934;
69、β5为个人贷款过去3个月平均额度使用率对应系数,优选的数值范围为(0.2713,0.3168),最优为0.294;
70、β6为个人贷款过去12个月应还金额连续增加月份数对应系数,取值范围为(-1.2154,-1.0571),最优为-1.1363;
71、β7为信用卡过去12个月利息>0的月数对应系数,取值范围为(-0.2852,-0.2503),最优为-0.2678;
72、x1为特征转换步骤生成的过去12个月信贷账户最大逾期期数的woe转换值;
73、x2为特征转换步骤生成的当前信用卡剩余可使用额度的自然对数转换值;
74、x3为特征转换步骤生成的当前月aum(金融资产)总值的平方根转换值;
75、x4为特征转换步骤生成的过去12个月的工资最大值的立方根转换值;
76、x5为特征转换步骤生成的个人贷款过去3个月平均额度使用率的平方转换;
77、x6为特征转换步骤生成的个人贷款过去12个月应还金额连续增加月份数的woe转换值;
78、x7为特征转换步骤生成的信用卡过去12个月利息>0的月数的woe转换值。
79、14.根据项13所述的方法,其中,
80、在计算出信用违约概率之后,计算所述待预测样本的信用评分的步骤为利用如下公式计算生成用于表征所述借款人的信用评分:
81、
82、
83、其中,p为计算信用违约概率模块中生成的借款人的违约概率(p),a为443.9036;b为-72.1348,round函数对计算分数四舍五入后的取整值;最后将大于1000的分数置为1000分,小于0分的分数置为0分。
84、15.根据项1~9中任一项所述的方法,其中,
85、所述零售信用预测数据选自:过去12个月存款账户时点最小余额距今月数、循环贷过去3个月额度使用率平均值、过去3个月的aum最小值、过去3个月投资理财账户平均余额、过去3个月存款账户时点最小余额中的一个、两个、三个、四个或五个。
86、16.根据项15所述的方法,其中,信用违约概率计算步骤包括:
87、将过去12个月存款账户时点最小余额距今月数、循环贷过去3个月额度使用率平均值、过去3个月的aum最小值、过去3个月投资理财账户平均余额、过去3个月存款账户时点最小余额进行特征转换,
88、优选对过去12个月存款账户时点最小余额距今月数采用woe方式进行转换;对循环贷过去3个月额度使用率平均值采用woe方式进行转换;对过去3个月的aum最小值采用连续型方式进行转换;对过去3个月投资理财账户平均余额采用连续型方式进行转换;对过去3个月存款账户时点最小余额采用woe方式进行转换;
89、进一步优选,对过去3个月的aum最小值采用连续型方式进行转换是对过去3个月的aum最小值使用取平方根的计算方式,对过去3个月投资理财账户平均余额采用连续型方式进行转换是对过去3个月投资理财账户平均余额采用取平方根的计算方式。
90、17.根据项15所述的方法,其中,
91、将过去12个月存款账户时点最小余额距今月数、循环贷过去3个月额度使用率平均值、过去3个月的aum最小值、过去3个月投资理财账户平均余额、过去3个月存款账户时点最小余额这五个特征转换后的数值代入基于样本零售信用预测数据采用逻辑回归构建的子模型来计算该待预测样本的违约概率。
92、18.根据项17所述的方法,其中,
93、所述子模型如下公式2所示:
94、
95、其中,k为进入的模型的特征数量,优选k为5;
96、α为截距项,优选的数值范围为(-0.6781,-0.4868),最优为-0.582;
97、β1为过去12个月存款账户时点最小余额距今月数对应系数,优选的数值范围为(-0.7058,-0.529),最优为-0.617;
98、β2为循环贷过去3个月额度使用率平均值对应系数,优选的数值范围为(0.0666,0.114),最优为0.090;
99、β3为过去3个月的aum最小值对应系数,优选的数值范围为(-0.6899,-0.4916),最优为-0.591;
100、β4为过去3个月投资理财账户平均余额对应系数,优选的数值范围为(-0.7065,-0.3619),最优为-0.534;
101、β5为过去3个月存款账户时点最小余额对应系数,优选的数值范围为(-0.118,-0.0557),最优为-0.087;
102、x1为特征转换步骤生成的过去12个月存款账户时点最小余额距今月数的woe转换值;
103、x2为特征转换步骤生成的循环贷过去3个月额度使用率平均值的平方转换值;
104、x3为特征转换步骤生成的过去3个月的aum最小值的自然对数转换值;
105、x4为特征转换步骤生成的过去3个月投资理财账户平均余额的平方根转换值;
106、x5为特征转换步骤生成的过去3个月存款账户时点最小余额的立方根转换值。
107、19.根据项18所述的方法,其中,
108、在计算出信用违约概率之后,计算所述待预测样本的信用评分的步骤为利用如下公式计算生成用于表征所述借款人的信用评分:
109、
110、
111、其中,p为计算信用违约概率模块中生成的借款人的违约概率(p),a为443.9036;b为-72.1348,round函数对计算分数四舍五入后的取整值;最后将大于1000的分数置为1000分,小于0分的分数置为0分。
112、20.根据项1~9中任一项所述的方法,其中,
113、所述零售信用预测数据选自:当前时点存款账户余额、信用卡过去12个月逾期期数最大值、信贷过去12个月额度使用率最小值、过去3个月月均信贷本月最低应还款额与月均aum的差值、个人贷款过去12个月还款金额平均值、当前信用卡剩余额度中的一个、两个、三个、四个、五个或六个。
114、21.根据项20所述的方法,其中,信用违约概率计算步骤包括:
115、将当前时点存款账户余额、信用卡过去12个月逾期期数最大值、信贷过去12个月额度使用率最小值、过去3个月月均信贷本月最低应还款额与月均aum的差值、个人贷款过去12个月还款金额平均值、当前信用卡剩余额度进行特征转换,
116、优选对当前时点存款账户余额采用连续型方式进行转换;对信用卡过去12个月逾期期数最大值采用woe方式进行转换;对信贷过去12个月额度使用率最小值采用连续型方式进行转换;对过去3个月月均信贷本月最低应还款额与月均aum的差值采用连续型方式进行转换;对个人贷款过去12个月还款金额平均值采用连续型方式进行转换;对当前信用卡剩余额度采用连续型方式进行转换;
117、进一步优选,对当前时点存款账户余额采用连续型方式进行转换为对当前时点存款账户余额采用取自然对数的计算方式,对信贷过去12个月额度使用率最小值采用连续型方式进行转换为对信贷过去12个月额度使用率最小值使用取平方根的计算方式,对过去3个月月均信贷本月最低应还款额与月均aum的差值采用连续型方式进行转换为对过去3个月月均信贷本月最低应还款额与月均aum的差值使用取立方根的计算方式,对个人贷款过去12个月还款金额平均值采用连续型方式进行转换为对个人贷款过去12个月还款金额平均值使用取原始值的计算方式,对当前信用卡剩余额度采用连续型方式进行转换为对当前信用卡剩余额度使用取立方根的计算方式。
118、22.根据项20所述的方法,其中,
119、将当前时点存款账户余额、信用卡过去12个月逾期期数最大值、信贷过去12个月额度使用率最小值、过去3个月月均信贷本月最低应还款额与月均aum的差值、个人贷款过去12个月还款金额平均值、当前信用卡剩余额度这六个特征转换后的数值代入基于样本零售信用预测数据和信用违约概率采用逻辑回归构建的子模型来计算该待预测样本的违约概率。
120、23.根据项22所述的方法,其中,
121、所述子模型如下公式3所示:
122、
123、其中,k为进入的模型的特征数量,优选k为6;
124、α为截距项,优选的数值范围为(-0.5296,-0.394),最优为-0.462;
125、β1为当前时点存款账户余额对应系数,优选的数值范围为(-0.1997,-0.1867),最优为-0.193;
126、β2为信用卡过去12个月逾期期数最大值对应系数,优选的数值范围为(-0.4853,-0.4469),最优为-0.466;
127、β3为信贷过去12个月额度使用率最小值对应系数,优选的数值范围为(0.1058,0.1187),最优为0.112;
128、β4为过去3个月月均信贷本月最低应还款额与月均aum的差值对应系数,优选的数值范围为(0.0053,0.0073),最优为0.006;
129、β5为个人贷款过去12个月还款金额平均值对应系数,优选的数值范围为(-0.0096,-0.0088),最优为-0.009;
130、β6为当前信用卡剩余额度对应系数,优选的数值范围为(-0.1637,-0.1519),最优为-0.158;
131、x1为特征转换步骤生成的当前时点存款账户余额的自然对数转换值;
132、x2为特征转换步骤生成的信用卡过去12个月逾期期数最大值的woe转换值;
133、x3为特征转换步骤生成的信贷过去12个月额度使用率最小值的平方根转换值;
134、x4为特征转换步骤生成的过去3个月月均信贷本月最低应还款额与月均aum的差值的立方根转换值;
135、x5为特征转换步骤生成的个人贷款过去12个月还款金额平均值的原始转换值;
136、x6为特征转换步骤生成当前信用卡剩余额度的立方根转换值。
137、24.根据项23所述的方法,其中,
138、在计算出信用违约概率之后,计算所述待预测样本的信用评分的步骤为利用如下公式计算生成用于表征所述借款人的信用评分:
139、
140、
141、其中,p为计算信用违约概率模块中生成的借款人的违约概率(p),a为443.9036;b为-72.1348,round函数对计算分数四舍五入后的取整值;最后将大于1000的分数置为1000分,小于0分的分数置为0分。
142、25.根据项1~9中任一项所述的方法,其中,
143、所述零售信用预测数据选自:个人贷款过去12个月还款金额平均值、个人贷款过去3个月应还金额连续增加的月数占比、循环贷过去3个月额度使用率最小值、过去6个月存款账户时点最小余额、当前信用卡剩余额度、信用卡过去12个月逾期期数最大值中的一个、两个、三个、四个、五个或六个。
144、26.根据项25所述的方法,其中,信用违约概率计算步骤包括:
145、将个人贷款过去12个月还款金额平均值、个人贷款过去3个月应还金额连续增加的月数占比、循环贷过去3个月额度使用率最小值、过去6个月存款账户时点最小余额、当前信用卡剩余额度、信用卡过去12个月逾期期数最大值进行特征转换,
146、优选对个人贷款过去12个月还款金额平均值采用连续型方式进行转换;对个人贷款过去3个月应还金额连续增加的月数占比采用woe方式进行转换;对循环贷过去3个月额度使用率最小值采用连续型方式进行转换;对过去6个月存款账户时点最小余额采用连续型方式进行转换;对当前信用卡剩余额度采用连续型方式进行转换;对信用卡过去12个月逾期期数最大值采用woe方式进行转换;
147、进一步优选对个人贷款过去12个月还款金额平均值采用连续型方式进行转换为对个人贷款过去12个月还款金额平均值使用取自然对数的计算方式,对循环贷过去3个月额度使用率最小值采用连续型方式进行转换为对循环贷过去3个月额度使用率最小值使用取平方的计算方式,对过去6个月存款账户时点最小余额采用连续型方式进行转换为对过去6个月存款账户时点最小余额使用取原始值的计算方式,对当前信用卡剩余额度采用连续型方式进行转换为对当前信用卡剩余额度使用取立方根的计算方式,。
148、27.根据项25所述的方法,其中,
149、将个人贷款过去12个月还款金额平均值、个人贷款过去3个月应还金额连续增加的月数占比、循环贷过去3个月额度使用率最小值、过去6个月存款账户时点最小余额、当前信用卡剩余额度、信用卡过去12个月逾期期数最大值这六个特征转换后的数值代入基于样本零售信用预测数据和信用违约概率采用逻辑回归构建的子模型来计算该待预测样本的违约概率。
150、28.根据项27所述的方法,其中,
151、所述子模型如下公式4所示:
152、
153、其中,k为进入的模型的特征数量,优选k为6;
154、α为截距项,优选的数值范围为(3.5781,3.7431),最优为3.661;
155、β1为个人贷款过去12个月还款金额平均值对应系数,优选的数值范围为(-0.5156,-0.496),最优为-0.506;
156、β2为个人贷款过去3个月应还金额连续增加的月数占比对应系数,优选的数值范围为(0.6685,0.6991),最优为0.684;
157、β3为循环贷过去3个月额度使用率最小值对应系数,优选的数值范围为(0.0088,0.0096),最优为0.009;
158、β4为过去6个月存款账户时点最小余额比对应系数,优选的数值范围为(-0.2122,-0.2012),最优为-0.207;
159、β5为当前信用卡剩余额度对应系数,优选的数值范围为(-0.0588,-0.0419),最优为-0.050;
160、β6为信用卡过去12个月逾期期数最大值对应系数,优选的数值范围为(-0.4024,-0.3742),最优为-0.388;
161、x1为特征转换步骤生成的个人贷款过去12个月还款金额平均值的woe转换值;
162、x2为特征转换步骤生成的个人贷款过去3个月应还金额连续增加的月数占比的woe转换值;
163、x3为特征转换步骤生成的循环贷过去3个月额度使用率最小值的woe转换值;
164、x4为特征转换步骤生成的过去6个月存款账户时点最小余额的woe转换值;
165、x5为特征转换步骤生成的当前信用卡剩余额度的woe转换值;
166、x6为特征转换步骤生成的信用卡过去12个月逾期期数最大值的woe转换值。
167、29.根据项28所述的方法,其中,
168、在计算出信用违约概率之后,计算所述待预测样本的信用评分的步骤为利用如下公式计算生成用于表征所述借款人的信用评分:
169、
170、
171、其中,p为计算信用违约概率模块中生成的借款人的违约概率(p),a为443.9036;b为-72.1348,round函数对计算分数四舍五入后的取整值;最后将大于1000的分数置为1000分,小于0分的分数置为0分。
172、30.根据项1~9中任一项所述的方法,其中,
173、所述零售信用预测数据选自:过去6个月存款账户时点平均余额、信用卡过去6个月账单余额连续增加月数、循环贷过去6个月额度使用率最小值、过去6个月月均信贷本月应还款额/月均aum、信贷过去12个月还款率>80%的月份数、信用卡过去12个月额度使用率>90%最多连续月数、个人贷款当月还款金额总和、当前额度使用率超过90%的个贷账户数中的一个、两个、三个、四个、五个、六个、七个或八个。
174、31.根据项30所述的方法,其中,信用违约概率计算步骤包括:
175、将过去6个月存款账户时点平均余额、信用卡过去6个月账单余额连续增加月数、循环贷过去6个月额度使用率最小值、过去6个月月均信贷本月应还款额/月均aum、信贷过去12个月还款率>80%的月份数、信用卡过去12个月额度使用率>90%最多连续月数、个人贷款当月还款金额总和、当前额度使用率超过90%的个贷账户数进行特征转换,
176、优选对过去6个月存款账户时点平均余额连续型转换方法进行转换;对信用卡过去6个月账单余额连续增加月数采用woe方式进行转换;对循环贷过去6个月额度使用率最小值采用连续型转换方法进行转换;对过去6个月月均信贷本月应还款额/月均aum采用连续型转换方法进行转换;对信贷过去12个月还款率>80%的月份数采用连续型转换方法进行转换;对信用卡过去12个月额度使用率>90%最多连续月数采用woe方式进行转换;对个人贷款当月还款金额总和采用连续型转换方法进行转换;对当前额度使用率超过90%的个贷账户数采用连续型转换方法进行转换;
177、进一步优选对过去6个月存款账户时点平均余额连续型转换方法进行转换为对过去6个月存款账户时点平均余额使用取自然对数的计算方式,对循环贷过去6个月额度使用率最小值采用连续型转换方法进行转换为对循环贷过去6个月额度使用率最小值使用取平方根的计算方式,对过去6个月月均信贷本月应还款额/月均aum采用连续型转换方法进行转换为对过去6个月月均信贷本月应还款额/月均aum使用取自然对数的计算方式,对信贷过去12个月还款率>80%的月份数采用连续型转换方法进行转换为对信贷过去12个月还款率>80%的月份数使用取立方根的计算方式,对个人贷款当月还款金额总和采用连续型转换方法进行转换为对个人贷款当月还款金额总和使用取原始值的计算方式,对当前额度使用率超过90%的个贷账户数采用连续型转换方法进行转换为对当前额度使用率超过90%的个贷账户数使用取平方的计算方式。
178、32.根据项30所述的方法,其中,
179、将过去6个月存款账户时点平均余额、信用卡过去6个月账单余额连续增加月数、循环贷过去6个月额度使用率最小值、过去6个月月均信贷本月应还款额/月均aum、信贷过去12个月还款率>80%的月份数、信用卡过去12个月额度使用率>90%最多连续月数、个人贷款当月还款金额总和、当前额度使用率超过90%的个贷账户数这八个特征转换后的数值代入基于样本零售信用预测数据和信用违约概率采用逻辑回归构建的子模型来计算该待预测样本的违约概率。
180、33.根据项32所述的方法,其中,
181、所述子模型如下公式5所示:
182、
183、其中,k为进入的模型的特征数量,优选k为8;
184、α为截距项,优选的数值范围为(0.2614,0.4061),最优为0.334;
185、β1为过去6个月存款账户时点平均余额对应系数,优选的数值范围为(-0.2041,-0.1896),最优为-0.197;
186、β2为信用卡过去6个月账单余额连续增加月数对应系数,优选的数值范围为(-0.4365,-0.3966),最优为-0.417;
187、β3为循环贷过去6个月额度使用率最小值对应系数,优选的数值范围为(0.1747,0.1912),最优为0.183;
188、β4为过去6个月月均信贷本月应还款额/月均aum对应系数,优选的数值范围为(0.2261,0.2516),最优为0.239;
189、β5为信贷过去12个月还款率>80%的月份数对应系数,优选的数值范围为(-0.5716,-0.51),最优为-0.541;
190、β6为信用卡过去12个月额度使用率>90%最多连续月数对应系数,优选的数值范围为(-0.3114,-0.2683),最优为-0.290;
191、β7为个人贷款当月还款金额总和对应系数,优选的数值范围为(-0.3661,-0.281),最优为-0.324;
192、β8为当前额度使用率超过90%的个贷账户数对应系数,优选的数值范围为(-0.4713,-0.3529),最优为-0.412;
193、x1为特征转换步骤生成的过去6个月存款账户时点平均余额的自然对数转换值;
194、x2为特征转换步骤生成的信用卡过去6个月账单余额连续增加月数的连续型方式的woe转换值;
195、x3为特征转换步骤生成的循环贷过去6个月额度使用率最小值的平方根转换值;
196、x4为特征转换步骤生成的过去6个月月均信贷本月应还款额/月均aum的自然对数转换值;
197、x5为特征转换步骤生成的信贷过去12个月还款率>80%的月份数的立方根转换值;
198、x6为特征转换步骤生成的信用卡过去12个月额度使用率>90%最多连续月数的woe转换值;
199、x7为特征转换步骤生成的个人贷款当月还款金额总和的原始转换值;
200、x8为特征转换步骤生成的当前额度使用率超过90%的个贷账户数的平方转换值。
201、34.根据项33所述的方法,其中,
202、在计算出信用违约概率之后,计算所述待预测样本的信用评分的步骤为利用如下公式计算生成用于表征所述借款人的信用评分:
203、
204、
205、其中,p为计算信用违约概率模块中生成的借款人的违约概率(p),a为443.9036;b为-72.1348,round函数对计算分数四舍五入后的取整值;最后将大于1000的分数置为1000分,小于0分的分数置为0分。
206、35.根据项1~9中任一项所述的方法,其中,
207、所述零售信用预测数据选自:过去12个月个金账户持有月数、过去3个月投资理财账户平均余额、过去3个月存款账户时点最小余额、过去6月代发工资次数、过去12个月的工资最大值中的一个、两个、三个、四个或五个。
208、36.根据项35所述的方法,其中,信用违约概率计算步骤包括:
209、将过去12个月个金账户持有月数、过去3个月投资理财账户平均余额、过去3个月存款账户时点最小余额、过去6月代发工资次数、过去12个月的工资最大值进行特征转换,
210、优选对过去12个月个金账户持有月数采用woe方式进行转换;对过去3个月投资理财账户平均余额采用连续型转换方法进行转换;对过去3个月存款账户时点最小余额采用连续型转换方法进行转换;对过去6月代发工资次数采用woe方式进行转换;对过去12个月的工资最大值采用连续型转换方法进行转换;
211、进一步优选对过去3个月投资理财账户平均余额采用连续型转换方法进行转换为对过去3个月投资理财账户平均余额使用取平方根的计算方式;对过去3个月存款账户时点最小余额采用连续型转换方法进行转换为对过去3个月存款账户时点最小余额使用取自然对数的计算方式;对过去12个月的工资最大值采用连续型转换方法进行转换为对过去12个月的工资最大值使用取原始值的计算方式。
212、37.根据项35所述的方法,其中,
213、将过去12个月个金账户持有月数、过去3个月投资理财账户平均余额、过去3个月存款账户时点最小余额、过去6月代发工资次数、过去12个月的工资最大值这五个特征转换后的数值代入基于样本零售信用预测数据和信用违约概率采用逻辑回归构建的子模型来计算该待预测样本的违约概率。
214、38.根据项37所述的方法,其中,
215、所述子模型如下公式6所示:
216、
217、其中,k为进入的模型的特征数量,优选k为5;
218、α为截距项,优选的数值范围为(0.2884,1.9611),最优为1.125;
219、β1为过去12个月个金账户持有月数对应系数,优选的数值范围为(-0.721,-0.6281),最优为-0.675;
220、β2为过去3个月投资理财账户平均余额对应系数,优选的数值范围为(-0.0646,-0.0125),最优为-0.039;
221、β3为过去3个月存款账户时点最小余额对应系数,优选的数值范围为(-0.1275,-0.0891),最优为-0.108;
222、β4为过去6月代发工资次数对应系数,优选的数值范围为(-0.4612,-0.2386),最优为-0.350;
223、β5为过去12个月的工资最大值对应系数,优选的数值范围为(-0.3679,-0.1707),最优为-0.269;
224、x1为特征转换步骤生成的过去12个月个金账户持有月数的woe转换值;
225、x2为特征转换步骤生成的过去3个月投资理财账户平均余额的平方根转换值;
226、x3为特征转换步骤生成的过去3个月存款账户时点最小余额的自然对数转换值;
227、x4为特征转换步骤生成的过去6月代发工资次数的woe转换值;
228、x5为特征转换步骤生成的过去12个月的工资最大值的原始转换值。
229、39.根据项38所述的方法,其中,
230、在计算出信用违约概率之后,计算所述待预测样本的信用评分的步骤为利用如下公式计算生成用于表征所述借款人的信用评分:
231、
232、
233、其中,p为计算信用违约概率模块中生成的借款人的违约概率(p),a为443.9036;b为-72.1348,round函数对计算分数四舍五入后的取整值;最后将大于1000的分数置为1000分,小于0分的分数置为0分。
234、40.一种计算零售信用风险的装置,其包括:
235、数据采集模块,其用于获取待预测样本的零售信用预测数据;
236、对待预测样本进行分类的模块,其用于基于决策树方法将待预测样本进行分类以确定用于计算信用违约概率的子模型;
237、信用违约概率计算模块,其用于将零售信用预测数据代入信用违约概率子模型中以计算所述待预测样本的信用违约概率,优选所述信用违约概率为针对线上信贷业务的信用违约概率。
238、41.根据项40所述的装置,其中,所述装置执行项1~39中任一项所述的计算零售信用风险的方法的步骤。
239、42.一种计算零售信用风险的系统,其特征在于,所述计算零售信用风险的系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的所述计算零售信用风险方法的程序,所述计算零售信用风险的程序被所述处理器执行时实现如项1~39中任一项所述的计算零售信用风险的方法的步骤。
240、43.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算零售信用风险方法的程序,所述计算零售信用风险方法的程序被处理器执行时实现如项1~39中任一项所述的计算零售信用风险的方法的步骤。
241、44.一种针对线上信贷业务构建零售信用风险预测模型的方法,其包括:
242、数据采集步骤,其获取用于构建模型的样本的原始零售信用预测数据;
243、数据衍生步骤,其基于原始的零售信用预测数据加工出衍生零售信用预测数据;
244、特征初筛步骤,其对包括原始零售信用预测数据和衍生零售信用预测数据的全部类别,即全部特征进行初步筛选,以获得初步筛选后的特征;
245、初筛数据转换步骤,对初步筛选后的特征进行转换方式的判断以确认采用woe转换方式、哑特征转换方式以及连续型转换方式中的一种来进行特征转换,并针对每一个初步筛选后的特征采用判断的最优方式来进行特征转换;
246、特征精筛步骤,对进行特征转换后的初步筛选的特征进行深度筛选以获得精筛后的特征;
247、信用违约概率建模步骤,针对精筛后的特征结合与信用违约之间的概率关系选择逻辑回归的方式进行模型构建,并确认用于计算信用违约概率的方式;
248、其中数据采集步骤获取的数据样本为使用过线上信贷业务的客户样本。
249、45.根据项44所述的方法,其中,
250、在数据采集步骤中,获取的用于构建模型的样本的原始零售信用预测数据包括:
251、信用卡类基础数据,其是基于样本用户的信用卡创建过程和使用过程中全部可获取的数据,
252、个人贷款类基础数据,其是基于样本用户的贷款申请情况及使用行为的全部可获取的数据,
253、客户基本信息类基础数据,其是基于样本用户本身的属性,但与在金融机构的行为不直接关联的数据,
254、个人金融资产类基础数据,其是样本用户在金融机构与信用卡和贷款不相关的其他全部金融资产和金融交易类数据。
255、46.根据项44所述的方法,其中,
256、在数据衍生步骤中,基于原始的零售信用预测数据加工出衍生零售信用预测数据是指基于时间维度、空间维度、频率维度、统计信息维度对采集的原始的零售信用预测数据进行加工而得到的数据;
257、优选,衍生零售信用预测数据包括但不限于:
258、基于样本关系长度进行加工得到的衍生零售信用预测数据,
259、基于时间间隔类变量进行加工得到的衍生零售信用预测数据,
260、基于样本行为频率程度进行加工得到的衍生零售信用预测数据,
261、基于样本当前时间点情况进行加工得到的衍生零售信用预测数据,
262、基于样本持续行为进行加工得到的衍生零售信用预测数据,
263、基于统计信息维度对样本数据进行加工得到的衍生零售信用预测数据。
264、47.根据项44~46中任一项所述的方法,其中,
265、特征初筛步骤包括如下步骤:
266、第一初筛步骤,基于用于构建模型的样本的每一特征的数据缺失情况来对特征进行筛选,
267、第二初筛步骤,基于某一特征样本的单一值过高情况来对特征进行筛选,
268、第三初筛步骤,计算每一个特征的信息iv值对特征进行初步筛选;
269、第一初筛步骤、第二初筛步骤和第三初筛步骤的顺序可以为任意顺序,
270、第四初筛步骤,对经过第一~第三初步筛选后的特征采用逐步判别算法进行特征的初步筛选;
271、第五初筛步骤,对经过第四初筛步骤之后的特征基于各个特征本身的风险特性与用于模型构建的样本实际的真实结果的吻合情况来进行特征的初步筛选。
272、48.根据项44~47中任一项所述的方法,其中,还包括:
273、样本选定步骤,其用于在数据采集步骤之前对全部用户进行筛选并获取用于模型构建的使用了线上信贷业务的样本,
274、优选,样本选定步骤包括基于决策树对样本全部用户进行分类,分类依据包括但不限于:
275、某一用户是否是已在金融机构申请注册信贷业务的客户;
276、某一用户是否为收入稳定的客户;
277、某一用户为新客户或存量客户
278、某一用户办理业务归属的地理区域。
279、49.根据项44~48中任一项所述的方法,其中,在初筛数据转换步骤中,初步筛选后的特征进行转换方式的判断,是基于经过初步筛选特征的集中度和数据类型来进行判断的。
280、50.根据项49所述的方法,其中,
281、初筛数据转换步骤基于集中度和数据类型的判断包括如下步骤:
282、针对每一特征的数据类型进行分类将每一特征分类成字符型变量和数值型变量,
283、对字符型变量采用哑特征转换方式进行初筛数据转换,
284、对数值型变量进一步进行分类的过程包括如下子步骤:
285、如果该数值型变量的取值少于n个,采用woe的转换方式进行初筛数据转换,
286、如果该数值型变量的取值在n个以上时,进一步判断如果转换为连续型变量取值较多且单一取值的集中度大于m%,则采用woe的转换方式,如果单一取值的集中度小于等于m%,则采用连续型的转换方式,
287、优选,n和m均为正整数,其中n=5~10,m=90~99。
288、51.根据项50所述的方法,其中,还包括:
289、针对确认采用连续型的转换方式的特征基于该特征在不同连续型转换方式下与信用违约的相关性高低来选择最优转换方法来进行该特征的连续型特征转换,
290、优选采用直接选取原始值、计算原始数据的平方、计算原始数据平方根、计算原始数据立方根或计算原始数据自然对数的方式进行连续型特征转换。
291、52.根据项44~51中任一项所述的方法,其中,特征精筛步骤包括:
292、第一精筛步骤,基于逐步回归算法,基于f检验与t检验对特征的显著性进行特征的筛选,
293、第二精筛步骤,基于每个特征计算方差膨胀因子并剔除方差膨胀因子较高的特征来进行特征的筛选,
294、第三精筛步骤,基于逻辑回归对经过第一精筛步骤和第二精筛步骤之后的特征,分析特征系数是否符合针对信用违约的预测结果的趋势以进一步进行特征筛选。
295、53.根据项44~52中任一项所述的方法,其中,信用违约概率建模步骤将经过特征精筛步骤筛选的特征代入sigmoid函数进行逻辑回归计算信用违约概率的模型。
296、54.一种针对线上信贷业务构建零售信用风险预测模型的装置,其特征在于,所述装置包括:
297、数据采集模块,其用于获取用于构建模型的样本的原始零售信用预测数据;
298、数据衍生模块,其用于基于原始的零售信用预测数据加工出衍生零售信用预测数据;
299、特征初筛模块,其用于对包括原始零售信用预测数据和衍生零售信用预测数据的全部类别,即全部特征进行初步筛选,以获得初步筛选后的特征;
300、初筛数据转换模块,其用于对初步筛选后的特征进行转换方式的判断以确认采用woe转换方式、哑特征转换方式以及连续型转换方式中的一种来进行特征转换,并针对每一个初步筛选后的特征采用判断的最优方式来进行特征转换;
301、特征精筛模块,其用于对进行特征转换后的初步筛选的特征进行深度筛选以获得精筛后的特征;
302、信用违约概率建模模块,其用于针对精筛后的特征结合与信用违约之间的概率关系选择逻辑回归的方式进行模型构建,并确认用于计算信用违约概率的方式,
303、其中数据采集模块获取的数据样本为使用过线上信贷业务的客户样本。
304、55.根据项54所述的装置,其中,所述装置执行项44~53中任一项所述的构建零售信用风险预测模型方法的步骤。
305、56.一种针对线上信贷业务构建零售信用风险预测模型的系统,其特征在于,所述系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的构建零售信用风险预测模型方法的程序,所述构建零售信用风险预测模型方法的程序被所述处理器执行时实现如项44~53中任一项所述的构建零售信用风险预测模型方法的步骤。
306、发明效果
307、本技术用于构建零售信用风险预测模型的方法和系统在构建模型时结合了某大型金融机构的大量样本,并从中筛选有线上信贷业务的客户数据作为原始数据,并深入地对样本获得的原始数据进行加工和衍生,利用高级统计分析方法和可解释的机器学习技术,根据原始数据和衍生数据的自身特点以及数据中包含的市场上难以获取的强金融属性信息,构建的零售信用类通用评分模型。
308、此外本技术在构建模型之初先利用决策树的方法对样本进行最为合理的分类并基于分类的样本构建子分类模型。结合决策树构建金融模型可以有效地将样本按照可执行的类别进行分类,从而更好覆盖不同客群的信用风险特点,避免将全部样本用于构建模型导致模型缺乏子群代表性的问题。
309、进一步在本技术构建风险预测模型时由于采用了逐步判别分析方法进行模型特征的初步筛选充分提高了模型开发的整体效率。逐步判别的方法能够更好地甄选出相同维度下更为重要的特征变量,大幅度减少下一步骤中需要开发人员根据变量趋势逐一判断筛选的工作量,在不影响整体模型效果的前提下充分提高模型开发效率,使初筛变量时更加高效和精准。
310、本技术在模型构建时开创性地将连续型转换、woe转换、哑特征转换三种方式结合,对经过了初始筛选地部分特征进行再加工,结合了三种转换方式的优缺点,并且独创性地设计了转换判断方法,根据特征数据属性、缺失率、集中度的等参数辅以业务逻辑上的判断,选择最优的特征转换方式,通过这样的模型构建方法能够规避以完全woe变量构建模型时存在的过拟合、以完全连续型变量构建模型时存在的无法很好适配分类型变量的这些技术缺点。
311、此外,用本技术构建的计算信用风险概率或对信用风险进行评分的方法和系统,即delta模型(dleta系列评分卡)(包括dleta1~dleta6子模型或子评分卡),由于其模型构建时首先基于决策树进行拆分,因此信用风险进行计算初始先对客户样本进行有效地决策分类选择其最为适合的子模型或子评分卡进行处理,同时由于子模型或子评分卡中使用的模型构建方法为本技术所述方法,在构建过程中同样的规避了以完全woe变量构建模型时存在的过拟合、以完全连续型变量构建模型时存在的无法很好适配分类型变量的这些技术缺点,因此其在预测信用风险方面有着显著优于现有模型的效果。除此之外,由于本技术针对的是线上信贷业务,样本数据是从海量数据中筛选出有线上信贷业务的客户数据,不仅涵盖了互联网业务的预测类变量,还包含了互联网业务的逾期表现数据,因此通过特定的业务场景数据利用统计学原理提炼出的风险规律,在针对线上信贷业务的信用风险方面有着非常显著的适配性和区分性。