风控评分方法、装置、设备及存储介质与流程

文档序号:35490245发布日期:2023-09-17 01:00阅读:39来源:国知局
风控评分方法、装置、设备及存储介质与流程

本发明涉及分数评估,尤其涉及一种风控评分方法、装置、设备及存储介质。


背景技术:

1、评分卡模型是广泛应用的金融风控场景模型,但其在复杂特征的处理上过程较为欠缺。当前技术中公开了特征工程方法,主要基于业务专家口径或者数学衍生,然而,其依赖于业务专家和算法设计的经验,相对灵活性较低,特征扩充的丰富性和有效性有限;还公开了模型融合算法,然而,在实际应用场景中,进行堆叠使得模型的复杂度、相应的模型参数量等明显增加,模型优化难度增大,导致模型存在过拟合或欠拟合风险。另一方面,由于生产环境过程需要与训练过程完全一致,复杂的堆叠模型在生产环境中进行部署的难度也相对较大。


技术实现思路

1、本发明的主要目的在于提供一种风控评分方法、装置、设备及存储介质,旨在解决现有技术特征工程灵活性低、模型的复杂度以及模型参数量增加,模型优化难度增大,导致存在过拟合或欠拟合风险的技术问题。

2、为实现上述目的,本发明提供了一种风控评分方法,所述方法包括以下步骤:

3、根据评分卡模型建模指标集合得到衍生指标集合,并对所述衍生指标集合进行搜索,得到目标信息值序列以及对应的衍生指标和加权系数;

4、根据所述目标信息值序列对应的衍生指标和加权系数进行特征生成,得到特征工程指标;

5、基于所述特征工程指标进行模型训练,得到目标评分卡模型;

6、通过所述目标评分卡模型对用户进行风控评分。

7、可选地,所述根据评分卡模型建模指标集合得到衍生指标集合,并对所述衍生指标集合进行搜索,得到目标信息值序列以及对应的衍生指标和加权系数,包括:

8、根据评分卡模型建模指标集合中的裸指标和裸指标对应的加权系数得到衍生指标集合;

9、对所述衍生指标集合进行搜索,得到待细化衍生指标集合以及第一信息值序列;

10、对所述待细化衍生指标集合进行搜索,得到第二信息值序列;

11、根据所述第一信息值序列和所述第二信息值序列确定目标信息值序列以及对应的衍生指标和加权系数。

12、可选地,所述根据评分卡模型建模指标集中的裸指标和裸指标对应的加权系数得到衍生指标集合,包括:

13、将评分卡模型建模指标集合中的任意两个裸指标作为裸指标组合,其中,所述裸指标组合包括第一裸指标和第二裸指标,所述第一裸指标的加权系数为第一加权系数,所述第二裸指标的加权系数为第二加权系数;

14、获取第一搜索范围和第一搜索步长,并根据所述第一搜索范围和所述第一搜索步长确定第一加权系数,其中,所述第一搜索范围和所述第一搜索步长为所述第一加权系数的网格参数;

15、根据所述第一加权系数以及第一加权系数与所述第二加权系数之间的预设关系,得到第二加权系数;

16、根据所述第一裸指标、所述第二裸指标、所述第一加权系数和所述第二加权系数计算衍生指标数据,得到衍生指标集合。

17、可选地,所述对所述衍生指标集合进行搜索,得到待细化衍生指标集合以及第一信息值序列,包括:

18、对所述第一裸指标和第二裸指标分别进行信息值分析,得到第一裸指标信息值序列和第二裸指标信息值序列;

19、对所述衍生指标集合中的各个衍生指标对应的裸指标组合分别进行证据权重分组,获得各个裸指标组合对应的信息值序列;

20、将所述各个裸指标组合对应的信息值序列中的最大值分别与所述第一裸指标信息值序列、所述第二裸指标信息值序列以及预设信息值阈值进行比较;

21、若所述各个裸指标组合对应的信息值序列中的最大值大于所述第一裸指标信息值序列、所述第二裸指标信息值序列以及所述预设信息值阈值,则将所述各个裸指标组合对应的信息值序列中的最大值作为第一信息值序列;

22、将所述第一信息值序列对应的衍生指标作为待细化衍生指标,并对所述待细化衍生指标进行迭代;

23、根据所述第一搜索范围以及所述第一搜索步长确定迭代次数阈值;

24、在所述待细化衍生指标的迭代次数达到所述迭代次数阈值时,将迭代过程中的所有待细化衍生指标作为待细化衍生指标集合。

25、可选地,所述对所述待细化衍生指标集合进行搜索,得到第二信息值序列,包括:

26、将所述第一搜索步长进行二分细化,得到第二搜索步长;

27、根据所述第二搜索步长和所述迭代次数阈值,确定第二搜索范围;

28、根据所述第二搜索范围和所述第二搜索步长对所述待细化衍生指标集合进行二次细化搜索,得到筛选后的信息值序列;

29、将所述筛选后的信息值序列中的最大值作为第二信息值序列。

30、可选地,所述根据所述第一信息值序列和所述第二信息值序列确定目标信息值序列以及对应的衍生指标和加权系数,包括:

31、将所述第一信息值序列和所述第二信息值序列进行比较;

32、若所述第二信息值序列大于等于所述第一信息值序列,返回所述对所述待细化衍生指标集合进行搜索,得到第二信息值序列的步骤;

33、若所述第二信息值序列小于所述第一信息值序列,则将所述第二信息值序列作为目标信息值序列,并输出所述目标信息值序列对应的衍生指标和加权系数。

34、可选地,所述基于所述特征工程指标进行模型训练,得到目标评分卡模型,包括

35、将所述特征工程指标和所述评分卡模型建模指标集合进行拼接,得到目标指标集合;

36、通过目标指标集合对初始评分卡模型进行模型训练,得到目标评分卡模型。

37、搜索模块,用于根据评分卡模型建模指标集合得到衍生指标集合,并对所述衍生指标集合进行搜索,得到目标信息值序列以及对应的衍生指标和加权系数;

38、生成模块,用于根据所述目标信息值序列对应的衍生指标和加权系数进行特征生成,得到特征工程指标;

39、训练模块,用于基于所述特征工程指标进行模型训练,得到目标评分卡模型;

40、评分模块,用于通过所述目标评分卡模型对用户进行风控评分。

41、此外,为实现上述目的,本发明还提出一种风控评分装置,所述风控评分装置包括:

42、此外,为实现上述目的,本发明还提出一种风控评分设备,所述风控评分设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的风控评分程序,所述风控评分程序配置为实现如上文所述的风控评分方法的步骤。

43、此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有风控评分程序,所述风控评分程序被处理器执行时实现如上文所述的风控评分方法的步骤。

44、本发明根据评分卡模型建模指标集合得到衍生指标集合,并对衍生指标集合进行搜索,得到目标信息值序列以及对应的衍生指标和加权系数;根据目标信息值序列对应的衍生指标和加权系数进行特征生成,得到特征工程指标;基于特征工程指标进行模型训练,得到目标评分卡模型;通过目标评分卡模型对用户进行风控评分。通过上述方式,对衍生指标集合进行搜索得到目标信息值序列对应的衍生指标和加权系数,从而得到特征工程指标用于模型训练,进而得到目标评分卡模型对用户进行风控评分,解决了特征工程灵活性低、模型的复杂度以及模型参数量增加,模型优化难度增大,导致存在过拟合或欠拟合风险的问题,实现指标自动特征工程与指标有效性筛选的结合,有效降低特征工程工作量。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1