数据处理方法、装置、计算机设备和存储介质与流程

文档序号:29734893发布日期:2022-04-21 15:32阅读:98来源:国知局
数据处理方法、装置、计算机设备和存储介质与流程

1.本技术涉及数据处理技术领域,特别是涉及一种数据处理方法、装置、计算机设备和存储介质。


背景技术:

2.目前各消费金融机构,授信准入风险策略主要采用基于获客渠道、产品与人口统计特征属性的顶层细分刻画:渠道(channel)、产品(product)与人口属性(demographic attributes)。消费信贷领域往往以获客渠道或产品为主上分维度,人口统计特征(年龄、学历、职业)为下分维度,构建授信准入顶层细分刻画框架。
3.然而,传统的技术方案中,基于人口特征的分群刻画,受限于机构对接学信网以及采集职业信息的不均衡性影响,数据的缺失性以及对客服务公平性(如性别),使得信贷客群申请授信阶段的细分刻画应用受限,并且,由于传统的技术所采取的人口特征这个维度不够精细化,且单一,这样容易导致根据传统的方案进行信贷申请的审核,审核的准确度不高。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种数据处理方法、装置、计算机设备和存储介质。
5.一种数据处理方法,方法包括:
6.获取当前用户的资源转借申请数据;
7.根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据;
8.根据预设的风险评估模型得到当前用户的信用评分;
9.获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围;
10.当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请数据审核通过。
11.在其中一个实施例中,上述的方法还包括:
12.获取样本数据,样本数据包括预设数目的样本用户对应的资源转借申请数据;
13.根据各样本数据以及各样本用户的信用评分进行模型训练,得到决策树模型,决策树模型包括第一层级、第二层级以及第三层级,第一层级中的各节点配置有对应的资源转借类型,第二层级的各节点配置有各资源转借类型对应的时长条件,第三层级的各节点配置有对应的风险控制范围以及各时长条件下的资源交易条件;
14.上述的获取当前风险控制范围,包括:
15.将资源转借时长与当前资源转借类型下各时长条件进行匹配,确定与资源转借时长匹配的时长条件;
16.将资源交易行为数据与资源转借时长所匹配的时长条件下各资源交易条件进行匹配,确定与资源交易行为数据匹配的资源交易条件;
17.获取资源交易行为数据所匹配的资源交易条件对应节点上配置的风险控制范围,得到当前风险控制范围。
18.在其中一个实施例中,上述的方法还包括:
19.获取决策树模型中各节点的违约率以及审核通过率;
20.确定各节点的平均违约率以及平均审核通过率;
21.将决策树模型中各节点的违约率与平均违约率进行比对,得到高违约率节点以及低违约率节点;
22.将决策树模型中各节点的审核通过率与平均审核通过率进行比对,得到高通过率节点以及低通过率节点;
23.当从各节点中筛选出高违约率高通过率节点或者低违约率低通过率节点时,重新获取高违约率高通过率节点或者低违约率低通过率节点对应样本用户的新的信用评分;
24.根据新的信用评分,重新训练决策树模型。
25.在其中一个实施例中,上述的方法还包括:
26.当重新训练后的决策树模型中存在高违约率高通过率节点或者低违约率低通过率节点时,根据高违约率高通过率节点的违约率以及审核通过率、低违约率低通过率节点的违约率以及审核通过率,调整高违约率低通过率节点以及低违约率高通过率节点对应的风险控制范围。
27.在其中一个实施例中,上述的方法还包括:
28.对样本数据进行训练得到拒绝样本以及通过样本;
29.根据预先设置的置入比率从拒绝样本中回捞对应数目的拒绝样本,对回捞到的拒绝样本重新进行训练;
30.根据预先设置的置出比率从通过样本中剔除相应数目的通过样本,以更新通过样本;
31.上述的获取决策树模型中各节点的审核通过率,包括:
32.根据更新后的通过样本的数目,确定决策树模型中各节点的审核通过率。
33.在其中一个实施例中,上述的方法还包括:
34.接收第二层级中新增资源转借类型的请求;
35.提取新增资源转借类型的请求中的目标类型,将目标类型添加至决策树模型中。
36.在其中一个实施例中,上述的资源转借时长为当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长,上述的根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据,包括:
37.从资源转借申请数据中提取当前资源转借类型;
38.根据当前资源转借类型以及资源转借申请数据中的用户信息获取当前用户的历史资源转借数据;
39.根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长;
40.根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间当前用户与各资源出借机构间的资源交易行为数据。
41.一种数据处理装置,其特征在于,装置包括:
42.第一获取模块,用于获取当前用户的资源转借申请数据;
43.第二获取模块,用于根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据;
44.生成模块,用于根据预设的风险评估模型得到当前用户的信用评分;
45.确定模块,用于获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围;
46.审核模块,用于当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请数据审核通过。
47.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:
48.获取当前用户的资源转借申请数据;
49.根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据;
50.根据预设的风险评估模型得到当前用户的信用评分;
51.获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围;
52.当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请数据审核通过。
53.一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
54.获取当前用户的资源转借申请数据;
55.根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据;
56.根据预设的风险评估模型得到当前用户的信用评分;
57.获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围;
58.当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请数据审核通过。
59.上述数据处理方法、装置、计算机设备和存储介质,通过获取当前用户的资源转借申请数据;根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据;根据预设的风险评估模型得到当前用户的信用评分;获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围;当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请数据审核通过。本技术通过将当前资源转借类型、对应的资源转借时长以及资源交易行为数据与用户的信
用评分相结合,对资源转借申请数据,提升了数据源的精细化程度,使得审核结果更加精准,并且,本技术不单单使用人口特征的分群刻画,避免受到用户信息采集的不均衡性的影响。
附图说明
60.图1为一个实施例中数据处理方法的应用环境图;
61.图2为一个实施例中数据处理方法的流程示意图;
62.图3为一个实施例中调整决策树模型的结构示意图;
63.图4为一个实施例中调整决策树模型的流程示意图;
64.图5为另一个实施例中根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据步骤的细化流程示意图;
65.图6为一个实施例中数据处理装置的结构框图;
66.图7为一个实施例中计算机设备的内部结构图。
具体实施方式
67.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
68.请参考图1,图1为本技术一示例性实施例提供的一种数据处理方法的应用环境示意图。如图1所示,该应用环境中包括服务器100以及终端101,服务器100与终端101之间可以通过网络102实现可通信的连接,以实现本技术的数据处理方法。
69.服务器100用于获取当前用户的资源转借申请数据;根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据;根据预设的风险评估模型得到当前用户的信用评分;获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围;当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请数据审核通过,接收终端101发送的审核结果的查询请求,获取对应的审核结果,将审核结果发送至终端展示。其中,服务器100可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
70.终端101用于向服务器100发送审核结果的查询请求,并接收服务器100反馈的审核结果并展示。终端101可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。
71.网络102用于实现终端101与服务器100之间的网络连接,具体的,网络102可以包括多种类型的有线或无线网络。
72.在一个实施例中,如图2所示,提供了一种数据处理方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
73.s11、获取当前用户的资源转借申请数据。
74.本技术中,上述的资源转借申请数据为资源转借申请相关的数据,如,申请用户的
用户信息、资源转借类型、资源转借时长、资源交易行为数据以及资源转借金额等。一种应用场景中,上述的资源转借申请数据可以为信贷申请数据。上述的资源转借类型可以为信贷类型,上述的资源转借时长可以为信贷时长,即从用户开户至今的时长,上述的资源交易行为数据可以为多头数据,即在用户开户至今的时长内用户发起过与信贷有关的行为的机构数。
75.具体的,上述的信贷类型可以为小贷类型、消金类型、银行个贷类型、信用卡类型、其他贷款类型、弱人行客群及无人行记录客群类型等。上述的各信贷类型下的信贷时长分别对应不同信贷类型下首次开户距今的时长。
76.s12、根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据。
77.本技术中,上述的资源出借机构可以为将资源出借给申请方的机构,如信贷机构。上述的资源交易行为数据可以为资源转借时长内当前用户所发起资源交易行为的机构数,如,该资源交易行为数据可以为多头数据。
78.例如,当前用户向a机构申请借款,发起借款申请,a机构获取当前用户所申请的信贷类型以及当前用户自首次开户至今的贷款时长,以及在该时长内当前用户与其他机构发起信贷的机构数。
79.在其中一个实施例中,如图3所示,上述的资源转借时长为当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长,上述的根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据,可以包括:
80.s51、从资源转借申请数据中提取当前资源转借类型;
81.s52、根据当前资源转借类型以及资源转借申请数据中的用户信息获取当前用户的历史资源转借数据;
82.s53、根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长;
83.s54、根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间当前用户与各资源出借机构间的资源交易行为数据。
84.本技术中,上述的资源交易行为数据可以为资源转借时长当前用户所发起资源申请相关行为的资源出借机构的数目。例如,若资源转借时长为3个月,则获取当前用户在近3个月内申请过贷款的信贷机构数,或者发起过与信贷申请有关的行为的信贷机构数。该与信贷有关的行为可以为信贷申请、授信以及还款等行为。
85.本技术通过获取当前资源转借类型、资源转借时长以及资源交易行为数据,基于该些数据对用户的资源转借申请数据进行审核,本技术对用户资源转借申请数据进行审核其实是对用户信用的一种审核,使得审核通过的用户的违约风险尽量低,提高审核的准确度。
86.s13、根据预设的风险评估模型得到当前用户的信用评分。
87.本技术中,上述的风险评估模型可以是根据用户的历史资源转借数据对用户的信用度进行评分。例如,可以是根据用户历史所申请的贷款类型、贷款机构、违约情况、还款情况、催收情况、逾期情况等信息作为输入参数,最终得到用户的信用评分。
88.s14、获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围。
89.本技术中,根据资源交易行为数据、当前资源转借类型以及对应的资源转借时长可以唯一性确定一个预先配置的风险控制范围。具体的,本技术是通过决策树模型对风险控制范围进行配置。
90.s15、当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请数据审核通过。
91.在其中一个实施例中,上述的方法还可以包括:
92.获取样本数据,样本数据包括预设数目的样本用户对应的资源转借申请数据;
93.根据各样本数据以及各样本用户的信用评分进行模型训练,得到决策树模型,决策树模型包括第一层级、第二层级以及第三层级,第一层级中的各节点配置有对应的资源转借类型,第二层级的各节点配置有各资源转借类型对应的时长条件,第三层级的各节点配置有对应的风险控制范围以及各时长条件下的资源交易条件;
94.上述的获取当前风险控制范围,可以包括:
95.将资源转借时长与当前资源转借类型下各时长条件进行匹配,确定与资源转借时长匹配的时长条件;
96.将资源交易行为数据与资源转借时长所匹配的时长条件下各资源交易条件进行匹配,确定与资源交易行为数据匹配的资源交易条件;
97.获取资源交易行为数据所匹配的资源交易条件对应节点上配置的风险控制范围,得到当前风险控制范围。
98.请参考图4,图4为一种实施例中决策树的模型结构示意图。在图4中,上述的决策树模型包括多个层级,各层级包括多个节点,各节点上配置有分类条件。其中,第一层级32上的各节点,上配置的分类条件为资源转借类型,其中,第一层级32上的节点分别包括321、323以及其他节点(图未示)。第二层级33上的各节点上配置的分类条件为时长条件,该时长条件为资源转借时长所满足的条件,其中,第二层级33上的节点分别包括331、332、333以及其他节点(图未示)。第三层级34上各节点上配置的分类条件为资源交易条件,该资源交易条件为资源交易数据所满足的条件,其中,第三层级34上的节点分别包括341、342以及其他节点(图未示)。本技术中,为第三层级34上的各节点还配置有对应的风险控制范围。进一步的,本技术的决策树模型中还包括基础层级31,基础层级的分类条件可以为渠道或者产品,其中,基础层级中包括节点311以及其他节点(图未示)。基础层级的各节点上分配配置有不同的预设渠道或者预设产品。另一种实施方式中,上述的基础层级中可以包括多个子层级,例如,第一子层级设为产品,第二子层级设为渠道。
99.具体的,上述的决策树中还包括第四层级35,其中第四层级35中的节点分别为351、352以及其他节点(图未示)。
100.在对样本数据进行训练时,先获取当前样本数据,该当前样本数据为当前样本用户的资源转借申请数据。将该资源转借申请数据输入初始模型中,利用初始模型对样本数据进行训练,以得到最终的决策树模型。
101.具体的,将当前样本数据中的申请渠道与初始模型中的基础层级中各节点上配置的预设渠道进行匹配,当匹配成功时,将当前样本数据分类至基础层级中的匹配成功的a节
点上,假设a节点为小贷类型节点,然后继续往下层分类,直至划分到最后一层的某个m节点上。
102.进一步的,上述的基础层级31的下一层级为第一层级32,该第一层级32的各节点上分别配置有对应的资源转借类型。例如,第二层级中包括7个节点,分别配置的资源转借类型为小贷类型、消金类型、银行个贷类型、信用卡类型、其他贷款类型、弱人行或者无人行客群类型,其中,节点321上配置的资源转借类型为小贷类型,节点322上配置的资源转借类型为弱人行或者无人行。根据当前资源转借类型可以将上述划分到第一层级32的a节点上的当前样本数据继续在第二层级33上进一步分类,划分至b节点上。
103.进一步的,第一层级32的下一层级为第二层级33,该第二层级33的各节点上分别配置有对应的分类条件为各资源转借类型对应的时长条件。例如,小贷类型下面划分了3个时长条件,分别为小贷时长小于x,对应节点331,小贷时长大于x小于y,对应节点332,小贷时长大于y,对应节点333。将当前样本数据中的资源转借时长分别与小贷类型下的三个时长条件进行匹配,若匹配到小贷时长小于x这个节点,假设为c节点。
104.进一步的,第二层级33的下一层级为第三层级34,该第三层级34的各节点长分别配置有对应的分类条件为资源交易条件。该资源交易条件可以为当资源交易数据大于第一预设阈值时为高多头,对应节点341,当资源交易数据小于第二预设阈值时为低多头,对应节点342。将上述的c节点上的当前样本数据中的资源转借时长与第三层级中的资源交易条件进行匹配,若匹配到高多头这个节点,假设为d节点,则获取d节点上预先配置的风险控制范围。本技术中预先为第三层级34中的各节点还配置有对应的风险控制范围。
105.进一步的,根据当前样本数据获取当前样本用户的信用评分,将该信用评分与d节点上的风险控制范围进行比对,若该信用评分在d节点上的风险控制范围之内时,确定当前样本数据审核通过,则继续获取下一个样本数据进行审核,直至最后一个样本数据,以训练决策树模型。
106.本技术中,选取渠道、信贷类型以及信贷时长作为上分层,选取多头信息以及信用评分作为下分层,获取的数据较为精细化,使得训练出的决策树模型在审核信贷申请数据时的审核结果更加精准。
107.在其中一个实施例中,如图5所示,上述的方法还包括:
108.s41、获取决策树模型中各节点的违约率以及审核通过率;
109.s42、确定各节点的平均违约率以及平均审核通过率;
110.s43、将决策树模型中各节点的违约率与平均违约率进行比对,得到高违约率节点以及低违约率节点;
111.s44、将决策树模型中各节点的审核通过率与平均审核通过率进行比对,得到高通过率节点以及低通过率节点;
112.s45、当从各节点中筛选出高违约率高通过率节点或者低违约率低通过率节点时,重新获取高违约率高通过率节点或者低违约率低通过率节点对应样本用户的新的信用评分;
113.s46、根据新的信用评分,重新训练决策树模型。
114.本技术中,上述的获取决策树模型中各节点的违约率以及审核通过率,可以通过以下步骤实现:
115.获取上述的第三层级中各节点上所分配到的样本用户数以及审核通过的样本用户数,根据分配到的样本用户数以及审核通过的样本用户数得到第三层级中各节点的审核通过率;
116.获取上述的第三层级中各节点上所分配到的样本用户的违约数据,具体可以是违约的样本用户数量,根据违约的样本用户的数量以及各节点上所分配到的样本用户数,得到第三层级中各节点的违约率。
117.上述的将决策树模型中各节点的违约率与平均违约率进行比对,得到高违约率节点以及低违约率节点,可以通过以下步骤实现:
118.将违约率小于第三预设阈值的确定为低违约率,将违约率大于第四预设阈值的确定为高违约率;
119.将审核通过率小于第五预设阈值的确定为低通过率,将审核通过率大于第六预设阈值的确定为高通过率。
120.其中,上述的第三预设阈值可以为平均违约率的50%。上述的第四预设阈值可以为平均违约率15%。上述的第五预设阈值可以为平均通过率的50%。上述的第六预设阈值可以为平均通过率的1.5倍。本技术中,具体的预设阈值也可以根据实际需求具体设定,在此不做具体限定。
121.当从各节点中筛选出高违约率高通过率节点或者低违约率低通过率节点时,重新获取高违约率高通过率节点或者低违约率低通过率节点对应样本用户的新的信用评分,将新的信用评分替换原评分重新对该些样本用户进行训练。
122.本技术中,决策树模型的训练过程就是对初始模型的不断调整的过程。具体的,对样本数据进行模型训练时,根据各节点的违约率以及审核通过率对决策树模型的参数不断调整,以得到最优的决策树模型,其中,该决策树模型的参数可以为上述的风险控制范围。
123.在其中一个实施例中,上述的方法还可以包括:
124.当重新训练后的决策树模型中存在高违约率高通过率节点或者低违约率低通过率节点时,根据高违约率高通过率节点的违约率以及审核通过率、低违约率低通过率节点的违约率以及审核通过率,调整高违约率低通过率节点以及低违约率高通过率节点对应的风险控制范围。
125.本技术中,当重新训练后的决策树模型中仍可以筛选出高违约率高通过率节点或者低违约率低通过率节点时,根据高违约率高通过率节点的违约率以及审核通过率、低违约率低通过率节点的违约率以及审核通过率,调整高违约率低通过率节点以及低违约率高通过率节点对应的风险控制范围,具体的,将高违约率高通过率节点的风险控制范围调整为更小的范围,将低违约率低通过率节点的风险控制范围调整为更大的范围,使得高违约率高通过率节点的审核通过率降低,低违约率低通过率节点的通过率提高。
126.本技术中,提高该实施方式可以调整决策树模型,使得决策树模型更加精准,提升方案的灵活性。
127.在其中一个实施例中,上述的方法还可以包括:
128.对样本数据进行训练得到拒绝样本以及通过样本;
129.根据预先设置的置入比率从拒绝样本中回捞对应数目的拒绝样本,对回捞到的拒绝样本重新进行训练;
130.根据预先设置的置出比率从通过样本中剔除相应数目的通过样本,以更新通过样本;
131.获取决策树模型中各节点的审核通过率,包括:
132.根据更新后的通过样本的数目,确定决策树模型中各节点的审核通过率。
133.本技术中,可以针对高违约率低通过率节点设置置入比率,以从拒绝样本中回捞对应数目的拒绝样本,对回捞到的拒绝样本重新进行训练。可以针对低违约率高通过率设置置出比率从通过样本中剔除相应数目的通过样本,以更新通过样本。
134.本技术中,通常根据政策偏好松紧设置随机置换率,宽松情景下,置入比率不低于置出比率值(即正回捞率),通常针对低违约率高通过率节点设置2.0%-4.0%的置出比率,针对高违约率低通过率节点设置3.0%-5.0%的置入比率;紧缩情景下,置入比率不高于置出比率,通常针对低违约率低通过率节点设置1.0%-3.0%的置出比率,针对高违约率低通过率节点设置1.0%-3.0%置入比率。
135.本技术通过该实施方式可以对决策树模型进行补偿,即对拒绝掉的样本中回捞一部分,对通过的样本中重新拒绝掉一部分,以调整模型的精准度。
136.在其中一个实施例中,上述的方法还可以包括:
137.接收第二层级中新增资源转借类型的请求;
138.提取新增资源转借类型的请求中的目标类型,将目标类型添加至决策树模型中。
139.本技术中,当有新的业务类型需要添加时,可以向服务器提交新增资源转借类型的请求。例如,当需要新增一种原决策树模型中所没有的信贷类型时,可以将该新的信贷类型添加至决策树模型中。将新的信贷类型添加至决策树模型时,需要将该新的信贷类型的下层级对应的各节点上所配置的分类条件也添加至决策树模型中。例如,需要配置该新的信贷类型下的时长条件以及各时长条件下的资源交易条件。
140.本技术中,通过该实施方式可以新增或修改决策树模型中各层级中各节点的分类条件,提升方案的灵活性。
141.一种可能的应用场景中,本技术中的基层层级、第一层级以及第二层级为上分层、第三层级以及第四层级为下分层,进行模型训练时主要采用决策树模型,选择“合适”的下分特征维度,根据决策树特征卡方统计量(f统计量或熵)的排序与上层经验细分特征,逐层生长下分树,并始终将申请风险评分作为最下层细分,具体步骤如下:
142.算法常用参数设置,显著性水平0.2,树最大分支5,树最大深度8,叶节点最小样本容量200,其他参数勾选默认值;
143.上层细分生长,如图4所示为某个渠道的客户消费信贷类型切分,上层细分为共6组(对应渠道a-f);
144.各上层细分节点的下分生长,以渠道a为例,下层细分分别用小贷机构贷款时长和第三方多头贷款申请查询近6个月非银机构数作为生长切分节点;
145.申请风险评分(a-score)作为保底/末节点特征选择,并确定不同逾期水平的cutoff作为最终分裂;
146.高风险节点正向回捞规则测试,即设置一定的置入比率对拒绝样本进行回捞;
147.低风险节点负向拒绝规则测试,即设置一定的置出比率对通过样本进行拒绝;
148.依上述步骤进行不同渠道的下分决策树生长及正反向交叉测试研发,从而形成最
终决策树;
149.模型训练完成之后,需要对模型进行评估。这个阶段主要使训练好的每个上层细分节点下的树模型风险违约水平一致,同时对细分的客群稳定性进行评估,其次,还需对同池客群的风险同质性与相互池之间的风险异质性检验(其中客群稳定性评估采用人群占比的psi偏移指标,各分支的同质性采用违约率的均值t-检验统计量)。
150.进一步进行应用检验,这个阶段主要在策略引擎上部署模型,并申请流量随机30%-50%在新的细分框架下进行实际准入决策,同时对同批次客群不同细分框架下的决策结果标记,并在授信准入后120-180天进行对比分析,以确定不同细分框架下的决策效能差异。
151.综上,本技术的数据处理方法与传统的方案相比,从通过率以及违约率方面都相对得到优化,模型性能的提升,意味着模型对信用风险的区分能力变强。相同业务模式下,通过采用本专利方法,将提升信用审批通过率,降低信用风险逾期,取得更好的风险管控水平。
152.在一个实施例中,如图6所示,提供了一种数据处理装置,包括:第一获取模块11、第二获取模块12、生成模块13、确定模块14以及审核模块15,其中:
153.第一获取模块11,用于获取当前用户的资源转借申请数据;
154.第二获取模块12,用于根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据;
155.生成模块13,用于根据预设的风险评估模型得到当前用户的信用评分;
156.确定模块14,用于获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围;
157.审核模块15,用于当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请数据审核通过。
158.在其中一个实施例中,上述的装置还包括训练模块(图未示),该训练模块可以获取样本数据,样本数据包括预设数目的样本用户对应的资源转借申请数据,根据各样本数据以及各样本用户的信用评分进行模型训练,得到决策树模型,决策树模型包括第一层级、第二层级以及第三层级,第一层级中的各节点配置有对应的资源转借类型,第二层级的各节点配置有各资源转借类型对应的时长条件,第三层级的各节点配置有对应的风险控制范围以及各时长条件下的资源交易条件;
159.上述的确定模块14可以将资源转借时长与当前资源转借类型下各时长条件进行匹配,确定与资源转借时长匹配的时长条件,将资源交易行为数据与资源转借时长所匹配的时长条件下各资源交易条件进行匹配,确定与资源交易行为数据匹配的资源交易条件,获取资源交易行为数据所匹配的资源交易条件对应节点上配置的风险控制范围,得到当前风险控制范围。
160.在其中一个实施例中,上述的装置还包括第一调整模块(图未示),该第一调整模块可以获取决策树模型中各节点的违约率以及审核通过率,确定各节点的平均违约率以及平均审核通过率,将决策树模型中各节点的违约率与平均违约率进行比对,得到高违约率节点以及低违约率节点,将决策树模型中各节点的审核通过率与平均审核通过率进行比
对,得到高通过率节点以及低通过率节点,当从各节点中筛选出高违约率高通过率节点或者低违约率低通过率节点时,重新获取高违约率高通过率节点或者低违约率低通过率节点对应样本用户的新的信用评分,根据新的信用评分,重新训练决策树模型。
161.在其中一个实施例中,上述的装置还包括第二调整模块(图未示),该第二调整模块可以当重新训练后的决策树模型中存在高违约率高通过率节点或者低违约率低通过率节点时,根据高违约率高通过率节点的违约率以及审核通过率、低违约率低通过率节点的违约率以及审核通过率,调整高违约率低通过率节点以及低违约率高通过率节点对应的风险控制范围。
162.在其中一个实施例中,上述的装置还包括第三调整模块(图未示),该第三特征模块可以对样本数据进行训练得到拒绝样本以及通过样本,根据预先设置的置入比率从拒绝样本中回捞对应数目的拒绝样本,对回捞到的拒绝样本重新进行训练,根据预先设置的置出比率从通过样本中剔除相应数目的通过样本,以更新通过样本;
163.上述的第一调整模块还可以根据更新后的通过样本的数目,确定决策树模型中各节点的审核通过率。
164.在其中一个实施例中,上述的装置还包括新增模块(图未示),该新增模块可以接收第二层级中新增资源转借类型的请求,提取新增资源转借类型的请求中的目标类型,将目标类型添加至决策树模型中。
165.在其中一个实施例中,上述的资源转借时长为当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长,上述的第二获取模块12可以从资源转借申请数据中提取当前资源转借类型,根据当前资源转借类型以及资源转借申请数据中的用户信息获取当前用户的历史资源转借数据,根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长,根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间当前用户与各资源出借机构间的资源交易行为数据。
166.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储智能家居设备的运行数据等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现编译虚拟机的资源分配方法。
167.在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现以下步骤:获取当前用户的资源转借申请数据;根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据;根据预设的风险评估模型得到当前用户的信用评分;获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围;当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请
数据审核通过。
168.在一个实施例中,处理器执行计算机程序时具体还实现以下步骤:
169.获取样本数据,样本数据包括预设数目的样本用户对应的资源转借申请数据;
170.根据各样本数据以及各样本用户的信用评分进行模型训练,得到决策树模型,决策树模型包括第一层级、第二层级以及第三层级,第一层级中的各节点配置有对应的资源转借类型,第二层级的各节点配置有各资源转借类型对应的时长条件,第三层级的各节点配置有对应的风险控制范围以及各时长条件下的资源交易条件;
171.处理器执行计算机程序实现上述的获取当前风险控制范围,步骤时具体实现以下步骤:
172.将资源转借时长与当前资源转借类型下各时长条件进行匹配,确定与资源转借时长匹配的时长条件;
173.将资源交易行为数据与资源转借时长所匹配的时长条件下各资源交易条件进行匹配,确定与资源交易行为数据匹配的资源交易条件;
174.获取资源交易行为数据所匹配的资源交易条件对应节点上配置的风险控制范围,得到当前风险控制范围。
175.在一个实施例中,处理器执行计算机程序时具体还实现以下步骤:
176.获取决策树模型中各节点的违约率以及审核通过率;
177.确定各节点的平均违约率以及平均审核通过率;
178.将决策树模型中各节点的违约率与平均违约率进行比对,得到高违约率节点以及低违约率节点;
179.将决策树模型中各节点的审核通过率与平均审核通过率进行比对,得到高通过率节点以及低通过率节点;
180.当从各节点中筛选出高违约率高通过率节点或者低违约率低通过率节点时,重新获取高违约率高通过率节点或者低违约率低通过率节点对应样本用户的新的信用评分;
181.根据新的信用评分,重新训练决策树模型。
182.在一个实施例中,处理器执行计算机程序时具体还实现以下步骤:
183.当重新训练后的决策树模型中存在高违约率高通过率节点或者低违约率低通过率节点时,根据高违约率高通过率节点的违约率以及审核通过率、低违约率低通过率节点的违约率以及审核通过率,调整高违约率低通过率节点以及低违约率高通过率节点对应的风险控制范围。
184.在一个实施例中,处理器执行计算机程序时具体还实现以下步骤:
185.对样本数据进行训练得到拒绝样本以及通过样本;
186.根据预先设置的置入比率从拒绝样本中回捞对应数目的拒绝样本,对回捞到的拒绝样本重新进行训练;
187.根据预先设置的置出比率从通过样本中剔除相应数目的通过样本,以更新通过样本;
188.处理器执行计算机程序实现上述的获取决策树模型中各节点的审核通过率步骤时具体实现以下步骤:
189.根据更新后的通过样本的数目,确定决策树模型中各节点的审核通过率。
190.在一个实施例中,处理器执行计算机程序时具体还实现以下步骤:
191.接收第二层级中新增资源转借类型的请求;
192.提取新增资源转借类型的请求中的目标类型,将目标类型添加至决策树模型中。
193.在一个实施例中,上述的资源转借时长为当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长,处理器执行计算机程序实现上述的根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据步骤时具体实现以下步骤:
194.从资源转借申请数据中提取当前资源转借类型;
195.根据当前资源转借类型以及资源转借申请数据中的用户信息获取当前用户的历史资源转借数据;
196.根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长;
197.根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间当前用户与各资源出借机构间的资源交易行为数据。
198.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取当前用户的资源转借申请数据;根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据;根据预设的风险评估模型得到当前用户的信用评分;获取当前风险控制范围,当前风险控制范围为预先配置的与当前资源转借类型、资源转借时长以及资源交易行为数据对应的风险控制范围;当信用评分在当前风险控制范围内时,确定当前用户的资源转借申请数据审核通过。
199.在一个实施例中,计算机程序被处理器执行时具体还实现以下步骤:
200.获取样本数据,样本数据包括预设数目的样本用户对应的资源转借申请数据;
201.根据各样本数据以及各样本用户的信用评分进行模型训练,得到决策树模型,决策树模型包括第一层级、第二层级以及第三层级,第一层级中的各节点配置有对应的资源转借类型,第二层级的各节点配置有各资源转借类型对应的时长条件,第三层级的各节点配置有对应的风险控制范围以及各时长条件下的资源交易条件;
202.计算机程序被处理器执行实现上述的获取当前风险控制范围步骤时具体实现以下步骤:
203.将资源转借时长与当前资源转借类型下各时长条件进行匹配,确定与资源转借时长匹配的时长条件;
204.将资源交易行为数据与资源转借时长所匹配的时长条件下各资源交易条件进行匹配,确定与资源交易行为数据匹配的资源交易条件;
205.获取资源交易行为数据所匹配的资源交易条件对应节点上配置的风险控制范围,得到当前风险控制范围。
206.在一个实施例中,计算机程序被处理器执行时具体还实现以下步骤:
207.获取决策树模型中各节点的违约率以及审核通过率;
208.确定各节点的平均违约率以及平均审核通过率;
209.将决策树模型中各节点的违约率与平均违约率进行比对,得到高违约率节点以及
低违约率节点;
210.将决策树模型中各节点的审核通过率与平均审核通过率进行比对,得到高通过率节点以及低通过率节点;
211.当从各节点中筛选出高违约率高通过率节点或者低违约率低通过率节点时,重新获取高违约率高通过率节点或者低违约率低通过率节点对应样本用户的新的信用评分;
212.根据新的信用评分,重新训练决策树模型。
213.在一个实施例中,计算机程序被处理器执行时,具体还实现以下步骤:
214.当重新训练后的决策树模型中存在高违约率高通过率节点或者低违约率低通过率节点时,根据高违约率高通过率节点的违约率以及审核通过率、低违约率低通过率节点的违约率以及审核通过率,调整高违约率低通过率节点以及低违约率高通过率节点对应的风险控制范围。
215.在一个实施例中,计算机程序被处理器执行时具体还实现以下步骤:
216.对样本数据进行训练得到拒绝样本以及通过样本;
217.根据预先设置的置入比率从拒绝样本中回捞对应数目的拒绝样本,对回捞到的拒绝样本重新进行训练;
218.根据预先设置的置出比率从通过样本中剔除相应数目的通过样本,以更新通过样本;
219.计算机程序被处理器执行实现上述的获取决策树模型中各节点的审核通过率步骤时,具体实现以下步骤:
220.根据更新后的通过样本的数目,确定决策树模型中各节点的审核通过率。
221.在一个实施例中,计算机程序被处理器执行时具体还实现以下步骤:
222.接收第二层级中新增资源转借类型的请求;
223.提取新增资源转借类型的请求中的目标类型,将目标类型添加至决策树模型中。
224.在一个实施例中,上述的资源转借时长为当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长,计算机程序被处理器执行实现上述的根据资源转借申请数据获取当前资源转借类型、当前资源转借类型对应的资源转借时长以及资源转借时长内当前用户与各资源出借机构间的资源交易行为数据步骤时,具体实现以下步骤:
225.从资源转借申请数据中提取当前资源转借类型;
226.根据当前资源转借类型以及资源转借申请数据中的用户信息获取当前用户的历史资源转借数据;
227.根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间的时长;
228.根据历史资源转借数据获取当前用户首次申请当前资源转借类型对应资源的时间至当前时间当前用户与各资源出借机构间的资源交易行为数据。
229.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom
(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
230.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
231.以上实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1