本技术涉及人工智能,具体而言,本技术涉及一种样本数据处理方法、风控模型训练方法及装置。
背景技术:
1、在许多金融业务中涉及风险控制,金融机构会设计相应的风控策略来规避可能产生的风险。尤其在消费贷等业务场景中,金融机构会根据风控策略建立对应的风控模型,当接收到用户对消费贷等相关业务的申请时,需要通过风控模型对用户的进行筛选,不符合相关业务的风控策略的用户,会被风控模型拦截,称为拦截用户,符合相关业务的风控策略的用户,不会被风控模型拦截,称为通过用户。
2、通过用户在后续会产生相关业务对应的订单行为数据,例如,对于消费贷业务,会产生是否违约n天等数据。而拦截用户由于被拦截,无法产生相关业务对应的订单行为数据。目前,在构建风控策略对应的风控模型时,采用的是通过用户以及其对应的订单行为数据作为训练样本,对初始风控模型进训练得到用于在线部署的风控模型。
3、但是,由于训练样本中不包含拦截用户,训练得到的风控模型存在对用户进行风险表现判断准确性差、风控策略优化过程中维护成本和实验成本高的问题。
技术实现思路
1、本技术的目的旨在至少能解决上述的技术缺陷之一,本技术实施例所提供的技术方案如下:
2、第一方面,本技术实施例提供了一种样本数据处理方法,其特征在于,包括:
3、获取目标业务的第一风控模型的至少一个拦截用户,并获取各拦截用户在被拦截后产生的与目标业务相关的非订单行为数据,非订单行为数据为用户执行目标业务对应的订单以外的行为所产生的数据;
4、对于每一拦截用户,基于拦截用户的非订单行为数据获取对应的风险标签,风险标签用于指示对应的用户的风险定性为有风险或无风险;
5、基于各拦截用户和对应的风险标签,获取对应的至少一个第一训练样本;
6、其中,第一风控模型是利用初始通过样本训练得到的,初始通过样本为带有无风险的风险标签的通过用户,通过用户为目标业务对应的未被拦截的用户。
7、在本技术的一种可选实施例中,非订单行为数据包括至少一种即时行为数据和至少一种延迟行为数据;
8、基于拦截用户的非订单行为数据获取对应的风险标签,包括:
9、若各即时行为数据和各延迟行为数据没有一种非订单行为数据指示拦截用户的风险定性为有风险,则确定拦截用户的风险标签为无风险;
10、若各即时行为数据和各延迟行为数据中的至少一个指示拦截用户的风险定性为有风险,则确定拦截用户的风险标签为有风险。
11、在本技术的一种可选实施例中,基于各拦截用户和对应的风险标签,获取对应的至少一个第一训练样本,包括:
12、利用各风险标签对对应的拦截用户进行标注,得到对应的至少一个第一训练样本。
13、在本技术的一种可选实施例中,该方法还包括:
14、获取第一风控模型的至少一个通过用户,并获取各通过用户在通过后产生的与目标业务对应的订单行为数据,订单行为数据为用户执行目标业务对应的订单内的行为所产生的数据;
15、对于每一通过用户,基于通过用户的订单行为数据获取对应的增量风险标签,并基于增量风险标签确定通过用户的风险标签;
16、基于各拦截用户和对应的风险标签,获取对应的至少一个第一训练样本,包括:
17、基于各拦截用户和对应的风险标签、以及各通过用户和对应的风险标签,获取对应的至少一个训练样本。
18、在本技术的一种可选实施例中,基于增量风险标签确定通过用户的风险标签,包括:
19、若增量风险标签指示通过用户的风险定性为有风险,则将通过用户的风险标签替换指示通过用户的风险定性为有风险。
20、在本技术的一种可选实施例中,基于各拦截用户和对应的风险标签、以及各通过用户和对应的风险标签,获取对应的至少一个第一训练样本,包括:
21、利用各风险标签对对应的拦截用户进行标注,并利用各风险标签对对应的通过用户进行标注,得到对应的至少一个第一训练样本。
22、在本技术的一种可选实施例中,该方法还包括:
23、基于各第一训练样本对应的用户在预设时间段内的风险表现,对各第一训练样本的风险标签进行质量评估,得到对应的质量评估结果;
24、若质量评估结果满足预设条件,则将各第一训练样本作为对应的第二训练样本;
25、若质量评估结果不满足预设条件,则对各第一训练样本进行至少一次筛选,直至筛选得到的各第一训练样本的风险标签对应的质量评估结果满足预设条件,将筛选得到的各第一训练样本作为对应的第二训练样本;
26、其中,预设条件指示各第一训练样本的风险标签与各第一训练样本对应的用户的风险表现相符。
27、在本技术的一种可选实施例中,基于各第一训练样本对应的用户在预设时间段内的风险表现,对各第一训练样本的风险标签进行质量评估,得到对应的质量评估结果,包括:
28、获取各第一训练样本对应的用户风险表现,风险表现包括用户执行有风险行为和无风险行为;
29、获取风险标签指示为有风险的各用户中执行有风险行为的用户的第一比例,以及风险标签指示为无风险的各用户中执行有风险行为的用户的第二比例;
30、若第一比例与第二比例的比值不小于预设阈值,则确定质量评估结果满足预设条件,若第一比例与第二比例的比值小于预设阈值,则确定质量评估结果不满足预设条件。
31、在本技术的一种可选实施例中,对各第一训练样本进行至少一次筛选,包括:
32、对于第一次筛选,将各第一训练样本对应的用户输入第一风控模型,得到各用户第一风险评分,并将各用户的第一风险评分与对应的风险标签进行比较,将第一风险评分和风险标签不相符的用户对应的第一训练样本筛除;
33、对于第一次筛选后的任一次筛选,将前一次筛选得到的第一训练样本对应的用户输入目标业务的第二风控模型,得到各用户的第二风险评分,并将各用户的第二风险评分与对应的风险标签进行比较,将第二风险评分和风险标签不相符的用户对应的第一训练样本筛除,第二风控模型是利用前一次筛选得到的第一训练样本和初始通过样本一起训练得到的。
34、第二方面,本技术实施例提供了一种风控模型训练方法,包括:
35、根据第一方面实施例或第一方面任一可选实施例中所提供的样本数据处理方法,获取对应的训练样本;
36、基于训练样本对目标业务的初始的风控模型进行训练,得到目标业务对应的第三风控模型。
37、第三方面,本技术实施例提供了一种样本数据处理装置,包括:
38、非订单行为数据获取模块,用于获取目标业务的第一风控模型的至少一个拦截用户,并获取各拦截用户在被拦截后产生的与目标业务相关的非订单行为数据,非订单行为数据为用户执行目标业务对应的订单以外的行为所产生的数据;
39、风险标签获取模块,用于对于每一拦截用户,基于拦截用户的非订单行为数据获取对应的风险标签,风险标签用于指示对应的用户的风险定性为有风险或无风险;
40、第一训练样本获取模块,用于基于各拦截用户和对应的风险标签,获取对应的至少一个第一训练样本;
41、其中,第一风控模型是利用初始通过样本训练得到的,初始通过样本为带有无风险的风险标签的通过用户,通过用户为目标业务对应的未被拦截的用户。
42、在本技术的一种可选实施例中,非订单行为数据包括至少一种即时行为数据和至少一种延迟行为数据;
43、第一风险标签获取模块具体用于:
44、若各即时行为数据和各延迟行为数据没有一种非订单行为数据指示拦截用户的风险定性为有风险,则确定拦截用户的风险标签为无风险;
45、若各即时行为数据和各延迟行为数据中的至少一个指示拦截用户的风险定性为有风险,则确定拦截用户的风险标签为有风险。
46、在本技术的有种可选实施例中,第一训练样本获取模块具体用于:
47、利用各风险标签对对应的拦截用户进行标注,得到对应的至少一个第一训练样本。
48、在本技术的一种可选实施例中,该装置还包括第二风险标签获取模块,用于:
49、获取第一风控模型的至少一个通过用户,并获取各通过用户在通过后产生的与目标业务对应的订单行为数据,订单行为数据为用户执行目标业务对应的订单内的行为所产生的数据;
50、对于每一通过用户,基于通过用户的订单行为数据获取对应的增量风险标签,并基于增量风险标签确定通过用户的风险标签;
51、第一训练样本获取模块具体用于:
52、基于各拦截用户和对应的风险标签、以及各通过用户和对应的风险标签,获取对应的至少一个训练样本。
53、在本技术的一种可选实施例中,第二风险标签获取模块具体用于:
54、若增量风险标签指示通过用户的风险定性为有风险,则将通过用户的风险标签替换指示通过用户的风险定性为有风险。
55、在本技术的一种可选实施例中,第一训练样本获取模块进一步用于:
56、利用各风险标签对对应的拦截用户进行标注,并利用各风险标签对对应的通过用户进行标注,得到对应的至少一个第一训练样本。
57、在本技术的一种可选实施例中,该装置还包括第二训练样本获取模块,用于:
58、基于各第一训练样本对应的用户在预设时间段内的风险表现,对各第一训练样本的风险标签进行质量评估,得到对应的质量评估结果;
59、若质量评估结果满足预设条件,则将各第一训练样本作为对应的第二训练样本;
60、若质量评估结果不满足预设条件,则对各第一训练样本进行至少一次筛选,直至筛选得到的各第一训练样本的风险标签对应的质量评估结果满足预设条件,将筛选得到的各第一训练样本作为对应的第二训练样本;
61、其中,预设条件指示各第一训练样本的风险标签与各第一训练样本对应的用户的风险表现相符。
62、在本技术的一种可选实施例中,第二训练样本获取模块具体用于:
63、获取各第一训练样本对应的用户风险表现,风险表现包括用户执行有风险行为和无风险行为;
64、获取风险标签指示为有风险的各用户中执行有风险行为的用户的第一比例,以及风险标签指示为无风险的各用户中执行有风险行为的用户的第二比例;
65、若第一比例与第二比例的比值不小于预设阈值,则确定质量评估结果满足预设条件,若第一比例与第二比例的比值小于预设阈值,则确定质量评估结果不满足预设条件。
66、在本技术的一种可选实施例中,第二训练样本获取模块具体用于:
67、对于第一次筛选,将各第一训练样本对应的用户输入第一风控模型,得到各用户第一风险评分,并将各用户的第一风险评分与对应的风险标签进行比较,将第一风险评分和风险标签不相符的用户对应的第一训练样本筛除;
68、对于第一次筛选后的任一次筛选,将前一次筛选得到的第一训练样本对应的用户输入目标业务的第二风控模型,得到各用户的第二风险评分,并将各用户的第二风险评分与对应的风险标签进行比较,将第二风险评分和风险标签不相符的用户对应的第一训练样本筛除,第二风控模型是利用前一次筛选得到的第一训练样本和初始通过样本一起训练得到的。
69、第四方面,本技术实施例提供了一种风控模型训练装置,包括:
70、训练样本获取模块,用于根据第一方面实施例或第一方面任一可选实施例中所提供的样本数据处理方法,获取对应的训练样本;
71、训练模块,用于利用所述训练样本对目标业务的初始的风控模型进行训练,得到所述目标业务对应的第三风控模型。
72、第五方面,本技术实施例提供了一种电子设备,包括存储器和处理器;
73、存储器中存储有计算机程序;
74、处理器,用于执行计算机程序以实现第一方面实施例、第二方面实施例、第一方面任一可选实施例或第二方面任一可选实施例中所提供的方法。
75、第六方面,本技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现第一方面实施例、第二方面实施例、第一方面任一可选实施例或第二方面任一可选实施例中所提供的方法。
76、第七方面,本技术实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行时实现第一方面实施例、第二方面实施例、第一方面任一可选实施例或第二方面任一可选实施例中所提供方法。
77、本技术实施例提供的技术方案带来的有益效果是:
78、通过有初始通过样本训练得到的第一风控模型,确定出目标业务对应的拦截用户,并获取这些拦截用户在被拦截后产生的非订单行为数据,基于每一拦截用户的非订单行为数据重新确定该拦截用户的风险标签,最后利用有拦截用户和其对应的重新确定的风险标签获取包含有拦截用户对应的样本的第一训练样本。该方案中,由于第一训练样本中包含有拦截用户对应的样本,在利用第一训练样本进行目标业务的风控模型的训练时,可以提高得到的目标业务的风控模型进行风险判断的准确性,并可以降低目标业务风控策略优化过程中的维护成本和实验成本。