本说明书涉及计算机,尤其涉及一种模型训练、业务风控的方法及装置。
背景技术:
1、随着互联网技术的发展,神经网络模型(neural network,nn)以其所具有的优秀的数据处理能力受到广泛关注。
2、但是,目前输出结果精确度较高的神经网络模型的规模往往较大,不便于部署到服务器,而规模较小的神经网络模型在输出结果上精确度又相对较低。因此,现有的神经网络模型往往不能在保持较小规模的同时,保证输出结果在精确度上较高。
技术实现思路
1、本说明书提供一种模型训练、业务风控的方法及装置,以解决现有技术存在的规模小的神经网络模型的精确度差的问题。
2、本说明书采用下述技术方案:
3、本说明书提供了一种模型训练方法,包括:
4、获取轻量模型作为待训练模型,并获取用于训练所述待训练模型的训练样本,所述待训练模型包括:风控模型,所述训练样本包括:样本业务数据;
5、将所述训练样本输入到所述风控模型中,以通过所述风控模型中的特征提取层,得到所述训练样本的特征数据;
6、针对所述风控模型中的每个辅助分类器,将所述特征数据输入到该辅助分类器中,得到该辅助分类器针对所述训练样本的风险预测结果,作为该辅助分类器对应的第一风险预测结果;
7、将各第一风险预测结果输入到所述风控模型中的主分类器中,以使所述主分类器根据所述各第一风险预测结果,得到针对所述训练样本的风险预测结果,作为第二风险预测结果;
8、根据所述第一风险预测结果、所述第二风险预测结果、以及所述训练样本的实际风险标签,对所述风控模型进行训练,所述风控模块用于执行业务风控。
9、可选地,根据所述第一风险预测结果、所述第二风险预测结果、以及所述训练样本的实际风险标签,对所述风控模型进行训练,具体包括:
10、根据所述第一风险预测结果、所述第二风险预测结果、以及所述训练样本的实际风险标签,确定至少一种目标损失,所述目标损失包括:用于表征所述各第一风险预测结果和所述实际风险标签之间的偏差的第一损失、用于表征所述各第一风险预测结果与目标风险预测结果之间的偏差的第二损失、用于表征所述目标风险预测结果与所述第二风险预测结果之间的偏差的第三损失、用于表征所述第二风险预测结果和所述实际风险标签之间的偏差的第四损失、用于表征各第一风险预测结果之间的偏差的第五损失,所述目标风险预测结果是基于各第一风险预测结果与所述实际风险标签之间的偏差,从所述各第一风险预测结果中选取出的,各第一风险预测结果之间的偏差越小,所述第五损失越大;
11、以最小化所述目标损失为优化目标,对所述待训练模型进行训练。
12、可选地,基于各第一风险预测结果与所述实际风险标签之间的偏差,从所述各第一风险结果中选取出所述目标风险预测结果,具体包括:
13、将与所述实际风险标签之间的偏差最小的第一风险预测结果,作为选取出的目标风险预测结果。
14、可选地,根据所述第一风险预测结果、所述第二风险预测结果、以及所述训练样本的实际风险标签,确定至少一种目标损失,具体包括:
15、当所述目标损失为所述第一损失时,针对每个第一风险预测结果,根据该第一风险预测结果和所述训练样本的实际风险标签之间的偏差,确定第一子损失;
16、根据所述各第一子损失,确定第一损失。
17、可选地,根据所述第一风险预测结果、所述第二风险预测结果、以及所述训练样本的实际风险标签,确定至少一种目标损失,具体包括:
18、当所述目标损失为所述第二损失时,针对每个第一风险预测结果,根据该第一风险预测结果和所述目标风险预测结果之间的偏差,确定第二子损失;
19、根据各第二子损失,确定第二损失。
20、可选地,针对所述风控模型中的每个辅助分类器,将所述特征数据输入到该辅助分类器中,得到该辅助分类器针对所述训练样本的风险预测结果,作为该辅助分类器对应的第一风险预测结果,具体包括:
21、确定所述训练样本对应的业务场景,作为目标业务场景;
22、从所述风控模型中的各辅助分类器中,确定出与所述目标业务场景相匹配的各辅助分类器,作为各第一目标分类器;
23、针对每个第一目标分类器,将所述特征数据输入到该第一目标分类器中,得到该第一目标分类器针对所述训练样本的风险预测结果,作为该第一目标分类器对应的第一风险预测结果;
24、将各第一风险预测结果输入到所述风控模型中的主分类器中,以使所述主分类器根据所述各第一风险预测结果,得到针对所述训练样本的风险预测结果,具体包括:
25、从所述风控模型中的各主分类器中,确定出与所述目标业务场景相匹配的主分类器,作为第二目标分类器;
26、将各第一目标分类器对应的第一风险预测结果输入到所述第二目标分类器中,以使所述第二目标分类器根据所述各第一目标分类器对应的第一风险预测结果,得到针对所述训练样本的风险预测结果,作为第二风险预测结果。
27、本说明书提供了一种业务风控的方法,包括:
28、获取待执行业务的业务数据;
29、将所述业务数据输入到风控模型中,以通过所述风控模型根据所述待执行业务的业务数据,得到所述待执行业务的风险预测结果,所述风控模型是通过上述模型训练方法训练得到;
30、根据所述待执行业务的风险预测结果,执行相应的任务。
31、本说明书提供了一种模型训练装置,包括:
32、获取模块,用于获取轻量模型作为待训练模型,并获取用于训练所述待训练模型的训练样本,所述待训练模型包括:风控模型,所述训练样本包括:样本业务数据;
33、特征提取模块,用于将所述训练样本输入到所述风控模型中,以通过所述风控模型中的特征提取层,得到所述训练样本的特征数据;
34、第一分类模块,用于针对所述风控模型中的每个辅助分类器,将所述特征数据输入到该辅助分类器中,得到该辅助分类器针对所述训练样本的风险预测结果,作为该辅助分类器对应的第一风险预测结果;
35、第二分类模块,用于将各第一风险预测结果输入到所述风控模型中的主分类器中,以使所述主分类器根据所述各第一风险预测结果,得到针对所述训练样本的风险预测结果,作为第二风险预测结果;
36、训练模块,用于根据所述第一风险预测结果、所述第二风险预测结果、以及所述训练样本的实际风险标签,对所述风控模型进行训练,所述风控模型用于执行业务风控。
37、可选地,所述训练模块具体用于,根据所述第一风险预测结果、所述第二风险预测结果、以及所述训练样本的实际风险标签,确定至少一种目标损失,所述目标损失包括:用于表征所述各第一风险预测结果和所述实际风险标签之间的偏差的第一损失、用于表征所述各第一风险预测结果与目标风险预测结果之间的偏差的第二损失、用于表征所述目标风险预测结果与所述第二风险预测结果之间的偏差的第三损失、用于表征所述第二风险预测结果和所述实际风险标签之间的偏差的第四损失、用于表征各第一风险预测结果之间的偏差的第五损失,所述目标风险预测结果是基于各第一风险预测结果与所述实际风险标签之间的偏差,从所述各第一风险预测结果中选取出的,各第一风险预测结果之间的偏差越小,所述第五损失越大;以最小化所述目标损失为优化目标,对所述待训练模型进行训练。
38、可选地,所述训练模块具体用于,将与所述实际风险标签之间的偏差最小的第一风险预测结果,作为选取出的目标风险预测结果。
39、可选地,所述训练模块具体用于,当所述目标损失为所述第一损失时,针对每个第一风险预测结果,根据该第一风险预测结果和所述训练样本的实际风险标签之间的偏差,确定第一子损失;根据所述各第一子损失,确定第一损失。
40、可选地,所述训练模块具体用于,当所述目标损失为所述第二损失时,针对每个第一风险预测结果,根据该第一风险预测结果和所述目标风险预测结果之间的偏差,确定第二子损失;根据各第二子损失,确定第二损失。
41、可选地,所述第一分类模块具体用于,确定所述训练样本对应的业务场景,作为目标业务场景;从所述风控模型中的各辅助分类器中,确定出与所述目标业务场景相匹配的各辅助分类器,作为各第一目标分类器;针对每个第一目标分类器,将所述特征数据输入到该第一目标分类器中,得到该第一目标分类器针对所述训练样本的风险预测结果,作为该第一目标分类器对应的第一风险预测结果;
42、所述第二分类模块具体用于,从所述风控模型中的各主分类器中,确定出与所述目标业务场景相匹配的主分类器,作为第二目标分类器;将各第一目标分类器对应的第一风险预测结果输入到所述第二目标分类器中,以使所述第二目标分类器根据所述各第一目标分类器对应的第一风险预测结果,得到针对所述训练样本的风险预测结果,作为第二风险预测结果。
43、本说明书提供了一种业务风控的装置,包括:
44、业务数据获取模块,用于获取待执行业务的业务数据;
45、风控模块,用于将所述业务数据输入到风控模型中,以通过所述风控模型根据所述待执行业务的业务数据,得到所述待执行业务的风险预测结果,所述风控模型是通过上述模型训练方法训练得到;
46、业务执行模块,用于根据所述待执行业务的风险预测结果,执行相应的任务。
47、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练、业务风控的方法。
48、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练、业务风控的方法。
49、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
50、在本说明书提供的模型训练方法,首先获取轻量模型作为待训练模型,待训练模型包括风控模型,并获取用于训练风控模型的训练样本,将训练样本输入到风控模型中,以通过风控模型中的特征提取层,得到训练样本的特征数据,针对风控模型中的每个辅助分类器,将特征数据输入到该辅助分类器中,得到该辅助分类器针对训练样本的风险预测结果,作为该辅助分类器对应的第一风险预测结果,将各第一风险预测结果输入到风控模型中的主分类器中,以使主分类器根据各第一风险预测结果,得到针对训练样本的风险预测结果,作为第二风险预测结果,根据第一风险预测结果、第二风险预测结果、以及训练样本的实际风险标签,对风控模型进行训练。
51、从上述方法中可以看出,可以通过设置在轻量模型中的各辅助分类器对主分类器进行辅助,从而使得主分类器能够集成各辅助分类器的风险预测结果,得到更加准确的风险预测结果。