一种模型训练的方法、装置、存储介质及电子设备与流程

文档序号:35293272发布日期:2023-09-01 15:44阅读:21来源:国知局
一种模型训练的方法、装置、存储介质及电子设备与流程

本说明书涉及计算机,尤其涉及一种模型训练的方法、装置、存储介质及电子设备。


背景技术:

1、当前,由于深度学习模型在诸如图像识别、风险预测、自然语言处理、隐私数据保护等发挥着极大的作用,已成为主要探索的方向之一。

2、但是,在样本分布不均的情况下,深度学习模型的预测可能会出现偏差。例如,在对商户进行风险预测的场景中,通常情况下小型商户由于规模较小,所以相应的历史业务记录也会较少,而大型商户由于规模较大,所以相应的历史业务记录也会较多,因此,通过各商户的历史业务记录对深度学习模型进行训练,将导致深度学习模型学习出更多适用于对大型商户进行风险预测的知识,如利用业务的交易额来判断商户的交易是否存在风险。然而在实际应用中,小型商户的交易额往往较小,大型商户的交易额往往较大,这就导致当小型商户出现了大额交易时,即使是正常的交易也可能被深度学习模型误识别为是存在风险的交易。

3、从而,如何提高深度学习模型的准确率,则是一个亟待解决的问题。


技术实现思路

1、本说明书提供一种模型训练的方法、装置、存储介质及电子设备,以提高深度学习模型的准确率,保证数据安全。

2、本说明书采用下述技术方案:

3、本说明书提供一种模型训练的方法,包括:

4、获取业务数据以及所述业务数据所对应的标注信息,所述业务数据中包括若干维度的数据;

5、从所述业务数据中确定出预设维度下的数据,所述业务数据中在所述预设维度下的数据为与预设的预测模型执行所述业务数据对应任务的任务目标存在直接关联的数据;

6、将所述业务数据输入到所述预测模型中,以使所述预测模型输出针对所述业务数据的预测结果,作为第一预测结果,以及将所述业务数据中在所述预设维度下的数据输入到所述预测模型中,以使所述预测模型基于所述业务数据中在所述预设维度下的数据得到第二预测结果;

7、以最小化所述第一预测结果与所述标注信息之间的偏差,以及维持所述第一预测结果与所述第二预测结果之间的偏差位于预设偏差范围内为优化条件,对所述预测模型进行训练。

8、可选地,将所述业务数据中预设维度的特征数据输入到所述预测模型中,以使所述预测模型基于所述预设维度的特征数据得到第二预测结果,具体包括:

9、确定出所述业务数据中除预设维度之前其他维度下的数据,并将所述其他维度下的数据替换为预设数据,得到替换后的业务数据;

10、将所述替换后的业务数据输入到所述预测模型中,以使所述预测模型基于所述预设维度的特征数据和所述预设数据确定出第二预测结果。

11、可选地,以最小化所述第一预测结果与所述标注信息之间的偏差,以及维持所述第一预测结果与所述第二预测结果之间的偏差位于预设偏差范围内为优化条件,对所述预测模型进行训练,具体包括:

12、确定所述第一预测结果与所述第二预测结果之间的差值,以及确定预设的偏差调整参数与所述差值之间的偏差;

13、以最小化所述第一预测结果与所述标注信息之间的差异,以及最小化所述偏差调整参数与所述差值之间的偏差为优化条件,对所述预测模型进行训练,所述偏差调整参数位于所述预设偏差范围内。

14、可选地,从所述业务数据中确定出预设维度下的数据之前,还包括:

15、针对所述若干维度中的每个维度,确定该维度与所述预测模型执行所述业务数据对应任务的任务目标之间的相关度,作为该维度对应的相关度;

16、根据各维度对应的相关度,从所述若干维度中确定出预设维度。

17、本说明书提供一种模型训练的装置,包括:

18、获取模块,用于获取业务数据以及所述业务数据所对应的标注信息,所述业务数据中包括若干维度的数据;

19、确定模块,用于从所述业务数据中确定出预设维度下的数据,所述业务数据中在所述预设维度下的数据为与预设的预测模型执行所述业务数据对应任务的任务目标存在直接关联的数据;

20、输入模块,用于将所述业务数据输入到所述预测模型中,以使所述预测模型输出针对所述业务数据的预测结果,作为第一预测结果,以及将所述业务数据中在所述预设维度下的数据输入到所述预测模型中,以使所述预测模型基于所述业务数据中在所述预设维度下的数据得到第二预测结果;

21、训练模块,用于以最小化所述第一预测结果与所述标注信息之间的偏差,以及维持所述第一预测结果与所述第二预测结果之间的偏差位于预设偏差范围内为优化条件,对所述预测模型进行训练。

22、可选地,所述输入模块用于,确定出所述业务数据中除预设维度之前其他维度下的数据,并将所述其他维度下的数据替换为预设数据,得到替换后的业务数据;将所述替换后的业务数据输入到所述预测模型中,以使所述预测模型基于所述预设维度的特征数据和所述预设数据确定出第二预测结果。

23、可选地,所述训练模块用于,确定所述第一预测结果与所述第二预测结果之间的差值,以及确定预设的偏差调整参数与所述差值之间的偏差;以最小化所述第一预测结果与所述标注信息之间的差异,以及最小化所述偏差调整参数与所述差值之间的偏差为优化条件,对所述预测模型进行训练,所述偏差调整参数位于所述预设偏差范围内。

24、可选地,所述确定模块用于,针对所述若干维度中的每个维度,确定该维度与所述预测模型执行所述业务数据对应任务的任务目标之间的相关度,作为该维度对应的相关度;根据各维度对应的相关度,从所述若干维度中确定出预设维度。

25、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训的方法。

26、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练的方法。

27、本说明书采用的上述至少一个技术方案能够达到以下有益效果:

28、在本说明书中提供的模型训练的方法中,可以获取业务数据以及该业务数据所对应的标注信息,该业务数据中包括若干维度的数据;从该业务数据中确定出预设维度下的数据,该业务数据中在该预设维度下的数据为与预设的预测模型执行该业务数据对应任务的任务目标存在直接关联的数据,而后,将该业务数据输入到预测模型中,以使预测模型输出针对该业务数据的预测结果,作为第一预测结果,以及将该业务数据中在该预设维度下的数据输入到该预测模型中,以使该预测模型基于该业务数据中在该预设维度下的数据得到第二预测结果,最后,以最小化该第一预测结果与标注信息之间的偏差,以及维持第一预测结果与第二预测结果之间的偏差位于预设偏差范围内为优化条件,对该预测模型进行训练。

29、从上述内容中可以看出,本说明书中提供的模型训练的方法,在模型训练中,可以通过与模型预测的任务存在直接关联的维度下的数据,来得到第二预测结果,并使得通过训练样本全部维度下的数据确定出的第一预测结果和第二预测结果之间存在一定差异,从而在一定程度上抵消与模型预测的任务存在直接关联的维度下的数据对模型预测出的结果的影响,在一定程度上提高了模型预测的准确率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1