本说明书涉及计算机,尤其涉及一种模型训练方法、装置、设备及可读存储介质。
背景技术:
1、随着人工智能技术的发展,和人们对隐私数据关注度的提高,机器学习模型到了广泛的应用,如人脸识别模型、语音识别模型、自然语言处理模型等。同时,机器学习模型本身需要面对各种类型的安全性问题,如数据投毒和后门攻击。攻击者通过向模型的训练数据集中注入恶意样本以破坏学习过程,导致训练完成的机器学习模型针对攻击者预先设置的干净样本得到错误的预测结果,从而降低模型的性能。
2、基于此,本说明书提供了一种模型训练方法。
技术实现思路
1、本说明书提供一种模型训练方法、装置、设备及可读存储介质,以部分的解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供了一种模型训练方法,包括:
4、获取预先通过中毒样本训练得到的源模型;
5、获取待训练的变换网络,根据所述变换网络和所述源模型确定待训练的目标模型;
6、获取干净样本和所述干净样本的标签;
7、将所述干净样本输入所述目标模型,得到所述目标模型输出的所述干净样本的预测结果;
8、以所述干净样本的预测结果和所述干净样本的标签之间的差异的最小化为优化目标,调整所述变换网络的参数,得到训练完成的目标模型;
9、当接收到预测请求时,将所述预测请求对应的待预测数据输入训练完成的目标模型,得到所述目标模型输出的所述待预测数据的预测结果。
10、本说明书提供了一种模型训练装置,包括:
11、源模型获取模块,用于获取预先通过中毒样本训练得到的源模型;
12、目标模型确定模块,用于获取待训练的变换网络,根据所述变换网络和所述源模型确定待训练的目标模型;
13、干净样本获取模块,用于获取干净样本和所述干净样本的标签;
14、输入模块,用于将所述干净样本输入所述目标模型,得到所述目标模型输出的所述干净样本的预测结果;
15、第一训练模块,用于以所述干净样本的预测结果和所述干净样本的标签之间的差异的最小化为优化目标,调整所述变换网络的参数,得到训练完成的目标模型;
16、预测模块,用于当接收到预测请求时,将所述预测请求对应的待预测数据输入训练完成的目标模型,得到所述目标模型输出的所述待预测数据的预测结果。
17、本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练方法。
18、本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练方法。
19、本说明书采用的上述至少一个技术方案能够达到以下有益效果:
20、本说明书提供的模型训练方法中,根据待训练的变换网络以及通过中毒样本训练得到的源模型确定待训练的目标模型,将获取到的干净样本输入目标模型,得到目标模型输出的预测结果,根据预测结果和干净样本的标签,调整变换网络的参数,得到训练完成的目标模型,以便在接收到预测请求时,将待预测数据输入训练完成的目标模型,得到待预测数据的预测结果。可见,基于变换网络对源模型进行重构的方式,在不调整源模型的模型参数的前提下,通过变换网络对受到中毒样本攻击的源模型的输入和/或输出进行变换,以避免源模型针对攻击者预设的样本得到错误的预测结果,从而在保证模型性能的同时实现较高的防御效果。
1.一种模型训练方法,所述方法包括:
2.如权利要求1所述的方法,所述变换网络包括第一变换网络;
3.如权利要求1所述的方法,所述变换网络包括第二变换网络;
4.如权利要求1所述的方法,所述变换网络包括第一变换网络和第二变换网络;
5.如权利要求4所述的方法,所述方法还包括:
6.如权利要求1所述的方法,所述源模型为黑盒模型;
7.如权利要求1所述的方法,所述目标模型执行的数据处理任务与所述源模型执行的数据处理任务不同。
8.一种模型训练装置,所述装置包括:
9.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~7任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述权利要求1~7任一项所述的方法。