本申请涉及计算机,尤其涉及一种对抗攻击图像生成方法、装置、电子设备和存储介质。
背景技术:
1、随着技术的不断发展,人脸识别模型广泛的应用于各领域。例如,对用户上传视频中的人脸进行识别,以审核该视频是否存在侵权的问题。因此,要求人脸识别模型具有很好的鲁棒性,能够对经过修改的人脸图像进行准确的识别。
2、目前,一般基于优化扰动方法,来评估神经网络模型鲁棒性的手段。但该优化扰动方法仅适用于针对通用图像分类的对抗攻击方法,评估人脸识别模型的鲁棒性的准确性不高。
技术实现思路
1、本申请实施例提供一种对抗攻击图像生成方法、装置、电子设备和存储介质,用以解决目前的对抗攻击方法评估人脸识别模型的鲁棒性的准确性不高的问题。
2、第一方面,本申请实施例提供一种对抗攻击图像生成方法,包括:获取待攻击人脸图像;对待攻击人脸图像进行扰动处理,得到初始扰动人脸图像;确定中间扰动人脸图像,包括:利用人脸识别模型对初始扰动人脸图像进行人脸识别对抗攻击,得到对抗攻击识别结果;基于预设损失函数、对抗攻击识别结果以及目标人脸识别结果确定损失值;根据损失值确定扰动参数,若根据损失值确定初始扰动人脸图像为待攻击人脸图像的对抗攻击图像,则将确定的扰动参数作为对抗扰动参数;基于扰动参数对初始扰动人脸图像进行迭代扰动处理,得到中间扰动人脸图像,中间扰动图像作为下一次对抗攻击的初始扰动人脸图像;重复执行确定中间扰动人脸图像的步骤,直至完成预设数量次对抗攻击,将预设数量次对抗攻击中得到的对抗扰动参数中的最小值确定为目标对抗扰动参数;根据目标对抗扰动参数对待攻击人脸图像进行扰动处理,
3、第二方面,本申请实施例提供一种对抗攻击图像生成装置,包括:
4、获取模块,用于获取待攻击人脸图像;
5、第一处理模块,用于对待攻击人脸图像进行扰动处理,得到初始扰动人脸图像
6、确定模块,确定中间扰动人脸图像,包括:利用人脸识别模型对初始扰动人脸图像进行人脸识别对抗攻击,得到对抗攻击识别结果;基于预设损失函数、对抗攻击识别结果以及目标人脸识别结果确定损失值;根据损失值确定扰动参数,若根据损失值确定初始扰动人脸图像为待攻击人脸图像的对抗攻击图像,则将确定的扰动参数作为对抗扰动参数;基于扰动参数对初始扰动人脸图像进行迭代扰动处理,得到中间扰动人脸图像,中间扰动图像作为下一次对抗攻击的初始扰动人脸图像;
7、执行模块,用于重复执行确定中间扰动人脸图像的步骤,直至完成预设数量次对抗攻击,将预设数量次对抗攻击中得到的对抗扰动参数中的最小值确定为目标对抗扰动参数;
8、第二处理模块,用于根据目标对抗扰动参数对待攻击人脸图像进行扰动处理,得到目标对抗攻击图像。
9、第三方面,本申请实施例提供一种电子设备,包括处理器、存储器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如第一方面中任一项的对抗攻击图像生成方法。
10、第四方面,本申请实施例提供一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,当计算机程序在电子设备上运行时,使得电子设备执行如第一方面中任一项的对抗攻击图像生成方法。
11、第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序,该计算机程序在电子设备上运行时,使得电子设备执行如第一方面中任一项的对抗攻击图像生成方法。
12、本申请实施例提供一种对抗攻击图像生成方法、装置、电子设备和存储介质,本申请实施例是针对人脸识别模型的对抗攻击,通过基于预设损失函数,确定人脸识别模型对初始扰动人脸图像进行人脸识别对抗攻击得到的对抗攻击识别结果相对目标人脸识别结果的损失值,进而通过损失值确定目标对抗扰动参数,以得到准确的目标对抗攻击图像,若目标对抗攻击图像的对象与待攻击人脸图像的对象相同,可以确定人脸识别模型的鲁棒性较差,若目标对抗攻击图像的对象与待攻击人脸图像的对象不同,可以确定人脸识别模型的鲁棒性较好,从而实现准确评估人脸识别模型的鲁棒性。
1.一种对抗攻击图像生成方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于预设损失函数、所述对抗攻击识别结果以及目标人脸识别结果确定损失值,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于预设损失函数、所述对抗攻击识别结果以及目标人脸识别结果确定损失值之前,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述损失值确定所述初始扰动人脸图像为所述待攻击人脸图像的对抗攻击图像,包括:
5.根据权利要求2所述的对抗攻击图像生成方法,其特征在于,所述基于预设损失函数、所述对抗攻击识别结果以及目标人脸识别结果确定损失值之前,所述方法还包括:
6.根据权利要求5所述的方法,其特征在于,所述根据所述损失值确定所述初始扰动人脸图像为所述待攻击人脸图像的对抗攻击图像,包括:
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述根据所述损失值确定扰动参数,包括:
8.一种对抗攻击图像生成装置,其特征在于,包括:
9.一种电子设备,包括处理器、存储器及存储在所述存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述的对抗攻击图像生成方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,当所述计算机程序在电子设备上运行时,使得电子设备执行如权利要求1至7中任一项所述的对抗攻击图像生成方法。