一种静默图像翻拍检测模型的训练方法、装置及相关设备与流程

文档序号:34489882发布日期:2023-06-17 21:29阅读:37来源:国知局
一种静默图像翻拍检测模型的训练方法、装置及相关设备与流程

本发明涉及计算机,尤其涉及一种静默图像翻拍检测模型的训练方法、装置及相关设备。


背景技术:

1、随着科学技术的迅速发展,现有的静默图像翻拍检测可以在没有眨眼、张嘴等一些列中的动作配合下判断给定的图片中出现的人脸是真人还是翻拍的照片,简言之,静默图像翻拍检测可以在用户无感的情况下直接进行图像翻拍校验,具有良好的用户体验。

2、然而,现有的静默图像翻拍检测技术中,单一rgb通道图像信息在模型训练过程中,存在高频和深度信息丢失的问题,从而导致模型预测精度较低,降低用户体验。因此,如何弥补单一rgb通道图像信息在模型训练过程中高频和深度信息的丢失已经成为了亟待解决的技术问题之一。


技术实现思路

1、本技术实施例提供一种静默图像翻拍检测模型的训练方法、装置及相关设备,终端设备可以通过弥补单一rgb通道图像信息在模型训练过程中深度信息和高频信息的丢失,提高静默图像翻拍检测模型的预测效果(或者说预测精度),提升用户体验。

2、第一方面,本发明实施例提供了一种静默图像翻拍检测模型的训练方法。该方法包括:将样本人脸图像输入至预训练网络模型。通过所述预训练网络模型来根据所述样本人脸图像获取所述样本人脸图像的预测深度图和预测傅里叶频谱图。获取所述样本人脸图像的伪深度图和真实傅里叶频谱图。根据所述预训练网络模型的第一损失函数对所述预测深度图和所述伪深度图进行处理得到第一损失值。根据所述第一损失函数对所述预测傅里叶频谱图和所述真实傅里叶频谱图进行处理得到第二损失值。获取所述预训练网络模型的第二损失函数对应的第三损失值。通过所述第一损失值、所述第二损失值和所述第三损失值对所述预训练网络模型进行训练以得到所述静默图像翻拍检测模型。

3、在本技术实施例中,终端设备可以通过损失函数来根据样本人脸图像的预测深度图和伪深度图以及预测傅里叶频谱图和真实傅里叶频谱图进行处理得到对应的损失值,从而使得预训练网络模型根据损失值可以学习到丢失的深度信息和高频信息,以得到静默图像翻拍检测模型。采用上述方法,终端设备解决了单一rgb通道图像信息在预训练网络模型学习过程中深度信息和高频信息丢失的问题,从而提高了静默图像翻拍检测模型的预测效果(或者说预测精度),提升了用户体验。

4、结合第一方面,在一种可行的实现方式中,所述根据所述预训练网络模型的第一损失函数对所述预测深度图和所述位深度图进行处理得到第一损失值,包括:对所述预测深度图和所述伪深度图中的任一对应像素点进行以下损失值确定操作:获取所述任一对应像素点在所述预测深度图中的第一预测像素值。获取所述任一对应像素点在所述伪深度图中的第一真实像素值。将所述第一预测像素值和所述第一真实像素值代入所述预训练网络模型的第一损失函数以得到所述任一对应像素点的损失值。根据对所述预测深度图和所述伪深度图中的每一个对应像素点执行所述损失值确定操作的结果确定所述预测深度图和所述伪深度图的第一损失值。

5、结合第一方面,在一种可行的实现方式中,所述根据所述第一损失函数对所述预测傅里叶频谱图和所述真实傅里叶频谱图进行处理以得到第二损失值,包括:对所述预测傅里叶频谱图和所述真实傅里叶频谱图中的任一对应像素点进行以下损失值确定操作:获取所述任一对应像素点在所述预测傅里叶频谱图中的第二预测像素值。获取所述任一对应像素点在所述真实傅里叶频谱图中的第二真实像素值。将所述第二预测像素值和所述第二真实像素值代入所述第一损失函数以得到所述任一对应像素点的损失值。根据对所述预测傅里叶频谱图和所述真实傅里叶频谱图中的每一个对应像素点执行所述损失值确定操作的结果确定所述预测傅里叶频谱图和所述真实傅里叶频谱图的第二损失值。

6、结合第一方面,在一种可行的实现方式中,所述预训练网络模型的第一损失函数满足以下公式:

7、loss(xi,yi)=(xi-yi)2

8、其中,xi为对应像素点的真实像素值,yi为对应像素点的预测像素值。

9、结合第一方面,在一种可行的实现方式中,所述获取所述样本人脸图像的伪深度图,包括:通过预设算法预测所述样本人脸图像中每一个像素点对应的像素值。根据所述样本人脸图像中每一像素点对应的像素值获取所述样本人脸图像的伪深度图。

10、结合第一方面,在一种可行的实现方式中,所述获取所述样本人脸图像的真实傅里叶频谱图,包括:对所述样本人脸图像做傅里叶变换得到所述样本人脸图像的真实傅里叶频谱图。

11、结合第一方面,在一种可行的实现方式中农,所述获取所述预训练网络模型中第二损失函数对应的第三损失值,包括:获取所述样本人脸图像的翻拍概率和非翻拍概率。根据所述翻拍概率和所述非翻拍概率确定所述预训练网络模型中第二损失函数对应的第三损失值。

12、结合第一方面,在一种可行的实现方式中,所述方法还包括:将待检测人脸图像输入至所述静默图像翻拍检测模型。根据所述静默图像翻拍检测模型的输出结果确定所述待检测人脸图像是否为翻拍图像。

13、第二方面,本发明实施例提供了一种静默图像翻拍检测模型的训练装置。该装置包括:输入单元,用于将样本人脸图像输入至预训练网络模型。获取单元,用于通过所述预训练网络模型来根据所述样本人脸图像获取所述样本人脸图像的预测深度图和预测傅里叶频谱图。所述获取单元,用于获取所述样本人脸图像的伪深度图和真实傅里叶频谱图。处理单元,用于根据所述预训练网络模型的第一损失函数对所述预测深度图和所述伪深度图进行处理得到第一损失值。所述处理单元,用于根据所述第一损失函数对所述预测傅里叶频谱图和所述真实傅里叶频谱图进行处理得到第二损失值。所述获取单元,用于获取所述预训练网络模型的第二损失函数对应的第三损失值。所述处理单元,用于通过所述第一损失值、所述第二损失值和所述第三损失值对所述预训练网络模型进行训练以得到所述静默图像翻拍检测模型。

14、结合第二方面,在一种可行的实现方式中,所述装置还包括确定单元。所述处理单元,用于对所述预测深度图和所述伪深度图中的任一对应像素点进行以下损失值确定操作,具体操作内容:所述获取单元,用于获取所述任一对应像素点在所述预测深度图中的第一预测像素值。所述获取单元,用于获取所述任一对应像素点在所述伪深度图中的第一真实像素值。所述处理单元,用于将所述第一预测像素值和所述第一真实像素值代入所述预训练网络模型的第一损失函数以得到所述任一对应像素点的损失值。确定单元,用于根据对所述预测深度图和所述伪深度图中的每一个对应像素点执行所述损失值确定操作的结果确定所述预测深度图和所述位深度图的第一损失值。

15、结合第二方面,在一种可行的实现方式中,所述处理单元,用于对所述预测傅里叶频谱图和所述真实傅里叶频谱图中任一对应像素点进行以下损失值确定操作。所述获取单元,用于获取所述任一对应像素点在所述预测傅里叶频谱图中的第二预测像素值。所述获取单元,用于获取所述任一对应像素点在所述真实傅里叶频谱图中的第二真实像素值。所述处理单元,用于将所述第二预测像素值和所述第二真实像素值代入所述第一损失函数以得到所述任一对应像素点的损失值。所述确定单元,用于根据对所述预测傅里叶频谱图和所述真实傅里叶频谱图中的每一个对应像素点执行所述损失值确定操作的结果确定所述预测傅里叶频谱图和所述真实傅里叶频谱图的第二损失值。

16、结合第二方面,在一种可行的实现方式中,所述预训练网络模型的第一损失函数满足以下公式:

17、loss(xi,yi)=(xi-yi)2

18、其中,xi为对应像素点的真实像素值,yi为对应像素点的预测像素值。

19、结合第二方面,在一种可行的实现方式中,所述处理单元,用于通过预设算法预测所述样本人脸图像中每一个像素点对应的像素值。所述获取单元,用于根据所述样本人脸图像中每一个像素点对应的像素值获取所述样本人脸图像的伪深度图。

20、结合第二方面,在一种可行的实现方式中,所述处理单元,用于对所述人脸图像做傅里叶变换得到所述人脸图像的真实傅里叶频谱图。

21、结合第二方面,在一种可行的实现方式中,所述获取单元,用于获取所述样本人脸图像的翻拍概率和非翻拍概率。所述确定单元,用于根据所述翻拍概率和所述非翻拍概率确定所述预训练网络模型中第二损失函数对应的第三损失值。

22、结合第二方面,在一种可行的实现方式中,所述输入单元,用于将待检测人脸图像输入至所述静默图像翻拍检测模型。所述确定单元,用于根据所述静默图像翻拍检测模型的输出结果确定所述待检测人脸图像是否为翻拍图像。

23、第三方面,本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质用于存储计算机程序,当该计算机程序在计算机上运行时,使得计算机执行上述第一方面中任意一种可能的实现方式所提供的静默图像翻拍检测模型的训练方法,也能实现第一方面提供的静默图像翻拍检测模型的训练方法所具备的有益效果。

24、第四方面,本技术实施例提供了一种电子设备,该电子设备可包括处理器和存储器,上述处理器和存储器相互连接。其中,上述存储器用于存储计算机程序,上述处理器被配置用于执行上述计算机程序以实现上述第一方面提供的静默图像翻拍检测模型的训练方法,也能实现上述第一方面提供的静默图像翻拍检测模型的训练方法所具备的有益效果。

25、通过实施本发明实施例,终端设备可以根据对样本人脸图像的预测深度图和伪深度图以及预测傅里叶频谱图和真实傅里叶频谱图进行处理得到对应损失值,从而使得预训练网络模型根据损失值可以学习到丢失的深度信息和高频信息,以得到静默图像翻拍检测模型。通过上述方法,终端设备通过计算伪深度图和傅里叶频谱图的对应的损失值来弥补单一rgn通道图像信息在预训练网络模型学习过程中深度信息和高频信息的丢失,从而提高了静默图像翻拍检测模型的预测效果(或者说预测精度),提升了用户体验。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1