一种生成图像检测方法、装置、电子设备和存储介质

文档序号：37796233发布日期：2024-04-30 17:06阅读：7来源：国知局

本技术涉及人工智能，具体而言，涉及一种生成图像检测方法、装置、电子设备和存储介质。

背景技术：

1、随着人工智能内容生成(artificial intelligence generated content，aigc)技术的快速发展，人工智能生成图像的质量得到了快速提高，从人眼观感的角度来看部分图像生成算法生成的图像质量正在逼近真实图像。在这些人工智能生成图像为人们的日常生活带来便利与乐趣的同时，社会也面临着虚假信息传播、隐私泄漏、版权侵犯等风险问题。

2、相关技术通过预训练的扩散生成模型对人工智能生成图像进行检测，确定其是否属于伪造图像。但是该方法在面对训练集不可见的跨生成器和跨场景检测时检测精度会发生程度不一的下降，甚至出现完全无法检测的情况。

3、因此，如何在跨生成器和跨场景的情景下提高生成图像检测的准确率成为业界亟待解决的技术问题。

技术实现思路

1、本技术提供一种生成图像检测方法、装置、电子设备和存储介质，用于解决如何在跨生成器和跨场景的情景下提高生成图像检测的准确率的技术问题。

2、本技术提供一种生成图像检测方法，包括：

3、获取待检测图像；

4、将所述待检测图像输入生成图像检测模型，得到所述生成图像检测模型输出的所述待检测图像的生成图像检测结果；

5、其中，所述生成图像检测模型包括频率分支网络、空间分支网络和分类检测网络；

6、所述频率分支网络用于确定所述待检测图像的频谱图对应的可疑频带，对所述可疑频带对应的频谱图进行频谱成分拆分和组合，得到所述待检测图像的第一伪造相关特征；

7、所述空间分支网络用于对所述待检测图像的空间特征进行正交分解，得到所述待检测图像的第二伪造相关特征；

8、所述分类检测网络用于基于所述第一伪造相关特征和所述第二伪造相关特征对所述待检测图像进行分类预测，得到所述生成图像检测结果。

9、在一些实施例中，所述频率分支网络用于：

10、对所述待检测图像进行频域变换，得到所述待检测图像的频谱图；

11、对所述待检测图像的频谱图进行可疑频带提议，得到所述待检测图像的频谱图对应的可疑频带；

12、基于所述可疑频带在所述待检测图像的频谱图中的起始频率和终止频率，确定所述可疑频带对应的频谱掩膜；

13、基于所述可疑频带对应的频谱掩膜，对所述待检测图像的频谱图进行频谱成分拆分和组合，得到所述待检测图像对应的伪造特征相关图像；

14、基于所述伪造特征相关图像，确定所述待检测图像的第一伪造相关特征。

15、在一些实施例中，所述对所述待检测图像的频谱图进行可疑频带提议，得到所述待检测图像的频谱图对应的可疑频带，包括：

16、将所述待检测图像的频谱图输入频带提议网络，得到所述频带提议网络输出的多个可疑频带；

17、将所述待检测图像的频谱图输入频带提议网络，得到所述频带提议网络在给定频带先验位置处输出的多个可疑频带，输出结果包括各个可疑频带的起始频率与终止频率；

18、其中，所述频带先验位置是基于频谱图的频率等分点确定的。

19、在一些实施例中，所述基于所述可疑频带对应的频谱掩膜，对所述待检测图像的频谱图进行频谱成分拆分和组合，得到所述待检测图像对应的伪造特征相关图像，包括：

20、基于所述可疑频带对应的频谱掩膜，对所述待检测图像的频谱图进行频谱成分拆分，得到所述待检测图像的频谱图对应的伪造特征相关频谱；所述伪造特征相关频谱包括伪造特征相关幅度谱和伪造特征相关相位谱；

21、对所述伪造特征相关幅度谱和所述伪造特征相关相位谱进行组合，确定所述待检测图像对应的伪造特征相关图像。

22、在一些实施例中，所述空间分支网络用于：

23、对所述待检测图像的空间特征提取，得到所述待检测图像的空间特征；

24、基于第一向量基底和第二向量基底对所述空间特征进行正交分解，得到所述待检测图像的第二伪造相关特征；

25、其中，所述第一向量基底中的基向量与所述第二向量基底中的基向量相互垂直；所述第一向量基底中的基向量用于对所述待检测图像中的伪造相关特征进行表示；所述第二向量基底中的基向量用于对所述待检测图像中的伪造无关特征进行表示。

26、在一些实施例中，所述生成图像检测模型的损失函数包括第一损失函数和第二损失函数；

27、所述第一损失函数是基于交叉熵分类损失函数、频带有效性损失函数、向量基底正交性损失函数、特征对齐损失函数和互信息上界最小化损失函数确定的；

28、所述第二损失函数是基于互信息上界估计器的损失函数确定的；

29、其中，所述互信息上界最小化损失函数是基于所述互信息上界估计器确定的。

30、在一些实施例中，所述生成图像检测模型是基于如下步骤训练得到的：

31、基于训练样本集对初始模型进行训练，确定当前次迭代训练过程中第一损失函数的函数值；

32、在所述第一损失函数的函数值不满足预设收敛条件的情况下，基于所述第一损失函数的梯度反方向对所述初始模型的参数进行调整；

33、确定所述当前次迭代训练过程中第二损失函数的函数值；

34、基于所述第二损失函数的梯度反方向对所述第一损失函数中互信息上界估计器的参数进行调整；

35、基于所述训练样本集对参数调整后的初始模型进行下一次迭代训练，直至所述第一损失函数的函数值满足预设收敛条件。

36、本技术提供一种生成图像检测装置，包括：

37、获取单元，用于获取待检测图像；

38、检测单元，用于将所述待检测图像输入生成图像检测模型，得到所述生成图像检测模型输出的所述待检测图像的生成图像检测结果；

39、其中，所述生成图像检测模型包括频率分支网络、空间分支网络和分类检测网络；

40、所述频率分支网络用于确定所述待检测图像的频谱图对应的可疑频带，对所述可疑频带对应的频谱图进行频谱成分拆分和组合，得到所述待检测图像的第一伪造相关特征；

41、所述空间分支网络用于对所述待检测图像的空间特征进行正交分解，得到所述待检测图像的第二伪造相关特征；

42、所述分类检测网络用于基于所述第一伪造相关特征和所述第二伪造相关特征对所述待检测图像进行分类预测，得到所述生成图像检测结果。

43、本技术提供一种电子设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述的生成图像检测方法。

44、本技术提供一种非暂态计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现所述的生成图像检测方法。

45、本技术提供的生成图像检测方法、装置、电子设备和存储介质具有以下有益效果：

46、(1)提出了可疑频带的提议与分离和分析方法，灵活应对频谱中丰富多样的伪造特征。与从图像的频谱中直接提取伪造特征的现有技术方案相比，该方法能够将包含可疑伪造线索的频带一并分析与对比，在特征提取后的融合阶段再进行决策，有效缓解了算法过拟合到特定伪造模式的风险；与通过学习划分点对频谱进行划分再在固定频率范围内提取特征的现有技术方案相比，本方法没有将可疑伪造线索的查找局限在某一频率范围内，而是设定在了全部频率范围上，并且能够根据不同的伪造线索自适应地缩小频率范围，有效增强了算法应对全频带范围上未知伪造特征的能力；

47、(2)提出了可学习的空间特征正交分解方法，灵活应对图像中丰富多样的内容信息。不同图像包含不同的内容信息，现有直接从图像中提取伪造特征的相关方法极易造成伪造特征耦合了与其无关的图像内容特征，造成网络跨域检测能力的下降。本方法采取了先整体提取特征然后再做可学习的特征分解的方案，能够在频域分支特征与互信息监督学习策略的帮助下寻找最优的伪造特征分解方式，从而将伪造特征与其他特征相分离，提高网络对图像内容的鲁棒性；

48、(3)提出了基于互信息的伪造特征纯化训练策略，灵活应对从图像及其频谱中分离得到的质量不一的伪造特征。由于伪造特征与图像内容的高度耦合，从空间域与频率域分离得到的伪造特征仍包含有与伪造特征无关的信息，而与伪造特征无关的特征中仍包含少量与伪造特征相关的信息。为此，在训练过程中，从信息论的角度监督算法将伪造线索信息与其他无关信息相分离，实现伪造特征的进一步纯化，进一步提升了算法的检测能力，而现有技术还没有引入类似的技术方案。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：董晶,王伟,彭勃,王建文,孟哲令
技术所有人：中国科学院自动化研究所
我是此专利的发明人

上一篇：方便放置产品说明书的包装袋的制作方法
上一篇：一种悬挂式四害消杀的诱捕装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。