一种深度网络生成人脸图像的检测方法及系统与流程

文档序号：15559332发布日期：2018-09-29 01:52阅读：141来源：国知局

本发明涉及多媒体信息安全与取证领域，具体地，涉及一种深度网络生成人脸图像的检测方法及系统。
背景技术：
：随着科学技术的快速发展，数字图像在社会生产生活的各个方面得到了非常广泛的应用，成为了记录客观事实的重要载体。与此同时，功能强大的多媒体处理软件得以普及。借助专业的图像编辑软件，如adobephotoshop、gimp、acdsee等，普通用户也能轻易地对图像数据进行编辑和修改且不留下明显的视觉痕迹，从而掩盖甚至歪曲事实的真相。更有甚者，如今通过深度网络对大量的真实图像进行学习，可以训练得到图像生成模型。这类图像生成模型可以用来生成海量逼真的虚假场景图像，如人脸。这些虚假的图像一旦被用于新闻报道、身份验证、司法取证等敏感领域，将严重妨害社会的正常秩序。因此，认证图像真伪成为一个亟待解决的实际问题。一般地，数字图像的认证技术可分为主动认证和被动认证两大类。主动认证包括数字签名、数字水印等方法，这类技术需要在数字图像生成时或在其传播前添加额外的认证信息，如嵌入签名或水印，然后通过鉴定嵌入信息有无变化来判断图像是否真实或完整。然而，在现实中数字图像的来源各异，往往难以对它们预先嵌入信息，这大大限制了主动认证技术的应用。与主动认证技术相比，被动认证技术并不需要在图像中预嵌入信息，而仅依赖图像本身的数据进行认证，因而更加实用。被动认证的基本依据是：数码相机的硬件特性以及在图像拍摄过程中的各种信号处理手段都会在图像数据中留下固有的属性，而对图像进行修改则会破坏这些固有属性或者引入新的痕迹。通过提取相关的特征，可以鉴定图像的来源及判断它们是否经过修改。传统的图像篡改手段包括拼接，区域复制移位，图像增强等等。这些篡改手段的共性是它们均在已有的真实图像上进行编辑和修改。与传统的篡改手段相比，通过深度网络构建的图像生成模型可以达到“无中生有”的篡改效果。通过选择合适的参数，篡改者可利用训练好的深度网络生成特定的场景，如符合某种形状、姿态及年龄阶段特征的人脸图像。现有的技术表明，这类生成图像在某些时候可做到栩栩如生，能够欺瞒人眼。不法分子通过深度网络生成的虚假照片来牟取利益，这样会带来诸多安全方面的隐患。因此，现有针对生成图像的检测技术还有待于改进和发展。技术实现要素：本发明针对深度网络生成的人脸图像发明了一种有效的检测方法，能够准确地判断一张给定的人脸图像是真实图像还是由深度网络生成的虚假图像，提高了安全性。本发明解决技术问题所采用的技术方案如下：一种深度网络生成人脸图像的检测方法，包括以下步骤：a、构造由真实人脸图像和生成人脸图像组成的训练样本集；b、基于颜色关系对所述训练样本集进行建模，并提取统计特征；c、对所述统计特征进行训练，以得到分类模型；d、基于所述分类模型对待测图像进行检测，并输出检测识别结果。所述的深度网络生成人脸图像的检测方法，其中，所述a步骤具体包括：a1、通过成像设备获得真实人脸图像；a2、通过随机噪声向量通过训练好的深度网络得到生成人脸图像；a3、将真实人脸图像视为负样本，将生成人脸图像视为正样本，构成训练样本集。所述的深度网络生成人脸图像的检测方法，其中，所述b步骤具体包括：b1、提取所述训练样本集中的每个样本的颜色通道中相邻像素值的大小关系；b2、通过共生矩阵描述训练样本集中每个样本的颜色和纹理信息；b3、得到每一副图像的特征。所述的深度网络生成人脸图像的检测方法，其中，所述b1具体为：记输入图像为i，其r、g、b三个颜色通道分别为ir，ig和ib，则按下式计算每个颜色通道中相邻像素取值的大小关系：rc，i，j(x，y)＝φ{ic(x，y)＞ic(x+i，x+j)}；其中，c∈{r，g，b}，(i，j)∈{(0，1)，(0，-1)，(1，0)，(-1，0)}，当且仅当括号中的逻辑表达式为真时φ{·}＝1，将r、g、b三个通道的大小关系视为一个三元组，也即：ri，j(x，y)＝(rr，i，j(x，y)，rg，i，j(x，y)，rb，i，j(x，y))ri，j(x，y)中每个分量的取值均为0或1，进行如下等价变换：所述的深度网络生成人脸图像的检测方法，其中，所述b2具体包括：使用共生矩阵来对r′i，j建模，计算方法如下(以水平方向的k阶共生矩阵为例)：其中，(v1，v2，...，vk)是共生矩阵下标的索引，n是归一化因子，当且仅当括号中的逻辑表达式为真时φ{·}＝1，否则φ{·}＝0。所述的深度网络生成人脸图像的检测方法，其中，所述c步骤具体包括：利用监督学习的方法训练一个以线性判别分析器为基分类器的集成分类器作为二分类模型。所述的深度网络生成人脸图像的检测方法，其中，所述d步骤具体包括：通过分类模型对待测图像进行预测，若分类模型预测待测图像为生成人脸图像，则判断该图像为生成的人脸图像；否则，则为真实人脸图像。一种深度网络生成人脸图像的检测系统，其中，所述深度网络生成人脸图像的检测系统包括：样本构造模块，用于构造由真实人脸图像和生成人脸图像组成的训练样本集；特征提取模块，用于基于颜色关系对所述训练样本集进行建模，并提取统计特征；特征训练模块，用于对所述统计特征进行训练，以得到分类模型；图像检测模块，用于基于所述分类模型对待测图像进行检测，并输出检测识别结果。其中，所述特征提取模块包括：像素关系模块以及统计描述模块。像素关系模块用于提取所述训练样本集中的每个样本的颜色通道中相邻像素值的大小关系。具体通过以下过程计算：记输入图像为i，其r、g、b三个颜色通道分别为ir，ig和ib，则按下式计算每个颜色通道中相邻像素取值的大小关系：rc，i，j(x，y)＝φ{ic(x，y)＞ic(x+i，x+j)}；当且仅当括号中的逻辑表达式为真时φ{·}＝1，将r、g、b三个通道的大小关系视为一个三元组，也即：ri，j(x，y)＝(rr，i，j(x，y)，rg，i，j(x，y)，rb，i，j(x，y))ri，j(x，y)中每个分量的取值均为0或1，进行如下等价变换：统计描述模块用于描述训练样本集中每个样本的颜色和纹理信息。具体的，使用共生矩阵来对r′i，j建模，计算方法如下：其中，(v1，v2，...，vk)是共生矩阵下标的索引，n是归一化因子，当且仅当括号中的逻辑表达式为真时φ{·}＝1，否则φ{·}＝0。本发明公开了一种深度网络生成人脸图像的检测方法及系统，构造由真实人脸图像和生成人脸图像组成的训练样本集；基于颜色关系对所述训练样本集进行建模，并提取统计特征；对所述统计特征进行训练，以得到分类模型；基于所述分类模型对待测图像进行预测。根据深度网络生成人脸图像在统计特性上与真实图像的不一致，设计了一组基于相邻像素颜色关系的共生矩阵特征，对不同类型深度网络生成的不同尺寸的人脸图像均具有非常高的检测准确率，能够有效地判断给定的人脸图像是否为通过深度网络生成的虚假图像，提高了安全性。附图说明图1是本发明检测人脸图像的实施例的流程图。图2是本发明生成人脸图像的示意图。图3(a)与图3(b)是本发明对图像相邻像素计算颜色关系的过程图。图4是本发明图像通过像素颜色关系统计共生矩阵的示意图。图5(a)与图5(b)是真实人脸图像和生成人脸图像的特征比较示意图。具体实施方式为使本发明的目的、技术方案及优点更加清楚、明确，以下参照附图并举实施例对本发明进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。请参见图1，图1是本发明一种深度网络生成人脸图像的检测方法较佳实施例的流程图。所述深度网络生成人脸图像的检测方法包括：步骤s10、构造由真实人脸图像和生成人脸图像组成的训练样本集。具体地，首先利用真实人脸图像训练深度网络作为人脸图像生成器，将随机噪声向量输入训练好的深度网络，得到生成人脸图像，如图2所示。所述训练好的深度网络的类型包括但不限于变分自编码器、生成对抗网络。将真实人脸图像视为负样本，将生成人脸图像视为正样本，构成训练集合，所述真实人脸图像通过成像设备拍摄得到，所述生成人脸图像由随机噪声向量通过训练好的深度网络生成得到。步骤s20、基于颜色关系对所述训练样本集进行建模，并提取统计特征；具体方法是：对由深度网络生成的人脸图像和真实人脸图像，分别提取特征，对每张图像为i，按下式计算其r、g、b三个颜色通道中相邻像素取值的大小关系：rc，i，j(x，y)＝φ{ic(x，y)＞ic(x+i，x+j)}上式中，c∈{r，g，b}，(i，j)∈{(0，1)，(0，-1)，(1，0)，(-1，0)}，当且仅当括号中的逻辑表达式为真时φ{·}＝1，否则φ{·}＝0。为了描述像素之间的颜色关系，将r、g、b三个通道的大小关系视为一个三元组，也即：ri，j(x，y)＝(rr，i，j(x，y)，rg，i，j(x，y)，rb，i，j(x，y))为了便于后续的统计，将三元组ri，j(x，y)等价转换为取值在区间[0，7]中的整数：对于r′i，j，分别沿水平方向和垂直方向统计其中连续3个元素出现的频率，得到3阶共生矩阵和每个共生矩阵所包含的维数是d＝83＝512。以水平方向为例，共生矩阵的计算方法是：其中，(v1，v2，v3)是共生矩阵下标的索引，n是归一化因子，当且仅当括号中的逻辑表达式为真时φ{·}＝1，否则φ{·}＝0。最后对求和并计算均值，得到一组512维的统计特征。对于给定的图像，分别抽取其r、g、b三个颜色通道的像素值，如图3(a)所示，并将所述r、g、b三个颜色通道的像素值代入rc，i，j(x，y)＝φ{ic(x，y)＞ic(x+i，x+j)}以及ri，j(x，y)＝(rr，i，j(x，y)，rg，i，j(x，y)，rb，i，j(x，y))进行计算，得到如3(b)所示结果。接着根据进行转换，得到如图4所示结果。最后，根据统计水平方向的共生矩阵得到512维特征。类似地，分别计算并求出这些特征的均值，即得到该图像的特征。图5画出了分别从1000张真实人脸图像和1000张生成人脸图像计算得到的512维特征的均值曲线。可以看到，真实人脸图像和生成人脸图像的特征在许多维度上都有显著的区别。步骤s30、对所述统计特征进行训练，以得到分类模型；具体的，对训练图像集中的每个样本，采用上述方法提取共生矩阵作为特征，利用监督学习的方法训练一个以线性判别分析器(lineardiscriminantanalysis，lda)为基分类器的集成分类器作为二分类模型。所述分类模型是由对训练样本集进行监督学习而得到的二分类器。所述基于颜色关系对训练样本集进行建模是通过共生矩阵对训练样本集的颜色关系建模。使用集成分类器，是因为其在训练样本多、特征维数高时仍然具有很高的运行效率，而且能得到良好的分类性能。在实际应用中也可根据需要选择其它类型的分类器，如支持向量机(svm)等。步骤s40、基于所述分类模型对待测图像进行检测。具体的，对于给定的待测人脸图像，也采用同样的方法提取共生矩阵作为特征。将特征输入训练好的分类模型，得到预测结果。若预测结果表明待测图像为生成人脸图像，则判断该图像是通过深度网络生成的人脸图像；否则，该图像是真实的人脸图像。在进一步优选实施例中，利用celeba人脸图像数据集(包含202599张真实人脸图像)训练一个由变分自编码器(variationalauto-encoder，vae)构成的深度网络作为人脸图像生成器。训练好的深度网络生成与celeba数据集等量的人脸图像。此例中，图像尺寸为64×64。分别将生成人脸图像和celeba中的真实人脸图像以50％的比例随机划分为训练集和测试集。在训练集中，对每张图像提取上述的512维特征，训练一个二分类模型。训练好分类模型后，对测试集中的图像进行检测，得到的检测结果如下：实际类别\预测类别真实人脸图像生成人脸图像真实人脸图像99.90％0.10％生成人脸图像0.04％99.96％在进一步优选实施例中，利用celeba人脸图像数据集训练一个生成对抗网络(generativeadversarialnetwork，gan)作为人脸图像生成器。利用训练好的深度网络生成与celeba数据集等量的人脸图像，图像尺寸为64×64。接着，分别将生成人脸图像和celeba中的真实人脸图像以50％的比例随机划分为训练集和测试集，提取特征，训练分类模型并进行测试，得到实验结果如下：实际类别\预测类别真实人脸图像生成人脸图像真实人脸图像99.33％0.67％生成人脸图像0.05％99.95％在进一步优选实施例中，利用celeba人脸图像数据集训练一个由变分自编码器构成的深度网络作为人脸图像生成器，生成尺寸为128x128的人脸图像。分别将生成人脸图像和celeba中的真实人脸图像以50％的比例随机划分为训练集和测试集，进行一系列的实验后，得到实验结果如下：实际类别\预测类别真实人脸图像生成人脸图像真实人脸图像99.99％0.01％生成人脸图像0.00％100％在进一步优选实施例中，利用celeba人脸图像数据集训练一个生成对抗网络作为人脸图像生成器，生成尺寸为128×128的人脸图像。分别将生成人脸图像和celeba中的真实人脸图像以50％的比例随机划分为训练集和测试集，进行一系列的实验后，得到实验结果如下：实际类别\预测类别真实人脸图像生成人脸图像真实人脸图像100％0.00％生成人脸图像0.00％100％在进一步优选实施例中，利用celeba-hq人脸图像数据集(包含30000张真实人脸图像)训练一个渐进增长式生成对抗网络(progressivegrowingofgans)作为人脸图像生成器，生成尺寸为1024×1024的高清人脸图像。按分别将生成人脸图像和celeba中的真实人脸图像以50％的此例随机划分为训练集和测试集，进行一系列的实验后，得到实验结果如下：实际类别\预测类别真实人脸图像生成人脸图像真实人脸图像99.07％0.93％生成人脸图像0.38％99.62％根据上述实验结果，可知本发明方法对不同类型深度网络生成的不同尺寸的人脸图像均具有非常高的检测准确率，能够有效地判断给定的人脸图像是否为生成的虚假图像。这对于涉及人脸图像安全的实用场合具有重要意义。基于上述方法实施例，本发明还提供了一种深度网络生成人脸图像的检测系统，其中，所述深度网络生成人脸图像的检测系统包括：样本构造模块、特征提取模块、特征训练模块以及图像检测模块。样本构造模块，用于构造由真实人脸图像和生成人脸图像组成的训练样本集；特征提取模块，用于基于颜色关系对所述训练样本集进行建模，并提取统计特征；特征训练模块，用于对所述统计特征进行训练，以得到分类模型；图像检测模块，用于基于所述分类模型对待测图像进行检测。其中，特征提取模块包括像素关系模块以及统计描述模块。像素关系模块用于提取所述训练样本集中的每个样本的颜色通道中相邻像素值的大小关系。具体通过以下过程计算：记输入图像为i，其r、g、b三个颜色通道分别为ir，ig和ib，则按下式计算每个颜色通道中相邻像素取值的大小关系：rc，i，j(x，y)＝φ{ic(x，y)＞ic(x+i，x+j)}；当且仅当括号中的逻辑表达式为真时φ{·}＝1，将r、g、b三个通道的大小关系视为一个三元组，也即：ri，j(x，y)＝(rr，i，j(x，y)，rg，i，j(x，y)，rb，i，j(x，y))ri，j(x，y)中每个分量的取值均为0或1，进行如下等价变换：统计描述模块用于描述训练样本集中每个样本的颜色和纹理信息。具体的，使用共生矩阵来对r′i，j建模，计算方法如下：其中，(v1，v2，...，vk)是共生矩阵下标的索引，n是归一化因子，当且仅当括号中的逻辑表达式为真时φ{·}＝1，否则φ{·}＝0。本发明的原理是：深度网络生成的人脸图像尽管能在一定程度上模拟人脸的形状、姿态、表情等整体信息，但无法很好地生成真实图像中存在的纹理细节，这导致生成图像像素间的内在关系与真实图像不一致，无法保持真实图像固有的统计特性。因此，通过提取图像相邻像素间的颜色关系中统计特征，可以有效地辨别真实人脸图像和生成人脸图像。本发明公开了检测一种深度网络生成人脸图像的检测方法及系统，构造由真实人脸图像和生成人脸图像组成的训练样本集；基于颜色关系对所述训练样本集进行建模，并提取统计特征；对所述统计特征进行训练，以得到分类模型；基于所述分类模型对待测图像进行预测。根据深度网络生成人脸图像在统计特性上与真实图像的不一致，设计了一组基于相邻像素颜色关系的共生矩阵特征，对不同类型深度网络生成的不同尺寸的人脸图像均具有非常高的检测准确率，能够有效地判断给定的人脸图像是否为通过深度网络生成的虚假图像。应当理解的是，本发明的应用不限于上述的举例，对本领域普通技术人员来说，可以根据上述说明加以改进或变换，所有这些改进和变换都应属于本发明所附权利要求的保护范围。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李昊东;黄继武
技术所有人：深圳大学
我是此专利的发明人

上一篇：一种用于智能汽车电机浸漆的传感控制自动输送设备的制作方法
上一篇：一种节能荧光灯管的加工模的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。