模型训练、身份验证方法、装置、存储介质和计算机设备与流程

文档序号:13388175阅读:188来源:国知局
模型训练、身份验证方法、装置、存储介质和计算机设备与流程

本发明涉及计算机技术领域,特别是涉及一种模型训练、身份验证方法、装置、存储介质和计算机设备。



背景技术:

随着计算机技术的发展和图像处理技术的进步,基于图像的处理方式变得越来越多样。比如,出于安全等因素考虑,会对原始图像进行处理得到相应的带噪声图像。目前,在用户使用带噪声图像进行交互时,通常需要对带噪声图像进行去噪,以得到原始图像从而进行后续交互。

然而,传统的图像去噪过程中,主要是通过基于纹理合成的方式,将已知的原始图像区域纹理扩散到待去噪的图像区域,来实现图像去噪。但在采用该方式对待去噪图像进行去噪的过程中,很容易出现误匹配的情况,从而导致处理得到的图像产生严重失真。



技术实现要素:

基于此,有必要针对传统的图像去噪技术导致的图像失真的问题,提供一种模型训练、身份验证方法、装置、存储介质和计算机设备。

一种模型训练方法,所述方法包括:

获取原始图像和相应的带噪声图像;

将所述原始图像和所述带噪声图像输入鉴别模型,得到第一鉴别置信度;

通过图像生成模型,生成所述带噪声图像的去噪声图像;

将所述去噪声图像和所述带噪声图像输入鉴别模型,得到第二鉴别置信度;

按照增大所述第一鉴别置信度和所述第二鉴别置信度间差异的调整方式,调整所述鉴别模型和所述图像生成模型,并继续训练,直至满足训练结束条件。

一种模型训练装置,所述装置包括:

图像获取模块,用于获取原始图像和相应的带噪声图像;

第一输出模块,用于将所述原始图像和所述带噪声图像输入鉴别模型,得到第一鉴别置信度;

图像生成模块,用于通过图像生成模型,生成所述带噪声图像的去噪声图像;

第二输出模块,用于将所述去噪声图像和所述带噪声图像输入鉴别模型,得到第二鉴别置信度;

模型调整模块,用于按照增大所述第一鉴别置信度和所述第二鉴别置信度间差异的调整方式,调整所述鉴别模型和所述图像生成模型,并继续训练,直至满足训练结束条件。

一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时,使得所述处理器执行上述模型训练方法的步骤。

一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述模型训练方法的步骤。

上述模型训练方法、装置、存储介质和计算机设备,包括图像生成模型和鉴别模型两个模型的训练。其中,训练图像生成模型的过程在于学习生成带噪声图像的去噪声图像,训练鉴别模型的过程在于学习在给定带噪声图像的条件下,学习判断输入的另一图像是原始图像还是通过图像生成模型生成的去噪声图像。这样图像生成模型学习生成与原始图像更相似的图像,以干扰鉴别模型的判断,鉴别模型学习更加精准地进行原始图像和去噪声图像的判断,两个模型相互对抗,相互促进,使得训练得到的模型性能更优,从而在使用训练得到的图像生成模型进行图像去噪时,能够极大程度上克服图像失真的问题。

一种身份验证方法,所述方法包括:

获取与用户标识对应的人脸图像帧;

从与所述用户标识对应的身份证件中,获取带网纹人脸证件图像;

通过上述模型训练方法训练得到的图像生成模型,生成所述带网纹人脸证件图像的去网纹人脸证件图像;

将所述人脸图像帧和所述去网纹人脸证件图像对比,得到身份验证结果。

一种身份验证装置,所述装置包括:

获取模块,用于采集与用户标识对应的人脸图像帧;从与所述用户标识对应的身份证件中,获取带网纹人脸证件图像;

生成模块,用于通过上述模型训练方法训练得到的图像生成模型,生成所述带网纹人脸证件图像的去网纹人脸证件图像;

验证模块,用于将所述人脸图像帧和所述去网纹人脸证件图像对比,得到身份验证结果。

一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时,使得所述处理器执行上述身份验证方法的步骤。

一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行上述身份验证方法的步骤。

上述身份验证方法、装置、存储介质和计算机设备,在需要进行用户身份验证时,采集与用户标识对应的人脸图像帧,再从与该用户标识对应的身份证件中,读取带网纹人脸证件图像,然后通过按照图像生成模型与鉴别模型相互对抗、相互促进的方式训练得到的图像生成模型,生成去噪效果好且不失真的去网纹人脸证件图像,再将采集的人脸图像帧和生成的去网纹人脸证件图像对比,即可得到身份验证结果,极大地提高了身份验证的准确性。

附图说明

图1为一个实施例中模型训练方法的应用环境图;

图2为一个实施例中模型训练方法的流程示意图;

图3为一个实施例中原始图像和相应的带噪声图像的示意图;

图4为一个实施例中图像生成模型中各层输出的特征图的传递示意图;

图5为另一个实施例中模型训练方法的流程示意图;

图6为一个实施例中图像生成模型和鉴别模型的输入输出示意图;

图7为一个实施例中身份验证方法的流程示意图;

图8为一个实施例中模型训练装置的结构框图;

图9为一个实施例中身份验证装置的结果框图;

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

图1为一个实施例中模型训练方法的应用环境图。如图1所示,该应用环境包括终端110和服务器120,其中终端110和服务器120可通过网络进行通信。终端110可以是台式设备或者移动终端。服务器120可以是独立的物理服务器、物理服务器集群或者虚拟服务器。终端110可通过服务器120从互联网中获取原始图像和相应的带噪声图像,再根据获取的原始图像和相应的带噪声图像对鉴别模型和图像生成模型进行训练,从而不断调整优化鉴别模型和图像生成模型。服务器120也可获取终端110上传的原始图像和相应的带噪声图像,再根据获取的原始图像和相应的带噪声图像对鉴别模型和图像生成模型进行训练,从而不断调整优化鉴别模型和图像生成模型。

在一个实施例中,图1的应用环境图还可以应用于身份验证方法。终端110可将采集的与用户标识对应的人脸图像帧发送至服务器120,服务器120获取与用户标识对应的人脸图像帧后,从与该用户标识对应的身份证件中,获取带网纹人脸证件图像,再通过上述模型训练方法训练得到的图像生成模型,生成带网纹人脸证件图像的去网纹人脸证件图像,将人脸图像帧和去网纹人脸证件图像对比,即可得到身份验证结果。终端110也可在采集到与用户标识对应的人脸图像帧后,执行身份验证方法,在终端本地完成身份验证过程。

图2为一个实施例中模型训练方法的流程示意图。该模型训练方法可以由终端实现,也可由服务器实现,还可以由终端和服务器协同实现。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图2,该模型训练方法具体包括如下步骤:

s202,获取原始图像和相应的带噪声图像。

其中,原始图像是在图像形成时直接存储的、且未携带噪声的图像。比如,图像采集设备直接采集得到的图像等。带噪声图像是对原始图像进行噪声添加处理后得到的图像。噪声是对原始图像内容产生干扰的数据。比如,网纹或者防伪标记等。带噪声图像是携带干扰数据的原始图像。比如,带网纹的图像或者带防伪标记的图像等。在某些特定场景中,出于安全等因素考虑,会对原始图像进行处理得到相应的带噪声图像。比如,身份证上随机添加的网纹或者护照上添加的防伪标记。

在一个实施例中,服务器中设置有训练样本集,在训练样本集中存储着多组原始图像和相应的带噪声图像,服务器从训练样本集中获取任意一组原始图像和相应的带噪声图像。

其中,训练样本集中的原始图像和相应的带噪声图像,可以是由服务器通过互联网爬取的进行噪声添加处理前后的图像作为原始图像和相应的带噪声图像;也可以是服务器在爬取原始图像后,在该原始图像上随机添加噪声,自行得到的相应的带噪声图像。训练样本集中的原始图像和相应的带噪声图像还可以是由终端通过图像采集设备采集的原始图像,或者是终端从相册中选取的原始图像。终端可再将得到的原始图像上传至服务器,服务器获取原始图像后,在原始图像上随机添加噪声,得到相应的带噪声图像。

在一个实施例中,服务器中可设置多个训练样本集,用户可通过终端选择用于进行训练的训练样本集。服务器可获取终端检测到的用户触发的携带有训练样本集标识的选择指令,再提取选择指令中的训练样本集标识,从训练样本集标识对应的训练样本集中获取原始图像和相应的带噪声图像。

在一个实施例中,训练样本集中可仅包括原始图像。服务器从训练样本集中获取任意一帧原始图像后,在原始图像上随机添加噪声,得到相应的带噪声图像,从而获取到原始图像和相应的带噪声图像。

在上述实施例中,原始图像和相应的带噪声图像,只有噪声或者分辨率存在差异,两帧图像中除噪声之外的图像内容一致。

s204,将原始图像和带噪声图像输入鉴别模型,得到第一鉴别置信度。

其中,鉴别模型是经过训练后具有鉴别能力的机器学习模型。机器学习英文全称为machinelearning,简称ml。机器学习模型可通过样本学习具备鉴别能力。机器学习模型可采用神经网络模型、支持向量机或者逻辑回归模型等。神经网络模型比如卷积神经网络、反向传播神经网络、反馈神经网络、径向基神经网络或者自组织神经网络等。在本实施例中,鉴别模型用于鉴别除带噪声图像外输入的另一图像是否为原始图像,并输出鉴别结果的鉴别置信度。

鉴别置信度与非带噪声图像的另一输入图像一一对应,是表示相应的另一输入图像是原始图像的可信程度。鉴别置信度越高,表示相应的图像是原始图像的可能性越高。可以理解的是,这里的第一鉴别置信度和后文中的第二鉴别置信度均是鉴别置信度,但是对应不同的输入图像条件下的鉴别置信度。

在一个实施例中,鉴别模型可以是由多层互相连接而形成的复杂网络模型。鉴别模型可包括多层特征转换层,每层特征转换层都有对应的模型参数,每层的模型参数可以是多个,每层特征转换层中一个模型参数对输入的图像进行线性或非线性变化,得到特征图(featuremap)作为运算结果。每个特征转换层接收前一层的运算结果,经过自身的运算,对下一层输出本层的运算结果。其中,模型参数是模型结构中的各个参数,能反应模型输出和输入的对应关系。

具体地,服务器在获取到原始图像和待噪声图像后,将获取的原始图像和带噪声图像均输入鉴别模型中,鉴别模型中包括的层逐层对输入的原始图像和带噪声图像进行线性或非线性变化操作,直至鉴别模型中最后一层完成线性或非线性变化操作,服务器从而根据鉴别模型最后一层输出的结果,得到针对当前输入的第一鉴别置信度。

在一个实施例中,鉴别模型可以是已经训练完成的通用的具有鉴别能力的机器学习模型。在将通用的机器学习模型用于特定场景进行鉴别时,鉴别效果不佳,因此需要通过专用于特定场景的样本对通用的机器学习模型进行进一步训练和优化。在本实施例中,服务器可获取根据通用的机器学习模型的模型结构和模型参数,并将该模型参数导入鉴别模型结构,得到带有模型参数的鉴别模型。鉴别模型所带的模型参数,作为本实施例中训练鉴别模型的初始参数参与到训练中。

在一个实施例中,鉴别模型也可以是开发人员根据历史模型训练经验初始化的机器学习模型。服务器直接将初始化的机器学习模型中所带的模型参数,作为本实施例中训练鉴别模型的初始参数参与到训练中。

s206,通过图像生成模型,生成带噪声图像的去噪声图像。

其中,图像生成模型是经过训练后具有图像生成能力的机器学习算法模型。去噪声图像是对带噪声图像进行去噪处理后得到的图像,也就是对携带干扰数据的原始图像去除干扰数据后得到的图像。可以理解的是,图像生成模型与鉴别模型都是机器学习模型,但经过训练后两个模型学习到的能力不同。在本实施例中,图像生成模型用于对带噪声图像进行去噪处理,生成去噪声图像。

具体地,服务器在获取到待噪声图像后,将获取的带噪声图像均输入图像生成模型中,图像生成模型中包括的层逐层对输入的带噪声图像进行线性或非线性变化操作,直至图像生成模型中最后一层完成线性或非线性变化操作,服务器从而获取图像生成模型最后一层输出的图像,作为针对当前输入的带噪声图像生成的去噪声图像。

s208,将去噪声图像和带噪声图像输入鉴别模型,得到第二鉴别置信度。

具体地,服务器在获取到针对当前带噪声图像生成的去噪声图像后,将获取的去噪声图像和带噪声图像均输入鉴别模型中,鉴别模型中包括的层逐层对输入的去噪声图像和带噪声图像进行线性或非线性变化操作,直至鉴别模型中最后一层完成线性或非线性变化操作,服务器从而根据鉴别模型最后一层输出的结果,得到针对当前输入的第二鉴别置信度。

s210,按照增大第一鉴别置信度和第二鉴别置信度间差异的调整方式,调整鉴别模型和图像生成模型,并继续训练,直至满足训练结束条件。

其中,训练模型的过程为确定模型中各特征转换层对应的模型参数的过程。在确定各模型参数时,服务器可以先初始化需训练的模型中各特征转换层对应的模型参数,并在后续的训练过程中,不断优化该初始化的模型参数,并将优化得到的最优的模型参数作为训练好的模型的模型参数。

在一个实施例中,训练结束条件可以是对模型的训练次数达到预设训练次数。服务器可在对模型进行训练时,对训练次数进行计数,当计数达到预设训练次数时,服务器可判定模型满足训练结束条件,并结束对模型的训练。

在一个实施例中,训练结束条件也可以是调整后的鉴别模型的鉴别性能指标达到预设指标,调整后的图像生成模型的图像生成性能指标达到预设指标。

具体地,服务器可比较第一鉴别置信度和第二鉴别置信度的差异,从而朝增大差异的方向,调整鉴别模型和图像生成模型的模型参数。如果调整模型参数后,不满足训练停止条件,则返回步骤s202继续训练,直到满足训练停止条件时结束训练。

在一个实施例中,第一鉴别置信度和第二鉴别置信度的差异可以用代价函数来衡量。代价函数是模型参数的函数,能够衡量模型的第一鉴别置信度和第二鉴别置信度之间的差异的函数。服务器可在代价函数的值小于预先设定的值时结束训练,得到用于对输入图像进行鉴别的鉴别模型以及用于对带噪声图像进行去噪处理的图像生成模型。服务器具体可以选择交叉熵或均方误差等函数作为代价函数。

上述模型训练方法,包括图像生成模型和鉴别模型两个模型的训练。其中,训练图像生成模型的过程在于学习生成带噪声图像的去噪声图像,训练鉴别模型的过程在于学习在给定带噪声图像的条件下,学习判断输入的另一图像是原始图像还是通过图像生成模型生成的去噪声图像。这样图像生成模型学习生成与原始图像更相似的图像,以干扰鉴别模型的判断,鉴别模型学习更加精准地进行原始图像和去噪声图像的判断,两个模型相互对抗,相互促进,使得训练得到的模型性能更优,从而在使用训练得到的图像生成模型进行图像去噪时,能够极大程度上克服图像失真的问题。

在一个实施例中,原始图像为原始人脸证件图像。步骤s202包括:获取原始人脸证件图像集;从原始人脸证件图像集中选取原始人脸证件图像;为选取的原始人脸证件图像添加网纹,得到相应的带噪声图像。

其中,原始人脸证件图像,是用作证件中证明证件持有者身份的包含人脸的图像。证件是用来证明证件持有者身份或者经历的证书或者文件。比如,身份证、学生证或者军官证等。在某些特定场景中,出于安全或者防伪等因素考虑,会在原始人脸证件图像上添加网纹或者防伪标记等后制成证件。网纹是用于干扰图像内容的特殊纹理。比如方格纹、网格纹或者点状纹等。

具体地,服务器中设置有原始人脸证件图像集,在原始人脸证件图像集中存储着若干原始人脸证件图像,服务器从原始人脸证件图像集中选取任意一帧原始人脸证件图像,为选取的原始人脸证件图像随机添加网纹,得到相应的带噪声图像。

其中,原始人脸证件图像集中的原始人脸证件图像,可以是由服务器通过网络爬取的未添加网纹的、且符合证件照片样式的人脸图像作为原始人脸证件图像;也可以是由终端通过图像采集设备采集的符合证件照片样式的人脸图像,将采集到的人脸图像作为原始人脸证件图像,或者是终端从相册中选取的符合证件照片样式的人脸图片作为原始人脸证件图像。

图3示出了一个实施例中原始图像和相应的带噪声图像的示意图。参考图3,该示意图包括原始图像301和带噪声图像302。从图中可以看出带噪声图像302可由原始图像301添加网纹得到。

在本实施例中,以原始人脸证件图像和添加网纹后得到的带噪声图像为样本来训练图像生成模型和鉴别模型,这样每个样本均可以尽可能为模型的训练提供有用信息,提高模型训练效率,且能够训练得到可从添加网纹后得到的带噪声图像中恢复出不带网纹的清晰的人脸图像的图像生成模型,从而可利用恢复出的清晰的人脸图像进行后续的人脸识别或者身份验证。

在一个实施例中,鉴别模型为卷积神经网络模型。步骤s204包括:分别将原始图像和带噪声图像输入鉴别模型;获取鉴别模型中的卷积层输出的与原始图像对应的特征图;获取卷积层输出的与带噪声图像对应的特征图;根据与原始图像对应的特征图和与带噪声图像对应的特征图,计算原始图像与带噪声图像的第一鉴别置信度。

其中,卷积神经网络(convolutionalneuralnetwork,简称cnn)是一种人工神经网络。神经网络模型是由多层互相连接而形成的复杂网络模型,包括多层特征转换层,如卷积层(convolutionallayer)和子采样层(poolinglayer)等。神经网络模型的每层特征转换层都有对应的模型参数,每层的模型参数可以是多个,每层特征转换层中一个模型参数对输入的图像进行线性或非线性变化,得到特征图作为运算结果。每个特征转换层接收前一层的运算结果,经过自身的运算,对下一层输出本层的运算结果。

在卷积神经网络的卷积层中,存在多个特征图,每个特征图包括多个神经元,同一个特征图的所有神经元共用一个卷积核。卷积核就是相应神经元的权值,卷积核代表一个特征。卷积核一般以随机小数矩阵的形式初始化,在网络的训练过程中将学习得到合理的卷积核。卷积层可以减少神经网络中各层之间的连接,同时又降低了过拟合的风险。

子采样也叫做池化(pooling),通常有均值子采样(meanpooling)和最大值子采样(maxpooling)两种形式。子采样可以看作一种特殊的卷积过程。卷积和子采样大大简化了神经网络的复杂度,减少了神经网络的参数。

卷积神经网络模型是使用了卷积神经网络算法训练而成的机器学习模型。本实施例中采用卷积神经网络可直接构建,也可将已有的卷积神经网络进行改造得到。

具体地,服务器分别将原始图像和带噪声图像输入鉴别模型,依次通过鉴别模型的各特征转换层。在每一层特征转换层上,服务器利用该特征转换层对应的模型参数,对上一层输出的特征图中包括的像素点对应的像素值进行线性或者非线性变化,并输出当前特征转换层上的特征图。其中,如果当前特征转换层为第一级特征转换层,则上一层输出的特征图为输入的原始图像或带噪声图像。像素点对应的像素值具体可以为像素点的rgb(redgreenblue)三通道颜色值。

进一步地,服务器可获取鉴别模型所包括的卷积层对输入的原始图像和带噪声图像对应的像素值矩阵进行操作,得到相应的响应值构成特征图。鉴别模型中不同的层提取的特征不同。服务器获取的与原始图像对应的特征图来自的卷积层可以是鉴别模型中的任一层,也可以是任意多层。

在一个实施例中,服务器获取的与原始图像对应的特征图和与带噪声图像对应的特征图,可以是提取噪声特征后的特征图,服务器可计算与原始图像对应的特征图和与带噪声图像对应的特征图中噪声特征的相似度,并根据该相似度计算出相应的鉴别置信度。其中,相似度可采用余弦相似度或者图像间各自感知哈希值的汉明距离。那么,在本实施例中,与原始图像对应的特征图和与带噪声图像对应的特征图中噪声特征的相似度越低,则鉴别置信度越高,也就是说输入的非带噪声图像为原始图像的可能性越大。

在一个实施例中,服务器获取的与原始图像对应的特征图和与带噪声图像对应的特征图,也可以是提取非噪声特征后的特征图,在本实施例中,与原始图像对应的特征图和与带噪声图像对应的特征图中非噪声特征的相似度越高,则鉴别置信度越高,也就是说输入的非带噪声图像为原始图像的可能性越大。

上述实施例中,鉴别模型的卷积层所输出的特征图,可以更好地反映出相应输入图像的特性,从而可以根据反映特征的特征图计算鉴别模型的鉴别置信度,可进一步鉴别模型的训练效率,并保证训练出的鉴别模型的鉴别准确性。

在一个实施例中,图像生成模型为卷积神经网络模型,卷积神经网络模型包括编码层和相应的解码层。步骤s206包括:将带噪声图像输入图像生成模型;在按照图像生成模型所包括的层的顺序,将当前层输出的特征图作为下一层的输入时,若当前层为解码层,则获取与当前解码层相应的编码层所输出的特征图,并将获取的特征图与当前解码层输出的特征图融合后输入下一层;获取图像生成模型中末层输出的特征图,得到去噪声图像。

其中,编码层(encoder)用于对输入图像进行特征提取并降维得到低维的特征图。解码层(decoder)用于对降维得到的特征图进行升维,得到与输入图像维度相同的输出图像。在本实施例中,图像生成模型为卷积神经网络模型,卷积神经网络模型包括编码层和相应的解码层。其中,编码层对图像的降维幅度与相应的解码层对图像的升维幅度一致。比如,编码层对图像进行编码后,使得图像分辨率缩小至四分之一,那么与该编码层对应的解码层对图像进行解密后,使得图像分辨率增大至四倍。

具体地,服务器将带噪声图像输入图像生成模型后,带噪声图像先经过编码层的特征变换作用,再经过解码层的特征变换作用。由于图像生成模型中包括的每一层,均是对输入当前层的图像进行特征提取,输出特征提取后的特征图,那么在层层特征提取后,图像生成模型意图提取的特征已明确,但特征图包含的图像信息确越来越少,则需要在解码时将缺失的图像信息添加至特征图中,以输出更接近于原始图像的去噪声图像。

在一个实施例中,服务器在按照图像生成模型所包括的层的顺序,将当前层输出的特征图作为下一层的输入时,检测当前层是解码层还是编码层。若服务器判定当前层为编码层时,则直接将当前层输出的特征图作为下一层的输入;若服务器判定当前层为解码层时,则获取与当前解码层相应的编码层所输出的特征图,并将获取的特征图与当前解码层输出的特征图融合后输入下一层,直至当前层为图像生成模型的最后一层时,获取当前层输出的特征图,从而得到去噪声图像。

其中,将获取的特征图与当前解码层输出的特征图融合,可以是将获取的特征图与当前解码层输出的特征图对应像素位的像素值合并;也可以是确定当前解码层输出的特征图中缺失像素值的像素位,将获取的特征图中该像素位的像素值添加至前解码层输出的特征图中相应的像素位。

举例说明,假设图像生成模型为n层结构,那么第i层编码层相应的解码层为第n-i层。服务器在按照图像生成模型所包括的层的顺序,得到第n-i层输出的特征图后,获取第i层输出的特征图,将第n-i层输出的特征图与第i层输出的特征图融合后,输入第n-i+1层。

图4示出了一个实施例中图像生成模型中各层输出的特征图的传递示意图。参考图4,该示意图包括输入图像410、中间图像420和输出图像430。其中,中间图像420和输出图像430均为图像生成模型中所包括的层输出的特征图。输入图像410经过第一层编码层输出特征图421,特征图421经过第二层编码层输出特征图422,特征图422经过第二层编码层输出特征图423,特征图423第一层解码层输出特征图424,特征图424与特征图422融合后经过第二层解码层输出特征图425,特征图425与特征图421融合后经过第二层解码层输出输出图像430。

上述实施例中,由于图像生成模型中的编码层和解码层在逐层进行特征提取时,得到的特征图中提取的特征更加明显,但包括的原始输入的图像的信息越来越少,为此,通过在对特征图进行解码操作时,将相应的编码层输出的特征图进行融合,使得后续解码层的输入图像即明确了图像特征,又能携带原始输入图像的图像信息,从而保证最终输出的图像既能去除噪声,又能够保留完整的图像信息。

在一个实施例中,按照增大第一鉴别置信度和第二鉴别置信度间差异的调整方式,调整鉴别模型和图像生成模型,包括:按照最大化第一鉴别置信度的调整方式,调整鉴别模型;按照最小化第二鉴别置信度的调整方式,调整鉴别模型和图像生成模型。

具体地,服务器可调整鉴别模型的模型参数,使得调整后的鉴别模型在输入原始图像和待噪声图像后输出的第一鉴别置信度增大。服务器还可异步调整鉴别模型和图像生成模型的模型参数,使得通过调整后的图像生成模型生成的去噪声图像,与带噪声图像输入调整后的鉴别模型后输出的第二鉴别置信度减小。

在一个实施例中,按照最大化第一鉴别置信度的调整方式,调整鉴别模型,包括:按照鉴别模型所包括的层的次序,逆序确定第一鉴别置信度随各层所对应的模型参数的变化率;按逆序调整鉴别模型所包括的层所对应的模型参数,使得第一鉴别置信度随相应调整的层所对应的模型参数的变化率增大。

其中,第一鉴别置信度随模型参数的变化率是第一鉴别置信度随模型参数变化的速度。第一鉴别置信度随模型参数的变化率越大,第一鉴别置信度随模型参数变化得越快。最大化第一鉴别置信度的过程是求解第一鉴别置信度最大值的过程,具体可沿变化率上升方向求解极大值。

具体地,图像被输入模型后,每经过一层则进行一次非线性变化,并将输出的运算结果作为下一层的输入。由于服务器直接将原始图像和带噪声图像输入鉴别模型进行鉴别得到第一鉴别置信度,那么服务器则可按照鉴别模型所包括的层的次序,从鉴别模型所包括的最后一层起,确定第一鉴别置信度随当前层所对应的模型参数的变化率,再依次逆序确定第一鉴别置信度随各层所对应的模型参数的变化率。服务器可再按逆序依次调整鉴别模型所包括的层所对应的模型参数,使得第一鉴别置信度随相应调整的层所对应的模型参数的变化率增大,使得鉴别模型鉴别出输入的非带噪声图像的另一图像为原始图像的鉴别结果更准确。

举例说明,假设第一鉴别置信度为d1,按照鉴别模型所包括的层的次序,逆序第一层所对应的模型参数为z,则d1随z的变化率为逆序第二层所对应的模型参数为b,则d1随b的变化率为逆序第三层所对应的模型参数为c,则d1随c的变化率为在求解变化率时,链式求导会一层一层的将梯度传导到在前的层。在求解变化率至鉴别模型所包括的第一层,服务器可逆序依次调整模型参数z、b、c至鉴别模型所包括的第一层对应的模型参数,使得最后一层求得的变化率增大。

在本实施例中,通过反向传播方式求解第一鉴别置信度随鉴别模型各层所对应的模型参数的变化率,通过调节鉴别模型各层所对应的模型参数使得计算得到的变化率减大,以训练鉴别模型,使得训练得到的鉴别模型效果更优。

在一个实施例中,按照最小化第二鉴别置信度的调整方式,调整鉴别模型和图像生成模型,包括:依次按照图像生成模型和鉴别模型所包括的层的次序,逆序确定第二鉴别置信度随各层所对应的模型参数的变化率;按逆序,调整鉴别模型和图像生成模型所包括的层所对应的模型参数,使得第二鉴别置信度随相应调整的层所对应的模型参数的变化率减小。

具体地,最小化第二鉴别置信度的过程是求解第二鉴别置信度最小值的过程,具体可沿变化率下降方向求解极小值。由于服务器先通过图像生成模型生成带噪声图像的去噪声图像,再将去噪声图像和带噪声图像输入鉴别模型进行鉴别,那么服务器则可依次按照图像生成模型和鉴别模型所包括的层的次序,从鉴别模型所包括的最后一层起,确定第二鉴别置信度随当前层所对应的模型参数的变化率,再依次逆序确定第二鉴别置信度随各层所对应的模型参数的变化率。服务器可再按逆序依次调整图像生成模型和鉴别模型所包括的层所对应的非线性变化算子,使得第二鉴别置信度随相应调整的层所对应的模型参数的变化率减小。

举例说明,假设第二鉴别置信度为d2,按照图像生成模型和鉴别模型所包括的层的次序,逆序第一层所对应的模型参数为z,则d2随z的变化率为逆序第二层所对应的模型参数为b,则d2随b的变化率为逆序第三层所对应的模型参数为c,则d2随c的变化率为在求解变化率时,链式求导会一层一层的将梯度传导到在前的层。在求解变化率至图像生成模型所包括的第一层,服务器可逆序依次调整模型参数z、b、c至图像生成模型所包括的第一层对应的模型参数,使得最后一层求得的变化率减小。

在本实施例中,通过反向传播方式求解第二鉴别置信度随图像生成模型和鉴别模型各层所对应的模型参数的变化率,通过调节图像生成模型和鉴别模型各层所对应的模型参数使得计算得到的变化率减小,以训练图像生成模型和鉴别模型,使得训练得到的图像生成模型和鉴别模型效果更优。

在一个实施例中,服务器还可获取原始图像与相应的去噪声图像的内容损耗,根据第一鉴别置信度、第二鉴别置信度和内容损耗生成训练代价,按照最小化训练代价的调整方式,调整图像生成模型和鉴别模型。其中,内容损耗是指通过图像生成模型生成的去噪声图像与相应的原始图像之间在图像内容上的差异。

在一个实施例中,训练代价具体可表示为:

l=k1[logd(ii,ji)]+k2[log(1-d(g(ii),ji))]+k3r(ii,g(ii))(1)

其中,ii表示原始图像,g(ii)表示图像生成模型生成的去噪声图像,ji表示带噪声图像。d(ii,ji)为鉴别模型在输入原始图像和带噪声图像时输出的第一鉴别置信度,d(g(ii),ji)为鉴别模型在输入去噪声图像和带噪声图像时输出的第二鉴别置信度。r(ii,g(ii))为内容损耗,k1、k2和k3分别为第一鉴别置信度、第二鉴别置信度和内容损耗所占训练代价的权重。k1具体可以是ii在服从的概率分布下的期望,k2具体可以是g(ii)和ji在各自服从的概率分布下的联合期望。

r(ii,g(ii))=k4[||ii-g(ii)||](2)

其中,k4具体可以是ii和g(ii)在各自服从的概率分布下的联合期望。||ii-g(ii)||具体可以是两帧图像相应像素位的像素值差值矩阵的值。

具体地,模型训练的目的在于最小化训练代价l,也就是最大化d(ii,ji),最小化d(g(ii),ji)和r(ii,g(ii))。

在本实施例中,将去噪声图像与原始图像的内容损耗,协同第一鉴别置信度和第二鉴别置信度作为反馈调节依据调节图像生成模型和鉴别模型,提高了模型训练效率,且进一步减少了模型训练过程中的过拟合风险。

上述实施例中,通过调整图像生成模型和鉴别模型的模型参数,以最大化输入原始图像和带噪声图像得到的第一鉴别置信度,最小化输入去噪声图像和带噪声图像得到的第二鉴别置信度,不断增大第一鉴别置信度和第二鉴别置信度的差异,使得鉴别模型能够精确鉴别输入的非带噪声图像的另一图像是否为原始图像,图像生成模型能够生成更接近原始图像的去噪声图像来干扰鉴别模型,从而提高鉴别模型的鉴别准确率以及图像生成模型的图像生成效果。

如图5所示,在一个具体地实施例中,模型训练方法具体包括以下步骤:

s502,获取原始人脸证件图像集;从原始人脸证件图像集中选取原始人脸证件图像;为选取的原始人脸证件图像添加网纹,得到相应的带噪声图像。

s504,分别将原始人脸证件图像和带噪声图像输入鉴别模型;获取鉴别模型中的卷积层输出的与原始人脸证件图像对应的特征图;获取卷积层输出的与带噪声图像对应的特征图;根据与原始人脸证件图像对应的特征图和与带噪声图像对应的特征图,计算原始人脸证件图像与带噪声图像的第一鉴别置信度。

s506,将带噪声图像输入图像生成模型;在按照图像生成模型所包括的层的顺序,将当前层输出的特征图作为下一层的输入时,若当前层为解码层,则获取与当前解码层相应的编码层所输出的特征图,并将获取的特征图与当前解码层输出的特征图融合后输入下一层;获取图像生成模型中末层输出的特征图,得到去噪声图像。

s508,分别将去噪声图像和带噪声图像输入鉴别模型;获取鉴别模型中的卷积层输出的与去噪声图像对应的特征图;获取卷积层输出的与带噪声图像对应的特征图;根据与去噪声图像对应的特征图和与带噪声图像对应的特征图,计算去噪声图像与带噪声图像的第二鉴别置信度。

s510,按照鉴别模型所包括的层的次序,逆序确定第一鉴别置信度随各层所对应的模型参数的变化率;按逆序调整鉴别模型所包括的层所对应的模型参数,使得第一鉴别置信度随相应调整的层所对应的模型参数的变化率增大。

s512,依次按照图像生成模型和鉴别模型所包括的层的次序,逆序确定第二鉴别置信度随各层所对应的模型参数的变化率;按逆序,调整鉴别模型和图像生成模型所包括的层所对应的模型参数,使得第二鉴别置信度随相应调整的层所对应的模型参数的变化率减小。

s514,检测鉴别模型与图像生成模型是否满足训练结束条件;若是,则跳转至步骤s516;若否,则返回步骤s502。

s516,结束模型训练。

在本实施例中,包括图像生成模型和鉴别模型两个模型的训练。其中,训练图像生成模型的过程在于学习生成带噪声图像的去噪声图像,训练鉴别模型的过程在于学习在给定带噪声图像的条件下,学习判断输入的另一图像是原始人脸证件图像还是通过图像生成模型生成的去噪声图像。这样图像生成模型学习生成与原始人脸证件图像更相似的图像,以干扰鉴别模型的判断,鉴别模型学习更加精准地进行原始图像和去噪声图像的判断,两个模型相互对抗,相互促进,使得训练得到的模型性能更优,从而在使用训练得到的图像生成模型进行图像去噪时,能够极大程度上克服图像失真的问题。

图6示出了一个实施例中图像生成模型和鉴别模型的输入输出示意图。参考图6,该示意图包括原始人脸证件图像601,带网纹人脸证件图像602、去网纹人脸证件图像603、鉴别模型604和图像生成网络605。将原始人脸证件图像601和带网纹人脸证件图像602输入鉴别模型604得到第一鉴别置信度。将带网纹人脸证件图像602输入图像生成网络605后得到去网纹人脸证件图像603,再将去网纹人脸证件图像603和带网纹人脸证件图像602输入鉴别模型604得到第二鉴别置信度。

图7为一个实施例中身份验证方法的流程示意图。该身份验证方法可以由终端实现,也可由服务器实现,还可以由终端和服务器协同实现。本实施例主要以该方法应用于上述图1中的服务器120来举例说明。参照图7,该身份验证方法具体包括如下步骤:

s702,获取与用户标识对应的人脸图像帧。

具体地,用户标识用于唯一标识一个用户。用户标识可以是包括数字、字母和符号中的至少一种字符的字符串。终端可调用摄像头采集人脸图像帧,将采集到的人脸图像帧协同用户标识发送至服务器,服务器从而获取与用户标识对应的人脸图像帧。

s704,从与用户标识对应的身份证件中,获取带网纹人脸证件图像。

具体地,服务器可在获取用户标识后,根据用户标识查找与用户标识对应的身份证件,从查找到的身份证件中获取带网纹人脸证件图像。服务器也可通过证件扫描仪扫描读取与用户标识对应的身份证件,再从读取的身份证件中获取带网纹人脸证件图像

s706,通过上述模型训练方法训练得到的图像生成模型,生成带网纹人脸证件图像的去网纹人脸证件图像。

具体地,服务器可通过上述任一实施例中的模型训练方法训练得到的图像生成模型,生成带网纹人脸证件图像的去网纹人脸证件图像。

s708,将人脸图像帧和去网纹人脸证件图像对比,得到身份验证结果。

具体地,服务器可计算人脸图像帧和去网纹人脸证件图像的相似度,在计算得到的相似度超过预设相似度阈值时,判定人脸图像帧和去网纹人脸证件图像中人脸区域对应相同的用户,得到身份验证通过的结果。在计算得到的相似度低于预设相似度阈值时,判定人脸图像帧和去网纹人脸证件图像中人脸区域对应不同的用户,得到身份验证未通过的结果。

上述身份验证方法,在需要进行用户身份验证时,采集与用户标识对应的人脸图像帧,再从与该用户标识对应的身份证件中,读取带网纹人脸证件图像,然后通过按照图像生成模型与鉴别模型相互对抗、相互促进的方式训练得到的图像生成模型,生成去噪效果好且不失真的去网纹人脸证件图像,再将采集的人脸图像帧和生成的去网纹人脸证件图像对比,即可得到身份验证结果,极大地提高了身份验证的准确性。

如图8所示,在一个实施例中,提供了一种模型训练装置800,包括:图像获取模块801、第一输出模块802、图像生成模块803、第二输出模块804和模型调整模块805。

图像获取模块801,用于获取原始图像和相应的带噪声图像。

第一输出模块802,用于将原始图像和带噪声图像输入鉴别模型,得到第一鉴别置信度。

图像生成模块803,用于通过图像生成模型,生成带噪声图像的去噪声图像。

第二输出模块804,用于将去噪声图像和带噪声图像输入鉴别模型,得到第二鉴别置信度。

模型调整模块805,用于按照增大第一鉴别置信度和第二鉴别置信度间差异的调整方式,调整鉴别模型和图像生成模型,并继续训练,直至满足训练结束条件。

上述模型训练装置800,包括图像生成模型和鉴别模型两个模型的训练。其中,训练图像生成模型的过程在于学习生成带噪声图像的去噪声图像,训练鉴别模型的过程在于学习在给定带噪声图像的条件下,学习判断输入的另一图像是原始图像还是通过图像生成模型生成的去噪声图像。这样图像生成模型学习生成与原始图像更相似的图像,以干扰鉴别模型的判断,鉴别模型学习更加精准地进行原始图像和去噪声图像的判断,两个模型相互对抗,相互促进,使得训练得到的模型性能更优,从而在使用训练得到的图像生成模型进行图像去噪时,能够极大程度上克服图像失真的问题。

在一个实施例中,原始图像为原始人脸证件图像。图像获取装置8001还用于获取原始人脸证件图像集;从原始人脸证件图像集中选取原始人脸证件图像;为选取的原始人脸证件图像添加网纹,得到相应的带噪声图像。

在本实施例中,以原始人脸证件图像和添加网纹后得到的带噪声图像为样本来训练图像生成模型和鉴别模型,这样每个样本均可以尽可能为模型的训练提供有用信息,提高模型训练效率,且能够训练得到可从添加网纹后得到的带噪声图像中恢复出不带网纹的清晰的人脸图像的图像生成模型,从而可利用恢复出的清晰的人脸图像进行后续的人脸识别或者身份验证。

在一个实施例中,鉴别模型为卷积神经网络模型。第一输出模块802还用于分别将原始图像和带噪声图像输入鉴别模型;获取鉴别模型中的卷积层输出的与原始图像对应的特征图;获取卷积层输出的与带噪声图像对应的特征图;根据与原始图像对应的特征图和与带噪声图像对应的特征图,计算原始图像与带噪声图像的第一鉴别置信度。

在本实施例中,鉴别模型的卷积层所输出的特征图,可以更好地反映出相应输入图像的特性,从而可以根据反映特征的特征图计算鉴别模型的鉴别置信度,可进一步鉴别模型的训练效率,并保证训练出的鉴别模型的鉴别准确性。

在一个实施例中,图像生成模型为卷积神经网络模型;卷积神经网络模型包括编码层和相应的解码层。图像生成模块803还用于将带噪声图像输入图像生成模型;在按照图像生成模型所包括的层的顺序,将当前层输出的特征图作为下一层的输入时,若当前层为解码层,则获取与当前解码层相应的编码层所输出的特征图,并将获取的特征图与当前解码层输出的特征图融合后输入下一层;获取图像生成模型中末层输出的特征图,得到去噪声图像。

在本实施例中,由于图像生成模型中的编码层和解码层在逐层进行特征提取时,得到的特征图中提取的特征更加明显,但包括的原始输入的图像的信息越来越少,为此,通过在对特征图进行解码操作时,将相应的编码层输出的特征图进行融合,使得后续解码层的输入图像即明确了图像特征,又能携带原始输入图像的图像信息,从而保证最终输出的图像既能去除噪声,又能够保留完整的图像信息。

在一个实施例中,模型调整模块805还用于按照最大化第一鉴别置信度的调整方式,调整鉴别模型;按照最小化第二鉴别置信度的调整方式,调整鉴别模型和图像生成模型。

在本实施例中,通过调整图像生成模型和鉴别模型的模型参数,以最大化输入原始图像和带噪声图像得到的第一鉴别置信度,最小化输入去噪声图像和带噪声图像得到的第二鉴别置信度,不断增大第一鉴别置信度和第二鉴别置信度的差异,使得鉴别模型能够精确鉴别输入的非带噪声图像的另一图像是否为原始图像,图像生成模型能够生成更接近原始图像的去噪声图像来干扰鉴别模型,从而提高鉴别模型的鉴别准确率以及图像生成模型的图像生成效果。

在一个实施例中,模型调整模块805还用于按照鉴别模型所包括的层的次序,逆序确定第一鉴别置信度随各层所对应的模型参数的变化率;按逆序调整鉴别模型所包括的层所对应的模型参数,使得第一鉴别置信度随相应调整的层所对应的模型参数的变化率增大。

在本实施例中,通过反向传播方式求解第一鉴别置信度随鉴别模型各层所对应的模型参数的变化率,通过调节鉴别模型各层所对应的模型参数使得计算得到的变化率减大,以训练鉴别模型,使得训练得到的鉴别模型效果更优。

在一个实施例中,模型调整模块805还用于依次按照图像生成模型和鉴别模型所包括的层的次序,逆序确定第二鉴别置信度随各层所对应的模型参数的变化率;按逆序,调整鉴别模型和图像生成模型所包括的层所对应的模型参数,使得第二鉴别置信度随相应调整的层所对应的模型参数的变化率减小。

在本实施例中,通过反向传播方式求解第二鉴别置信度随图像生成模型和鉴别模型各层所对应的模型参数的变化率,通过调节图像生成模型和鉴别模型各层所对应的模型参数使得计算得到的变化率减小,以训练图像生成模型和鉴别模型,使得训练得到的图像生成模型和鉴别模型效果更优。

如图9所示,在一个实施例中,提供了一种身份验证装置900,包括:获取模块901、生成模块902和验证模块903。

获取模块901,用于获取与用户标识对应的人脸图像帧;从与用户标识对应的身份证件中,获取带网纹人脸证件图像。

生成模块902,用于通过上述模型训练方法训练得到的图像生成模型,生成带网纹人脸证件图像的去网纹人脸证件图像。

验证模块903,用于将人脸图像帧和去网纹人脸证件图像对比,得到身份验证结果。

上述身份验证装置900,在需要进行用户身份验证时,采集与用户标识对应的人脸图像帧,再从与该用户标识对应的身份证件中,读取带网纹人脸证件图像,然后通过按照图像生成模型与鉴别模型相互对抗、相互促进的方式训练得到的图像生成模型,生成去噪效果好且不失真的去网纹人脸证件图像,再将采集的人脸图像帧和生成的去网纹人脸证件图像对比,即可得到身份验证结果,极大地提高了身份验证的准确性。

图10示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110或服务器120。如图10所示,该计算机设备包括通过系统总线连接的处理器、非易失性存储介质、内存储器和网络接口。其中,处理器包括中央处理器和图形处理器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器实现模型训练方法和/或身份验证方法。该中央处理器用于提供计算和控制能力,支撑整个计算机设备的运行,该图形处理器用于执行图形处理指令。该内存储器中也可储存有计算机可读指令,该计算机可读指令被所述处理器执行时,可使得所述处理器执行模型训练方法和/或身份验证方法。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,本申请提供的应用程序处理装置可以实现为一种计算机程序的形式,所述计算机程序可在如图10所示的计算机设备上运行,所述计算机设备的非易失性存储介质可存储组成该应用程序处理装置的各个程序模块,比如,图8所示的图像获取模块801或者图9所示的获取模块901等。各个程序模块中包括计算机可读指令,所述计算机可读指令用于使所述计算机设备执行本说明书中描述的本申请各个实施例的应用程序处理方法中的步骤。

例如,所述计算机设备可以通过如图8所示的模型训练装置800中的图像获取模块801获取原始图像和相应的带噪声图像,通过第一输出模块802将原始图像和带噪声图像输入鉴别模型,得到第一鉴别置信度,通过图像生成模块803通过图像生成模型,生成带噪声图像的去噪声图像,通过第二输出模块804将去噪声图像和带噪声图像输入鉴别模型,得到第二鉴别置信度,通过模型调整模块805按照增大第一鉴别置信度和第二鉴别置信度间差异的调整方式,调整鉴别模型和图像生成模型,并继续训练,直至满足训练结束条件。

还例如,所述计算机设备可以通过如图9所示的身份验证装置900中的获取模块901获取与用户标识对应的人脸图像帧,从与用户标识对应的身份证件中,获取带网纹人脸证件图像,通过生成模块902通过上述模型训练方法训练得到的图像生成模型,生成带网纹人脸证件图像的去网纹人脸证件图像,通过验证模块903将人脸图像帧和去网纹人脸证件图像对比,得到身份验证结果。

在一个实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机可读指令,该计算机可读指令被处理器执行时,使得处理器执行以下步骤:获取原始图像和相应的带噪声图像;将原始图像和带噪声图像输入鉴别模型,得到第一鉴别置信度;通过图像生成模型,生成带噪声图像的去噪声图像;将去噪声图像和带噪声图像输入鉴别模型,得到第二鉴别置信度;按照增大第一鉴别置信度和第二鉴别置信度间差异的调整方式,调整鉴别模型和图像生成模型,并继续训练,直至满足训练结束条件。

在一个实施例中,原始图像为原始人脸证件图像。获取原始图像和相应的带噪声图像,包括:获取原始人脸证件图像集;从原始人脸证件图像集中选取原始人脸证件图像;为选取的原始人脸证件图像添加网纹,得到相应的带噪声图像。

在一个实施例中,鉴别模型为卷积神经网络模型。将原始图像和带噪声图像输入鉴别模型,得到第一鉴别置信度,包括:分别将原始图像和带噪声图像输入鉴别模型;获取鉴别模型中的卷积层输出的与原始图像对应的特征图;获取卷积层输出的与带噪声图像对应的特征图;根据与原始图像对应的特征图和与带噪声图像对应的特征图,计算原始图像与带噪声图像的第一鉴别置信度。

在一个实施例中,图像生成模型为卷积神经网络模型。卷积神经网络模型包括编码层和相应的解码层。通过图像生成模型,生成带噪声图像的去噪声图像,包括:将带噪声图像输入图像生成模型;在按照图像生成模型所包括的层的顺序,将当前层输出的特征图作为下一层的输入时,若当前层为解码层,则获取与当前解码层相应的编码层所输出的特征图,并将获取的特征图与当前解码层输出的特征图融合后输入下一层;获取图像生成模型中末层输出的特征图,得到去噪声图像。

在一个实施例中,按照增大第一鉴别置信度和第二鉴别置信度间差异的调整方式,调整鉴别模型和图像生成模型,包括:按照最大化第一鉴别置信度的调整方式,调整鉴别模型;按照最小化第二鉴别置信度的调整方式,调整鉴别模型和图像生成模型。

在一个实施例中,按照最大化第一鉴别置信度的调整方式,调整鉴别模型,包括:按照鉴别模型所包括的层的次序,逆序确定第一鉴别置信度随各层所对应的模型参数的变化率;按逆序调整鉴别模型所包括的层所对应的模型参数,使得第一鉴别置信度随相应调整的层所对应的模型参数的变化率增大。

在一个实施例中,按照最小化第二鉴别置信度的调整方式,调整鉴别模型和图像生成模型,包括:依次按照图像生成模型和鉴别模型所包括的层的次序,逆序确定第二鉴别置信度随各层所对应的模型参数的变化率;按逆序,调整鉴别模型和图像生成模型所包括的层所对应的模型参数,使得第二鉴别置信度随相应调整的层所对应的模型参数的变化率减小。

上述存储介质,包括图像生成模型和鉴别模型两个模型的训练。其中,训练图像生成模型的过程在于学习生成带噪声图像的去噪声图像,训练鉴别模型的过程在于学习在给定带噪声图像的条件下,学习判断输入的另一图像是原始图像还是通过图像生成模型生成的去噪声图像。这样图像生成模型学习生成与原始图像更相似的图像,以干扰鉴别模型的判断,鉴别模型学习更加精准地进行原始图像和去噪声图像的判断,两个模型相互对抗,相互促进,使得训练得到的模型性能更优,从而在使用训练得到的图像生成模型进行图像去噪时,能够极大程度上克服图像失真的问题。

在一个实施例中,提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机可读指令,该计算机可读指令被处理器执行时,使得处理器执行以下步骤:获取与用户标识对应的人脸图像帧;从与用户标识对应的身份证件中,获取带网纹人脸证件图像;通过上述模型训练方法训练得到的图像生成模型,生成带网纹人脸证件图像的去网纹人脸证件图像;将人脸图像帧和去网纹人脸证件图像对比,得到身份验证结果。

上述存储介质,在需要进行用户身份验证时,采集与用户标识对应的人脸图像帧,再从与该用户标识对应的身份证件中,读取带网纹人脸证件图像,然后通过按照图像生成模型与鉴别模型相互对抗、相互促进的方式训练得到的图像生成模型,生成去噪效果好且不失真的去网纹人脸证件图像,再将采集的人脸图像帧和生成的去网纹人脸证件图像对比,即可得到身份验证结果,极大地提高了身份验证的准确性。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:获取原始图像和相应的带噪声图像;将原始图像和带噪声图像输入鉴别模型,得到第一鉴别置信度;通过图像生成模型,生成带噪声图像的去噪声图像;将去噪声图像和带噪声图像输入鉴别模型,得到第二鉴别置信度;按照增大第一鉴别置信度和第二鉴别置信度间差异的调整方式,调整鉴别模型和图像生成模型,并继续训练,直至满足训练结束条件。

在一个实施例中,原始图像为原始人脸证件图像。获取原始图像和相应的带噪声图像,包括:获取原始人脸证件图像集;从原始人脸证件图像集中选取原始人脸证件图像;为选取的原始人脸证件图像添加网纹,得到相应的带噪声图像。

在一个实施例中,鉴别模型为卷积神经网络模型。将原始图像和带噪声图像输入鉴别模型,得到第一鉴别置信度,包括:分别将原始图像和带噪声图像输入鉴别模型;获取鉴别模型中的卷积层输出的与原始图像对应的特征图;获取卷积层输出的与带噪声图像对应的特征图;根据与原始图像对应的特征图和与带噪声图像对应的特征图,计算原始图像与带噪声图像的第一鉴别置信度。

在一个实施例中,图像生成模型为卷积神经网络模型。卷积神经网络模型包括编码层和相应的解码层。通过图像生成模型,生成带噪声图像的去噪声图像,包括:将带噪声图像输入图像生成模型;在按照图像生成模型所包括的层的顺序,将当前层输出的特征图作为下一层的输入时,若当前层为解码层,则获取与当前解码层相应的编码层所输出的特征图,并将获取的特征图与当前解码层输出的特征图融合后输入下一层;获取图像生成模型中末层输出的特征图,得到去噪声图像。

在一个实施例中,按照增大第一鉴别置信度和第二鉴别置信度间差异的调整方式,调整鉴别模型和图像生成模型,包括:按照最大化第一鉴别置信度的调整方式,调整鉴别模型;按照最小化第二鉴别置信度的调整方式,调整鉴别模型和图像生成模型。

在一个实施例中,按照最大化第一鉴别置信度的调整方式,调整鉴别模型,包括:按照鉴别模型所包括的层的次序,逆序确定第一鉴别置信度随各层所对应的模型参数的变化率;按逆序调整鉴别模型所包括的层所对应的模型参数,使得第一鉴别置信度随相应调整的层所对应的模型参数的变化率增大。

在一个实施例中,按照最小化第二鉴别置信度的调整方式,调整鉴别模型和图像生成模型,包括:依次按照图像生成模型和鉴别模型所包括的层的次序,逆序确定第二鉴别置信度随各层所对应的模型参数的变化率;按逆序,调整鉴别模型和图像生成模型所包括的层所对应的模型参数,使得第二鉴别置信度随相应调整的层所对应的模型参数的变化率减小。

上述计算机设备,包括图像生成模型和鉴别模型两个模型的训练。其中,训练图像生成模型的过程在于学习生成带噪声图像的去噪声图像,训练鉴别模型的过程在于学习在给定带噪声图像的条件下,学习判断输入的另一图像是原始图像还是通过图像生成模型生成的去噪声图像。这样图像生成模型学习生成与原始图像更相似的图像,以干扰鉴别模型的判断,鉴别模型学习更加精准地进行原始图像和去噪声图像的判断,两个模型相互对抗,相互促进,使得训练得到的模型性能更优,从而在使用训练得到的图像生成模型进行图像去噪时,能够极大程度上克服图像失真的问题。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,所述存储器中储存有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:获取与用户标识对应的人脸图像帧;从与用户标识对应的身份证件中,获取带网纹人脸证件图像;通过上述模型训练方法训练得到的图像生成模型,生成带网纹人脸证件图像的去网纹人脸证件图像;将人脸图像帧和去网纹人脸证件图像对比,得到身份验证结果。

上述计算机设备,在需要进行用户身份验证时,采集与用户标识对应的人脸图像帧,再从与该用户标识对应的身份证件中,读取带网纹人脸证件图像,然后通过按照图像生成模型与鉴别模型相互对抗、相互促进的方式训练得到的图像生成模型,生成去噪效果好且不失真的去网纹人脸证件图像,再将采集的人脸图像帧和生成的去网纹人脸证件图像对比,即可得到身份验证结果,极大地提高了身份验证的准确性。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-onlymemory,rom)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1