一种多判别器误差反传的对抗网络方法与流程

文档序号:13393267阅读:812来源:国知局

本发明涉及深度学习神经网络技术领域,具体涉及一种多判别器误差反传的对抗网络方法。



背景技术:

生成式对抗网络(generativeadversarialnetwork,简称gan)是由goodfellow在2014年提出的框架,它基于“博奕论”的思想,构造生成器(generator)和判别器(discriminator)两种模型,前者通过输入(0,1)的均匀噪声或高斯随机噪声生成图像,后者对输入的图像进行判别,确定是来自数据集的图像还是由生成器产生的图像。判别器每完成一次判断,将结果误差返回给生成器。

然而,原始的gan模型中,判别器的数量只有一个,这就意味着,生成器生成图像真假与否的判决,只取决于这一个判别器。这种情况下所产生的结果是,如果判别器对生成器生成图像的判断有所偏差,则会影响整个网络训练的精确度和速度。



技术实现要素:

本发明的目的是为了解决现有技术中的上述缺陷,构建了一种多判别器误差反传的对抗网络方法,该对抗网络方法能够通过多个判别器共同判断的角度,对整个网络的训练提供更多的可靠性。它改变了以往判别生成图像只通过一个判别器做出决定的局面,创造性地提出了多个判别器协同工作的网络训练算法,能够避免原有gan模型对生成图像判断的单一性,能够从更加客观的角度去评判生成器的生成图像,从而使整个网络的训练更加稳定。

本发明的目的可以通过采取如下技术方案达到:

一种多判别器误差反传的对抗网络方法,所述动态调整算法包括下列步骤:

s1、构造生成对抗网络gan模型,模型包含生成器和判别器;

s2、在现有gan模型的基础上构造多个判别器;

s3、准备好数据集对改进之后的多判别器网络进行训练;

s4、在每次训练的过程中,记录所有判别器的损失函数;

s5、计算所有判别器损失函数的平均值,返回至生成器进行后续的网络训练。

进一步地,所述的步骤s2具体如下:

在原有gan模型的基础上,复制多个判别器,分别同时接收来自生成器的生成图像和来自数据集的真实图像。

进一步地,所述的步骤s3中准备好数据集对改进之后的多判别器网络进行训练,过程如下:

s31、根据判别器的数量,选定数据集中的同等数量的真实图像;

s32、将互不相同的来自数据集中的真实图像,输入判别器中进行训练。

进一步地,所述的步骤s4中在每次训练的过程中,记录所有判别器的损失函数,过程如下:

s41、将数据集中的图像输入判别器中进行训练;

s42、记录每一个判别器在每次迭代之后的损失函数。

进一步地,所述的步骤s5中,计算所有判别器损失函数的平均值,返回至生成器进行后续的网络训练,过程如下:

s51、计算所有判别器在每次迭代之后的损失函数之和;

s52、根据判别器数量的大小,对求和之后的损失函数求平均操作;

s53、将求平均之后的损失函数返回至生成器中继续进行网络训练。

本发明相对于现有技术具有如下的优点及效果:

1.客观性:本发明在原始gan模型的基础之上,提出了多个判别器同时接收生成器生成图像的结构,从多个不同的角度对生成图像进行判决,增强了网络训练的客观性;

2.稳定性:本发明所构建的多判别器误差反传的对抗网络算法,能够从多个判别器的角度对生成图像进行判断,相对于原始模型的损失函数,本发明提出的均值损失函数能够根据多个判别器的结构对生成图像进行修正,更具有可行性,从而使整个网络的训练更加稳定。

附图说明

图1是多判别器误差反传的网络结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例

本实施例公开了一种多判别器误差反传的对抗网络方法,具体包括下列步骤:

步骤s1、构造生成对抗网络gan模型,模型包含生成器和判别器;

步骤s2、在现有gan模型的基础上构造多个判别器;

步骤s3、准备好数据集对改进之后的多判别器网络进行训练。

根据判别器的数量,选定数据集中的同等数量的真实图像,将互不相同的来自数据集中的真实图像,输入判别器中进行训练。这样的训练方法产生的结果是,不同的判别器由于接收了数据集中的不同真实图像,在经过训练之后,每个判别器的参数权重也是不同的。利用多个不同参数权重的判别器对生成图像进行判断,角度更加客观,网络的训练也更加稳定。

步骤s4、在每次训练的过程中,记录所有判别器的损失函数。

具体方法如下:

s41、将数据集中的图像输入判别器中进行训练;

s42、记录每一个判别器在每次迭代之后的损失函数。

接下来,介绍损失函数的意义及具体表达形式。

在统计学,统计决策理论和经济学中,损失函数是指一种将一个事件(在一个样本空间中的一个元素)映射到一个表达与其事件相关的经济成本或机会成本的实数上的一种函数。更通俗地说,在统计学中损失函数是一种衡量损失和错误(这种损失与“错误地”估计有关,如费用或者设备的损失)程度的函数。因此,在本专利中,损失函数的作用是衡量判别器对生成图像判断的能力。损失函数的值越小,说明在当前迭代中,判别器能够有较好的性能辨别生成器的生成图像;反之则说明判别器的性能较差。

损失函数的表达式为:

其中,d(x)表示判别器对图像的判别,pr表示数据集图像的分布,pg表示生成图像的分布,λ为超参数,为梯度。

步骤s5、计算所有判别器损失函数的平均值,返回至生成器进行后续的网络训练。具体如下:

s51、计算所有判别器在每次迭代之后的损失函数之和;

s52、根据判别器数量的大小,对求和之后的损失函数求平均操作;

s53、将求平均之后的损失函数返回至生成器中继续进行网络训练。

在传统的对抗网络模型中,只有一个生成器和一个判别器,即只存在一个损失函数。在这种情况下,判别器给出的辨别结果不能够客观地反映对抗网络的性能。若采用多个判别器,同时结合求损失函数平均值的方法,综合了多个判别器的判别结果,能够从更别客观的角度反映判别的结果,从而有利于整个对抗网络以更加快速的效率、更加准确的方向进行训练。

综上所述,本实施例公开了一种多判别器误差反传的对抗网络方法,提出了多个判别器协同工作的网络训练算法,能够避免原有gan模型对生成图像判断的单一性,能够从更加客观的角度去评判生成器的生成图像,从而使整个网络的训练更加稳定。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1