本发明适用于机器视觉,尤其涉及一种生成对抗网络的训练分析方法。
背景技术:
1、生成对抗网络(generative adversarial network,gan)是在无监督的情况下学习复杂和结构化数据的生成模型最广泛使用的方法。事实上,gan在图像生成、语音生成、文本生成等众多领域都取得了令人难以置信的经验成功。以这种方式训练的模型在下游应用中也变得至关重要,在gan方法中,生成器被训练为输出目标数据集的样本,被称之为真实样本,鉴别器的鉴别模型被训练来区分真实的和生成的样本,生成器被并行训练以欺骗鉴别器。但是正确地调整鉴别器和生成器的联合训练是gan的关键挑战之一。
2、为了解决这一问题,研究人员通过精细的超参数优化和启发式的组合来解决这一问题,但是缺少分析和优化gan训练的理论依据。
3、因此亟需一种新的生成对抗网络的训练分析方法来解决上述问题。
技术实现思路
1、本发明提供一种生成对抗网络的训练分析方法,旨在解决调整生成对抗网络中鉴别器和生成器的联合训练的困难问题。
2、所述训练分析方法包括以下步骤:
3、s1、建立孤立点模型,并定义真实样本分布、生成样本分布、核鉴别器、所述核鉴别器的更新方式、生成器的更新方式以及孤立点;
4、s2、通过所述孤立点模型对所述真实样本分布中的真实点附近的行为进行分析,判断生成对抗网络训练过程中的局部是否稳定;
5、s3、通过所述孤立点模型对所述生成对抗网络训练过程中错误的局部极小值和近似模式崩溃进行分析;
6、s4、通过所述孤立点模型分析与所述真实点隔离的生成点会发生的情况;
7、s5、通过所述孤立点模型分析核宽度在所述生成对抗网络的训练中的作用。
8、优选的,所述真实样本分布的计算公式如下:
9、
10、其中,pr表示,nr表示所述真实点的数量,表示所述真实点,pi所述真实点的概率。
11、优选的,所述生成样本分布的计算公式如下:
12、
13、其中,pg表示生成点,ng表示所述生成点的数量,表示所述生成点,pi所述生成点的概率。
14、优选的,所述核鉴别器的更新方式满足以下计算公式:
15、
16、其中,a(x)表示基函数向量,θ表示参数向量,ηd>0表示所述鉴别器的步长,正则化参数λ>0。
17、优选的,所述生成器的更新方式满足以下计算公式:
18、
19、其中,表示所述生成器的参数的更新表达式。
20、优选的,步骤s2中,通过所述真实点的孤立区域中对应的动态平衡点是否局部稳定判断生成对抗网络训练过程中的局部是否稳定。
21、优选的,所述动态平衡点的局部稳定根据所述真实点的孤立区域中的真实概率与所述孤立区域中所述生成点的总概率的质量差大小进行判断,所述质量差的计算公式如下:
22、
23、其中,δi表示第i个所述真实点对应的动态平衡点的质量差,pi表示真实概率;
24、当δi>0时,所述动态平衡点局部稳定;
25、当δi<0并且|ni|≥1时,所述动态平衡点局部不稳定;
26、当|ni|=1并且时,所述动态平衡点局部稳定;
27、当|ni|=1并且时,所述动态平衡点局部不稳定;式中,表示所述生成点的概率,μ表示比例系数,k1、k2、k3、k4表示权重系数,ni表示所述真实点的数量。
28、本发明的有益效果在于,通过建立孤立点模型,并定义真实样本分布、生成样本分布、核鉴别器、所述核鉴别器的更新方式、生成器的更新方式以及孤立点;通过所述孤立点模型对所述真实样本分布中的真实点附近的行为进行分析,判断生成对抗网络训练过程中的局部是否稳定;通过所述孤立点模型对所述生成对抗网络训练过程中错误的局部极小值和近似模式崩溃进行分析;通过所述孤立点模型分析与所述真实点隔离的生成点会发生的情况;通过所述孤立点模型分析核宽度在所述生成对抗网络的训练中的作用。通过孤立点模型可以解耦联合更新生成器和鉴别器的生成对抗网络中核的训练动态,分析其稳定的局部平衡和坏的局部极小值,分析出核宽度在生成对抗网络联合训练中的重要作用。
1.一种生成对抗网络的训练分析方法,其特征在于,所述训练分析方法包括以下步骤:
2.如权利要求1所述的生成对抗网络的训练分析方法,其特征在于,所述真实样本分布的计算公式如下:
3.如权利要求2所述的生成对抗网络的训练分析方法,其特征在于,所述生成样本分布的计算公式如下:
4.如权利要求3所述的生成对抗网络的训练分析方法,其特征在于,所述核鉴别器的更新方式满足以下计算公式:
5.如权利要求4所述的生成对抗网络的训练分析方法,其特征在于,所述生成器的更新方式满足以下计算公式:
6.如权利要求5所述的生成对抗网络的训练分析方法,其特征在于,步骤s2中,通过所述真实点的孤立区域中对应的动态平衡点是否局部稳定判断生成对抗网络训练过程中的局部是否稳定。
7.如权利要求6所述的生成对抗网络的训练分析方法,其特征在于,所述动态平衡点的局部稳定根据所述真实点的孤立区域中的真实概率与所述孤立区域中所述生成点的总概率的质量差大小进行判断,所述质量差的计算公式如下: