《表2 全局判别器的网络层》

《表2 全局判别器的网络层》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于条件梯度Wasserstein生成对抗网络的图像识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由于是对每个batch中的每一个样本都做了梯度惩罚,因此判别器中不能用batchnormalization[11],但是可以使用其他的Normalization方法[12],比如Layer Normalization、InstanceNormalization。在本文的D网络,再训练G网络,并且每训练5次D网络,再训练1次G网络,目的就是为了保证D网络大致满足Wasserstein距离的条件。在WGAN网络模型中训练网络并不建议用Adam优化器,但是在本文的网络模型中因为使用了WGAN-GP的训练方式,所以还是可以用Adam优化器,且参数设定为:β1=0.000 5,β2=0.9,并且本文采用了适应性更强的根据训练次数可变的学习率,学习率初始化为0.002,当训练的迭代次数epoch大于设定的训练次数的一半时,学习率变为原来的十分之一,当训练的迭代次数epoch大于设定的训练次数的五分之四时,学习率再变为上一次的十分之一。可变化的学习率可以让参数调整变得更加有效。