《表1 2500次后各种准确率出现的概率》

《表1 2500次后各种准确率出现的概率》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于CNN优化的手写数字识别技术研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在数据训练过程中,常见的随机梯度下降算法效果不是很好,参数调整影响效果很大。根据得到的cost函数,通过GradientDescentOptimizer优化器更新权重W和偏置b变量,但是数据本身的scale如果差异很大,那么造成W的差异很大。而AdamOptimizer优化器则可以消除这种现象,引用Adam方法的同时就是引入Momentum和RMSProp,Momentum可以抵消震动的幅度,RMSProp可以使用较大的学习率加快速度。表1为两种算法执行2500次后训练过程的对比(每百次训练打印一次)。