《表1 模型参数:基于参数共享的卷积神经网络压缩》

《表1 模型参数:基于参数共享的卷积神经网络压缩》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于参数共享的卷积神经网络压缩》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文进行实验的网络为数字手写体识别网络,网络模型由caffe社区提供(1),具体结构如图7所示,该网络有两个卷积层、两个池化层、两个全连接层,其中第一个全连接层的激活函数为relu。模型权重参数如表1所示,该网络可学习参数的总量为431080,其中全连接层可学习参数的总量为405510,卷积层可学习参数的总量为25570。文中若无特别说明,训练网络模型所用超参数均为caffe社区提供的默认值:lr=0.01,momentum=0.9,weight_decay=0.0005,batch_size=64。所用数据集为Mixed National Institute of Standards and Technology database(MNIST),其中训练集60000张,测试集10000张。本文实验结果中所提到的网络的误差曲线为训练集的误差随训练次数的关系,误差曲线中纵坐标的第一个值为模型第一次训练时,训练集的误差,随后的纵坐标的值为模型每训练100次,训练集误差的平均值。网络的准确率曲线为测试集的准确率随训练次数的关系,准确率曲线中纵坐标的第一个值为模型第一次训练时,测试集的准确率,随后的纵坐标的值为模型每训练500次,测试集的准确率。