《表1 模型参数:基于参数共享的卷积神经网络压缩》
本文进行实验的网络为数字手写体识别网络,网络模型由caffe社区提供(1),具体结构如图7所示,该网络有两个卷积层、两个池化层、两个全连接层,其中第一个全连接层的激活函数为relu。模型权重参数如表1所示,该网络可学习参数的总量为431080,其中全连接层可学习参数的总量为405510,卷积层可学习参数的总量为25570。文中若无特别说明,训练网络模型所用超参数均为caffe社区提供的默认值:lr=0.01,momentum=0.9,weight_decay=0.0005,batch_size=64。所用数据集为Mixed National Institute of Standards and Technology database(MNIST),其中训练集60000张,测试集10000张。本文实验结果中所提到的网络的误差曲线为训练集的误差随训练次数的关系,误差曲线中纵坐标的第一个值为模型第一次训练时,训练集的误差,随后的纵坐标的值为模型每训练100次,训练集误差的平均值。网络的准确率曲线为测试集的准确率随训练次数的关系,准确率曲线中纵坐标的第一个值为模型第一次训练时,测试集的准确率,随后的纵坐标的值为模型每训练500次,测试集的准确率。
图表编号 | XD00124636100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.01 |
作者 | 舒红乔、洪缨、刘岩 |
绘制单位 | 中国科学院声学研究所水下航行器信息技术重点实验室、中国科学院大学、中国科学院声学研究所水下航行器信息技术重点实验室、中国科学院声学研究所水下航行器信息技术重点实验室 |
更多格式 | 高清、无水印(增值服务) |