《表1 ResNet-50结构》

《表1 ResNet-50结构》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种鲁棒的离线笔迹鉴别方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

深度残差神经网络(ResNet)由He等[33]提出,他们将网络引入残差学习单元保护了输入信息的完整性,使得随着网络的加深模型不会出现退化的现象,而是进一步提升学习能力.他们在ILSVRC和COCO2015比赛中的目标定位、分割、识别、探测任务中均取得第一名的优异成绩.随后,他们进一步探索深度残差神经网络的学习能力,并通过实验表明残差神经网络是当前特征学习能力最强的网络模型[34].Christlein等[24]也通过实验表明残差神经网络在笔迹鉴别任务中比其他网络具有更强的表征能力.为此,在此模型中采用ResNet学习局部特征.为了平衡时间复杂度、资源消耗与学习效率,我们使用ResNet-50这个模型框架.由于笔迹识别任务的特殊性,将ResNet-50做了相应的优化和改进,其结构组成如表1所示.为了获取更具全局性与鲁棒性的局部特征,我们将原始的平均池化层改为全局池化层.此外,由于训练集相对较小与网络较深的原因,我们在全连接层后面添加了relu激活特征层与dropout层,并将dropout率设置为0.5,以增强模型的正则化,防止过拟合.在笔迹检索任务中,学习率初始设置为0.1,并在训练30步后将其降为0.01;在笔迹识别任务中,学习率初始设置为0.1,训练20步之后将其缩小为0.02,在训练30步之后,进一步将其缩小为0.01.模型的输入图像大小为224×224,梯度下降的动量因子设置为0.9,softmax层的大小设置应根据任务(笔迹识别、笔迹检索)与数据集而定.我们在ICDAR2013数据集上做笔迹检索任务时,将其大小设置为100;而在CVL数据集上做笔迹识别任务时,我们将其大小设置为310.