《表1 ResNet-50网络参数表》

《表1 ResNet-50网络参数表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于改进R-FCN的多遮挡行人实时检测算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
(Comp*表示模型的复杂度,K表示卷积内核大小)

针对R-FCN中位置敏感池化层输出的高维数的分数图,本文使用了可分离卷积,使用少的通道数量提取特征图,将R-FCN的位置敏感分数图变“薄”,减少位置敏感分数图的维数,加快R-FCN的检测速度。选择Res Net-50作为基础网络,提取特征图。图1中“Conv layers”表示Res Net-50的结构,网络参数如表1所示。由于R-FCN的conv5_x的2048维输出接一个1024维(用p×p×(c+1)表示)的1×1的过滤器去卷积生成位置敏感分数图(p表示池化核大小,c表示类别),因此本文将可分离卷积设置在conv5_x层,工作流程如图3所示。本文设置可分离卷积核的大小K=15,代替1×1卷积,相比于R-FCN中K=7,可以获取152/72=4.6倍的特征图感受野。为了减少位置敏感分数图的计算量,本文使用1×15和15×1代替15×15的卷积核操作,其中输入通道数Cin=2048,Cmid=256。由于只有行人和背景两类检测目标,所以Cout为2×p2=98,其中p表示池化大小为7,最后进行总和输出。本文输入大小为w×h×2048特征图,输出为w×h×98的特征图。根据模型参数量计算公式可得: