《表1 Person网络Tab.1 Person network》

《表1 Person网络Tab.1 Person network》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于级联网络的行人检测方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

Person网络是一个具有目标分类和位置回归两种功能的网络,采用4个卷积层、3个Max-pooling层、1个全连接(Full Connection,FC)层如表1。全连接层包含2个分支:一个用于Softmax分类,另一个用于边界框回归。Person网络的输入是像素为30×90的行人样本图,行人的检测框都是高比宽长的矩形框且宽高比接近1∶3,因此选取的卷积核宽高比也为1∶3,采用两个2×6、两个1×3的卷积核。非线性激活层采用PRe LU(Parametric Rectified Linear Unit)[13],提高网络收敛速度。参考全卷积网络(Fully Convolutional Network,FCN)分割网络思想,采用了不同卷积层之间的特征融合,将Conv3、Conv4的特征通过双线性插值算法重设为相同大小并进行拼接,这种不同层之间的特征融合可以提高网络的检测性能。例如,原始行人像素为30×90,经过3次池化,行人像素值变为3×6。检测这种3×6的图像发现其效果不佳,而采用不同层的特征拼接且联合了不同层的语义特征,网络对于不同大小的行人具有很高的检测能力,因此最终网络结构添加了两个上采样层以及一个用于降维的卷积层。网络结构示意图如图2所示。YOLOv2预测出的行人框,输出结果作为级联网络的最终预测框。