《表1 Person网络Tab.1 Person network》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于级联网络的行人检测方法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

Person网络是一个具有目标分类和位置回归两种功能的网络，采用4个卷积层、3个Max-pooling层、1个全连接（Full Connection，FC）层如表1。全连接层包含2个分支:一个用于Softmax分类，另一个用于边界框回归。Person网络的输入是像素为30×90的行人样本图，行人的检测框都是高比宽长的矩形框且宽高比接近1∶3，因此选取的卷积核宽高比也为1∶3，采用两个2×6、两个1×3的卷积核。非线性激活层采用PRe LU（Parametric Rectified Linear Unit）[13]，提高网络收敛速度。参考全卷积网络（Fully Convolutional Network，FCN）分割网络思想，采用了不同卷积层之间的特征融合，将Conv3、Conv4的特征通过双线性插值算法重设为相同大小并进行拼接，这种不同层之间的特征融合可以提高网络的检测性能。例如，原始行人像素为30×90，经过3次池化，行人像素值变为3×6。检测这种3×6的图像发现其效果不佳，而采用不同层的特征拼接且联合了不同层的语义特征，网络对于不同大小的行人具有很高的检测能力，因此最终网络结构添加了两个上采样层以及一个用于降维的卷积层。网络结构示意图如图2所示。YOLOv2预测出的行人框，输出结果作为级联网络的最终预测框。

图表编号	XD0035549000 严禁用于非法目的
绘制时间	2019.01.10
作者	陈光喜、王佳鑫、黄勇、詹益俊、詹宝莹
绘制单位	广西图像图形智能处理重点实验室(桂林电子科技大学)、广西图像图形智能处理重点实验室(桂林电子科技大学)、广东省数学教育软件工程技术研究中心(广州大学)、广西图像图形智能处理重点实验室(桂林电子科技大学)、广西图像图形智能处理重点实验室(桂林电子科技大学)
更多格式	高清、无水印（增值服务）