《表1 Person网络Tab.1 Person network》
Person网络是一个具有目标分类和位置回归两种功能的网络,采用4个卷积层、3个Max-pooling层、1个全连接(Full Connection,FC)层如表1。全连接层包含2个分支:一个用于Softmax分类,另一个用于边界框回归。Person网络的输入是像素为30×90的行人样本图,行人的检测框都是高比宽长的矩形框且宽高比接近1∶3,因此选取的卷积核宽高比也为1∶3,采用两个2×6、两个1×3的卷积核。非线性激活层采用PRe LU(Parametric Rectified Linear Unit)[13],提高网络收敛速度。参考全卷积网络(Fully Convolutional Network,FCN)分割网络思想,采用了不同卷积层之间的特征融合,将Conv3、Conv4的特征通过双线性插值算法重设为相同大小并进行拼接,这种不同层之间的特征融合可以提高网络的检测性能。例如,原始行人像素为30×90,经过3次池化,行人像素值变为3×6。检测这种3×6的图像发现其效果不佳,而采用不同层的特征拼接且联合了不同层的语义特征,网络对于不同大小的行人具有很高的检测能力,因此最终网络结构添加了两个上采样层以及一个用于降维的卷积层。网络结构示意图如图2所示。YOLOv2预测出的行人框,输出结果作为级联网络的最终预测框。
图表编号 | XD0035549000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.10 |
作者 | 陈光喜、王佳鑫、黄勇、詹益俊、詹宝莹 |
绘制单位 | 广西图像图形智能处理重点实验室(桂林电子科技大学)、广西图像图形智能处理重点实验室(桂林电子科技大学)、广东省数学教育软件工程技术研究中心(广州大学)、广西图像图形智能处理重点实验室(桂林电子科技大学)、广西图像图形智能处理重点实验室(桂林电子科技大学) |
更多格式 | 高清、无水印(增值服务) |