《表3 采用级联网络的结果Tab.3 Detection results by using cascading networks with different thresholds》
以开源框架Caffe为基础,将从YOLOv2网络得到的坐标作为输入值,输入Person网络进行分类与边界框回归,输入固定尺寸width×height为30×90。当冲量为0.9,权值衰减为0.004,初始学习率为0.001,学习率下降策略为step,且当迭代训练达到1 000 000次时,模型达到饱和。训练时样本是从原始真实行人框上随机截取的,按截取的图片与真实行人框的IOU,将截取的图片分为正样本、部分样本和负样本。负样本是IOU<0.5的样本,正样本是IOU>0.8的样本,其他样本为部分样本,正样本、部分样本、负样本比例为1∶1∶3。实验结果如表3所示,threshold:0.24、0.1、0.01是YOLOv2检测行人的阈值。对比表2与表3可知,使用级联方法可以得到比YOLOv2更高的召回率、准确率,以及定位的准确性更为精准。表4展示卷积核不同宽高比下的Person网络效果,从中可以得出选取为1∶3的卷积核时,F值最高,且检测效果最为突出。
图表编号 | XD0035549300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.10 |
作者 | 陈光喜、王佳鑫、黄勇、詹益俊、詹宝莹 |
绘制单位 | 广西图像图形智能处理重点实验室(桂林电子科技大学)、广西图像图形智能处理重点实验室(桂林电子科技大学)、广东省数学教育软件工程技术研究中心(广州大学)、广西图像图形智能处理重点实验室(桂林电子科技大学)、广西图像图形智能处理重点实验室(桂林电子科技大学) |
更多格式 | 高清、无水印(增值服务) |