《表1 锚框尺寸选择方案:基于Faster RCNN的行人及车辆类型检测》
由于车辆类型和人的检测受建筑物和树木遮挡等的影响,导致车辆和人的显示尺寸差异比较大,其长宽比也是复杂多样。原始的Faster RCNN模型包含9种锚框,其长宽比分别为0.5,1,2,尺寸分别为8,16,32。如果按照原始Faster RCNN模型的锚框方案,输入图像在经过池化后,特征图中的各点对应的感受野尺寸为16×16。使用最小尺度映射的锚框尺寸都达到128,而实际中存在一些距离较远的行人以及车辆,进而其占有的尺寸也比较小,由于这些较小尺寸的目标在测试时可能会出现一定的定位偏差,进而造成检测错误,准确率也会随之降低。因此,根据人和车辆尺寸差异比较大、长宽比更加复杂多样的特点,即可调整原始Faster RCNN模型中的RPN网络的锚框尺寸。调整后锚框的种类保持不变,只是将锚框尺寸改成4,8,16,有助于增强对距离远的行人以及车辆的检测。测试结果表明,经过调整后的锚框尺寸可以使得检测准确率提高。锚框尺寸对比见表1。
图表编号 | XD00149946000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.01 |
作者 | 邵丽萍、魏相站、李春红、唐志英、白忠臣、张正平 |
绘制单位 | 贵州大学大数据与信息工程学院、贵州大学大数据与信息工程学院、贵州大学大数据与信息工程学院、贵州大学贵州省光电子技术及应用重点实验室、贵州大学贵州省光电子技术及应用重点实验室、贵州大学大数据与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |