《表1 不同模型在HollywoodHeads上的mAP及测试速度》
本文方法对比了基于R-CNN[12]的目标检测器、基于可形变零件模型(DPM)[13]的面检测器(DPM Face)、文献[10]中提出的结合上下文信息的Local-RCNN、基于Zeiler-Fergus网络(ZF)与VGG16的Faster-RCNN。R-CNN使用HollywoodHeads数据集的训练子集训练人头上的R-CNN目标检测器。受内存限制,R-CNN训练的SVM阶段是在一组训练图像上完成。对基于DPM的面部检测器,使用香草DPM模型。FasterRCNN的预训练模型使用ImageNet的VGG16和ZF的Caffe模型。在Faster-RCNN上同时对比了增加锚点框与软非极大值抑制操作后对检测结果的影响,R-FCN使用本文优化后的模型,同样采取了迁移学习的方法,使用Caffe Zoo提供的ResNet-50与ResNet-101。主要对比本文方法中增强多尺度目标学习的锚点框(Anchor)、降低边界框相互间影响的S-NMS、增强目标表征的可形变卷积、可形变位置敏感感兴趣区域池化以及位置敏感感兴趣区域对齐在HollywoodHeads数据集的表现,不同模型的mAP与测试速度如表1所示。
图表编号 | XD0066610100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.25 |
作者 | 吉训生、王昊 |
绘制单位 | 江南大学物联网工程学院、江南大学物联网工程学院 |
更多格式 | 高清、无水印(增值服务) |