《表3 当前主流检测框架与GaB R-CNN在学生测试图片集上的平均精确度》
对于教室内学生行为的检测,包括学生举手、起立回答、睡觉、扭头行为,在Mmdetection工具箱[20]中分别用当前主流检测器以及本论文改进后的GaB R-CNN对2600张学生场景照片进行训练,选用Res Net或ResNeXt[21]作为主干网络,除SSD512以外输入尺寸最大边长均缩放为1333,数据增强均包括随机缩放、左右翻转、裁剪,优化器(op)均使用带惯性动量的随机梯度下降(SGD),批大小(Batch_Size)设置为6,迭代次数(Epoch)为15;用400张照片对模型进行测试,采用COCO AP[16]作为评价标准,模型检测结果对比如表3(下页)所示,在使用ResNet101作为骨干网络时,融合后的GaB R-CNN相较于Faster R-CNN,AP提升了近10个百分点,达到76.5%,在使用表达能力更强的主干网络ResNeXt101时,AP值达到了78.1%。但实验发现相比于Libra R-CNN提升并不明显,均使用ResNet101的情况下提升仅有0.8%。
图表编号 | XD00207365500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 张冰雪、刘树潜、熊振海、侯龙锋 |
绘制单位 | 上海理工大学、上海理工大学、国防大学、上海理工大学 |
更多格式 | 高清、无水印(增值服务) |