《表3 当前主流检测框架与GaB R-CNN在学生测试图片集上的平均精确度》

《表3 当前主流检测框架与GaB R-CNN在学生测试图片集上的平均精确度》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于指导锚框平衡检测模型的录播课堂行为分析研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对于教室内学生行为的检测,包括学生举手、起立回答、睡觉、扭头行为,在Mmdetection工具箱[20]中分别用当前主流检测器以及本论文改进后的GaB R-CNN对2600张学生场景照片进行训练,选用Res Net或ResNeXt[21]作为主干网络,除SSD512以外输入尺寸最大边长均缩放为1333,数据增强均包括随机缩放、左右翻转、裁剪,优化器(op)均使用带惯性动量的随机梯度下降(SGD),批大小(Batch_Size)设置为6,迭代次数(Epoch)为15;用400张照片对模型进行测试,采用COCO AP[16]作为评价标准,模型检测结果对比如表3(下页)所示,在使用ResNet101作为骨干网络时,融合后的GaB R-CNN相较于Faster R-CNN,AP提升了近10个百分点,达到76.5%,在使用表达能力更强的主干网络ResNeXt101时,AP值达到了78.1%。但实验发现相比于Libra R-CNN提升并不明显,均使用ResNet101的情况下提升仅有0.8%。