《表1 本文动作识别算法和其他算法m AP(%)对比》
本文实验评估了在THUMOS'14数据集上重叠Io U阈值在0.3~0.7之间变化时的m AP。如表1所示,CDC获得的结果要好于所有其他先进方法的结果。与建议的CDC模型相比:用FV编码i DTF的系统[18]不能直接从原始视频中学习时空模式来进行预测。基于RNN/LSTM的方法(Yeung等[19],Yuan等[20])无法在时间依赖性之外明确捕获运动信息。S-CNN可以有效地捕捉原始视频的时空模型,比其他3种方法的m AP得到了明显的提高,但是仅在段级粒度上进行时序动作定位,缺乏调整候选建议边界的能力。CDC网络通过反卷积操作恢复时间维度上的长度,可以超出段级水平预测确定细粒度的置信度分数,在帧级粒度上进行时序动作定位的检测,因此可以精确定位时间边界。比S-CNN方法在各个阈值上的的m AP提高了0.7%~4.4%。
图表编号 | XD00220053400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.01 |
作者 | 王倩、范冬艳 |
绘制单位 | 上海工程技术大学电子电气工程学院、上海工程技术大学电子电气工程学院 |
更多格式 | 高清、无水印(增值服务) |