《表1 在Activity Net v1.3数据集上的时域区域生成性能对比》

《表1 在Activity Net v1.3数据集上的时域区域生成性能对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《时域候选优化的时序动作检测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:加粗字体表示最优结果,“—”表示无法获取数据。

将本文方法与SSN(structured segment network)(Zhao等,2017)、TCN(temporal context network)(Dai等,2017)、Prop-SSAD(single shot action detector for proposal)(Lin等,2017)、CTAP(complementary temporal action proposal)(Gao等,2018)和BSN(boundary sensitive network)(Lin等,2018)等方法在ActivityNet v1.3数据集上进行时域区域生成性能对比实验,结果如表1所示。可以看出,本文方法在评价指标AR@100和AUC中均优于其他方法。与其他方法中效果最好的BSN相比,本文方法将AR@100提高了0.5,将AUC指标从66.17提高到66.32。虽然其他方法同样采用双流网络提取视频特征,但本文方法表现更好,因为其他方法只利用了卷积层,有限的感受野使得模型一次只能注意到视频中的一小段区域,丢失了视频的全局时序信息及候选的上下文信息。而在本文方法中,LAEM模块基于CNN,强调时序信息的局部特征响应,并利用局部信息预测候选区域的边界概率和动作概率;GAEM模块基于BLSTM,利用前后回顾的记忆单元处理长视频中的时序关联性,捕捉视频的全局信息并准确预测候选区域的动作概率。基于这两个模块对局部信息和全局信息的整合,本文方法得以结合概率曲线得到具有更准确、更灵活的动作时序边界的候选区域,可以覆盖视频中多种长度间隔的动作检测。