《表2 Kinetics视频数据集从头训练》
实验一的结果如表2所示,我们使用了Kinetics数据集中的训练集提供的240000个短视频,然后利用OpenPose提取到骨架序列,进行训练图卷积神经网络,然后在20000个验证集的骨架序列上进行了评估。观察实验结果,发现准确度并不高,远远低于常见的基于RGB或者光流模态的方法,例如i3D[5]。分析原因,本文认为这是由于Kinetics包含大量的类别都需要去识别与人体交互的物体和场景,例如打篮球这个动作,需要有篮球这个物体,例如踢足球,需要有足球场这个场景。而基于骨架的行为识别,能够对场景和物体本身不敏感,对动作本身有较好的区分度。
图表编号 | XD00139865000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.15 |
作者 | 董安、左劼、孙频捷 |
绘制单位 | 四川大学计算机学院、四川大学计算机学院、上海政法学院 |
更多格式 | 高清、无水印(增值服务) |