《表4 不同模型的网络参数量及时间轴输入大小对比》
本文的主要思想是在尽量不损失精度而且尽可能减少模型参数和计算量的情况下,构建轻量型的精度和轻度并举的人体动作识别模型。因此,本文对近年的经典人体动作识别模型进行了复现和实验,与本文方法作参数量的定量比较如表4所示。其中对于输入帧,本文通过保持每5帧中有1帧来自每秒25帧的原始流来进行子采样。这些模型与本文的识别准确率的对比实验结果如表5所示。在实验阶段,对每个对比模型均采用了两种预训练方式。Two-Stream模型是在2014年提出的,双流网络均是2D网络,因此该模型的参数量较少,约为12M;C3D模型是单流的3D模型,具有较深的网络结构;Two-Steam VGG模型是双流的VGG模型;Two-Stream I3D模型是双流I3D(two-stream inflated 3D Conv Net)融合模型。从表4的参数量对比和表5的实验结果可以直观地看出,本文在保持精度水平和目前前沿方法的动作识别准确率大致一致的前提下,模型的参数量明显少于其他方法的参数量。这一结果表明,本文提出的基于深度学习的轻量型人体动作识别模型能够有效地实现减少模型的参数量而不损失其精度。
图表编号 | XD00198029300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.05 |
作者 | 何冰倩、魏维、张斌 |
绘制单位 | 成都信息工程大学计算机学院、成都信息工程大学软件工程学院、成都信息工程大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |