《表4 单独角度和多角度的驾驶人员行为识别精度》
使用Kinetics上预训练的参数在多角度驾驶人员数据集上进行微调,在不同模型中,仍然是R(2+1)D模型表现最好。在加深网络层数的基础上,设置32帧为一剪辑输入。这是当前环境下(单个1 080 GPU)的极限,可以达到87%的精度。虽然精度随着层数的增加而增加,但模型复杂度也随着层数的增加而变大,计算代价也随着帧数的增多而变大。在考虑到上述问题后,将R(2+1)D模型最终的层数定为34层,输入为32×112×112。如表4所示,多角度的识别率可达到87.00%。显著优于单独视角下的实验结果。
图表编号 | XD00146080100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 赵维、沈柏杉、张宇、孔俊 |
绘制单位 | 吉林警察学院信息工程系、东北师范大学信息科学与技术学院、东北师范大学信息科学与技术学院、东北师范大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |