《表1 STPP层不同池化水平下的动作识别准确率比较》

《表1 STPP层不同池化水平下的动作识别准确率比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于改进的深度神经网络的人体动作识别模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在Linux系统搭建的Tensor Flow平台下进行实验。深度神经网络容易陷入过拟合现象,因此本文将模型中空间流和时间流dropout层的丢失率分别设置为0.7和0.8。空间域初始的学习率设置为10-3,在迭代15 000次后设置为10-4,在迭代30 000次后停止训练。时间域初始的学习率设置为3×10-3,在迭代第20 000次后每20 000次学习率缩小为原来的1/10,最大迭代次数为80 000次。通过本文模型的第一模块分别提取视频序列的运动特征和外观特征。考虑到STPP层不同池化水平对动作识别任务有不同的影响,设计了不同池化水平的对比实验,该实验结果来源于仅对第一模块的双流三维卷积神经网络进行训练及测试的动作识别准确率。本文考虑STPP两种池化水平:{2×2×1,1×1×1}和{4×4×1,2×2×1,1×1×1},分别描述为STPP-1和STPP-2,然后在UCF101数据集第一分割视频序列(split1)上进行实验。由表1可知,当STPP池化水平为{4×4×1,2×2×1,1×1×1}时,动作识别准确率均优于STPP-1和最大池化,因此在后续实验中,STPP的池化水平都设置为此标准。由表1还可以看出,相同网络结构下时间域的识别率高于空间域的识别率,这说明运动信息比外观信息更能表达人体动作信息。