《表3 循环神经网络模型在Mars和i LIDS-VID数据上的结果》
%
(3)循环神经网络。RNN选取LSTM作为基本单元,每个时刻送入一帧行人图像特征,并将LSTM每个时刻的输出特征保存,最后把LSTM输出的所有特征进行平均作为最终的视频特征表达。测试了LSTM隐状态个数分别为512、1 024、2 048三种情况,当隐藏状态个数为512时,模型性能最好,因此该参数取为512;学习率设置为0.000 1。表3给出了循环神经网络模型在不同帧长下的实验效果。与表1中的基准算法相比,加入循环神经网络模型后的效果有所下降,这表明RNN在捕获序列时域信息方面没有效果,或者在Mars和i LIDS-VID数据集上训练RNN网络效果不佳。如文献[15]所分析,RNN之所以在文献[6]中能够改善算法性能,其原因可能是文献[6]中采用的是浅层CNN特征,而其后的RNN时域模型的效果更多体现为特征提取的补充。而本文使用在Imagenet上预训练好的Resnet50网络提取特征,其已具有一定程度的鲁棒性。故RNN可能不能对其此特征再进行表达方面的学习而只是进行简单的行人分类,因此导致模型效果不佳甚至略有下降。
图表编号 | XD00222622100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.15 |
作者 | 项俊、林染染、黄子源、侯建华 |
绘制单位 | 中南民族大学电子信息工程学院、中南民族大学电子信息工程学院、中南民族大学电子信息工程学院、中南民族大学电子信息工程学院 |
更多格式 | 高清、无水印(增值服务) |