《表1:各种基于预训练模型的视觉追踪方法》
由于视觉跟踪涉及到视频帧的空间和动态信息,因此采用基于RNN[14]的方法来模拟目标的运动。由于训练需要大量的参数导致训练过程较为复杂,因此基于神经网络的方法数量有限。此外,使用基于RNN方法的目的是避免对预先训练好的CNN模型进行微调,因为微调已经训练好的模型需要花费大量时间,而且容易出现过拟合的问题。基于RNN的方法的主要步骤是,首先利用金字塔型多向递归网络或长短期记忆网络(LSTM)合并到不同的网络中,然后确定目标并研究前后目标物的时间依赖关系。最后,对目标的自结构进行编码,以降低与相似干扰物相关的跟踪灵敏度。RNN网络基本结构如图4所示。
图表编号 | XD00130752600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 赵奇慧、刘艳洋 |
绘制单位 | 智慧互通科技有限公司静态交通技术创新中心、智慧互通科技有限公司静态交通技术创新中心 |
更多格式 | 高清、无水印(增值服务) |