《表1 补充的网络结构:第一人称视角下的社会力优化多行人跟踪》

《表1 补充的网络结构:第一人称视角下的社会力优化多行人跟踪》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《第一人称视角下的社会力优化多行人跟踪》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:“-”代表无数据。

表观特征用来计算行人图像框之间的相似度。通常情况下,相同行人的图像框相似度较大,不同行人的图像框相似度较小。但是由于传统的尺度不变特征变换(scale-invariant feature transform,SIFT)和方向梯度直方图(histogram of oriented gradient,HOG)等特征对第一人称视角下的行人表征能力不够,且需要大量的先验知识,计算量较大。因此,本文基于3.1节所得的行人检测结果,通过在大规模行人重识别(person re-identification,ReID)数据集的预训练网络(Wojke等,2017)中加入2个卷积层、1个最大池化层和6个剩余模块,构建一个宽度剩余网络,用于提取行人目标框的表观特征,表1为额外补充的网络结构。