《表1 补充的网络结构:第一人称视角下的社会力优化多行人跟踪》
注:“-”代表无数据。
表观特征用来计算行人图像框之间的相似度。通常情况下,相同行人的图像框相似度较大,不同行人的图像框相似度较小。但是由于传统的尺度不变特征变换(scale-invariant feature transform,SIFT)和方向梯度直方图(histogram of oriented gradient,HOG)等特征对第一人称视角下的行人表征能力不够,且需要大量的先验知识,计算量较大。因此,本文基于3.1节所得的行人检测结果,通过在大规模行人重识别(person re-identification,ReID)数据集的预训练网络(Wojke等,2017)中加入2个卷积层、1个最大池化层和6个剩余模块,构建一个宽度剩余网络,用于提取行人目标框的表观特征,表1为额外补充的网络结构。
图表编号 | XD00159733500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.16 |
作者 | 杨廷召、刘骊、付晓东、刘利军、黄青松 |
绘制单位 | 昆明理工大学信息工程与自动化学院、昆明理工大学信息工程与自动化学院、云南省计算机技术应用重点实验室、昆明理工大学信息工程与自动化学院、云南省计算机技术应用重点实验室、昆明理工大学信息工程与自动化学院、云南省计算机技术应用重点实验室、昆明理工大学信息工程与自动化学院、云南省计算机技术应用重点实验室 |
更多格式 | 高清、无水印(增值服务) |