《表1 RPN网络层和ROIAlign层输入和输出》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于FasterMDNet的视频目标跟踪算法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

改进的快速多域卷积神经网络（FasterMDNet）网络模型架构如图1所示。网络中有三个卷积层用来提取整张图片的特征，通道依次为96、256、512；RPN网络层用来在图片的特征图上提取ROI，512-d表示输入特征为512个通道，网络内部输出一个2分类分支和一个4位置边框回归信息分支，k表示RPN定义的每个锚点产生k个锚盒；ROIAlign层对ROI进行特征提取，将得到的特征作为全连接层的输入，RPN网络层和ROIAlign层的输入和输出如表1所示；网络中共有三个全连接层用于二分类，区分目标和背景，前两个全连接层（FC4、FC5）表示目标和背景特征，输出均为512个单元，第三个全连接层（FC61～FC6k）表示多域层，具有k个域分支，每个视频序列对应一个域，训练期间用于学习区分目标和背景，其中红色表示目标，黄色表示背景。

图表编号	XD00163033200 严禁用于非法目的
绘制时间	2020.07.15
作者	王玲、王辉、王鹏、李岩芳
绘制单位	长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院
更多格式	高清、无水印（增值服务）