《表1 RPN网络层和ROIAlign层输入和输出》
改进的快速多域卷积神经网络(FasterMDNet)网络模型架构如图1所示。网络中有三个卷积层用来提取整张图片的特征,通道依次为96、256、512;RPN网络层用来在图片的特征图上提取ROI,512-d表示输入特征为512个通道,网络内部输出一个2分类分支和一个4位置边框回归信息分支,k表示RPN定义的每个锚点产生k个锚盒;ROIAlign层对ROI进行特征提取,将得到的特征作为全连接层的输入,RPN网络层和ROIAlign层的输入和输出如表1所示;网络中共有三个全连接层用于二分类,区分目标和背景,前两个全连接层(FC4、FC5)表示目标和背景特征,输出均为512个单元,第三个全连接层(FC61~FC6k)表示多域层,具有k个域分支,每个视频序列对应一个域,训练期间用于学习区分目标和背景,其中红色表示目标,黄色表示背景。
图表编号 | XD00163033200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.15 |
作者 | 王玲、王辉、王鹏、李岩芳 |
绘制单位 | 长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院 |
更多格式 | 高清、无水印(增值服务) |