《表1 ForegroundNet的解码器网络结构》

《表1 ForegroundNet的解码器网络结构》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《ForegroundNet:一种基于语义与动态特征的前景检测算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

通过输入当前图像与辅助图像训练一个端到端的全卷积网络来预测前景图像掩码。将输入图像对的大小缩放为224×224,保持与在ImageNet上预训练的MobileNet、VGG等骨干网络的输入尺寸一致,避免因尺度变化而带来的性能下降,从而提高语义特征的迁移学习效率。ForegroundNet网络由基于骨干网络的融合编码器和一个带反卷积网络的解码器构成(表1)。通过添加编码器和解码器之间的短连接,使得解码器中含有融合后的较高维特征、来自2幅输入图像的较低维特征,以便于ForegroundNet学习输入视频中的语义及动态特征。本文通过每个像素的标签y?{0,1}来指明每个像素中是否包含前景:y=0为背景,y=1为前景。解码器产生224×224×2的输出,然后送入softmax层进行分类。网络的损耗函数是像素级softmax损失的总和,即