《表1 输出特征图的尺寸:一种改进的卷积神经网络的室内深度估计方法》

《表1 输出特征图的尺寸:一种改进的卷积神经网络的室内深度估计方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种改进的卷积神经网络的室内深度估计方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文所提出的网络结构,如图1所示,图中Conv表示卷积层,Down表示下采样卷积层,FCSE1、FCSE2、FCSE3、FCSE4分别表示提取特征层1、提取特征层2、提取特征层3、提取特征层4,Trans表示FCRN上采样模块,⊕表示连接层.采用端到端的学习方式,该框架学习从彩色图像到相应深度图像的直接映射,采用编码器-解码器结构(encoder-decoder)的网络框架.encoder部分采用10个FCSE_block模块(即图1中的FCSE)和卷积层Conv以及Down1、Down2、Down3、Down4.decoder部分采用4个Trans上采样模块.Conv1包含一个尺寸为7×7、步长为2的卷积层,一个3×3的最大池化,一个Relu层.Down1、Down2、Down3、Down4和Conv2中的是3×3、步长为1的卷积层,同时Conv2又包含一个Relu层.首先将输入图像送入一个卷积层,和一个最大池化层,特征图尺寸变为76×57×64.受文献[1]中up-projection模块结构的启发,将下采样模块的结构设计为Down1、FCSE1(FCSE_block×2)、Down2、FCSE2(FCSE_block×3)、Down3、FCSE3(FCSE_block×4)、Down4、FCSE4(FCSE_block×1).FCSE_block×2是指将特征图依次传入2个FCSE_block模块(如图2所示),FCSE1、FCSE2、FCSE3、FCSE4同理.各层输出参数如表1所示.本文所提出的深度模型中,所有的卷积层之后均连接着批量正则化层(batch normalization,BN层),文中为了简化而忽略.