《表1 基于空洞卷积金字塔池化和空间金字塔池化实验对比》

《表1 基于空洞卷积金字塔池化和空间金字塔池化实验对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《全卷积神经网络下的多光谱遥感影像分割》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了避免这种细节无法恢复的现象,满足图像语义分割需要的类别标签和像素所在原图位置的对齐要求,需要将底层特征和高层特征互相融合,底层特征语义信息较少,但空间位置比较准确,高层特征语义信息丰富,但没有细节信息,即没有空间位置信息,融合多层级特征有助于底层特征与高层特征的互补,恢复边缘信息,提高分割精度,使分割结果更平滑。本文将自然图像语义分割常用的两种金字塔结构用于本文的数据集,以验证何种结构更适合本文的数据。一种结构为空洞卷积金字塔池化(Chen等,2014),空洞卷积是在传统的卷积的基础上引入采样频率,可以理解为略过特征图上一些信息,使卷积核中一些参数恒为零,以达到感受野变大的目的。空洞卷积中的采样频率决定了感受野的大小,因而不同的采样频率可以获得不同尺度的特征信息,这就是基于空洞卷积的金字塔池化结构获得多尺度特征的原理。基于空洞卷积的金字塔池化结构接收卷积神经网络提取的特征输入,使用4个采样频率的空洞卷积并行提取特征,4个采样频率依次为6,12,18,24,获得4个尺度的特征。另一种结构为空间金字塔池化(Zhao等,2017),将基础网络提取到的特征输入到空间金字塔池化结构,空间金字塔池化结构对输入的特征进行4路不同尺度的平均池化,4路池化的尺寸分别为1×1,2×2,3×3,6×6,将每路池化后得到的特征图先使用1×1的卷积核进行降维,保持全局特征的权重,然后再使用双线性插值操作上采样到与输入空间金字塔池化结构时相同大小的分辨率,最后将4路池化和原始特征合并到一起,以进行后续操作。由于两种结构在理论上都可以融合多尺度特征,汇聚上下文信息,在普通自然图像数据集效果也难分伯仲,因此本文选择用实验论证何种结构更适合本文的遥感影像数据集。最终结果如表1,因此本文使用空间金字塔池化获取多尺度信息。图5为不同金字塔预测结果图。图5(a)蓝色矩形框表明的是颜色特征(深色)和水域特征很接近,但非水域的区域,可以发现基于金字塔池化结构得到的结果比基于金字塔空洞卷积结构得到的效果要好,基于金字塔池化结构的网络模型学习能力更强,可以更好地融合上下文信息,学习到每类地物的独有的特征,避免出现颜色相近被分成同一类的问题。