《表1 MCNN模型结构:基于多分辨率时频特征融合的声学场景分类》

《表1 MCNN模型结构:基于多分辨率时频特征融合的声学场景分类》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于多分辨率时频特征融合的声学场景分类》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为此,我们在CNN中采用不同尺寸的卷积核和池化窗组合,力求同时捕捉细节和宏观信息。由于第二层卷积输出的高级特征来自于不同的子模型,每个子模型输出特征由同一输入特征图上不同大小的感受野提取得到,所以称之为多分辨率卷积神经网络(MCNN),模型结构和参数如表1所示。其中,在输入层分别采用了5×5卷积+1×5池化、7×7卷积+1×10池化、3×3卷积+1×2池化操作,在中间层分别采用了5×5卷积+1×100池化、7×7卷积+1×50池化、3×3卷积+1×250池化。这些参数都是经过组合实验优选出来的结果。