《表1 CNN模型参数:基于MFCC和CNN的音频相似度判别研究》

《表1 CNN模型参数:基于MFCC和CNN的音频相似度判别研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于MFCC和CNN的音频相似度判别研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

一维卷积神经网络包括四个一维卷积层、三个最大池化层、两个随机失活层、两个全连接层,总共包含40 514个训练参数。加入随机失活层的目的是提升模型在测试集上的准确率,防止过拟合。随机失活层在模型训练过程中,通过随机失活层的输出值使模型不会过分依赖某一节点的特征,并起到压缩权重的作用。除了最后一层全连接层,其余卷积层与全连接层都采用线性修正单元作为激活函数,最后一层采用归一化指数函数作为激活函数,将音频相似度的判别问题转变为一个二分类问题,两个输出神经元分别代表两段音频的相似概率与不相似概率,两者之和为1。CNN模型的具体参数见表1。模型每一层的参数通过训练样本得到。