《表1 CRNN、CRNN_CSEnet和CRNN_ISEnet算法下的情绪识别率》

《表1 CRNN、CRNN_CSEnet和CRNN_ISEnet算法下的情绪识别率》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于语谱图提取深度空间注意特征的语音情感识别算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

模型学习率L和输入批次B的设置要适当,过大过小都会加大重构误差,经测试,本实验设置的学习率为0.001,输入批次为400个epochs(轮次)。根据参考文献[18]在最优性能下确定网络的层数,卷积部分以VGGnet为基础经过多次试验形成具体层设置,层参数(卷积层数、卷积层内核大小和滤波器数)为(1,3×3,64)、(1,3×3,128)、(2,3×3,256)、(3,3×3,512)。每个卷积层后加归一化层,卷积层后连接一个Bi LSTM。以下实验均以语谱图作为模型输入。3个算法模型依次是基线模型CRNN模型、基于改进SEnet结构的混合模型(CRNN_CSEnet)和基于改进Itti算法和改进SEnet结构的混合模型(CRNN_ISEnet),识别率见表1。