《表1 CRNN、CRNN＿CSEnet和CRNN＿ISEnet算法下的情绪识别率》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于语谱图提取深度空间注意特征的语音情感识别算法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

模型学习率L和输入批次B的设置要适当，过大过小都会加大重构误差，经测试，本实验设置的学习率为0.001，输入批次为400个epochs（轮次）。根据参考文献[18]在最优性能下确定网络的层数，卷积部分以VGGnet为基础经过多次试验形成具体层设置，层参数（卷积层数、卷积层内核大小和滤波器数）为（1，3×3，64）、（1，3×3，128）、（2，3×3，256）、（3，3×3，512）。每个卷积层后加归一化层，卷积层后连接一个Bi LSTM。以下实验均以语谱图作为模型输入。3个算法模型依次是基线模型CRNN模型、基于改进SEnet结构的混合模型（CRNN＿CSEnet）和基于改进Itti算法和改进SEnet结构的混合模型（CRNN＿ISEnet），识别率见表1。

图表编号	XD0056947100 严禁用于非法目的
绘制时间	2019.07.20
作者	王金华、应娜、朱辰都、刘兆森、蔡哲栋
绘制单位	杭州电子科技大学、杭州电子科技大学、杭州电子科技大学、杭州电子科技大学、杭州电子科技大学
更多格式	高清、无水印（增值服务）