《表1 CRNN、CRNN_CSEnet和CRNN_ISEnet算法下的情绪识别率》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于语谱图提取深度空间注意特征的语音情感识别算法》
模型学习率L和输入批次B的设置要适当,过大过小都会加大重构误差,经测试,本实验设置的学习率为0.001,输入批次为400个epochs(轮次)。根据参考文献[18]在最优性能下确定网络的层数,卷积部分以VGGnet为基础经过多次试验形成具体层设置,层参数(卷积层数、卷积层内核大小和滤波器数)为(1,3×3,64)、(1,3×3,128)、(2,3×3,256)、(3,3×3,512)。每个卷积层后加归一化层,卷积层后连接一个Bi LSTM。以下实验均以语谱图作为模型输入。3个算法模型依次是基线模型CRNN模型、基于改进SEnet结构的混合模型(CRNN_CSEnet)和基于改进Itti算法和改进SEnet结构的混合模型(CRNN_ISEnet),识别率见表1。
图表编号 | XD0056947100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.20 |
作者 | 王金华、应娜、朱辰都、刘兆森、蔡哲栋 |
绘制单位 | 杭州电子科技大学、杭州电子科技大学、杭州电子科技大学、杭州电子科技大学、杭州电子科技大学 |
更多格式 | 高清、无水印(增值服务) |