《表6 不同深度神经网络结构的识别准确率》

《表6 不同深度神经网络结构的识别准确率》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于参数迁移和卷积循环神经网络的语音情感识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了验证本文提出的TCRNN模型的有效性,设计了三组对比实验。实验组G采用文献[9]提出的循环神经网络结构,使用三层LSTM,每层LSTM包含1 024个隐藏节点。实验组H采用文献[9]提出的卷积循环神经网络结构,使用两个卷积层和最大池化层对语谱图进行特征提取,得到多个特征图,然后将特征图直接展开成具有固定时间步长的一维特征输入到两层LSTM网络结构。实验组I采用本文提出的TCRNN模型进行训练。网络的卷积神经网络部分使用调整的AlexNet预训练模型并迁移第四层卷积层特征,循环神经网络部分采用两层LSTM结构。语谱图经过AlexNet网络得到的特征图进行维度转换后输入到后续的LSTM,其中时间作为一个维度,频域和特征图数量组成另外一个维度。实验结果如表6所示。