《表1 TIMIT数据集的音素错误率》
首先按上节配置要求在TIMIT数据集上进行多组实验,研究不同语音特征在各声学模型上的语音识别效果。一方面从横向角度比较MFCC、FBank和fMLLR三种声学特征在深度循环神经网络中的总体表现,寻找结果相对较优的特征作为网络的输入。另一方面纵向对比基线系统及标准LSTM、标准GRU和改进GRU三种门控单元网络的语音识别错误率。实验结果如表1所示。
图表编号 | XD00129806600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 俞建强、颜雁、刘葳、孙一鸣 |
绘制单位 | 长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院、长春理工大学计算机科学技术学院 |
更多格式 | 高清、无水印(增值服务) |