《表1 系统识别率比较:基于卷积长短期记忆网络的说话人辨识》

《表1 系统识别率比较:基于卷积长短期记忆网络的说话人辨识》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于卷积长短期记忆网络的说话人辨识》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

选择50个说话人进行实验,测试语音和识别语音都采用干净语音,不加入噪音。测试语音经卷积过LSTM网络模型训练,然后还原语音波形,并对还原后的语音波形提取24维的MFCC及其一阶差分语音特征矢量参数,训练GMM,GMM输出的超矢量分别选择50-170,比较系统识别率。从表1可以看出随着超矢量的增多,识别率越来越高;LSTM的输出设置越多,识别率也会增加。LSTM的输出与GMM的输出越多,越能描述说话人的语音特征。