《表2 不同说话人模型下的识别率比较》

《表2 不同说话人模型下的识别率比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于卷积长短期记忆网络的说话人辨识》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

同样选择50个说话人。在训练阶段采用不含噪音的语音数据训练说话人模型,在识别阶段,将噪音与干净语音的按一定比例融合,得到含噪的语音识别数据,对于含噪语音同样采用预处理,在卷积LSTM神经网络训练中,进行去噪音处理,然后利用得到的纯净语音,训练说话人模型GMM-SVM。同时实验对测试语音加完噪音后,提取MFCC及其一阶差分组成24位语音特征参数,分别训练GMM、SVM、GMM-SVM。从表2可以看出,当信噪比为30dB时,基本上识别不出说话人,但随着信噪比的增加,经过LSTM降噪处理,系统的识别率会比没有经过降噪处理的模型(GMM、SVM、GMM-SVM)的识别库率,验证了系统鲁棒性。