《表1 系统识别率比较:基于卷积长短期记忆网络的说话人辨识》
选择50个说话人进行实验,测试语音和识别语音都采用干净语音,不加入噪音。测试语音经卷积过LSTM网络模型训练,然后还原语音波形,并对还原后的语音波形提取24维的MFCC及其一阶差分语音特征矢量参数,训练GMM,GMM输出的超矢量分别选择50-170,比较系统识别率。从表1可以看出随着超矢量的增多,识别率越来越高;LSTM的输出设置越多,识别率也会增加。LSTM的输出与GMM的输出越多,越能描述说话人的语音特征。
图表编号 | XD00148165100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.01 |
作者 | 刘雪燕、李逵、袁宝玲 |
绘制单位 | 中山火炬职业技术学院信息工程系、中山火炬职业技术学院信息工程系、中山火炬职业技术学院信息工程系 |
更多格式 | 高清、无水印(增值服务) |