《表1 设定先验环境噪声为10 s时,在SD2002和AISHELL-1下基线系统、传统VTS方法和VTS-F方法在混有不同信噪比的3种噪声下的正确识别率》

《表1 设定先验环境噪声为10 s时,在SD2002和AISHELL-1下基线系统、传统VTS方法和VTS-F方法在混有不同信噪比的3种噪声下的正确识别率》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《具有环境自学习机制的鲁棒说话人识别算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表1显示了与基线系统和传统VTS方法相比,改进的VTS方法(Vector Taylor Series-Feature Improved,VTS-F)在特征域中的性能,其中选取的先验噪声时长为10 s。可以在SD2002和AISHELL-1数据库上看到,提出的方法在低SNR条件下比VTS表现更好,但它在高SNR条件下表现不佳。这可以被理解为当信噪比很低时,先验噪声得到的GMM噪声模型比VTS方法估计出的单高斯噪声模型更能够精确刻画噪声的分布。而当信噪比很高时,由于此时先验噪声很小,由此得出的噪声模型可能会不精确,导致系统识别性能下降。