《表1 在不同的噪声条件下各语音增强方法的seg SNR》

《表1 在不同的噪声条件下各语音增强方法的seg SNR》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《生成式对抗网络在语音增强方面的研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

选用CLSMD[16]、mss_map[17]、subspace[18]、MMSE[19]、SS[20]、Wiener[21]等传统的语音增强方法作为参考,选用语音质量评估标准中最为经典的segSNR[22](分割信噪比)和PESQ(perceptual evaluation of speech quality)[23]来计算得分,其中seg SNR是指对噪声的抑制能力,值越大越好,PESQ是指评估主观的语音质量,值也是越大越好。噪声同样选择了NOISEX-92噪声库中的噪声,分别为babble餐厅噪声、pink噪声和white噪声,纯净的语音同样来自NOIZEUS语音库;将三种噪声和纯净的语音分别进行叠加,各自形成了自己的语音信噪比,分别为-5 dB、0 dB、5 d B、10d B、15 dB各100个含噪语音句子,总共500个含噪语音句子。实验结果如表1和表2所示。