《表1 不同信噪比下的平均PESQ结果》

《表1 不同信噪比下的平均PESQ结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于感知相关代价函数的深度学习语音增强》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表2列出了在6种信噪比条件下,含噪语音以及通过传统的LogMMSE方法、4种基于不同代价函数的深度神经网络语音增强方法得到的增强语音的平均STOI结果。从表中很明显可以看出,4种基于DNN的语音增强方法和传统方法相比,STOI值显著提高。在低信噪比条件下,基于感知加权均方误差代价函数的DNN训练有利于语音可懂度的提高。大多数信噪比下,经过wMSE+MSSNR-DNN方法处理以后的增强语音的STOI值高于其它3种深度学习方法,这是由于利用人耳听觉系统的感知特性,对均方误差进行感知加权,并将其和频域加权分段信噪比结合,可以进一步提高增强语音的可懂度。但是,当SNR=5dB时,wMSE+MSSNR-DNN方法得到STOI值下降,这可能是由于该方法通过采用感知加权,在一定程度上造成了语音信息丢失。在大多数信噪比条件下,MSSNR-DNN方法优于MSE-DNN方法和wMSE-DNN方法。但是,在高信噪比环境中,特别是当SNR=20 dB时,虽然通过MSSNR-DNN方法得到的语音质量和MSE-DNN方法、wMSE-DNN方法相比略有下降,但是增强语音的可懂度分别提高了0.012和0.003,这是由于频域加权分段信噪比和语音可懂度高度相关。