《表2 不同信噪比下的平均STOI结果》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于感知相关代价函数的深度学习语音增强》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

图3表示TIMIT语料库中的一条干净语音，SNR=-5dB的含噪语音，以及通过5种不同的方法得到的增强语音的语谱图。从图3 (b）可以看出当SNR=-5dB时，语音信息被噪声掩盖。从图3 (c）看出传统的LogMMSE方法存在的残留噪声和语音失真问题严重。从图3 (e）可以看出wMSE-DNN方法和其它4种方法相比，残留噪声最少，但是语音信息的损失情况最为严重，因此难以提高语音可懂度。通过比较图3 (d）、图3 (e）和图3 (f）可以看出，MSSNR-DNN方法可以有效地恢复语音信息，从而提高增强语音的可懂度，但是语音段间仍然存在残留噪声。从图3 (g）可以看出，利用wMSE+MSSNR-DNN方法，可以进一步抑制残留噪声，同时保留更多的语音信息，这表明该方法可以保留更多对人耳听觉感知有重要作用的语音段，因此语音可懂度进一步提高。

图表编号	XD00206682400 严禁用于非法目的
绘制时间	2020.11.16
作者	房慧保、马建芬、田玉玲、张朝霞
绘制单位	太原理工大学信息与计算机学院、太原理工大学信息与计算机学院、太原理工大学信息与计算机学院、太原理工大学物理与光电工程学院
更多格式	高清、无水印（增值服务）