《表2 不同信噪比下的平均STOI结果》
图3表示TIMIT语料库中的一条干净语音,SNR=-5dB的含噪语音,以及通过5种不同的方法得到的增强语音的语谱图。从图3 (b)可以看出当SNR=-5dB时,语音信息被噪声掩盖。从图3 (c)看出传统的LogMMSE方法存在的残留噪声和语音失真问题严重。从图3 (e)可以看出wMSE-DNN方法和其它4种方法相比,残留噪声最少,但是语音信息的损失情况最为严重,因此难以提高语音可懂度。通过比较图3 (d)、图3 (e)和图3 (f)可以看出,MSSNR-DNN方法可以有效地恢复语音信息,从而提高增强语音的可懂度,但是语音段间仍然存在残留噪声。从图3 (g)可以看出,利用wMSE+MSSNR-DNN方法,可以进一步抑制残留噪声,同时保留更多的语音信息,这表明该方法可以保留更多对人耳听觉感知有重要作用的语音段,因此语音可懂度进一步提高。
图表编号 | XD00206682400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.16 |
作者 | 房慧保、马建芬、田玉玲、张朝霞 |
绘制单位 | 太原理工大学信息与计算机学院、太原理工大学信息与计算机学院、太原理工大学信息与计算机学院、太原理工大学物理与光电工程学院 |
更多格式 | 高清、无水印(增值服务) |