《表1 不同信噪比下的平均PESQ结果》
表2列出了在6种信噪比条件下,含噪语音以及通过传统的LogMMSE方法、4种基于不同代价函数的深度神经网络语音增强方法得到的增强语音的平均STOI结果。从表中很明显可以看出,4种基于DNN的语音增强方法和传统方法相比,STOI值显著提高。在低信噪比条件下,基于感知加权均方误差代价函数的DNN训练有利于语音可懂度的提高。大多数信噪比下,经过wMSE+MSSNR-DNN方法处理以后的增强语音的STOI值高于其它3种深度学习方法,这是由于利用人耳听觉系统的感知特性,对均方误差进行感知加权,并将其和频域加权分段信噪比结合,可以进一步提高增强语音的可懂度。但是,当SNR=5dB时,wMSE+MSSNR-DNN方法得到STOI值下降,这可能是由于该方法通过采用感知加权,在一定程度上造成了语音信息丢失。在大多数信噪比条件下,MSSNR-DNN方法优于MSE-DNN方法和wMSE-DNN方法。但是,在高信噪比环境中,特别是当SNR=20 dB时,虽然通过MSSNR-DNN方法得到的语音质量和MSE-DNN方法、wMSE-DNN方法相比略有下降,但是增强语音的可懂度分别提高了0.012和0.003,这是由于频域加权分段信噪比和语音可懂度高度相关。
图表编号 | XD00206682300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.16 |
作者 | 房慧保、马建芬、田玉玲、张朝霞 |
绘制单位 | 太原理工大学信息与计算机学院、太原理工大学信息与计算机学院、太原理工大学信息与计算机学院、太原理工大学物理与光电工程学院 |
更多格式 | 高清、无水印(增值服务) |