《表1 不同方法的语音增强结果》
直观比较不同方法的语音增强性能。图5和图6分别给出了,第3号说话人的原始语音,和被0db m109污染后的含噪语音,以及经不同方法处理后的时域波形图和语谱图。将图5(c)~图5(f)分别与图5(a)和图5(b)对比,可见使用GRU和GRU编解码网络处理后的语音失真,优于经过DNN增强得到的语音的波形失真。对比图5(a),图5(f)、图5(e)、图5(d)表明经解码器层数为2层的GRU编解码网络增强得到的语音波形图与干净语音的波形图最为接近。对比图6各图,GRU和GRU编解码网络相较于DNN更能有效处理含噪语音中的噪声部分,解码器层数为2层的GRU编解码网络具有最佳的抑制噪声和保存含噪语音中语音成分的能力。实验结果充分表明,经过GRU编解码网络增强的语音相较于经过DNN增强和直接应用GRU增强的语音更接近原始的干净语音。
图表编号 | XD00170299100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.16 |
作者 | 常新旭、张杨、杨林、寇金桥、王昕、徐冬冬 |
绘制单位 | 中国航天科工集团第二研究院北京计算机技术及应用研究所、中国航天科工集团第二研究院北京计算机技术及应用研究所、中国航天科工集团第二研究院北京计算机技术及应用研究所、中国航天科工集团第二研究院北京计算机技术及应用研究所、中国航天科工集团第二研究院北京计算机技术及应用研究所、中国航天科工集团第二研究院北京计算机技术及应用研究所 |
更多格式 | 高清、无水印(增值服务) |