《表3 真实远讲场景下单通道语音输入结果》
%
表3比较了几种单通道系统在远讲场景下真实数据上的效果,我们首先需要从麦克风阵列中选取一路信号作为主信号。通过分析可以得到如下结论:第一,Multi-2相比Multi-1在远讲场景下表现得更为出色,并取得了平均7.3%的相对错误下降,因此在实际过程中,我们不需要再去耗费大量人力收集大量的高质量干净音频,而是可以选择利用更加容易收集的近讲音频作为替代品,并可以取得不错的性能表现。第二,DNN-JT1相比Multi-2有一定的效果提升,DNN-JT3效果表现不佳,整体性能和Multi-2相当。DNN-JT4则表现出了最好的平均性能,相比基线提升9.7%,相比DNN-JT1提升3.3%,也进一步表明自定义的连接层参数能够很好的挖掘原始特征和去混响后的特征之间的互补性。得益于连接层的存在,DNN-JT4参数会更小,但是取得了和DNN-JT2效果相当的水平。
图表编号 | XD0016842700 严禁用于非法目的 |
---|---|
绘制时间 | 2018.08.10 |
作者 | 王智国、王海坤 |
绘制单位 | 科大讯飞股份有限公司 |
更多格式 | 高清、无水印(增值服务) |