《表3 真实远讲场景下单通道语音输入结果》

《表3 真实远讲场景下单通道语音输入结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《远场语音识别方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
%

表3比较了几种单通道系统在远讲场景下真实数据上的效果,我们首先需要从麦克风阵列中选取一路信号作为主信号。通过分析可以得到如下结论:第一,Multi-2相比Multi-1在远讲场景下表现得更为出色,并取得了平均7.3%的相对错误下降,因此在实际过程中,我们不需要再去耗费大量人力收集大量的高质量干净音频,而是可以选择利用更加容易收集的近讲音频作为替代品,并可以取得不错的性能表现。第二,DNN-JT1相比Multi-2有一定的效果提升,DNN-JT3效果表现不佳,整体性能和Multi-2相当。DNN-JT4则表现出了最好的平均性能,相比基线提升9.7%,相比DNN-JT1提升3.3%,也进一步表明自定义的连接层参数能够很好的挖掘原始特征和去混响后的特征之间的互补性。得益于连接层的存在,DNN-JT4参数会更小,但是取得了和DNN-JT2效果相当的水平。