《表3 不同端到端系统的性能》

《表3 不同端到端系统的性能》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Transformer的越南语连续语音识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

越南语的书写规则类似汉语和日语,是一种单音节的拼音文字,因此使用字错误率(Character error rate,CER)作为识别的标准。通过表3比较可以看出,在越南语这些小语种上,相比于其他端到端系统transformer的识别效果更好,取得了更低的词错误率,缩小了在小语种上和传统的HMM-GMM以及HMM-DNN之间的差距。通过训练时间也可以看出,transformer结构由于完全使用自注意力机制,摒弃RNN网络,训练速度也更快。