《表1 平行语料:基于非自回归方法的维汉神经机器翻译》

《表1 平行语料:基于非自回归方法的维汉神经机器翻译》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于非自回归方法的维汉神经机器翻译》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

数据集采用CWMT2017发布的维吾尔语-汉语新闻政务评测语料,英-德平行语料训练集采用WMT2015(4 500 000)和IWSLT201616(190 000)。对于WMT2015采用newstest2014和newstest2013作为测试集和开发集;对于IWSLT2016采用newstest2013作为测试集和开发集。对所有平行语料的所有句子都使用字节对编码(Byte Pair Encoding,BPE)算法[17]进行标记并分割成子单词单元。将学习到的规则应用于所有的训练集、开发集和测试集[18]。维汉语料和IWSLT2016英-德语料共享大小为40 000的词汇表,WMT2015英-德语料共享大小为60 000的词汇表。数据集见表1所示。