《表5 Transformer模型在英-汉任务上的翻译结果》
同样地,在CWMT2018的50万英汉数据上也进行了多粒度与不同规模数据上的对比实验,实验数据处理和模型配置与维汉系统一致,实验结果如表5所示。从表5中可以看出,音节粒度的机器翻译方法在英汉机器翻译上同样能提升效果。相比于在不同规模数据上(数据集规模由小到大)的单词粒度机器翻译分别提升了4.09、5.22、6.09、4.47、4.05个BLEU值,相比于BPE粒度机器翻译分别提升了2.34、2.19、2.01、1.3、0.3个BLEU值。由此可见,音节粒度的机器翻译方法在数据规模较少的情况下性能提升明显,随着数据量的增大,BPE粒度的效果越来越好,当训练数据规模到50万时,音节粒度和BPE的效果几乎持平。
图表编号 | XD00201547600 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.15 |
作者 | 艾山·吾买尔、斯拉吉艾合麦提·如则麦麦提、西热艾力·海热拉、刘文其、吐尔根·依布拉音、汪烈军、瓦依提·阿不力孜 |
绘制单位 | 新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学新疆多语种信息技术实验室、新疆大学软件学院、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室、新疆大学信息科学与工程学院、新疆大学新疆多语种信息技术实验室 |
更多格式 | 高清、无水印(增值服务) |