《表3 维汉机器翻译数据集统计》
本研究使用2017年全国机器翻译研讨会(CWMT)公开的33万个维汉机器翻译数据进行实验,测试集分别来自于CWMT2017和CWMT2013,具体信息如表3所示.文中实验基于OpenNMT(https:∥github.com/OpenNMT/OpenNMT-tf)进行模型训练;使用斯坦福分词工具(http:∥nlp.stanford.edu/software/segmenter.shtml)对汉语语句进行分词;使用双语互译评估(BLEU)值[22]和字符n元语法(n-gram)的F3(ChrF3)值[23]作为机器翻译的评价指标.
图表编号 | XD00140615500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.28 |
作者 | 潘一荣、李晓、杨雅婷、董瑞 |
绘制单位 | 中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室、中国科学院新疆理化技术研究所、中国科学院大学、新疆民族语音语言信息处理实验室 |
更多格式 | 高清、无水印(增值服务) |