《表3 亚词处理方式对比实验结果Tab.3 Comparative experiments of subword segmentation methods》
在数据处理方式的选择上,本研究在Transformer模型架构下,对JAEN_ZHEN-ZH2JA和JAZH两个合并数据集上进行实验,采用相同的超参数设置,对比了日语SentencePiece/英语BPE的两端分开处理与采用不同词表大小联合BPE处理,对翻译结果的影响.实验结果如表3所示,可见在日英翻译任务上,词表大小为2万个时,联合BPE的效果最好.
图表编号 | XD0044620800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.03.28 |
作者 | 周张萍、黄荣城、王博立、胡金铭、史晓东、陈毅东 |
绘制单位 | 厦门大学信息科学与技术学院、厦门大学信息科学与技术学院、厦门大学信息科学与技术学院、厦门大学信息科学与技术学院、厦门大学信息科学与技术学院、厦门大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |