《表1 各数据集的数据规模Tab.1 The size of datasets》
为了保证训练时显存不会溢出,本研究对合成的数据按句子长度过滤,长度限制为256个词.为了避免影响译文质量,再去除包含未登录词的句对.各数据规模如表1所示.
图表编号 | XD0044620600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.03.28 |
作者 | 周张萍、黄荣城、王博立、胡金铭、史晓东、陈毅东 |
绘制单位 | 厦门大学信息科学与技术学院、厦门大学信息科学与技术学院、厦门大学信息科学与技术学院、厦门大学信息科学与技术学院、厦门大学信息科学与技术学院、厦门大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |