《表1 数据集1语料库的划分》
(1)内蒙古大学开发的67 288句对蒙汉双语平行语料,数据集划分如表1所示,随机选取1 000句为验证集,800句为测试集。从65 488句训练集里选择具有上下文关系的篇章语料库,如表2所示,在本文使用的语料库里共选择出35个具有上下文关系的篇章语料库,涉及到小说、对话等,其中篇章上下文语料共有34 784句对。
图表编号 | XD00222621500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.15 |
作者 | 高芬、苏依拉、仁庆道尔吉 |
绘制单位 | 内蒙古工业大学信息工程学院、内蒙古工业大学信息工程学院、内蒙古工业大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |