《表3 语料对齐结果Tab.3 Corpus alignment result》

《表3 语料对齐结果Tab.3 Corpus alignment result》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《汉语-印尼语平行语料自动对齐方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文实验共获取了TED、apdf这2个网站共83 909条中印平行语料,人工审核44 160条。取人工审核的44 160条中印平行语料作为数据集用于训练长度模型,取其中的65%(总计28 704对)作为训练集,另35%(总计15 456对)作为测试集。实验包括段落对齐、句对齐和“段落对齐+句对齐”,结果见表3。同时,本文实验以Gale-Church提出的传统句对齐算法作为句对齐实验的对比实验,结果见表4。