《表3 汉英句子对齐语料规模统计》

《表3 汉英句子对齐语料规模统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《北京大学CCL语料库的研制》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

CCL语料库中汉英句子对齐语料约0.716亿字节,其中包含747个汉译英文件和1627个英译汉文件,约23.36万个对齐的句子对(具有翻译关系),含600多万汉字和近400万英语单词。语料以书面语为主,也包含少量口语,分为应用文、文学和新闻三类文体,涉及政治、科技、体育等多个领域。表3列出了这些对齐语料在不同文体中的统计信息。