《表2 古代汉语语料规模统计》

《表2 古代汉语语料规模统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《北京大学CCL语料库的研制》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

CCL语料库中古代汉语语料近4亿字节4,包含18,898个不同字形的汉字。古代汉语语料根据语料所在的朝代分类。对于一些不方便按照朝代分类的语料,CCL语料库将它们归入其他杂类。各朝代语料收录了从周代到民国的1.64亿字节的语料(占比41.05%);杂类语料2.36亿字节(占比58.95%)。古代汉语语料的分类及规模统计详见表2。