《表1 现代汉语语料规模统计》

《表1 现代汉语语料规模统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《北京大学CCL语料库的研制》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

CCL语料库中现代汉语语料近12亿字节3,包含10645个不同字形的汉字。其中1949年之前的语料为“现代”语料,1949年之后的为“当代”语料。现代文献约0.15亿字节,占全部现代汉语语料的1.28%;当代文献,涵盖了口语、文学、网络语料、应用文等10类,约11.8亿字节,占现代汉语语料的98.72%。现代汉语语料的分类及规模统计详见表1。