《表1 现代汉语语料规模统计》
CCL语料库中现代汉语语料近12亿字节3,包含10645个不同字形的汉字。其中1949年之前的语料为“现代”语料,1949年之后的为“当代”语料。现代文献约0.15亿字节,占全部现代汉语语料的1.28%;当代文献,涵盖了口语、文学、网络语料、应用文等10类,约11.8亿字节,占现代汉语语料的98.72%。现代汉语语料的分类及规模统计详见表1。
图表编号 | XD0097275400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.01 |
作者 | 詹卫东、郭锐、常宝宝、谌贻荣、陈龙 |
绘制单位 | 北京大学 |
更多格式 | 高清、无水印(增值服务) |