《表2 三类实体的词长、频数、比重》
在上述规模为465,197个词汇的先秦语料库中,5300个人名共出现24,615次,出现次数最多的“晏子”有968个,这些人名实体占词汇总数的5.29%;地名共出现14,424次,占词汇总数的3.10%,1666种地名中“晉”出现了1463次;261种时间词共出现6042次,占词汇总数的1.30%,其中“今”出现715次。三类实体的词汇共占整个语料库词汇的9.70%,从实体这一语言单位的整体数量上来看,具有一定的代表性,识别这三类实体对于探究历史事件的构成具有一定的价值和意义。这三类实体的词长、频数、所占本类实体比重如表2所示。
图表编号 | XD002754000 严禁用于非法目的 |
---|---|
绘制时间 | 2018.02.15 |
作者 | 王东波、高瑞卿、沈思、李斌 |
绘制单位 | 南京农业大学信息科学技术学院、南京农业大学信息科学技术学院、南京理工大学经济管理学院、南京师范大学文学院 |
更多格式 | 高清、无水印(增值服务) |