《表1 典籍文本标注前后对照样例》
在对《公羊传》《谷梁传》《左氏春秋》《吕氏春秋》《晏子春秋》五部先秦典籍进行人工自动分词、词性和实体标注的基础上(1),本文构建了具有历史性质的先秦典籍语料库,总词汇规模达到465,197个。语料中需要被识别的人名、地名、时间实体分别被标注成“nr”“ns”“t”,语料库的具体样例如表1所示。
图表编号 | XD002753600 严禁用于非法目的 |
---|---|
绘制时间 | 2018.02.15 |
作者 | 王东波、高瑞卿、沈思、李斌 |
绘制单位 | 南京农业大学信息科学技术学院、南京农业大学信息科学技术学院、南京理工大学经济管理学院、南京师范大学文学院 |
更多格式 | 高清、无水印(增值服务) |