《表9 先秦语料预处理结果样例》
根据具体不同标记长度的知识抽取实验,在模型构建中所用的词位标注集由十三个不同的标记组成,标注集用T来表示,具体为T={BN,MN,EN,SN,BP,MP,EP,SP,BT,MT,ET,ST,A},以B、M、E开头分别表示实体的初始词、实体中间词、实体结束词;S开头表示该实体是单字结构;以N,P,T结尾分别表示是人名、地名、时间实体;A代表需要识别的三类实体以外的词。例如:BN表示人名初始词,MN表示人名中间词,EN表示人名结束词,SN表示单字人名。经过以上的处理,得到的部分语料见表9。
图表编号 | XD002753300 严禁用于非法目的 |
---|---|
绘制时间 | 2018.02.15 |
作者 | 王东波、高瑞卿、沈思、李斌 |
绘制单位 | 南京农业大学信息科学技术学院、南京农业大学信息科学技术学院、南京理工大学经济管理学院、南京师范大学文学院 |
更多格式 | 高清、无水印(增值服务) |