《表9 先秦语料预处理结果样例》

《表9 先秦语料预处理结果样例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向先秦典籍的历史事件基本实体构件自动识别研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

根据具体不同标记长度的知识抽取实验,在模型构建中所用的词位标注集由十三个不同的标记组成,标注集用T来表示,具体为T={BN,MN,EN,SN,BP,MP,EP,SP,BT,MT,ET,ST,A},以B、M、E开头分别表示实体的初始词、实体中间词、实体结束词;S开头表示该实体是单字结构;以N,P,T结尾分别表示是人名、地名、时间实体;A代表需要识别的三类实体以外的词。例如:BN表示人名初始词,MN表示人名中间词,EN表示人名结束词,SN表示单字人名。经过以上的处理,得到的部分语料见表9。