《表2 训练集和测试集中各类型实体出现次数》

《表2 训练集和测试集中各类型实体出现次数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于词典与CRF算法的中文生物医学实体自动标注平台建设》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

利用本文搭建的自动标注平台,采用双人交叉标注的方式对200篇文献摘要进行标注,对有异议的标注进行讨论,最终得到200篇有标签文本。从中随机选取150篇作为训练集用于训练CRF实体识别模型,其余50篇作为测试集用于测试模型。各类实体标注数量如表2所示。