《表2 训练集和测试集中各类型实体出现次数》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于词典与CRF算法的中文生物医学实体自动标注平台建设》
利用本文搭建的自动标注平台,采用双人交叉标注的方式对200篇文献摘要进行标注,对有异议的标注进行讨论,最终得到200篇有标签文本。从中随机选取150篇作为训练集用于训练CRF实体识别模型,其余50篇作为测试集用于测试模型。各类实体标注数量如表2所示。
图表编号 | XD00214105200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.01 |
作者 | 任雪菁、安新颖、范少萍、张飞、黄裕翔 |
绘制单位 | 北京协和医学院、中国医学科学院医学信息研究所、北京协和医学院、中国医学科学院医学信息研究所、北京协和医学院、中国医学科学院医学信息研究所、北京协和医学院、中国医学科学院阜外医院、北京协和医学院、中国医学科学院医学信息研究所 |
更多格式 | 高清、无水印(增值服务) |