《表1 GENIA V3.02语料库中实体标签分布》

《表1 GENIA V3.02语料库中实体标签分布》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《PU场景下的生物医学命名实体识别算法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了验证本文提出的算法在生物医学领域中命名实体识别的性能,选取传统的HMM算法与本文提出的PU场景下的两步法算法进行比较。目前,最常用的生物医学标注语料库是GENIA V3.02语料库,该语料库包含了来自MEDLINE的2000个摘要标注文本(约360000个单词),并且包含36个词性类别,其中包含5个生物医学实体类型。本文识别的是蛋白质命名实体,采用了精确率、召回率和F值[19]作为评价指标。GENIA V3.02语料库中实体标签分布说明见表1。