《表1 GENIA V3.02语料库中实体标签分布》

《表1 GENIA V3.02语料库中实体标签分布》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《BioTrHMM:基于迁移学习的生物医学命名实体识别算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
/%

为了验证本文算法对生物医学命名实体识别的预测性能,选取传统的HMM算法与本文提出的基于迁移学习的Bio Tr HMM算法进行比较。目前,最常用的生物医学标注语料库是GENIA v3.02语料库,该语料库包含了来自MEDLINE的2 000个摘要标注文本(约360 000个单词),并且包含了36个词性类别,其中包含5个生物医学实体类型,本文使用了GE-NIA v3.02语料库(http://www.nactem.ac.uk/genia/genia-corpus)的数据进行实验。本文识别的是蛋白质命名实体,采用了精确率、召回率和F值[17]作为评价指标。GENIA v3.02语料库中实体标签分布说明如表1所示。