《表3 不同模型在JNLPBA数据集上的评价指标对比》

《表3 不同模型在JNLPBA数据集上的评价指标对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于句法依存分析的图网络生物医学命名实体识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
单位:%

各模型在JNLPBA数据集上的表现对比如表3所示。Tang等[20]在生物医学命名实体识别中融入词表示特征;Li等[21]提出在模型中结合使用句子向量和双词向量;Wei等[22]在Bi LSTM-CRF模型中引入注意力机制,获得了71.57%的准确率和73.50%的F1值;Dai等[23]在Bi LSTM-CRF模型中使用预训练词向量模型ELMO(Embeddings from Language MOdels,ELMO),获得了74.29%的F1值。以上方法均没有利用语料中的句法信息,效果有所局限。本文模型使用CNN提取字符特征,帮助模型识别包含特殊字符的实体,在不使用人工设计特征的情况下,提升了实体识别率;其次,本文使用GCN学习语料中的句法依存分析信息,增强了词与词之间的关联。GCN在归一化操作后会为每个节点的邻接节点赋予相同的权重,忽视了节点之间依存关系的差异性。针对这一问题,本文还引入了图注意力机制优化邻接节点的特征权重,让模型更好地聚合邻接节点特征。实验结果表明,本文模型的F1值比Dai等[23]提出的模型高出了2.62个百分点,相比于Wei等[22]提出的模型,其准确率提高了5.99个百分点,F1值提高了3.41个百分点,获得了更好表现。