《表2 词典规模:基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别》

《表2 词典规模:基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

(3) 词典特征。因为EMR的专业性比较强,为减少实体的错切分率,引入专业词典具有重要意义。在英文NER领域,MeSH、UMLS、SNOMED-CT、RxNORM等通用词典发挥了重要作用。由于中文领域缺乏公开且完整的医学词典,因此,我们从网络和书本中整理并构建了EMR基本元素(item)、解剖位置(body)、症状(symptom)、中文临床药物标准知识库(normalized Chinese clinical drug,NCCD)[10]4个词典。词典规模如表2所示。例如NCCD包括CONCEPT-NAME、CONCEPT-ID、CONCEPT-CLASS-ID等属性,本研究整理了CONCEPT-NAME药名属性共28 008个作为词典特征加入。