《表2 词典规模:基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于句子级Lattice-长短记忆神经网络的中文电子病历命名实体识别》
(3) 词典特征。因为EMR的专业性比较强,为减少实体的错切分率,引入专业词典具有重要意义。在英文NER领域,MeSH、UMLS、SNOMED-CT、RxNORM等通用词典发挥了重要作用。由于中文领域缺乏公开且完整的医学词典,因此,我们从网络和书本中整理并构建了EMR基本元素(item)、解剖位置(body)、症状(symptom)、中文临床药物标准知识库(normalized Chinese clinical drug,NCCD)[10]4个词典。词典规模如表2所示。例如NCCD包括CONCEPT-NAME、CONCEPT-ID、CONCEPT-CLASS-ID等属性,本研究整理了CONCEPT-NAME药名属性共28 008个作为词典特征加入。
图表编号 | XD0055524900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.20 |
作者 | 潘璀然、王青华、汤步洲、姜磊、黄勋、王理 |
绘制单位 | 南通大学医学院医学信息学教研室、南通大学医学院医学信息学教研室、哈尔滨工业大学(深圳)计算机科学与技术学院、海军军医大学(第二军医大学)长征医院风湿免疫科、南通大学信息科学技术学院通讯工程教研室、南通大学医学院医学信息学教研室 |
更多格式 | 高清、无水印(增值服务) |