《表5 实体标签表:基于深度学习的甲状腺病史结构化研究与实现》

《表5 实体标签表:基于深度学习的甲状腺病史结构化研究与实现》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于深度学习的甲状腺病史结构化研究与实现》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

(2) 文本分词。为确保实体识别模型的顺利训练,本文依赖基于标准词表构建的专业词库对病史文本进行精准分词。针对现有的中文分词工具对专业性较高的医学文本存在错误分词的问题,建立专业词库,提高分词准确度。专业词库包括症状、疾病、检查和治疗四个子库,初始化来源于几个专业数据集。另外,分词模块中需要对训练集加上标注,专家团队对13类实体进行标注,产生21种标签用于模型的监督学习。本文基于病史数据内容对甲状腺病史分词后的数据设计标签见表5。