《表5 Bi LSTM-CRF模型每类实体类型的评估结果(%)》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于BiLSTM-CRF中文临床文本中受保护的健康信息识别》
通过上述比对,选用Bi LSTM-CRF模型在全部出院小结记录上对模型进行评估。所有实体(32 311)类别识别的准确率、召回率以及F值分别达98.66%、99.36%以及99.01%,证明模型具有较好的性能。各实体类型结果如表5所示,大多数类型的实体识别F值超过95%。住院号与病理编号F值稍低于95%,可能由于编号间的结构相似性。而年龄F值偏低(83.17%),一部分原因可能是训练样本较少,且在出院小结文本中没有明显的年龄标记(如“张某,97,于2017年入院”)。而对于X光片编号类别,除训练样本较少原因外,部分出院小结中在上文提及相关操作,而下文编号没有明确指出为哪一类编号,因此造成识别准确率偏低(如“入院期间拍摄X光片,编号xxxx”)。
图表编号 | XD00227032800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.25 |
作者 | 刘婧茹、宋阳、贾睿、张翼鹏、罗勇、马敬东 |
绘制单位 | 华中科技大学同济医学院医药卫生管理学院、华中科技大学同济医学院医药卫生管理学院、四川省电子病历工程技术研究中心、成都中医药大学公共卫生学院、华中科技大学同济医学院医药卫生管理学院、四川省电子病历工程技术研究中心、四川九阵科技股份有限公司、华中科技大学同济医学院医药卫生管理学院 |
更多格式 | 高清、无水印(增值服务) |