《表1 元素测量条件:基于主动学习的中文电子病历命名实体识别研究》
为实现对基于信息熵的中文电子病历NER方法的实证评估,本文采用CCKS 2018 CNER评测数据[10],其中,训练数据600份,测试数据400份,实体类型包括解剖部位、手术、药物、独立症状、症状描述。根据主动学习的一般迭代方法[8],每次迭代选择排序靠前的2i+2份语料进行标注,其中,i代表迭代的次数。因此,最终选取600份中的512条(即:29)作为本实验的训练集,具体语料分布情况见表1。
图表编号 | XD00212845000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.15 |
作者 | 胡佳慧、赵琬清、方安、范云满 |
绘制单位 | 中国医学科学院医学信息研究所、中国医学科学院医学信息研究所、中国医学科学院医学信息研究所、中国医学科学院医学信息研究所 |
更多格式 | 高清、无水印(增值服务) |