《表1 元素测量条件:基于主动学习的中文电子病历命名实体识别研究》

《表1 元素测量条件:基于主动学习的中文电子病历命名实体识别研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于主动学习的中文电子病历命名实体识别研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为实现对基于信息熵的中文电子病历NER方法的实证评估,本文采用CCKS 2018 CNER评测数据[10],其中,训练数据600份,测试数据400份,实体类型包括解剖部位、手术、药物、独立症状、症状描述。根据主动学习的一般迭代方法[8],每次迭代选择排序靠前的2i+2份语料进行标注,其中,i代表迭代的次数。因此,最终选取600份中的512条(即:29)作为本实验的训练集,具体语料分布情况见表1。