《表9 混合不同文本的医生标注结果》
(注:Null表示混合不同文本为该测试医生标注的标签数量为0。)
得到基于不同文本的医生标注结果后,为进一步提高标注的准确率可以对基于不同文本得到的标注结果进行混合。从表8可以看出对于测试医生10、24、29与33,因为两种及以上的标注结果不存在,所以不能直接进行混合标注,需要替换相应文本重新挖掘相似医生后再进行混合标注;而对于测试医生13、21、28、35、38与63来说,已经用两种及以上的文本为其标注,在此基础上可直接进行混合标注,本文仅展示这些医生的混合标注过程。例如,对于测试医生13来说,可以混合咨询文本与文章标题两种文本对其进行标注,基于咨询文本为其标注时筛选出“咳嗽”、“高血压”、“冠心病”、“心脏病”、“肺炎”、“慢阻肺”、“房颤”与“月经失调”,基于文章标题为其标注时筛选出“高血压”、“糖尿病”、“冠心病”、“甲亢”、“房颤”、“心脏病”、“甲减”、“甲状腺疾病”与“心衰”,可以发现“高血压”、“冠心病”、“心脏病”与“房颤”4种投票在两类文本中都被筛选为适合标注的投票,因此这4种投票可以作为混合咨询文本与文章的标签对测试医生13进行标注。混合不同文本的标注结果如表9所示。
图表编号 | XD00174904300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.25 |
作者 | 叶佳鑫、熊回香、童兆莉、孟秋晴 |
绘制单位 | 华中师范大学信息管理学院、华中师范大学信息管理学院、华中师范大学信息管理学院、湖北交通职业技术学院、华中师范大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |