《表5 词嵌入向量类比测试结果》
随后,将各模型应用于测试集上,以检测其泛化能力,结果如表5所示。可知,MLP在影响部位和诊断关系识别任务上仍保持着很好的泛化能力,SVM和RF尽管对影响部位关系的识别效果最佳,但却获得较差的召回率。另外,MLP在疾病关系、症状表征关系识别训练上存在明显的过拟合现象(验证集结果远优于测试集结果),应与训练集规模有关。综合各模型特点,对其按照各关系识别效果赋予权重进行软投票集成。可知,在一定程度上能够提升疾病关系识别效果,症状表征关系和影响部位关系识别任务的F1值已达最佳。总体看来,诊断关系识别、影响部位关系识别上F1值均达到93%以上,效果已经相当不错;而疾病关系识别、症状表征关系识别在训练集较小的前提下,F1值也分别达到70.64%和78.16%,并且存在扩大训练集以改进效果的空间。
图表编号 | XD00110127200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.24 |
作者 | 陈果、许天祥 |
绘制单位 | 南京理工大学经济管理学院信息管理系、江苏省社会公共安全科技协同创新中心、南京理工大学经济管理学院信息管理系 |
更多格式 | 高清、无水印(增值服务) |