《表5 词嵌入向量类比测试结果》

《表5 词嵌入向量类比测试结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《小规模知识库指导下的细分领域实体关系发现研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

随后,将各模型应用于测试集上,以检测其泛化能力,结果如表5所示。可知,MLP在影响部位和诊断关系识别任务上仍保持着很好的泛化能力,SVM和RF尽管对影响部位关系的识别效果最佳,但却获得较差的召回率。另外,MLP在疾病关系、症状表征关系识别训练上存在明显的过拟合现象(验证集结果远优于测试集结果),应与训练集规模有关。综合各模型特点,对其按照各关系识别效果赋予权重进行软投票集成。可知,在一定程度上能够提升疾病关系识别效果,症状表征关系和影响部位关系识别任务的F1值已达最佳。总体看来,诊断关系识别、影响部位关系识别上F1值均达到93%以上,效果已经相当不错;而疾病关系识别、症状表征关系识别在训练集较小的前提下,F1值也分别达到70.64%和78.16%,并且存在扩大训练集以改进效果的空间。