《表2 实体识别的实验结果》
研究中,对于不同实体识别方法的效果对比见表2。由表2可以看到,当加入字符级的词向量时,模型的表现为最佳,达到了0.959 7。而基于LSTM的实体识别模型的表现最差,则是因为LSTM没有考虑到输出标签之间的联系,因而会出现一些不可能的错误。例如,“B-diseasae”后面的词的标签不可能是“I-test”。“B-diseasae”后面的标签只能是“I-disease”、“B-XX”或者“O”。但通过仿真结果讨论后可知,如果将LSTM后面加上CRF层就会避免该类错误,还可以发现字符级特征在实体识别上也是有效特征,能够更好地表征各个单词的含义,从而提高了实体识别的效果。
图表编号 | XD00102846200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 胡金鹏、关毅 |
绘制单位 | 哈尔滨工业大学计算机科学与技术学院、哈尔滨工业大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |