《表4 长、短机构名的实验结果对比》
实验结果还表明,Ensemble-SVM对人名和地名F值的提高效果比较明显,但是对于机构名的识别效果有所下降。这是因为Ensemble-SVM的最终模型使用的是分类算法,对各个标签进行标注时是相对独立的,没有利用序列中标签之间的依赖信息。而Char-NER和Word-NER的解码层使用CRF模型的转移概率矩阵对标签进行约束,从而降低非法标签序列出现的概率。本文将由3个或3个以上词组成的机构名作为长机构名,其他作为短机构名。对《人民日报》的测试结果进行统计分析,其中长机构名335个,预测出273个,正确的有248个,短机构名590个,预测出601个,正确的有535个。实验结果如表4所示。
图表编号 | XD00109148500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 殷章志、李欣子、黄德根、李玖一 |
绘制单位 | 大连理工大学计算机科学与技术学院、大连理工大学计算机科学与技术学院、大连理工大学计算机科学与技术学院、大连理工大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |