《表8 全部标注与少量标注对比实验》
将3.1节的BBC分类器使用全标注数据训练模型并与改进的知识迁移景点实体识别算法(使用少量标注数据)进行对比,结果如表8所示。可知,改进的算法在使用1/4的标注数据与全标注实验结果在P值上相差1.73%。此外,使用1/2的标注数据的识别准确率要高于使用全部标注数据的模型1.62%。观察两种结果可知,使用全标注的实验主要存在半自动化标注过程中的实体标注错误。这说明原始训练集中已经存在错误的标注数据,导致在识别过程中准确率下降。而本文算法利用公开的《人民日报》数据通过知识迁移的思想解决了这一问题。
图表编号 | XD00174902400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.25 |
作者 | 赵平、孙连英、涂帅、卞建玲、万莹 |
绘制单位 | 北京联合大学智慧城市学院、北京联合大学城市轨道交通与物流学院、北京联合大学智慧城市学院、北京中电普华信息技术有限公司、北京联合大学智慧城市学院 |
更多格式 | 高清、无水印(增值服务) |