《表2 语义标注结果:基于文本语义理解的学科发展趋势分析》
语义标注及评价结果如表2所示。方法将原始词表提供的百余个领域词汇扩展到上千个,为快速获取领域知识提供了一种便捷手段。而且,研究主题和关键技术的平均识别正确率为81%,能够为深入文本内容的学科发展趋势分析提供较为优质的数据资源。虽然标注语料中“研究主题”的数量仅为“关键技术”的一半,但语义标注模型识别出了更多的“关键技术”且正确率更高。分析采样数据发现,描述“关键技术”的词汇较为固定,语义模糊性相对较弱,使得Bootstrapping方法在迭代过程中能更快速捕捉到大多数实例的词法表达模式,缓解了“语义漂移”现象。
图表编号 | XD00136258500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.05 |
作者 | 余丽 |
绘制单位 | 中国科学院文献情报中心、资源与环境信息系统国家重点实验室 |
更多格式 | 高清、无水印(增值服务) |