《表1 知识图谱构建方式:大规模知识图谱补全技术的研究进展》
构建知识图谱需要从外部数据源获取知识,将其加工成三元组的形式存入数据库中,该构建方式大体上经过了4个阶段.早期的知识库需要人工来完成,而且基本由小范围的专家组成[1~3],因此知识库的规模有限,成本高昂;后来,随着众包技术的出现[4],人工工作由网络上的志愿者及少量专家的协作来完成,成本下降但质量没有之前可靠,但是知识库的规模得到了快速增长;为了更好地保证知识库中数据的质量,从半结构化的文档中自动化地抽取知识,半结构化的自动提取方式产生了,但其依然依赖大量的手工规则、学习规则和正则表达式,这些规则会对最终产生的数据质量产生很大影响为了克服以上的不足,利用人工智能方法和自然语言处理的最新技术,自动地从无结构文档中抽取三元组成为可能[5~8].表1[9]中列举了针对技术发展各阶段的代表性知识库案例,其具体实现细节可以参考有关文献.
图表编号 | XD00135960500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.20 |
作者 | 王硕、杜志娟、孟小峰 |
绘制单位 | 中国人民大学信息学院、河北大学机器学习与计算智能重点实验室、中国人民大学信息学院、中国人民大学信息学院 |
更多格式 | 高清、无水印(增值服务) |