《表1 实体“姚明”抽取结果》
我们通过爬虫获取了最新版本的百科词条数据.常规的词条包含以下几类基本内容:词条ID、词条名称、词条简介、词条信息(InfoBox)、词条标签等.为构建规范的知识库,我们着重对基本结构进行抽取,其他信息选择性抽取.以运动员“姚明”为例,抽取结果如表1所示.对于每条属性或关系,彼此存在映射关系[20],均能够以形如?姚明,生肖,猴?的RDF三元组形式表示.数据经去重和舍弃错误抽取的实体,最终得到实体约893万条,三元组约3828万条.
图表编号 | XD00168236800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.20 |
作者 | 杨一帆、马进、王海涛、何正球、陈文亮、张民 |
绘制单位 | 苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |