《表1 实体“姚明”抽取结果》

《表1 实体“姚明”抽取结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于简介文本的中文人物关系图谱属性补全与纠错》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

我们通过爬虫获取了最新版本的百科词条数据.常规的词条包含以下几类基本内容:词条ID、词条名称、词条简介、词条信息(InfoBox)、词条标签等.为构建规范的知识库,我们着重对基本结构进行抽取,其他信息选择性抽取.以运动员“姚明”为例,抽取结果如表1所示.对于每条属性或关系,彼此存在映射关系[20],均能够以形如?姚明,生肖,猴?的RDF三元组形式表示.数据经去重和舍弃错误抽取的实体,最终得到实体约893万条,三元组约3828万条.