《表1 基础排重规则:科技大数据知识图谱构建模型与方法研究》

《表1 基础排重规则:科技大数据知识图谱构建模型与方法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《科技大数据知识图谱构建模型与方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由于不同来源数据的描述方式存在差异,并且存在不同作者具有相同的名称、机构缩写或别名、期刊名称全拼缩写等中英文名称的歧义问题,需要对知识抽取获得的实体进行对齐和共指消歧。为此,首先针对不同的实体类型提出如表1所示的基础排重规则,对不同来源的实体进行甄别、筛选和区分,将不同数据来源中表示同一对象的实体归并为一个具有统一标识的实体添加到知识图谱中。例如使用DOI、ISSN、ISBN、ORCID等唯一标识符分别进行期刊论文、期刊、图书、研究人员实体去重,使用标题、作者、出版年份确定同一篇期刊论文,论文名称、会议名称、地点、日期等区分会议论文,使用标题、作者、毕业院校、年份、指导教师区别学位论文,使用标题和日期区分科技报告,研究人员也可通过邮箱、姓名、所属机构区分判断,机构通过名称和地点区分判断,会议通过会议名称、会议时间、地点区分判断,项目通过资助编号、项目名称和资助年份区分判断。