《表1 跨网络实体对齐关系数据集》

《表1 跨网络实体对齐关系数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合语义和结构信息的知识图谱实体对齐》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验的数据集采用Guan等人[20]提出的Cora1和Baidu Douban M/TV,如表1所示。第一个数据集来自英文Cora(1),记为Cora1,包括关于科学论文的书目信息,从论文的引用列表中生成的。两个数据源共有288个论文实体,每个实体都包含作者、标题、出版商等16个单网络关系,两个数据源共形成单网络关系2180个。第一个数据源有论文实体145个,第二个数据源有论文实体143个,跨网络实体对齐关系有116个,其中训练集76个,验证集20个,测试集20个,属于科研学术领域数据,语义视角包括论文标题、论文关键字、论文摘要等,结构视角包括论文作者、论文机构、发表时间等。第二个数据集是百度和豆瓣的电影对齐数据集,记作Baidu Douban M/TV,数据的标注是给定762个百度视频实体,去豆瓣视频中搜索,找到对齐的762个豆瓣视频的实体,即共有762个跨网络实体对齐关系,其中462个作为训练集,150个作为验证集,150个作为测试集。共有7 219个视频实体,每个视频实体有名称、导演、演员等共5个单网络关系,两个网络的单网络三元组共27 960个,属于视频领域数据,语义视角包括视频名称、演员等,结构视角包括导演、上映时间等。