《表1 跨网络实体对齐关系数据集》
实验的数据集采用Guan等人[20]提出的Cora1和Baidu Douban M/TV,如表1所示。第一个数据集来自英文Cora(1),记为Cora1,包括关于科学论文的书目信息,从论文的引用列表中生成的。两个数据源共有288个论文实体,每个实体都包含作者、标题、出版商等16个单网络关系,两个数据源共形成单网络关系2180个。第一个数据源有论文实体145个,第二个数据源有论文实体143个,跨网络实体对齐关系有116个,其中训练集76个,验证集20个,测试集20个,属于科研学术领域数据,语义视角包括论文标题、论文关键字、论文摘要等,结构视角包括论文作者、论文机构、发表时间等。第二个数据集是百度和豆瓣的电影对齐数据集,记作Baidu Douban M/TV,数据的标注是给定762个百度视频实体,去豆瓣视频中搜索,找到对齐的762个豆瓣视频的实体,即共有762个跨网络实体对齐关系,其中462个作为训练集,150个作为验证集,150个作为测试集。共有7 219个视频实体,每个视频实体有名称、导演、演员等共5个单网络关系,两个网络的单网络三元组共27 960个,属于视频领域数据,语义视角包括视频名称、演员等,结构视角包括导演、上映时间等。
图表编号 | XD0041681900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.15 |
作者 | 苏佳林、王元卓、靳小龙、李曼玲、程学旗 |
绘制单位 | 中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室、中国科学院大学计算机与控制学院、中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室 |
更多格式 | 高清、无水印(增值服务) |