《表5 半监督节点分类常用数据集》
在社会网络分析领域,引文网络是最为常见的数据,即节点为论文,连边关系为引用关系,常见的数据集包括Cora,DBLP,Citeseer等.这些常见的网络的数据集的描述如表5.一个典型的分类任务是给定每篇文章的内容信息和文章之间的引用关系,将每篇文章分类到对应的领域中.例如,在节点的半监督分类场景下,已知节点的属性信息包括文章的标题或摘要信息,以及节点之间的引用关系构成的网络信息,给定少量的数据标签,通过机器学习的方式,对网络中的每个节点的所属领域进行划分.在该任务中,图卷积神经网络将节点文本属性和引用网络结构有效的建模,取得了巨大的成功.如表6所示,相比直接使用内容信息(如MLP),仅使用结构信息(如DeepWalk[14])和传统图上半监督节点分类方法(如Planetoid[97]),以GCN为代表的图卷积神经网络算法的分类准确率远高于传统的方法,其中,GAT相比Planetoid模型在Cora、Citeseer、Pubmed上,分别提升7.3%,7.8%和1.8%.该任务也通常被视为衡量一个图卷积神经网络模型是否有效的基准任务.GCN[19],GAT[28],GWNN[21]等都使用该任务验证模型的有效性.
图表编号 | XD00163165600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 徐冰冰、岑科廷、黄俊杰、沈华伟、程学旗 |
绘制单位 | 中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所 |
更多格式 | 高清、无水印(增值服务) |