《表5 半监督节点分类常用数据集》

《表5 半监督节点分类常用数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《图卷积神经网络综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在社会网络分析领域,引文网络是最为常见的数据,即节点为论文,连边关系为引用关系,常见的数据集包括Cora,DBLP,Citeseer等.这些常见的网络的数据集的描述如表5.一个典型的分类任务是给定每篇文章的内容信息和文章之间的引用关系,将每篇文章分类到对应的领域中.例如,在节点的半监督分类场景下,已知节点的属性信息包括文章的标题或摘要信息,以及节点之间的引用关系构成的网络信息,给定少量的数据标签,通过机器学习的方式,对网络中的每个节点的所属领域进行划分.在该任务中,图卷积神经网络将节点文本属性和引用网络结构有效的建模,取得了巨大的成功.如表6所示,相比直接使用内容信息(如MLP),仅使用结构信息(如DeepWalk[14])和传统图上半监督节点分类方法(如Planetoid[97]),以GCN为代表的图卷积神经网络算法的分类准确率远高于传统的方法,其中,GAT相比Planetoid模型在Cora、Citeseer、Pubmed上,分别提升7.3%,7.8%和1.8%.该任务也通常被视为衡量一个图卷积神经网络模型是否有效的基准任务.GCN[19],GAT[28],GWNN[21]等都使用该任务验证模型的有效性.