《表8 链路预测结果:基于子图特征的科学家合作网络链路预测》

《表8 链路预测结果:基于子图特征的科学家合作网络链路预测》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于子图特征的科学家合作网络链路预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

使用基于邻居子图相似性特征作为XGBoost模型的输入得到的AUC值与进行特征选择后的AUC值见表8。从表中可以看出,使用所有特征得到的AUC值为0.831,只保留特征排序中影响力等级前4的特征后,AUC值为0.825,与所有相似性特征的AUC值相差较小,所以这些特征对链路预测结果影响较小。在去掉影响力低的特征基础上,又根据特征相关性,去掉了强相关特征中的HD_subvertex,得到的AUC值为0.705,与上一步的AUC值差距较大,分析原因发现,虽然jaccard_subvertex和HD_subvertex之间的相关性较高,可能是冗余特征,但是这两个特征在影响力排序中占据第1和第2位,十分重要,删除其中一个会对预测结果影响较大。因此在去冗余、去相关的时要综合考虑特征排序和相关性,根据特征选择去除冗余特征之后,可以得到基于邻居子图相似性特征的最优子集U2,U2={jaccard_subvertex,HD_subvertex,LHN_subvertex,subvertex}