《表1 科学家合作网数据说明》
将所有特征作为XGBoost模型的输入,使用分类器模型预测网络中的链路得到链路预测AUC值见表10。从表中可以看出,使用未进行特征选择的所有特征得到的AUC值为0.967,而使用单类特征选择之后得到的子集U的AUC值为0.965,与特征选择之间相差很小,说明特征选择过程可以帮助我们删除预测中部分冗余特征。对特征子集U进一步做特征选择,去掉特征排序中影响力等级低的相似性特征以及特征相关性中的部分强相关特征后,AUC值为0.959,与特征子集U的AUC值相差较小,说明在去冗余和去相关之后得到了与原始特征非常接近的预测结果。说明特征选择在多类别的网络结构特征中起到了关键性作用,进行特征选择可以在降低特征维数的同时,保证预测效果达到与特征选择之前相近的水平。
图表编号 | XD00130720200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.01 |
作者 | 许爽、李淼磊 |
绘制单位 | 大连民族大学信息与通信工程学院、大连民族大学信息与通信工程学院 |
更多格式 | 高清、无水印(增值服务) |