《表3 各算法在不同数据集上的F1-value对比》

《表3 各算法在不同数据集上的F1-value对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于聚类混合采样的不平衡数据分类》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文实验均在Jupyter Notebook上运行,其中在HSBC算法中,m1取10,m2取0.2时算法总体来看效果最好,因此本次实验取该值。对于每个数据集,按7:3的比例划分为训练集与测试集,5个数据集分别经过不做均衡化处理、随机欠采样(RUS)、随机过采样(ROS)、SMOTE算法、ADASYN算法及HSBC算法后使用GBDT算法对新训练集进行分类。F1-value及AUC对比结果见表3和表4,其中最大值用粗体标出。