《表3 基于不同采样方法的分类器性能比较》

《表3 基于不同采样方法的分类器性能比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向不平衡分类的IDP-SMOTE重采样算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文采用随机森林分类算法对本文提出的重采样方法进行测试和评价,并与SMOTE、KM-SMOTE和DB-SMOTE算法等升采样方法进行对比。其中,分类算法采用基于Python的scikit-learn机器学习包[12]中的标准模型和默认参数。重采样算法中,SMOTE、KM-SMOTE以及DB-SMOTE的最近邻系数均设置为k=5;设置KM-SMOTE的聚类系数c=2;设置DB-SMOTE的邻域半径ε=0.5,邻域内最少样本数MinPts=5;所有升采样算法的升采样比例均设置为β=1。分类器性能的采用F-measure、G-means和AUC等不平衡分类中常用的指标进行评价。每次实验随机选取75%的各类样本作为训练集,剩余样本作为测试集。通过100次重复实验,获得各个指标的平均值,其结果如表3所示。