《表1 样本不均衡分布情况统计》

《表1 样本不均衡分布情况统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向非均衡数据的糖尿病并发症预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了证明这一观点,选择UCI下的三个正负样本不同比例的数据集(煤矿高能地震波数据集、肺癌患者数据集和心力衰竭患者数据集),分别对比学习器(随机森林)使用SMOTE和F_SMOTE的实验数据。其中,随机森林学习器采用默认参数设置,使用5折交叉验证,SMOTE中的K近邻参数取值为3。为便于对比新算法的优势,三个数据集的正负数据分布情况如表1所示,SMOTE和F_SMOTE的PR曲线下的AUC值如图1所示。