《表4 十种非平衡数据集抽样方法[17-21]》

《表4 十种非平衡数据集抽样方法[17-21]》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向非平衡数据集的随机森林算法对学生学业问题的预测分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:表中1-6为向下采样,7-8为向上采样,9-10为混合采样

首先将原始非平衡数据集按照7∶3分成训练集和测试集,采用随机分层划分10次,确保每次划分的训练集和测试集的数据分布一致性.划分后,每次训练集和测试集的平衡率均为0.17(平均绩点≤2.2为少数类,其余为多数类),在10次划分的数据集上分别计算性能指标,然后取均值.采取10种非平衡数据方法处理原始数据(见表4)后,重复上述过程,得出性能指标的均值.