《表4 十种非平衡数据集抽样方法[17-21]》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向非平衡数据集的随机森林算法对学生学业问题的预测分析》
注:表中1-6为向下采样,7-8为向上采样,9-10为混合采样
首先将原始非平衡数据集按照7∶3分成训练集和测试集,采用随机分层划分10次,确保每次划分的训练集和测试集的数据分布一致性.划分后,每次训练集和测试集的平衡率均为0.17(平均绩点≤2.2为少数类,其余为多数类),在10次划分的数据集上分别计算性能指标,然后取均值.采取10种非平衡数据方法处理原始数据(见表4)后,重复上述过程,得出性能指标的均值.
图表编号 | XD00125960800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.25 |
作者 | 刘博、卢婷婷、陈国磊、赵璐 |
绘制单位 | 中国民航大学空中交通管理学院、中国民航大学空中交通管理学院、中国民航大学空中交通管理学院、中国民航大学空中交通管理学院 |
更多格式 | 高清、无水印(增值服务) |