《表9 随机森林+等距分箱+SMOTE建模预测细节分析》

《表9 随机森林+等距分箱+SMOTE建模预测细节分析》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据预处理技术的学生成绩预测模型研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表7中我们可以看到,未经预处理的数据集运用随机森林算法来进行预测,虽然可以以比较高的准确率来预测C、B、D三个等级,且成绩等级为A的学生最终有42.1%被正确预测,但等级为E的同学只有10%被正确预测,所以,虽然此模型的最终分类准确率能达到65.2%,但综合的效果不好.从表8中可以看到,经过SMOTE和人工分箱处理后,利用相同算法训练得到的模型对于类别A和E预测的能力得到了一定的提升,预测精度分别提高到50%和95%.表9的模型不同于表8的模型,使用了等距分箱进行建模对类别A和E的预测精度分别上升到67.1%和85%,最终的预测准确率为67.82%.最后再看表10,使用SMOTE和等频分箱处理的模型,不仅对原本的少数类A和E的预测精度提高到86.8%和91.3%,而且此方法的最终分类准确率也是几种方法中最高的,达到了71.72%.纵观经过预处理后的3种模型,对于等级为E(即不及格)的同学的预测准确率分别达到了95%、85%、91.3%,可以说达到了我们想要的效果.