《表2 计算数据集示例:基于大数据的高职院校贫困生精准认定探析》
在所有学生数据中,受资助数据样本较少,直接运用分类模型进行受助对象认定往往准确率不高。采用SMOTE采样平衡数据,可以提高分类效度,准确识别受资助者的特征。本次实验采样10 236条样本数据,其中受资助样本1 535条,通过SMOTE重采样方法,选取5个近邻进行计算。计算数据集如表2所示。实验结果显示,SMOTE处理后的数据不平衡率显著改善,较大提高了受资助者认定的准确率,有助于后期建模预测的精准度将大幅度提升,也能准确地识别受资助学生的特征,对于贫困生精准认定可以起到很好的效果。
图表编号 | XD00152775800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.25 |
作者 | 袁璟瑾、孔淑佩、陈燕 |
绘制单位 | 江苏航运职业技术学院学生工作处、江苏航运职业技术学院运输管理与经济学院、江苏航运职业技术学院运输管理与经济学院 |
更多格式 | 高清、无水印(增值服务) |