《表2 机器学习算法模型平均精度和标准差》

《表2 机器学习算法模型平均精度和标准差》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于MOOC的大数据学习预警模型在混合教学中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文在教学实践中尝试使用如支持向量机(SVM)、随机森林(Random-Forests)、朴素贝叶斯(Na6ve Bayes)、逻辑回归(Logistic Regression)、决策树(Decision Tree)、k-近邻(KNN)等主流机器学习算法建立预警模型。机器学习预警模型能够通过学生的学习行为信息预测其期末笔试成绩是否及格。模型的精度并不是决定机器学习算法效果的唯一因素。假设算法模型在训练数据上进行训练,需要在测试集上进行测试才有效果。如果算法模型在训练集上的精确度很高,但是无法确保在所有的新测试集上精度都很高,当训练和测试数据发生变化时,精确度也会改变,它可能会增加或减少。为了克服这一问题并得到一个广义模型,我们通常使用交叉验证。我们将数据分为10等分,通过特征数据标签准备、数据集切分、多种建模算法对比,用交叉验证来评估模型的精度。模型平均精度排前3位的依次为:支持向量机(76.33%)、逻辑回归(75.67%)、随机森林(72.67%)。其中支持向量机(SVM)建立的模型精度最高,平均预测精度和最高预测精度分别达到76.33%和90%(表2,图8,图9)。