《表6 优化特征提取前后运行结果比较》
通过公布的学堂在线日志数据集利用机器学习模型预测学员流失的概率,但是对于如何确定学员是否真正流失,官方给出的定义是:如果学员在未来10天内没有任何学习事件产生,则认为该学员从平台流失。基于此,分别选用4个基本特征和114个具有时间序列特点的优化特征,通过Python编程实现Logistic regression、Random forests、Gradient boosting三种机器学习模型,然后进行学员流失预测对比分析。预测结果对比如表6所示。
图表编号 | XD0068510400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.05 |
作者 | 王晓芳、贾宗维 |
绘制单位 | 晋中师范高等专科学校、山西农业大学信息科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |