《表1 三种模型误差对比:豆瓣Top 250电影数据挖掘及评分预测》
(2)模型构建。本文利用sklearn.ensemble中的RandomForestClassifier和GradientBoostingRegressor实现随机森林算法和梯度提升回归算法,sklearn中的tree包实现回归树算法。将处理好的训练集数据分别使用这三种算法来构建随机森林回归模型、Gradient Boosting回归模型和回归树模型,并利用predict()方法对测试集预测对应的值,即电影评分。三种模型得到的误差结果如表1所示。
图表编号 | XD00197555200 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.10 |
作者 | 耿娟、郭明欣 |
绘制单位 | 河北经贸大学数学与统计学学院 |
更多格式 | 高清、无水印(增值服务) |