《表1 三种模型误差对比:豆瓣Top 250电影数据挖掘及评分预测》

《表1 三种模型误差对比:豆瓣Top 250电影数据挖掘及评分预测》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《豆瓣Top 250电影数据挖掘及评分预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

(2)模型构建。本文利用sklearn.ensemble中的RandomForestClassifier和GradientBoostingRegressor实现随机森林算法和梯度提升回归算法,sklearn中的tree包实现回归树算法。将处理好的训练集数据分别使用这三种算法来构建随机森林回归模型、Gradient Boosting回归模型和回归树模型,并利用predict()方法对测试集预测对应的值,即电影评分。三种模型得到的误差结果如表1所示。