《表2 用户数量、训练集测试集结果分析表》

《表2 用户数量、训练集测试集结果分析表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于随机森林与变邻域下降的车辆合乘求解》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

用户数量(Size)、训练集比例(Training set)以及测试集比例(Test set)对随机森林得分(Score)的影响如表2所示,由于随机森林随机提取测试集,即使相同的用户数据、训练集比例以及测试集比例也会得到不同的实验结果,每次相同数据进行50次实验取平均值得到表中数据,从表中数据可知,训练集比例以及测试集比例对所构造的森林得分无较大影响,训练集比例取值为0.6时,森林得分较好;测试集比例不能过小,以免影响测试森林得分,无法公正评估森林准确性。随着用户数量的增加,得到的森林越加准确,到最后35 000个数据时,森林得分趋于稳定,所以本文中取35 000个用户历史数据,训练集比例为0.6,测试集比例为0.4进行实验。