《表2 用户数量、训练集测试集结果分析表》
用户数量(Size)、训练集比例(Training set)以及测试集比例(Test set)对随机森林得分(Score)的影响如表2所示,由于随机森林随机提取测试集,即使相同的用户数据、训练集比例以及测试集比例也会得到不同的实验结果,每次相同数据进行50次实验取平均值得到表中数据,从表中数据可知,训练集比例以及测试集比例对所构造的森林得分无较大影响,训练集比例取值为0.6时,森林得分较好;测试集比例不能过小,以免影响测试森林得分,无法公正评估森林准确性。随着用户数量的增加,得到的森林越加准确,到最后35 000个数据时,森林得分趋于稳定,所以本文中取35 000个用户历史数据,训练集比例为0.6,测试集比例为0.4进行实验。
图表编号 | XD00163029300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 郭羽含、胡德甲 |
绘制单位 | 辽宁工程技术大学软件学院、辽宁工程技术大学软件学院 |
更多格式 | 高清、无水印(增值服务) |