《表2 随机森林模型参数设置》
不同于神经网络,随机森林算法仅涉及两个超参数的配置[18]。它们是森林中树的棵数Nt和构造单个决策树时选用特征的个数Nf。由定理1可以看出,Nt的增加并不会导致森林出现严重的过拟合。但是随着树数目的增多,模型所花费的时间成本与空间成本都会上升。而且边际效用递减法则同样适用于此[14]。Nf如果取值过小,则单棵决策树的强度无法得到保证;但随着Nf的增大,森林中树间的相关度有可能也会增大。经过上述分析我们不难发现Nt和Nf的设置对于模型性能的影响是很大的。经过大量实验,本文对随机森林的两个超参数的设置如表2所示。
图表编号 | XD00168955300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.01 |
作者 | 庞泰吾、胡春燕、尹钟 |
绘制单位 | 上海理工大学光电信息与计算工程学院、上海理工大学光电信息与计算工程学院、上海理工大学光电信息与计算工程学院 |
更多格式 | 高清、无水印(增值服务) |