《表2 随机森林模型参数设置》

《表2 随机森林模型参数设置》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种改进的随机森林在医疗诊断中的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

不同于神经网络,随机森林算法仅涉及两个超参数的配置[18]。它们是森林中树的棵数Nt和构造单个决策树时选用特征的个数Nf。由定理1可以看出,Nt的增加并不会导致森林出现严重的过拟合。但是随着树数目的增多,模型所花费的时间成本与空间成本都会上升。而且边际效用递减法则同样适用于此[14]。Nf如果取值过小,则单棵决策树的强度无法得到保证;但随着Nf的增大,森林中树间的相关度有可能也会增大。经过上述分析我们不难发现Nt和Nf的设置对于模型性能的影响是很大的。经过大量实验,本文对随机森林的两个超参数的设置如表2所示。