《表3 特征筛选结果:一种基于随机森林的改进特征筛选算法》

《表3 特征筛选结果:一种基于随机森林的改进特征筛选算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于随机森林的改进特征筛选算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

现使用改进算法进行特征筛选,控制迭代停止的参数是最小特征个数和允许误差增量,它们的默认值分别是5和2.5%。其他影响执行时间的参数有:随机森林包含的决策树个数(默认10),交叉验证的次数(默认3),每轮剔除的特征比例(默认0.15)。因为得到的病例有限,大部分参数对最终结果的影响并不大,所以只对误差增量进行调整并分析结果。又由于每轮迭代划分出的训练集都不同,故每次得到的特征重要性顺序也不同,导致结果会有一定差异,因此测试时会对同一个参数值的输出多次记录。表3中最后一列为使用筛选结果训练所得模型的测试精度。