《表3 特征筛选结果:一种基于随机森林的改进特征筛选算法》
现使用改进算法进行特征筛选,控制迭代停止的参数是最小特征个数和允许误差增量,它们的默认值分别是5和2.5%。其他影响执行时间的参数有:随机森林包含的决策树个数(默认10),交叉验证的次数(默认3),每轮剔除的特征比例(默认0.15)。因为得到的病例有限,大部分参数对最终结果的影响并不大,所以只对误差增量进行调整并分析结果。又由于每轮迭代划分出的训练集都不同,故每次得到的特征重要性顺序也不同,导致结果会有一定差异,因此测试时会对同一个参数值的输出多次记录。表3中最后一列为使用筛选结果训练所得模型的测试精度。
图表编号 | XD0078686000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.15 |
作者 | 刘云翔、陈斌、周子宜 |
绘制单位 | 上海应用技术大学计算机科学与信息工程学院、上海应用技术大学计算机科学与信息工程学院、上海应用技术大学计算机科学与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |