《表2 变量的重要性排序:基于随机森林-支持向量机隧道盾构引起建筑物沉降研究》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于随机森林-支持向量机隧道盾构引起建筑物沉降研究》
直接选用上述16个影响因素建立预测模型容易产生过拟合现象,因此,需要先对影响因素进行筛选,剔除冗余变量,优选出新的影响因素集用于支持向量机建模。本文在参考大量文献基础上,最终创新性地使用随机森林算法对变量进行筛选,找出最优的变量组合以提高模型的预测精度。先将全部数据样本划分成容量为320的训练数据集和容量为80的测试数据集两部分。然后,利用R软件中Random Forest程序包来实现随机森林算法中的必要计算,从而对训练集中的影响因素进行特征选择。根据式(9)计算得到训练集中各指标的重要性,并将不同变量的重要性降序排列,其排列分布如表2所示。并据此将最不重要的变量特征逐次从现有的特征集中剔除,从而得到多组训练子集,计算每组训练子集的OBB误差率,选择误差最小的特征集作为备选特征变量集。
图表编号 | XD00211835300 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.01 |
作者 | 王祥、陈发达、刘凯、吴贤国、陈彬 |
绘制单位 | 贵阳城市轨道交通有限公司、贵阳城市轨道交通有限公司、贵阳城市轨道交通有限公司、华中科技大学土木与水利工程学院、华中科技大学土木与水利工程学院 |
更多格式 | 高清、无水印(增值服务) |