《表2 变量的重要性排序:基于随机森林-支持向量机隧道盾构引起建筑物沉降研究》

《表2 变量的重要性排序:基于随机森林-支持向量机隧道盾构引起建筑物沉降研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于随机森林-支持向量机隧道盾构引起建筑物沉降研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

直接选用上述16个影响因素建立预测模型容易产生过拟合现象,因此,需要先对影响因素进行筛选,剔除冗余变量,优选出新的影响因素集用于支持向量机建模。本文在参考大量文献基础上,最终创新性地使用随机森林算法对变量进行筛选,找出最优的变量组合以提高模型的预测精度。先将全部数据样本划分成容量为320的训练数据集和容量为80的测试数据集两部分。然后,利用R软件中Random Forest程序包来实现随机森林算法中的必要计算,从而对训练集中的影响因素进行特征选择。根据式(9)计算得到训练集中各指标的重要性,并将不同变量的重要性降序排列,其排列分布如表2所示。并据此将最不重要的变量特征逐次从现有的特征集中剔除,从而得到多组训练子集,计算每组训练子集的OBB误差率,选择误差最小的特征集作为备选特征变量集。