《表2 特征指标重要度排序》

《表2 特征指标重要度排序》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于自然驾驶数据的分心驾驶行为识别方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

最后,本文采用2种集成学习算法获取重要指标。方法1为梯度提升决策树-递归特征消除算法(Gradient Boosting Decision Tree-recursive Feature Elimination,GBDT-RFE),其中GBDT是一种常用的Boosting算法,能根据基学习器的表现对训练样本分布进行调整,使得先前的基学习器做错的训练样本在后续获得更多关注,最终将N个基学习器进行加权结合,得到最优分类结果[30]。方法2为随机森林-递归特征消除算法(Random Forest-recursive Feature Elimination,RF-RFE),随机森林属于Bagging方法的一种,它在决策树集成的基础上在训练过程中进一步引入了随机属性选择,输出的指标类别由各棵树投票而定。GBDT-RFE和RF-RFE算法分别采用GBDT和RF分析指标的重要性,得到指标的重要度排序,进而通过RFE方法遍历选择重要度高的特征。本文使用5折交叉验证,2种算法的特征个数与交叉验证正确分类分值的关系如图5(b)所示。可以发现,特征个数N=21时,GBDT-RFE和RF-RFE的分类正确值同时接近最优,且两者所获重要度排名前21的指标有80%以上的重合率,重要度排序结果基本一致。因此,本文选择了平均正确分类分值较高的GBDT-RFE获得前21个指标,如表2所示。