《表2 各类算法结果对比》

《表2 各类算法结果对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于GBDT算法的地铁IC卡通勤人群识别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从800份中处理过样本数据中,按通勤与非通勤在总体中的近似比例抽取650份作为训练数据,剩余150份作为测试数据。是否通勤为树的模型叶节点域,通勤为1,非通勤为-1。设定迭代次数为50,即最终生成树的个数。设置相关参数,最终训练较好的GBDT分类器在测试数据中的通勤识别正确率高达94.16%,具有很高的泛化能力。作为对比,此外采用贝叶斯算法、决策树、随机森林算法去训练分类器,用同样的数据进行训练建模和测试,其中构建GBDT分类器的效果最好,对比结果如表2。