《表4 模型训练结果:基于文本分析的高铁技术规章优化研究》

《表4 模型训练结果:基于文本分析的高铁技术规章优化研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于文本分析的高铁技术规章优化研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

训练通过Grid Search CV进行网格训练和调优,其中采用80%的训练数据作为训练集,20%的数据作为测试集,最终得到最优的模型参数为:Light GBM设置树的应用类型application=multiclasss,模型使用算法boosting=gbdt,度量函数metric=multi_logss,最大深度max_depth=15,分类数量num_class=18,叶子节点数num_leaves=64,学习速率learning_rate=0.01,随机特征设置比列feature_fraction=0.8,重采样比例bagging_fraction=0.9,重采样频率bagging_freq=5,正则化系数lambda_l1=0.6。最后在测试集上得到训练结果(见表4)。