《表4 模型训练结果:基于文本分析的高铁技术规章优化研究》
训练通过Grid Search CV进行网格训练和调优,其中采用80%的训练数据作为训练集,20%的数据作为测试集,最终得到最优的模型参数为:Light GBM设置树的应用类型application=multiclasss,模型使用算法boosting=gbdt,度量函数metric=multi_logss,最大深度max_depth=15,分类数量num_class=18,叶子节点数num_leaves=64,学习速率learning_rate=0.01,随机特征设置比列feature_fraction=0.8,重采样比例bagging_fraction=0.9,重采样频率bagging_freq=5,正则化系数lambda_l1=0.6。最后在测试集上得到训练结果(见表4)。
图表编号 | XD00196695000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.15 |
作者 | 杨连报、刘新、董兴芝、李新琴、薛蕊、东春昭、徐贵红 |
绘制单位 | 中国铁道科学研究院集团有限公司电子计算技术研究所、中国铁道科学研究院集团有限公司运输及经济研究所、中国铁道科学研究院集团有限公司电子计算技术研究所、中国铁道科学研究院集团有限公司电子计算技术研究所、中国铁道科学研究院集团有限公司电子计算技术研究所、中国铁道科学研究院集团有限公司铁路基础设施检测中心、中国铁道科学研究院集团有限公司电子计算技术研究所 |
更多格式 | 高清、无水印(增值服务) |