《表2 算法及其参数的取值范围》
为了得到此场景下各算法的最优超参数,使用了网格搜索的方法来“调整”超参数,同样使用3折交叉验证的方法和可决系数作为评估衡准。需“调整”的超参数及其最优值搜索范围如表2所示,其选取理由主要基于在通常情况下业界对算法的使用建议以及个人的使用经验。显然,每一种算法在超参数寻优过程中的计算成本不同,例如对于LightGBM算法,其寻优空间共有1 620种可能性,而岭回归算法只有5种。此处没有控制每一种算法在超参数寻优过程中的计算成本尽可能相同,是因为想挖掘每一种算法在此业务场景中的最大潜力,得到其最佳性能。此外,对于未提及的算法超参数,其取值为scikit-learn中的默认推荐值。
图表编号 | XD00119081400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 张美兰、刘琳琳 |
绘制单位 | 上海振华重工(集团)股份有限公司海服研究院、上海振华重工(集团)股份有限公司海服研究院 |
更多格式 | 高清、无水印(增值服务) |