《表5 三种模型训练参数与效果对比》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的动态基线性能时序数据异常检测研究与应用》
在同一训练数据集(15000*121)上使用三种模型进行训练和调参,并使用同一验证数据集比较RMSE,见表5。CatBoostRegressor模型具有overfit_detect选项用于检测避免过拟合,需要训练调整的参数较少,迭代3000次约用时25分钟,RMSE评价指标在验证集上表现最优;GBDTRegressor模型需要训练调整的参数较多,模型训练一轮用时5分钟,RMSE评价指标在验证集上表现次之;LSTM模型构建神经网络较为复杂,结合Keras与TensorFlow使用GPU进行训练,批量大小512、迭代50轮用时20分钟,RMSE评价指标在验证集上表现逊于前两种模型。CatBoostRegressor模型对不同形状特征的时序数据表现稳定,泛化性较强。在工程实践中,综合考量模型泛化能力、部署方便性和模型效果,最终选择CatBoostRegressor作为机器学习模型。
图表编号 | XD00179043000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.07 |
作者 | 马玉超 |
绘制单位 | 中国银行信息科技运营中心 |
更多格式 | 高清、无水印(增值服务) |