《表5 三种模型训练参数与效果对比》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于机器学习的动态基线性能时序数据异常检测研究与应用》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在同一训练数据集（15000*121）上使用三种模型进行训练和调参，并使用同一验证数据集比较RMSE，见表5。CatBoostRegressor模型具有overfit＿detect选项用于检测避免过拟合，需要训练调整的参数较少，迭代3000次约用时25分钟，RMSE评价指标在验证集上表现最优；GBDTRegressor模型需要训练调整的参数较多，模型训练一轮用时5分钟，RMSE评价指标在验证集上表现次之；LSTM模型构建神经网络较为复杂，结合Keras与TensorFlow使用GPU进行训练，批量大小512、迭代50轮用时20分钟，RMSE评价指标在验证集上表现逊于前两种模型。CatBoostRegressor模型对不同形状特征的时序数据表现稳定，泛化性较强。在工程实践中，综合考量模型泛化能力、部署方便性和模型效果，最终选择CatBoostRegressor作为机器学习模型。

图表编号	XD00179043000 严禁用于非法目的
绘制时间	2020.06.07
作者	马玉超
绘制单位	中国银行信息科技运营中心
更多格式	高清、无水印（增值服务）