《表5 三种模型训练参数与效果对比》

《表5 三种模型训练参数与效果对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的动态基线性能时序数据异常检测研究与应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在同一训练数据集(15000*121)上使用三种模型进行训练和调参,并使用同一验证数据集比较RMSE,见表5。CatBoostRegressor模型具有overfit_detect选项用于检测避免过拟合,需要训练调整的参数较少,迭代3000次约用时25分钟,RMSE评价指标在验证集上表现最优;GBDTRegressor模型需要训练调整的参数较多,模型训练一轮用时5分钟,RMSE评价指标在验证集上表现次之;LSTM模型构建神经网络较为复杂,结合Keras与TensorFlow使用GPU进行训练,批量大小512、迭代50轮用时20分钟,RMSE评价指标在验证集上表现逊于前两种模型。CatBoostRegressor模型对不同形状特征的时序数据表现稳定,泛化性较强。在工程实践中,综合考量模型泛化能力、部署方便性和模型效果,最终选择CatBoostRegressor作为机器学习模型。