《表2 类不平衡和平衡数据集上的XGBoost性能》

《表2 类不平衡和平衡数据集上的XGBoost性能》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于SMOTE和XGBoost的窃电检测方案》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从图6可以看出,虽然RF和LR所用时间短,但结合图4、图5后发现精确率、召回率及F1得分3项评价指标上都低于XGBoost和GBDT,而XGBoost在检测正常用户方面虽然与GBDT性能接近,但其时间复杂度显著低于GBDT,体现出XGBoost模型多线程并行计算的速度优势。从图4、图5观察到针对不同模型的各项评价指标,在正常用户和窃电用户之间产生了矛盾的结果,这是因为尽管精度很高,但由于数据集不平衡,该模型不能很好地对负样本数据进行分类。因此采用SMOTE算法生成与真实窃电样本分布相似的合成样本,再使用新数据集对模型进行训练。如表2所示,窃电用户的精确率、召回率和F1得分3项指标及平均准确率大幅度提高,正常用户检测精度的降低也在可接受范围内,验证了本文所提出的解决数据类不平衡的方案的有效性。