《表4 数据不平衡处理分布》

《表4 数据不平衡处理分布》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据增强和模型更新的异常流量检测技术》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由表2可得,训练集中类别U2R数量远小于类别Do S,使用不平衡的数据集,分类器会倾向于将数据分到多数类别中,容易忽略掉少数类别。为了解决数据不平衡产生的问题,本文使用SMOTE-ENN算法对训练集进行过采样和欠采样操作,增强训练数据的分布,平衡后的数据分布情况如表4所示。