《表2 KDD 99训练集和测试集分布情况》

《表2 KDD 99训练集和测试集分布情况》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于数据增强和模型更新的异常流量检测技术》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由于KDD 99数据集中存在大量的冗余数据,在模型训练过程中会降低模型训练的精度和效率,在测试集上表现欠佳。本文从去冗余的训练集中选取了40000条作为训练数据集,选取所有去冗余后的测试数据作为测试数据集,共77287条,实验中使用的数据量与文献[5]一致,训练数据集和测试数据集分布情况如表2所示。因为数据集中各个属性度量各不相同,为了更好地对特征进行提取,将训练数据进行归一化处理。