《表2 KDD 99训练集和测试集分布情况》
由于KDD 99数据集中存在大量的冗余数据,在模型训练过程中会降低模型训练的精度和效率,在测试集上表现欠佳。本文从去冗余的训练集中选取了40000条作为训练数据集,选取所有去冗余后的测试数据作为测试数据集,共77287条,实验中使用的数据量与文献[5]一致,训练数据集和测试数据集分布情况如表2所示。因为数据集中各个属性度量各不相同,为了更好地对特征进行提取,将训练数据进行归一化处理。
图表编号 | XD00140338300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.10 |
作者 | 张浩、陈龙、魏志强 |
绘制单位 | 福州大学数学与计算机科学学院、福建省网络计算与智能信息处理重点实验室、福州大学数学与计算机科学学院、福建省网络计算与智能信息处理重点实验室、福州大学数学与计算机科学学院、福建省网络计算与智能信息处理重点实验室 |
更多格式 | 高清、无水印(增值服务) |