《表1 字符类数据数值化处理》
KDD Cup99数据集包含42个字段,其中41个是网络数据包特征属性字段,另外一个是该条数据记录的标签。为避免字符数据不能直接计算距离以及过大过小数据直接应用影响平均值计算和距离计算效果等问题,将数据的字段按照表1的方法进行处理。例如,对protocol_type字段,其离散数值包括TCP、UDP、ICMP等,则TCP用11表示,UDP用12表示,ICMP用20表示。
图表编号 | XD00134618600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 汪生、金志刚 |
绘制单位 | 中国北方电子设备研究所、天津大学电气自动化与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |