《表1 各算法在不同规模数据集上的准确度》
本文从KDD-CUP 99数据集中选取5种不同规模的子集,首先进行预处理操作,然后进行数据标准化处理,以排除数据属性不同量纲带来的影响。各算法在不同规模数据集上检测的准确度大小如表1所示。从表1数据可以看出,本文提出的MR-DINFLO算法的准确度从数据集为100万时的0.86增长到500万时的0.94。这也说明了随着数据量的逐渐增大,算法越趋稳定。算法准确度评价结果如图2所示,从图2可以看出,在处理相同规模的数据时,本文提出的MR-DINFLO算法的准确度比MR-DINFLO(无信息熵)高,因此可以看出引入信息熵提高了检测准确度。同时可以看出INFLO算法准确度比LOF算法高。
图表编号 | XD0078281000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.10 |
作者 | 李永政、郝新兵 |
绘制单位 | 华北计算机系统工程研究所、中国信息安全研究院有限公司、中国信息安全研究院有限公司 |
更多格式 | 高清、无水印(增值服务) |