《表2 算法执行效率对比1》
将表1所用数据集修改为规模大小不同的五种数据集,测试各算法在不同规模的数据集中的执行效率,修改后的各数据集中离群点占比仍为3%。表2中截取距离R、近邻参数k均为各算法在对应规模数据集中达到最高检测准确率时的参数取值。通过对比三种算法在相应数据集检测达到最佳准确率时的运行时间,可更加公平地评价各算法的执行效率。由表2可知,随着数据集规模的增加,四种算法的运行时间都有所增加,NSD算法的平均运行时间为166.6 s,LDOF算法的平均运行时间为200 s,LOF算法的平均运行时间为232.4 s,CBOF算法的平均运行时间为207.4 s。相对于LOF、LODF、CBOF算法,NSD算法计算数据对象离群值时,对在截取距离R范围内没有邻居的对象不需要复杂的离群值计算过程,节省了计算开销,降低了执行时间。
图表编号 | XD00163352800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.05 |
作者 | 杜旭升、于炯、陈嘉颖、王跃飞、蒲勇霖、叶乐乐 |
绘制单位 | 新疆大学软件学院、新疆大学软件学院、新疆大学信息科学与工程学院、新疆大学信息科学与工程学院、新疆大学信息科学与工程学院、新疆大学信息科学与工程学院、西安交通大学软件学院 |
更多格式 | 高清、无水印(增值服务) |