《表2 两种方法的AUC值》
从实验可以看出,在准确性方面,两个算法差别不大,但在效率方面,EIF-CINFO有很大的提升。这是因为CINFO中的孤立森林每棵树只考虑到有限特征,导致在lasso回归中速度较慢。而EIF是基于对每个特征的考虑,因而在lasso回归筛选与离群点无关的特征时速度较快。表4为lasso降维时间的对比,可以看出EIF-CINFO中的lasso降维的时间要比CINFO的快很多,证明了之前的观点。因为EIF的随机超平面的隔离机制考虑了所有特征,用EIF得到的预备离群点能够更快地把与离群点无关的特征筛选出来。
图表编号 | XD00139599700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.10 |
作者 | 吴远超、范磊 |
绘制单位 | 上海交通大学网络空间安全学院、上海交通大学网络空间安全学院 |
更多格式 | 高清、无水印(增值服务) |