《表1 3种无监督方法的预测效果》
计算样本“代表性”的方法有多种,常用的无监督方法有iForest、HBOS和LOF,LOF的特点是根据样本局部的密度来计算样本的得分,但是忽略样本领域外的样本对其产生的影响,HBOS假设每个特征独立,将每个特征以直方图的形式离散化,然后计算特征在离散区间上频率的乘积作为样本的得分,该方法简单、快速,但是前提假设较强,当特征之间相关性较强时效果会受到影响,iForest通过样本被“孤立”的程度作为样本的得分,并且建立多颗相互独立的子树,综合考虑多颗子树的得分。本文分别测试该3种方法在该数据集的表现,如表1所示,综合比较3种方法预测的AUC和查全率,选择效果较好的iForest作为计算样本“代表性”的方法。
图表编号 | XD00220553200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.01 |
作者 | 林青轩、郭强、邓春燕、王雅静、刘建国 |
绘制单位 | 上海理工大学复杂系统科学研究中心、上海理工大学复杂系统科学研究中心、上海理工大学复杂系统科学研究中心、上海理工大学复杂系统科学研究中心、上海财经大学会计与财务研究院 |
更多格式 | 高清、无水印(增值服务) |