《表1 3种无监督方法的预测效果》

《表1 3种无监督方法的预测效果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于孤立森林采样策略的企业异常用水模式检测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

计算样本“代表性”的方法有多种,常用的无监督方法有iForest、HBOS和LOF,LOF的特点是根据样本局部的密度来计算样本的得分,但是忽略样本领域外的样本对其产生的影响,HBOS假设每个特征独立,将每个特征以直方图的形式离散化,然后计算特征在离散区间上频率的乘积作为样本的得分,该方法简单、快速,但是前提假设较强,当特征之间相关性较强时效果会受到影响,iForest通过样本被“孤立”的程度作为样本的得分,并且建立多颗相互独立的子树,综合考虑多颗子树的得分。本文分别测试该3种方法在该数据集的表现,如表1所示,综合比较3种方法预测的AUC和查全率,选择效果较好的iForest作为计算样本“代表性”的方法。