《表3 特征提取数对比:多层次序列集成的高维数值型异常检测》

《表3 特征提取数对比:多层次序列集成的高维数值型异常检测》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多层次序列集成的高维数值型异常检测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

通常在高维数据中会包含噪声或者无关特征,常规的异常数据检测方法往往会忽略这种噪声特征。本文方法MRENSE和CINFO方法在进行异常数据检测的过程中都会对高维数据进行特征提取,本文将这2种方法提取出的特征数目进行对比,结果如表3所示。从表3可以发现,MRENSE在对数据进行提取的时候往往会保留较多的特征信息,其提取出的特征数基本上是CINFO方法提取特征数的2倍,具体原因可以由它们在进行特征提取过程中所使用的方法解释。在MRENSE中,使用了弹性网络对高维数据进行特征提取,而CINFO则使用了Lasso进行特征提取。弹性网络和Lasso都是一种线性回归模型,不同的是弹性网络使用L1和L2范数作为先验正则项进行训练,而Lasso仅使用L1范数作为先验正则项进行训练。当很多特征存在相关性的情况下,Lasso只从其中随机选择一个,而弹性网络在选择变量或者特征的时候没有数目的限制。弹性网络的最大优势在于其永远可以产生有效解,并且它训练的过程更加稳定。MRENSE在构建序列集成学习的过程中使用了弹性网络对高维数据进行特征提取,从而尽可能多地保留了与异常数据相关的特征,然后利用提取的特征进行异常数据的检测就可以实现对异常数据检测效果的提升。