《表3 特征提取数对比:多层次序列集成的高维数值型异常检测》
通常在高维数据中会包含噪声或者无关特征,常规的异常数据检测方法往往会忽略这种噪声特征。本文方法MRENSE和CINFO方法在进行异常数据检测的过程中都会对高维数据进行特征提取,本文将这2种方法提取出的特征数目进行对比,结果如表3所示。从表3可以发现,MRENSE在对数据进行提取的时候往往会保留较多的特征信息,其提取出的特征数基本上是CINFO方法提取特征数的2倍,具体原因可以由它们在进行特征提取过程中所使用的方法解释。在MRENSE中,使用了弹性网络对高维数据进行特征提取,而CINFO则使用了Lasso进行特征提取。弹性网络和Lasso都是一种线性回归模型,不同的是弹性网络使用L1和L2范数作为先验正则项进行训练,而Lasso仅使用L1范数作为先验正则项进行训练。当很多特征存在相关性的情况下,Lasso只从其中随机选择一个,而弹性网络在选择变量或者特征的时候没有数目的限制。弹性网络的最大优势在于其永远可以产生有效解,并且它训练的过程更加稳定。MRENSE在构建序列集成学习的过程中使用了弹性网络对高维数据进行特征提取,从而尽可能多地保留了与异常数据相关的特征,然后利用提取的特征进行异常数据的检测就可以实现对异常数据检测效果的提升。
图表编号 | XD00164195900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.01 |
作者 | 李科心、李静、邵佳炜、肖屹 |
绘制单位 | 南京航空航天大学计算机科学与技术学院、南京航空航天大学计算机科学与技术学院、国网上海市电力公司信息通信公司、国网上海市电力公司信息通信公司 |
更多格式 | 高清、无水印(增值服务) |