《表4 t-SNE NLOF算法与采用其他的降维算法对异常检测结果的影响》

《表4 t-SNE NLOF算法与采用其他的降维算法对异常检测结果的影响》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于t-SNE降维预处理的网络流量异常检测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表3是基于t-SNE NLOF算法进行异常检测和基于LOF算法进行异常检测的性能比较。表4是采用t-SNE NLOF算法与采用其他的降维算法对异常检测结果影响的比较。图3是采用t-SNE算法和采用其他的降维算法对异常检测结果影响的比较。图3(a)是基于t-SNE LOF算法进行异常检测的结果图。图3(b)是基于LOF算法进行异常检测的结果图。图3(c)是基于主成分分析(Principal Component Analysis,PCA)算法降维,之后采用LOF算法进行异常检测的结果图。图3(d)是基于局部线性嵌入(Locally Linear Embedding,LLE)算法降维,之后采用LOF算法进行异常检测的结果图。图中灰色圈中为异常的网络数据包,其余部分为正常的网络数据包。从表3中可以看出,基于t-SNE LOF算法进行异常检测算法比基于LOF算法进行异常检测算法的准确率、检测率和F1分别高3.18个百分点、0.02个百分点和0.0001。基于t-SNE NLOF算法进行异常检测算法比基于LOF算法进行异常检测算法的准确率、检测率和F1分别高3.25个百分点、0.34个百分点和0.0041。从图3可以看出,基于t-SNE NLOF算法进行异常检测算法得到的正常网络数据包的决策边界更加清晰,因此能够更加准确地划分出有攻击的网络数据包。基于LOF算法进行异常检测算法得到的正常网络数据包的决策边界略模糊,容易将边界处的正常的网络数据包误分为异常的网络数据包。一个可能的解释是,高维的网络数据包特征中可能包含很多冗余信息,因此对LOF算法划分正常网络数据包的决策边界造成了干扰,进而导致有网络数据包被误分。从表4可以看出,本文提出的t-SNE LOF算法的准确率、检测率、精确度和F1值都比PCA LOF算法和LLE LOF算法高。也就是说,采用t-SNE算法降维后采用LOF算法进行异常检测能够得到更高的异常检测性能。一个可能的解释是,采用t-SNE算法在降维时,通常使高维空间的概率分布和低维空间的概率分布尽可能地相似。该算法在降维时没有信息损失。采用PCA算法降维时,只保留影响较大的特征,该算法在降维时有信息损失。因此,与PCA算法和LLE算法相比,t-SNE算法能够更好地表征网络数据包的低维特征。从表4可以看出,本文提出的t-SNE NLOF算法的准确率、检测率、精确度和F1值都比t-SNE LOF算法高。一个可能的解释是,本文提出的t-SNE NLOF算法能够检测异常点和异常簇,因此具有优于t-SNE LOF算法的性能。