《表3 各特征子集分类性能比较》

《表3 各特征子集分类性能比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向恶意网址检测的广谱特征选择与评估》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对于子集F5,由于CAE的选择评估标准依赖于单个特征与类别间的相关程度,评估值高的特征对于类别区分具有良好贡献,但是这也会造成相似特征会被同时选择,维度限制下,子集中特征相关性过高,整体贡献力有限。而子集F6则综合多种特征选择方法,有效避免了这一情况的发生。同时,子集F7相比于子集F5的未考虑子集特征间的相关性及子集F6的综合提取不仅评估了单个特征的贡献能力并一同评估特征间的相关性,在降维的同时,最大限度地维持子集的整体贡献值。所以,子集F7表现出更优性能。由表3可知,相对于子集F6,F7较F1的变化更加微小。实际上,子集F7仅包含了时间、数字与字母的转换频次、&与=的数量关系、域名级数、最长子路径长度5个特征,特征空间维度大幅下降,但检测准确率均高达99%,表明该特征子集适用于多类型分类器,具有普适性,是一组优秀的广谱特征。