《表3 训练集设置:一种基于集成学习的钓鱼网站检测方法》

《表3 训练集设置:一种基于集成学习的钓鱼网站检测方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于集成学习的钓鱼网站检测方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文选定同样使用集成方法的检测方法作为比较对象。庄蔚蔚[11]等人提出的SVMNB系统以改进支持向量机和拓展贝叶斯分类器为基础分类器。冯庆[12]等人提出的IPDWS系统通过对网页URL,网页链接以及页面文本信息进行特征提取。丁岩[15]通过规则匹配和逻辑回归结合建立分类器,与前两文不同的是,本文提出了三条规则对网页进行预过滤,满足了实时监测的要求。此外,本文以决策树为基分类器构造集成分类器。与丁岩[15]不同的是,本文规则针对HTTPS提出,且扩大了特征集合,使用了集成学习方法。在特征提取方面,本文不仅提取了URL字符特征,还对网页的DNS、Whois信息、网页文本、子链接以及PageRank等特征进行了提取。针对以上三种检测方法,本文设置了对比实验进行分析,表3和表4是训练集和测试集样本设置的数目。其中,Phish数据集共有130个使用了HTTPS的网站,Yahoo共有432个使用了HTTPS的网站。