《表2 敏感词统计表:基于URL语言特征的钓鱼网站检测算法》

《表2 敏感词统计表:基于URL语言特征的钓鱼网站检测算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于URL语言特征的钓鱼网站检测算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

通过上述分析的钓鱼网站和合法网站的子域名在语言特征上的差异,将常用的公共后缀、“-”、“.”、数字和知名的主级域名定义为敏感词。其中,知名主级域名是从Alexa网站上获取的排名前500的网站,去重后记录下这些网站的主级域名,并将其放入白名单。敏感词的分类和数量如表2所示。敏感词的匹配过程同词素一样。敏感度的定义如下。