《表1 基元数量统计表:基于URL语言特征的钓鱼网站检测算法》

《表1 基元数量统计表:基于URL语言特征的钓鱼网站检测算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于URL语言特征的钓鱼网站检测算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

其中,英文词素包括前缀、词根和后缀。在汉语中,把单独的汉字作为一个词素。但考虑到实际的注册习惯,中文网址一般由汉语拼音构成,无声调的汉语拼音涵盖了所有的汉字,并且数量有限,所以在这里将无声调的汉语拼音作为中文的词素。各类基元数量如表1。