《表1 训练样本数据分布》

《表1 训练样本数据分布》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种通用的恶意域名检测集成学习方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对于黑白样本中都有的域名,按照其重要性来决定其标签。如某个域名在某个DGA家族出现过一次,同时在公司及相关行业域名白名单中也存在,将该域名定义为白样本;若是与英文词汇中某个词汇重叠,将其视为黑样本来看待。同时,将DGA域名家族添加到73个,丰富黑样本的同时也缓解了样本不均衡的问题,最终调整后的样本分布如表1所示。