《表1 训练样本数据分布》
对于黑白样本中都有的域名,按照其重要性来决定其标签。如某个域名在某个DGA家族出现过一次,同时在公司及相关行业域名白名单中也存在,将该域名定义为白样本;若是与英文词汇中某个词汇重叠,将其视为黑样本来看待。同时,将DGA域名家族添加到73个,丰富黑样本的同时也缓解了样本不均衡的问题,最终调整后的样本分布如表1所示。
图表编号 | XD00129456700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.25 |
作者 | 刘浩杰、皇甫道一、李岩、王涛 |
绘制单位 | 苏宁科技集团、苏宁科技集团、苏宁科技集团、苏宁科技集团 |
更多格式 | 高清、无水印(增值服务) |