《表3 本文提出的恶意URL检测方案与其他方案的对比Tab.3 The malicious URL detection scheme proposed in this paper is compare
对已经采集到的420464个URL采用10折交叉验证方法,即每次将68079个恶意URL和310339个正常URL作为训练集,7564个恶意URL和34482个正常URL作为测试集,经过10次实验之后,将得到的实验结果取平均。如4.2节所述,我们从模型的准确率、召回率、假正率、F1四个方面评估模型的分类能力,并且与忽略词的位置和上下文信息、仅忽略上下文信息的情况作对比,结果如表3所示。可以看到检测能力上,本文提出的恶意URL检测方案检测能力要比其他检测方案好,但是三种方案的召回率都比较低,主要是由于难以在长度很短URL中捕获足够有效的信息,对于这部分样本的分类效果不佳,这也是未来的改进方向。
图表编号 | XD0039653800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.01 |
作者 | 吴海滨、张冬梅 |
绘制单位 | 北京邮电大学网络空间安全学院、北京邮电大学网络空间安全学院 |
更多格式 | 高清、无水印(增值服务) |