《表2 分类性能对比:基于朴素贝叶斯算法的垃圾邮件过滤研究》
%
本次实验目的主要为了验证改进后的算法对于垃圾邮件的分类能力是否有所提高。从Ling-Spam语料库和UCI机器学习数据库中的垃圾邮件数据库中随机抽取500封邮件进行训练,500封邮件进行测试。实验1结果如表2所示。可以看到,改进后的NB算法在查准率上高于NB算法。随着开方次数的增加,查准率也在不断增加,但查全率有所下降,因为根据增加的z值可知,不同频率特征词之间的区分度增加,误判减少,判断更准确,但有可能漏掉了垃圾邮件。本文对此又引入了新的指标,调和率(F1值)。从表2中可以看到,开方在2次到5次之间的F1值都高于原有算法,且F1值相差不大,分类效果较好,其中z取3时,效果最好。
图表编号 | XD00144852100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.09.20 |
作者 | 王鹿、李志伟、朱成德、李永久 |
绘制单位 | 上海工程技术大学电子电气工程学院、上海工程技术大学电子电气工程学院、上海工程技术大学电子电气工程学院、上海工程技术大学材料工程学院 |
更多格式 | 高清、无水印(增值服务) |