《表2 分类性能对比:基于朴素贝叶斯算法的垃圾邮件过滤研究》

《表2 分类性能对比:基于朴素贝叶斯算法的垃圾邮件过滤研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于朴素贝叶斯算法的垃圾邮件过滤研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
%

本次实验目的主要为了验证改进后的算法对于垃圾邮件的分类能力是否有所提高。从Ling-Spam语料库和UCI机器学习数据库中的垃圾邮件数据库中随机抽取500封邮件进行训练,500封邮件进行测试。实验1结果如表2所示。可以看到,改进后的NB算法在查准率上高于NB算法。随着开方次数的增加,查准率也在不断增加,但查全率有所下降,因为根据增加的z值可知,不同频率特征词之间的区分度增加,误判减少,判断更准确,但有可能漏掉了垃圾邮件。本文对此又引入了新的指标,调和率(F1值)。从表2中可以看到,开方在2次到5次之间的F1值都高于原有算法,且F1值相差不大,分类效果较好,其中z取3时,效果最好。