《表3 有标记样本比例为20%时, 5个对比算法在8个数据集上的平均分类正确率 (±标准差) Tab.3 When labeled samples is 20%, the classification

《表3 有标记样本比例为20%时, 5个对比算法在8个数据集上的平均分类正确率 (±标准差) Tab.3 When labeled samples is 20%, the classification   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《结合相似度的朴素贝叶斯半监督自训练方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在图4中,随着有标记样本比例的增加,5个算法在9个数据集中的正确率逐渐接近并趋于稳定值。其中NB算法在有标记样本比例高的情况下有运算速度快,准确率高的优势,但在有标记样本不足的情况下,分类精度较低。NBST算法在初始有标记样本分布好的情况下,也有一定优势,整体优于NB算法。NNBST相比NBST算法,在相同条件下得到更高的正确率。NBSTSMUC算法在Blood Transfusion Service Center这个数据集中占有优势。在其他数据集中,样本属性之间的关联不强,朴素贝叶斯分类器效果更好。通过对比,本文提出的NBSTCS算法在各个数据集上有一定优势。