《表4 在第二组数据集上两种算法的性能比较》

《表4 在第二组数据集上两种算法的性能比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Centroid和EM结合的半监督文本分类》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表4可以看出,当在每类中的已标注样本数量增加到20个时,Centroid分类器在每个类别上的准确率和召回率有了不同幅度的提高。Centroid分类器的MacroF1值提高到了65.56%。而加入了1000个未标注文本后,Centroid-EM算法在大多数类别上的准确率或召回率有了不同程度的提高进而改善了各类上的F1值。Centroid-EM算法的分类MacroF1值达到了70.30%,比Centroid分类器的MacroF1值提高了4.74%。在“体育”类上,Centroid和Centroid-EM算法的F1值仍然保持较高的水平,而对“法制”这一类来讲,未标注文本数的增加改善了Centroid分类模型,因此Centroid-EM算法的F1值有了较明显的提高。这一结果再次验证了Centroid-EM算法的性能在一定程度上取决于初始Centroid分类模型的好坏这一结论。