《表4 在第二组数据集上两种算法的性能比较》
从表4可以看出,当在每类中的已标注样本数量增加到20个时,Centroid分类器在每个类别上的准确率和召回率有了不同幅度的提高。Centroid分类器的MacroF1值提高到了65.56%。而加入了1000个未标注文本后,Centroid-EM算法在大多数类别上的准确率或召回率有了不同程度的提高进而改善了各类上的F1值。Centroid-EM算法的分类MacroF1值达到了70.30%,比Centroid分类器的MacroF1值提高了4.74%。在“体育”类上,Centroid和Centroid-EM算法的F1值仍然保持较高的水平,而对“法制”这一类来讲,未标注文本数的增加改善了Centroid分类模型,因此Centroid-EM算法的F1值有了较明显的提高。这一结果再次验证了Centroid-EM算法的性能在一定程度上取决于初始Centroid分类模型的好坏这一结论。
图表编号 | XD00111173900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.16 |
作者 | 阿力木江·艾沙、殷晓雨、库尔班·吾布力、李喆 |
绘制单位 | 新疆大学信息科学与工程学院、新疆大学网络与信息技术中心、新疆大学信息科学与工程学院、新疆大学信息科学与工程学院、新疆大学网络与信息技术中心 |
更多格式 | 高清、无水印(增值服务) |