《表3 不同主题数K下分类准确率比较》
本文将SDS_TM模型用于文本分类任务,以验证模型整体有效性,文本分类准确率越高,则表示主题的特征表达能力越强。表3展示了四种算法在R8和20 News数据集上文本分类准确率随着主题数K的变化情况,可以看出SDS_TM模型在两个数据集上都能获得较高的准确率,精确推理算法EM算法比近似推断算法VB和GS算法的准确率较高。R8数据集上分类准确率较20 News数据集上较高,这可能由于文档大小对主题建模的影响,R8比20 News具有较短的词汇表,在R8数据上文本的稀疏性较小,能够获取更加相似的语义信息,更能有效地引导主题建模。
图表编号 | XD003886800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 居亚亚、杨璐、严建峰 |
绘制单位 | 苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |