《表3 不同主题数K下分类准确率比较》

《表3 不同主题数K下分类准确率比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于语义分布相似度的主题模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文将SDS_TM模型用于文本分类任务,以验证模型整体有效性,文本分类准确率越高,则表示主题的特征表达能力越强。表3展示了四种算法在R8和20 News数据集上文本分类准确率随着主题数K的变化情况,可以看出SDS_TM模型在两个数据集上都能获得较高的准确率,精确推理算法EM算法比近似推断算法VB和GS算法的准确率较高。R8数据集上分类准确率较20 News数据集上较高,这可能由于文档大小对主题建模的影响,R8比20 News具有较短的词汇表,在R8数据上文本的稀疏性较小,能够获取更加相似的语义信息,更能有效地引导主题建模。