《表1 生成的一些主题词汇示例》

《表1 生成的一些主题词汇示例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《结合语义相似度改进LDA的文本主题分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表2显示了各种方法的主题词聚类性能结果,其中分别计算了聚类中前15和前30个单词的准确性。可以注意到,LDA和Classify-LDA在Rand-index方面表现较为相似。SS-LDA在Rand-index方面优于LDA和ClassifyLDA。对于Entropy指标,Classify-LDA优于LDA,而SS-LDA再次获得最佳性能。这是因为当主题的个数较多时,在Classify-LDA算法中的人工标注阶段,可能会出现某个词与多个主题都较为对应的情况,就可能会出现标注错误的后果,这对实验的结果会造成一定的影响。而本文SS-LDA使用常识知识充当LDA模型的监督,基于单词之间的相似性将两个相关或相似单词分配到同一个主题中。此外,所有算法的性能随着考虑的单词数量的增加而降低。