《表3 LDA模型和基于TF-IDF方法的LDA模型主题词汇分布结果(斜体为LDA模型)》

《表3 LDA模型和基于TF-IDF方法的LDA模型主题词汇分布结果(斜体为LDA模型)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《在线评论有用性的深度数据挖掘——基于TripAdvisor的酒店评论数据》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

其次,按照所确定的主题数训练两个模型,获得每个主题的词汇分布,词汇按出现的后验概率降序排序,如表3所示。与LDA模型比较,基于T F-I DF方法的LDA模型降低了主题间的词汇相似度,主题特色更鲜明。因此,尽管LDA模型的困惑度略优,但本文仍选择后者。