《表1 话题模型各类别数参考指标》

《表1 话题模型各类别数参考指标》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《前沿与动态:海外中国腐败研究述评——基于2012—2016年SSCI论文的分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文尝试利用话题模型将文章摘要分为4至12类。将类别数限定在这些范围内有以下两个原因:一方面,如果类别数过少,分类工作将失去鉴别文章议题的意义;另一方面,如果类别数过多则会为分类后的意义阐释工作带来困难。由于话题模型在建模时需输入拟聚类数量,因此我们依次尝试使用范围中的类别数。类别数的确定可通过模型指标和尝试性阐释确定。在客观指标方面,我们使用对数似然值、R方、话题一致性系数(Coherence)和AIC系数(表1对模型指标值进行了展示)。