《表3 基于LDA模型的政策主题分析结果》

《表3 基于LDA模型的政策主题分析结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《政策与部门视角下中国网络空间治理——基于LDA和SNA的大数据分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验在Python程序下进行,结合sklearn(2)、matplotlib(3)等几个常用的数据分析包,将清洗完成后的6 445个关键词进行LDA建模分析。文本的分类主题是建立在主题词聚类基础上相对抽象的概念,根据不同粒度划分可计算出不同的主题数量,因此需要结合需求,对结果进行不断调试以达到最优求解。考虑到本研究中政策文本涉及部门数目较多,涉及面较广,选取的潜在主题数目分别为6个、8个、10个、15个和20个。根据不同数量的分类主题/主题词列表可以发现,当分类主题总数为15时,列表的语义提取效果最好。限于篇幅,这里在表中展示了15个潜在主题、概率指数前10位的主题词列表,部分结果如表3所示。