《表3 国外数据挖掘主题列表(部分)》

《表3 国外数据挖掘主题列表(部分)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《中外图书情报学领域数据挖掘研究现状对比分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文基于开源包JGibbLDA[12]对LDA主题模型的参数训练,并使用Gibbs Sampling进行参数后验估计,根据学科特点和实验数据将主题数K设为30,迭代次数设为500,超参数α=1.67(50/K)、β=0.1,截取与主题相关程度大的前20个词。LDA主题抽取共获得3个重要的文件[13]:(1)。该文件包含了与主题相关程度最大的词(见表3)。(2)wordmap.txt。该文件给出语料库中每个词的编号。(3)。该文件展示了文献集中每个词语和主题的对应关系。