《表1 各主题标注及权重前五特征词》

《表1 各主题标注及权重前五特征词》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于合著网络社区发现的情报学研究主题演化分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

刘非凡等人【21】对2003年到2012年情报学期刊进行聚类分析,得到8类主题;胡浪【22】对近五年来图情类核心期刊文章进行关键词比对与可视化分析,得到9种主题。本研究基于此设定N=9进行训练,发现图书馆学基础研究以及计量学基础等研究难以标注出。随着互联网时代的发展,情报学领域的研究领域扩大,故而本文设立N=25划分主题,注意到25类主题中有些主题特征词反复出现“研究热点、情报学、影响因子”,主题内容重复。。所以本文对N=10到N=24的主题进行实验和计算perplexity指标,经实验得N=18的perplexity指标为3145.77,数值较小,划分效果良好,再根据其国内情报学领域实际情况,最终确定主题数目为18。依据各主题高权重特征词和高权重论文的相关度,对18个主题进行人工标注。如主题高权重特征词为{h指数、影响因子、专利分析、学术期刊、引文分析},与该主题下《“影响因子百分位”与SNIP的跨学科评价效力实证分析》等高权重论文内容显著相关,则标注主题为信息计量学。在排除高权重特征与高权重论文不相符的主题之后,我们最终确定17个主题,各个主题权重前五特征词及标注见表1。