《表1 各主题标注及权重前五特征词》
刘非凡等人【21】对2003年到2012年情报学期刊进行聚类分析,得到8类主题;胡浪【22】对近五年来图情类核心期刊文章进行关键词比对与可视化分析,得到9种主题。本研究基于此设定N=9进行训练,发现图书馆学基础研究以及计量学基础等研究难以标注出。随着互联网时代的发展,情报学领域的研究领域扩大,故而本文设立N=25划分主题,注意到25类主题中有些主题特征词反复出现“研究热点、情报学、影响因子”,主题内容重复。。所以本文对N=10到N=24的主题进行实验和计算perplexity指标,经实验得N=18的perplexity指标为3145.77,数值较小,划分效果良好,再根据其国内情报学领域实际情况,最终确定主题数目为18。依据各主题高权重特征词和高权重论文的相关度,对18个主题进行人工标注。如主题高权重特征词为{h指数、影响因子、专利分析、学术期刊、引文分析},与该主题下《“影响因子百分位”与SNIP的跨学科评价效力实证分析》等高权重论文内容显著相关,则标注主题为信息计量学。在排除高权重特征与高权重论文不相符的主题之后,我们最终确定17个主题,各个主题权重前五特征词及标注见表1。
图表编号 | XD00121808800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.01 |
作者 | 舒文琛、周恩国、李岱峰、梁晓敏 |
绘制单位 | 中山大学资讯管理学院、中山大学资讯管理学院、中山大学资讯管理学院、中山大学资讯管理学院 |
更多格式 | 高清、无水印(增值服务) |