《表1 基于全部论文、高被引论文和高被引作者论文所识别的爆发词比较》

《表1 基于全部论文、高被引论文和高被引作者论文所识别的爆发词比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《共词分析预测研究前沿的表面效度研究:基于自然语言处理》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在科学计量领域,研究前沿的预测一般通过“爆发词探测(Burst detection)”的方式进行。本研究选用了Sci2进行了爆发词的探测,并针对全部论文、高被引论文和高被引作者分别形成3个前沿集:针对全部论文的前沿集Ι,针对高被引论文的前沿集Ⅱ和针对高被引作者的前沿集Ⅲ。表1显示了3个前沿集中不同分析单元(题名、摘要、关键词和全文)前5位的爆发词。横向比较来看,不同分析单元在研究前沿预测方面都存在着一定的效度风险,具体表现在,无论在哪个前沿集上,基于题名、摘要、关键词和全文而识别的前5位的爆发词差别都比较明显。例如,基于全部论文探测到的爆发词中,只有“群落”和“生境”两个词在4个分析单元上都被探测出。而在基于高被引论文和高被引作者所探测到的爆发词中,竟没有一个词被4个分析单元都探测为前5位的爆发词。纵向比较来看,在题名、摘要、关键词和全文4个分析单元上,基于3个不同的语料集而探测到的前5位的爆发词也无一能够完全匹配。