《表1 基于全部论文、高被引论文和高被引作者论文所识别的爆发词比较》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《共词分析预测研究前沿的表面效度研究:基于自然语言处理》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在科学计量领域，研究前沿的预测一般通过“爆发词探测（Burst detection）”的方式进行。本研究选用了Sci2进行了爆发词的探测，并针对全部论文、高被引论文和高被引作者分别形成3个前沿集:针对全部论文的前沿集Ι，针对高被引论文的前沿集Ⅱ和针对高被引作者的前沿集Ⅲ。表1显示了3个前沿集中不同分析单元（题名、摘要、关键词和全文）前5位的爆发词。横向比较来看，不同分析单元在研究前沿预测方面都存在着一定的效度风险，具体表现在，无论在哪个前沿集上，基于题名、摘要、关键词和全文而识别的前5位的爆发词差别都比较明显。例如，基于全部论文探测到的爆发词中，只有“群落”和“生境”两个词在4个分析单元上都被探测出。而在基于高被引论文和高被引作者所探测到的爆发词中，竟没有一个词被4个分析单元都探测为前5位的爆发词。纵向比较来看，在题名、摘要、关键词和全文4个分析单元上，基于3个不同的语料集而探测到的前5位的爆发词也无一能够完全匹配。

图表编号	XD0022797900 严禁用于非法目的
绘制时间	2018.03.15
作者	周文杰、张彤彤、高冲
绘制单位	西北师范大学、西北师范大学、西北师范大学
更多格式	高清、无水印（增值服务）