《表1 实验数据概览:基于“precision-recall”曲线分析的高被引论文识别研究》

《表1 实验数据概览:基于“precision-recall”曲线分析的高被引论文识别研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于“precision-recall”曲线分析的高被引论文识别研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了进行不同学科领域的对比分析,并保证实验结果的普适性,本文选取地球物理学、计算机与自动化、力学、图书情报和药学等5个学科领域为研究对象,相关实验数据集来源于《中国学术期刊网络出版总库》(CNKI)。采用人工收集的方式,在2017年11月15日-2017年11月25日之间,获取5个学科收录在《中文核心期刊要目》(2014版)的90本期刊刊载的、发表在2004-2016年间的文献,去除“投稿启示”“会议通知”、广告等无意义的记录,最终得到448 749篇文献。其中,仅有157篇文献的下载量为0,即99.97%的文献至少被下载1次,下载量最高的1篇文献达到79 816次;84.83%的文献至少被引用1次,被引最高的1篇文献达到2 602次。考虑到文献下载量中的“自下载”数量无法获取,为了保持下载和被引的一致性,本文没有排除被引次数中的“自引”情况;此外,由于无法获取文献每次被下载或被引用的准确时间,因此,本文所指的文献下载量和被引量均是获取时间点的中国知网统计的文献下载量和被引频次。实验数据具体情况见表1所示。