《表1 人工采集的数据信息》

《表1 人工采集的数据信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于引文内容的图书被引动机研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

数据处理过程主要针对以下情况进行数据过滤:(1)合并处理。部分文献作者相同,内容无异,仅标题有个别字的差异;部分文献被翻译成英文文献,且被发表在不同的期刊中,对于这些情况我们仅将其当成一篇文章处理,其引用不重复累计;(2)纠错处理。由于期刊的页面排版等因素,部分文献的引用出现在错版的文章中,因此这些引用无效,需要剔除掉;(3)删除处理。部分文献在引用过程中没有标注参考文献编号;部分文献无法在国内的主流数据库检索到,也无法在搜索引擎中获得全文,因此这些文献也无法获取引文内容信息。经过数据清洗,我们最终得到399本图书的引文句及其上下文(构建的图书引文内容语料库具体情况见表1)。