《表1 人工采集的数据信息》
数据处理过程主要针对以下情况进行数据过滤:(1)合并处理。部分文献作者相同,内容无异,仅标题有个别字的差异;部分文献被翻译成英文文献,且被发表在不同的期刊中,对于这些情况我们仅将其当成一篇文章处理,其引用不重复累计;(2)纠错处理。由于期刊的页面排版等因素,部分文献的引用出现在错版的文章中,因此这些引用无效,需要剔除掉;(3)删除处理。部分文献在引用过程中没有标注参考文献编号;部分文献无法在国内的主流数据库检索到,也无法在搜索引擎中获得全文,因此这些文献也无法获取引文内容信息。经过数据清洗,我们最终得到399本图书的引文句及其上下文(构建的图书引文内容语料库具体情况见表1)。
图表编号 | XD0052173700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.25 |
作者 | 李卓、赵梦圆、柳嘉昊、周清清、章成志 |
绘制单位 | 南京理工大学经济管理学院信息管理系、南京理工大学经济管理学院信息管理系、南京理工大学经济管理学院信息管理系、南京理工大学经济管理学院信息管理系、南京理工大学经济管理学院信息管理系 |
更多格式 | 高清、无水印(增值服务) |