《表1.SCI-CH语料库统计信息》

《表1.SCI-CH语料库统计信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《中国学者SCI论文中四词词簇结构特点研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本研究自建了中国学者SCI论文语料库,即SCI-CH语料库,语料库的总容量约为458万字,1 000篇学术论文。所有论文全部来自中科院SCI分区表中四个分区,选取每个分区中影响因子较高的国际期刊,发表时间为2014—2015年,覆盖的学科包括数学、物理、化学、生物、工程技术、农林科学、环境科学、地学这八个学科,且每个分区中每个学科选取的论文数目一致。所有论文的第一作者均为汉语姓名且所属单位为中国大陆的高等院校或研究所,论文中的作者信息、图表、致谢、附录等其他信息全部删除,只保留正文部分。具体数据见表1。在表1中,一区的字符数相对二、三、四区较少,这是由于国内学者在一区较高影响因子的期刊中发表论文数量有限,但即便如此,也可以完全满足建立语料库对于字符数的要求。 (1)