《表1.SCI-CH语料库统计信息》
本研究自建了中国学者SCI论文语料库,即SCI-CH语料库,语料库的总容量约为458万字,1 000篇学术论文。所有论文全部来自中科院SCI分区表中四个分区,选取每个分区中影响因子较高的国际期刊,发表时间为2014—2015年,覆盖的学科包括数学、物理、化学、生物、工程技术、农林科学、环境科学、地学这八个学科,且每个分区中每个学科选取的论文数目一致。所有论文的第一作者均为汉语姓名且所属单位为中国大陆的高等院校或研究所,论文中的作者信息、图表、致谢、附录等其他信息全部删除,只保留正文部分。具体数据见表1。在表1中,一区的字符数相对二、三、四区较少,这是由于国内学者在一区较高影响因子的期刊中发表论文数量有限,但即便如此,也可以完全满足建立语料库对于字符数的要求。 (1)
图表编号 | XD0021980600 严禁用于非法目的 |
---|---|
绘制时间 | 2018.05.25 |
作者 | 姜晓艳 |
绘制单位 | 江苏师范大学 |
更多格式 | 高清、无水印(增值服务) |