《表2 生命科学学术英语语料库来源期刊》

《表2 生命科学学术英语语料库来源期刊》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《BioDEAP生命科学学术英语语料库的创建》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

根据语料库建设分层取样原则,语料采集时我们遵循了以下4个原则:1) 学科领域的代表性。按照国务院学位委员会、教育部2011年印发的学科专业目录生物学(学科代码0710)一级学科下设的植物学、动物学、生理学、水生生物学、微生物学、神经生物学、遗传学、发育生物学、细胞生物学、生物化学与分子生物学、生物信息学与计算生物学、生物物理学等12个二级学科分别选取期刊文章。2) 期刊的权威性。以中科院2015年JCR(Journal Citation Report)收录的8,618种理工科学术期刊分区表为主要参考并咨询行业专家意见,每个二级学科选取5-6种期刊,最终共确定53本期刊(见表2)。3) 语类的平衡性。按研究论文50%、综述文章35%、书评4%、讨论10%(包括评论、观点、论坛、访谈、科学与社会等栏目文章)、通讯1%(包括通讯、简讯、新闻报道)的比例抽选文章。文章类型的确定可以参照爱思唯尔(Elsevier)期刊库高级检索分类选项或者科学网文献类型选项。根据先导研究,每篇研究论文约6,500词,综述文章平均7,500词,书评约1,100词,讨论类文章约2,100词,通讯约1,500词,据此可以确定各子库的文本数量及抽取范围。4) 年代的最新性。所有文本全文收录(包括主题词、摘要、致谢部分)发表时间尽量控制在2010—2017年期间。