《表1《寂静的春天》文本库总体概貌》

《表1《寂静的春天》文本库总体概貌》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于齐夫定律的学术英语批判性读写应用研究——以《寂静的春天》为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

科普文章语法并不复杂,理解文章的关键在于对相关专业词汇的认知。因此,指导学生有效阅读,并且促成其概念性理解,进行有效的输出,教师需要“提供恰当的新输入材料,并提供适当的输出帮助”(文秋芳2013)。为了协助学生完成最终输出任务,需要帮助学生补充所欠缺的语言知识,主要是给予词汇方面的帮助。从表1可知,全书104,719词,包括8,582个词型。根据齐夫定律,在自然语言的语篇库里,一个单词出现的频率与它在频率表里的排名成反比。根据相关的实验定律,100万自然语篇库中仅仅排序在前135个词汇就占据整个语料库的一半(王崇德1995),可见学生若要掌握文章大意,并不需要认识文章所有词汇;另外,考虑到语料库中最高频的词汇往往是冠词(如the)、代词(如this、we、his)或者介词(如of、in)等一些功能词汇,对理解内容型文本作用不大,因此有必要进行去停用词处理,去除功能词后,把剩下的内容实词按出现频次进行排列。如表1所示,文献各章节去停用词后的词表中,前20%左右的词型就能覆盖每章50%的内容(词型数量偏小,覆盖率会偏大,如第一章);而且随着语料规模的扩大,覆盖全库50%的词型在全库词型所占的比例在减小(如第十二章,本章词型数量较大),所以若要掌握全书语篇库50%的内容,大致仅需掌握558个内容实词,占全部实词词型的6.65%(如果不进行去停用词处理,这个比例会更小)。