《表1 三组论文的TTR值》

《表1 三组论文的TTR值》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于语料库的英语写作水平与词块运用关系研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

形符(token)类似于我们日常说的“词”,总形符数是语料库容量最常用的测量单位。类符(type)作为一个统计量,指语料库文本中任何一个独特的词性(word form)。重复出现的形符只能记作一个类符[9]。形符类符比,即TTR值,是衡量语篇文本词汇密度的常用办法,可说明文本中词汇的运用丰富度。TTR值越大,表明词汇的使用难度较低,词汇的多样性较少,反之,则表明词汇的使用种类较多且难度大。本文首先利用Emeditor文本编辑器,对高分组、中分组与低分组的语料进行文本降噪处理,清除原始语料中冗余内容,包括论文的致谢、目录及参考文献等部分,仅保留论文正文;然后,研究者将语料分别导入Antconc3.2.4w,依次点击“word list”与“start”按钮,得出三组论文形符与类符值。具体统计结果如表1: