《表1 LAD和CEN中形符、类符数以及形次比》

《表1 LAD和CEN中形符、类符数以及形次比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于语料库的翻译共性研究——以《生死疲劳》英译本为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

词语的变化性是指相同长度的语料中不同词语的数量可通过语料库的类符形符比(Type-token Ratio,TTR)来衡量。7类符形符比是指语料库中类符(type)与形符(token)之间的比例,在一定程度上能够体现语料的用词变化性,但当较长的语料文本出现时,类符形符比已经不能全面、直接地衡量词汇的变化程度了。这是由于语料篇幅的增加,一些功能词汇便会不可避免地重复增多,TTR的数值便会被稀释,故此时的类符形符比不具备可比性。因此,标准类符/形符比所得到的数值可以理解为是对TTR进行了标准化处理后所得到的数值,我们称之为标准形次比(Standardized Type-token Ratio,STTR)。通过STTR值的大小可以较为准确、可靠地体现语料中词语的词汇变化与丰富度。STTR值与特定语料库中的词汇变化度与词语丰富度呈正相关关系,即STTR值越大,特定语料库中的词汇变化度越大,词语也越丰富,词语的重复率越低,反之亦然。表1是笔者运用Word Smith Tools 7.0分别统计的LAD和CEN语料库基本信息: