《表2 词性与难度级别的相关系数》

《表2 词性与难度级别的相关系数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于语文教材语料库的文本阅读难度分级关键因素分析与易读性公式研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从级别内部来看,不同词类占比的排序是大体一致的,占比最高的基本都为动词、名词、助词、副词等词类,而像是习用语、略语、前接词等在所有级别中的占比都较低。本研究发现词类在不同级别的分布情况大致可以分为三类:第一类是线性变化组,即词类所占比例随着级别变化大致呈现出线性变化的趋势,例如,连词的比例随着级别升高而逐步增加,而拟声词的比例随着级别升高逐步降低。第二类是阶段变化组,在小学学段内部呈现线性变化趋势,而到初中或高中学段的趋势则趋于平稳或稍有波动,比如叹词词类、副词词类等。第三类是无规律组,即词类占比在级别变化过程中没有呈现出明显的变化规律,整体处在一个相对稳定的状态,比较有代表性的有名词、动词、数词等词类。为了更加精确判断不同词类与难度级别之间的关系,本文计算了每个词类的Spearman相关系数,统计结果如表2所示,可以看到,难度级别与连词(0.972)、拟声词(-0.970)、区别词(0.958)、后接词(-0.938)、状态词(-0.912)、副词(0.904)等词类有显著相关的关系。其中与连词、区别词、副词为显著正相关,也就是说随着难度级别的升高,文本中连词、区别词与副词的比例是逐渐增加的。首先,连词的语法功能在于连接并列成分,连词的出现会使句子的长度、复杂度以及信息量增加;副词一般用于加强对动作和事物性质的描绘,副词的出现会使句子的表达和内容更加丰富;区别词则更强调词与词之间的对比。因此连词、副词、区别词的比例增加会更使文本的信息和内容更加丰富,同时也就提升了阅读文本的难度。另一方面,难度级别与后接词、状态词显著负相关,其中后接词主要指词缀,比如“们、子、儿、头”等。而状态词则为“绿油油、红彤彤、整整齐齐”等侧重形象描绘的词。这些词更倾向于出现在面向低年龄段的文本中,而随着难度级别的升高其使用频率也会随之降低,因此会呈现出显著负相关的特点。在所有词类中,动词与难度级别的相关性是最低的,也就是说动词在所有级别中的占比是比较稳定的,不会有明显的变化趋势。