《表4 评分者间与评分者内部一致性》

《表4 评分者间与评分者内部一致性》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《语文作文经典评分与人机结合评分的比较研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

Conquest软件除了可以计算出参数估计值之外,还能提供估计值的符合度统计量(fit statistics)。评分者宽严度符合度统计量(未加权统计量与加权统计量)是衡量评分者内部一致性的指标。未加权和加权统计量的期望值均为1,Linacre认为其理想取值范围为0.5~1.5[16],亦有研究者定为0.8~1.2[17]或0.7~1.3[18],本研究采用Linacre的标准,如果评分者的未加权和加权统计量在此范围之内,表明内部一致性较好。由表4可见,3号评分者虽然最为严厉,但内部一致性较好。4号评分者在使用人机结合评分时,宽严度估计值的未加权和加权统计量均大于1.5,该评分者在使用经典评分时偏宽松,使用人机结合评分时偏严厉,也可进一步说明其自身的内部一致性较差,而非受到特定评分方式的影响。其余评分者在使用两种不同的评分方式时内部一致性均表现良好。