《表2 评分员在不同时段的整体严厉度估计》

《表2 评分员在不同时段的整体严厉度估计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《大规模教育考试作文评分中的严厉度漂移研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

怀特图的第4列为评分员的严厉度估计。从图形可知,严厉度的分布要远远窄于考生能力估计的分布,且宽松的评分员略多于严厉的评分员。严厉度的跨度约为1.8个量尺单位(-0.83~+0.98),大致相当于原始分数量尺的1.8分(8.04~9.79)。怀特图第5列表示每个评分时段的整体平均严厉度水平。比较第4列和第5列可知,评分员的严厉度的个体变异要远大于评分员整体严厉度在时段间的变异。评分员在不同时段的整体严厉度估计值见表2。从表2可以看出,评分员的整体严厉度在5个时段间存在显著的差异(χ2=1400.9,df=4,p<0.01)。评分员在当前评分任务上的整体评分趋势是从严厉走向宽松,整体严厉度从第1天的+0.15变化为最后1天的-0.18。