《表6 作文各分数段评分的一致性》

《表6 作文各分数段评分的一致性》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《自动作文评阅系统评分效度验证及教学启示》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:人机分数差均值上标字母(如a,b,c)相同表示不存在显著差异(p>.05),不同则存在显著差异(p<.05)。

为进一步分析分数差的分布情况,本研究按照样本作文的人工分数将作文分为低(1~6分)、中(7~9分)、高(10~15分)三类,统计分析显示三类作文平均分存在显著差异(p<.01),然后分别比较其相邻吻合一致性和平均分数差(见表6)。结果表明,人机分数相邻吻合一致性在6~8分数段较高,为92.85%;在9~11分数段为中等,为81.37%;12~15分数段较低,仅为36.95%。人机分数差的均值也随分数段的上升而上升,单因素方差(One-way ANOVA)分析显示,三类作文的分数差存在显著差异(p=.000)。事后多重比较分析(Post hoc Turkey’s test)表明:低、中档作文的分数差不存在显著差异(p>.05),但均与高分档作文存在显著差异(p<.05)。不同等级作文平均分数差分布情况表明,该作文评阅系统有可能误判了人工判定的高分作文。