《表6 作文各分数段评分的一致性》
注:人机分数差均值上标字母(如a,b,c)相同表示不存在显著差异(p>.05),不同则存在显著差异(p<.05)。
为进一步分析分数差的分布情况,本研究按照样本作文的人工分数将作文分为低(1~6分)、中(7~9分)、高(10~15分)三类,统计分析显示三类作文平均分存在显著差异(p<.01),然后分别比较其相邻吻合一致性和平均分数差(见表6)。结果表明,人机分数相邻吻合一致性在6~8分数段较高,为92.85%;在9~11分数段为中等,为81.37%;12~15分数段较低,仅为36.95%。人机分数差的均值也随分数段的上升而上升,单因素方差(One-way ANOVA)分析显示,三类作文的分数差存在显著差异(p=.000)。事后多重比较分析(Post hoc Turkey’s test)表明:低、中档作文的分数差不存在显著差异(p>.05),但均与高分档作文存在显著差异(p<.05)。不同等级作文平均分数差分布情况表明,该作文评阅系统有可能误判了人工判定的高分作文。
图表编号 | XD00213815900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.01 |
作者 | 王建、张藤耀 |
绘制单位 | 商丘学院 |
更多格式 | 高清、无水印(增值服务) |