《表1 机器评分与人工评分在试题题型上的人分散度对照表(n=100)》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《机器自动口语测试的信度和效度研究——以MyET口语测试系统为例》
数据的描述性统计显示:机器评分的平均成绩(32.08)略低于人工评分的平均成绩(37.04、34.95、37.09);机器评分的最低分为8.4、最高分为45.8,而人工评分的最低分为0,最高分分别为53.00、53.04、55.28。机器评分与人工评分在试题题型上的人分散度对比结果如表1所示,可以看出:机器评分的总难度系数(0.53)略低于人工评分平均的总难度系数(0.61),但在Part A和Part B上,两者的难度差异并不大;Part C上的机器评分难度系数(0.40)与人工评分平均的难度系数(0.52)的差异虽然较大,但此部分三个评分员也呈现出较大差异,这说明人工评分对口头作文的评分标准较难把握;人工评分平均的总区分度(0.53)远高于机器评分的总区分度(0.29),尤其在Part A和Part B上,机器评分出现了趋中性。此外,从标准差来看,人工评分平均的总标准差为14.36,而机器评分的总标准差只有7.64,再次反映了机器评分的趋中性。
图表编号 | XD0096487400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 黄骞、王海军 |
绘制单位 | 浙江工业大学之江学院、浙江工业大学之江学院 |
更多格式 | 高清、无水印(增值服务) |