《表4 人机分数差及相邻吻合一致率分布》
总的来说,该AWE系统的评分效度不尽如人意。描述性统计数据及三大效度指标都表明人机评分之间存在巨大差异,这就警示AWE系统开发者应着力提高机器的评分效度,同时教师应谨慎使用机器分数作为学业评估的一部分。
图表编号 | XD00213816100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.01 |
作者 | 王建、张藤耀 |
绘制单位 | 商丘学院 |
更多格式 | 高清、无水印(增值服务) |
总的来说,该AWE系统的评分效度不尽如人意。描述性统计数据及三大效度指标都表明人机评分之间存在巨大差异,这就警示AWE系统开发者应着力提高机器的评分效度,同时教师应谨慎使用机器分数作为学业评估的一部分。
图表编号 | XD00213816100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.01 |
作者 | 王建、张藤耀 |
绘制单位 | 商丘学院 |
更多格式 | 高清、无水印(增值服务) |