《表1 大规模考试智能评卷应用实施流程》
注:本次应用涉及多科目题型,数据提供进度不统一,各阶段时间有重合
如表11,2020年进行了英语作文的人机对比大分差仲裁,按照超过两倍阈值(>8分,总分25分)共计发出96人份数据,有31份样本重新给分,可见,引入机评起到了较好的质检作用,智能评分效果也较好。本次语文作文根据人机评分分差超过17分的交由专家复核,共下发306份复核,重新给分1份。从相关度和一致率指标上看,智能评分总体水平达到人工水平,在人机不一致部分有一定的质检效果,但还需要持续改进研究以获得更好效果。
图表编号 | XD00204271200 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.10 |
作者 | 符耀章、刘明岩、马彪、江光贤 |
绘制单位 | 科大讯飞科技股份有限公司考试业务研发部 |
更多格式 | 高清、无水印(增值服务) |