《表2 基于随机选取定标集方法的人机评分在各分数段上的样本数量对比情况》
注:语文作文的满分值为60分。报道分为考生的实际得分,由双评模式下经评卷教师1评、2评、仲裁等环节最终得出。报道分栏去除了未进行智能评分的样本。
以语文作文为例。在2018年安徽省高考语文作文评卷过程中,由学科评卷专家随机选取251份评卷样本,进行专家评分,并以此作为定标集,其分数分布如表1所示。在此定标集上训练评分模型后,计算机智能辅助评分系统完成对389 299份样本的智能评分。机评分与报道分的相关系数为0.953,总体一致率为93.67%。表2给出相应分数段、分差分布条件下的人机评分对比情况。
图表编号 | XD00120576400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.10 |
作者 | 何屹松、孙媛媛、张凯、付瑞吉 |
绘制单位 | 安徽省教育招生考试院、安徽省教育招生考试院、科大讯飞股份有限公司、科大讯飞股份有限公司 |
更多格式 | 高清、无水印(增值服务) |