《表1 实验结果:开源硬件程序自动测评系统的研究与设计》
结果的评估(此处本研究只评估正确性,没有考虑相似性)指标采用了计算机领域常用的评价指标:准确率(Precision)、召回率(Recall)和F1值(F1-Measure)[25],以上指标常用于信息检索、统计分类、识别、预测等领域,也可用于评价测评方法的质量。其中,准确率反映了测评系统的查准率,召回率反映了测评系统的查全率。F1度量值为准确率和召回率的加权调和平均,F1值较高时说明实验方法较为理想。该方法在三道题数据集上的实验结果如表1所示。
图表编号 | XD00140734700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 傅骞、曾子龙、查聿翀、郑娅峰 |
绘制单位 | 北京师范大学教育学部、北京师范大学教育学部、北京师范大学教育学部、河南财经政法大学计算机与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |