《表1 实验结果:开源硬件程序自动测评系统的研究与设计》

《表1 实验结果:开源硬件程序自动测评系统的研究与设计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《开源硬件程序自动测评系统的研究与设计》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

结果的评估(此处本研究只评估正确性,没有考虑相似性)指标采用了计算机领域常用的评价指标:准确率(Precision)、召回率(Recall)和F1值(F1-Measure)[25],以上指标常用于信息检索、统计分类、识别、预测等领域,也可用于评价测评方法的质量。其中,准确率反映了测评系统的查准率,召回率反映了测评系统的查全率。F1度量值为准确率和召回率的加权调和平均,F1值较高时说明实验方法较为理想。该方法在三道题数据集上的实验结果如表1所示。