《表5 SQuAD数据集上的结果》
我们进一步分析各个模型在不同答案片段数量上的表现,本文按答案片段数量将测试集合分成5个部分,其分别为答案片段数量为1个到5个.本文绘制如图9、图10的EM和F1指标的随着答案片段数量的折线图.从表5中我们可以看到,当答案片段数量变多,准确地抽取出所有片段变得困难,所有模型性能都有所下降,但是我们的BERT-Boundary下降幅度缓慢.能够在5个片段时依然维持F1值在80以上的性能.
图表编号 | XD00163167900 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 苏立新、郭嘉丰、范意兴、兰艳艳、徐君、程学旗 |
绘制单位 | 中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学 |
更多格式 | 高清、无水印(增值服务) |