《表1 SQuAD数据集样例展示》
实验数据采用的是SQu AD数据集。该数据集包含107.7K个(文档,问题,答案)三元组。其中,87.5K个问答对作为训练集,10.1 K个问答对作为验证集,10.1K个问答对作为测试集。该数据集从维基百科中随机选取了536篇文档,采用众包的方式,工作人员对每篇文档提出问题,并标记正确答案。每篇文档平均包含250个单词,每个问题平均含有10个单词,问题的答案是原文档中的一个单词或者一个连续片段。相比于CNN/Daily Mail数据集,SQu AD数据集更有挑战性。表1是SQu AD数据集的一个样例展示。
图表编号 | XD00206705300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.16 |
作者 | 曹卫东、李宏伟、王怀超 |
绘制单位 | 中国民航大学计算机科学与技术学院、中国民航大学计算机科学与技术学院、中国民航大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |