《表1 自动答题数据集:深度学习建模下的自动句子填空技术》
本文的数据主要来源于互联网题库中的高中英文单项选择题。考虑到某些重点题型会被反复考察,对于抓取到的答题数据,本文采用编辑距离过滤内容相似的题目对。当两个问题对之间的编辑距离小于8时,这两个题目被认为是同一个问题。最终,本文收集到了62 834条答题数据。进而,本文按照8∶1∶1的比率,将整个数据集分成训练集、验证集和测试集三个部分。数据集的分配情况如表1所示。
图表编号 | XD0070616200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.08.01 |
作者 | 陈志刚、华磊、刘权、尹坤、魏思、胡国平 |
绘制单位 | 科大讯飞股份有限公司人工智能研究院、认知智能国家重点实验室、科大讯飞股份有限公司人工智能研究院、科大讯飞股份有限公司人工智能研究院、认知智能国家重点实验室、中国科学技术大学信息科学技术学院、科大讯飞股份有限公司人工智能研究院、科大讯飞股份有限公司人工智能研究院、认知智能国家重点实验室、科大讯飞股份有限公司人工智能研究院、认知智能国家重点实验室 |
更多格式 | 高清、无水印(增值服务) |