《表3 Gigaword数据集规模》
Gigaword(1)是一个由英文新闻文章组成的数据集,共包括接近950万来自纽约时报(New York Times)等多个新闻源的新闻语料,其中部分文章包含一句话的简短新闻提要(headline)。将新闻提要与文章的首句话组成生成式摘要平行语料库,用于深度神经网络模型的训练与测试。Gigaword用于生成式文本摘要方法的数据规模见表3。
图表编号 | XD0054895100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.01 |
作者 | 侯圣峦、张书涵、费超群 |
绘制单位 | 中国科学院计算技术研究所智能信息处理重点实验室、中国科学院大学、中国科学院计算技术研究所智能信息处理重点实验室、中国科学院大学、中国科学院计算技术研究所智能信息处理重点实验室、中国科学院大学 |
更多格式 | 高清、无水印(增值服务) |