《表1 图文数据集的信息:中文图文数据集构建》
图像标题生成的研究需要大量图文数据作为支撑,图文数据是由图像和图像描述组成的数据。目前,已有图像标题生成的图文数据集主要是英文的,如MSCOCO[2]、Flickr8k[3]、Flickr30k[4]、SBU[5]、IAPR-TC12[6]、PASCAL[7]、Visual Genome[8]和Multi30K[9];也有德文和日文数据集,如IAPR-TC12和Multi30K有德文版,STAIR Caption[10]为日文数据集;中文数据集有AIC[11](AI challenger)以及由Flickr8k翻译成中文的Flickr8k-CN[12]。各数据集的信息如表1[13]所示,样例如图1所示。
图表编号 | XD00173684400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.24 |
作者 | 邓洲、刘茂福、胡慧君、冯文贺 |
绘制单位 | 武汉科技大学计算机科学与技术学院、武汉科技大学智能信息处理与实时工业系统湖北省重点实验室、武汉科技大学计算机科学与技术学院、武汉科技大学智能信息处理与实时工业系统湖北省重点实验室、武汉科技大学计算机科学与技术学院、武汉科技大学智能信息处理与实时工业系统湖北省重点实验室、广东外语外贸大学语言工程与计算实验室 |
更多格式 | 高清、无水印(增值服务) |