《表3 3个基准数据集的信息》
本文实验采用Corel5k[19]、EspGame[8]和Iaprtc12[8]这3个在图像标注领域常用的数据集.Corel5k是图像标注常用的标准图像库,其中包含自然风光、人文生活等多目标图像,共包含大小为192×168的5 000幅彩色图像,每幅图像都被人工标注1个~5个标签,平均每张图像能被3.4个标签标注,总共有260个标签出现.EspGame数据集是从在线交互式游戏中获取的20 770张图像,其中包括商标、绘图、风景和人物照片等.其中,每幅图像从游戏中提取1个~15个标签,平均每幅图包含4.7个语义标签,总共有268个标签注释.Iaprtc12数据集由19 627张图像构成,涵盖运动、行为、人物、动物、城市、风景等方面.其关键词是从图像的标语或字幕中提取.在Iaprtc12数据集中,图像包含语义标签数最多为23个,最少为1个,平均每幅图像有5.7个语义标签,所有标签数为291.在3个数据集中,EspGame和Iaprtc12数据集在图像和标签数上都大于Corel5k,其中,Iaprtc12图像中包含的标签数最多,标注难度最大.数据集中标签和图像的详细信息见表3.
图表编号 | XD00136468400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 顾广华、曹宇尧、李刚、赵耀 |
绘制单位 | 燕山大学信息科学与工程学院、河北省信息传输与信号处理重点实验室(燕山大学)、燕山大学信息科学与工程学院、河北省信息传输与信号处理重点实验室(燕山大学)、燕山大学信息科学与工程学院、河北省信息传输与信号处理重点实验室(燕山大学)、北京交通大学信息科学研究所 |
更多格式 | 高清、无水印(增值服务) |