《表4 3种视觉场景理解模型优缺点对比》
分别对比基于搜索的视觉场景理解模型的Im2Text[6];基于模板匹配的视觉场景理解模型的BabyText[8];基于语言模型的视觉场景理解模型的Google NIC[17]和SAT[18]等4种典型方法的性能及人类自然描述Human,其中Google NIC模型没有使用注意力模型。实验中使用PASCAL VOC数据集[69]与SBU数据集[6]作为实验数据集,使用BLEU@4[62]准则作为评价准则,即判断连续4个词汇是否相似。具体对比结果如表5所示。
图表编号 | XD0043923000 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.10 |
作者 | 王忠民、王星、李刚、张福涛 |
绘制单位 | 西安邮电大学计算机学院、西安邮电大学陕西省网络数据智能处理重点实验室、西安邮电大学计算机学院、西安邮电大学计算机学院、西安邮电大学陕西省网络数据智能处理重点实验室、西安邮电大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |