《表4 3种视觉场景理解模型优缺点对比》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《视觉场景理解综述》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

分别对比基于搜索的视觉场景理解模型的Im2Text[6]；基于模板匹配的视觉场景理解模型的BabyText[8]；基于语言模型的视觉场景理解模型的Google NIC[17]和SAT[18]等4种典型方法的性能及人类自然描述Human，其中Google NIC模型没有使用注意力模型。实验中使用PASCAL VOC数据集[69]与SBU数据集[6]作为实验数据集，使用BLEU@4[62]准则作为评价准则，即判断连续4个词汇是否相似。具体对比结果如表5所示。

图表编号	XD0043923000 严禁用于非法目的
绘制时间	2019.01.10
作者	王忠民、王星、李刚、张福涛
绘制单位	西安邮电大学计算机学院、西安邮电大学陕西省网络数据智能处理重点实验室、西安邮电大学计算机学院、西安邮电大学计算机学院、西安邮电大学陕西省网络数据智能处理重点实验室、西安邮电大学计算机学院
更多格式	高清、无水印（增值服务）