《表4 3种视觉场景理解模型优缺点对比》

《表4 3种视觉场景理解模型优缺点对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《视觉场景理解综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

分别对比基于搜索的视觉场景理解模型的Im2Text[6];基于模板匹配的视觉场景理解模型的BabyText[8];基于语言模型的视觉场景理解模型的Google NIC[17]和SAT[18]等4种典型方法的性能及人类自然描述Human,其中Google NIC模型没有使用注意力模型。实验中使用PASCAL VOC数据集[69]与SBU数据集[6]作为实验数据集,使用BLEU@4[62]准则作为评价准则,即判断连续4个词汇是否相似。具体对比结果如表5所示。