《表1 模型消融测试结果:面向新概念学习的图像描述生成模型》

《表1 模型消融测试结果:面向新概念学习的图像描述生成模型》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向新概念学习的图像描述生成模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:黑体数据为最优值。

为了分析本文Att-DCC模型在引入不同图像特征信息(图像视觉特征、物体语义标签、空间注意力机制生成的视觉上下文信息)对于图像描述生成的作用,本文进行了消融实验测试,测试了Att-DCC模型在3种信息作用下的模型性能:(1)视觉特征,直接采用全局视觉特征作为LSTM的视觉信息输入;(2)语义标签,将采用CNN进行图像分类的语义标签作为LSTM的视觉信息输入;(3)全局视觉特征+语义标签+注意力,即Att-DCC模型所采用的实验情况。测试结果如表1所示。