《表1 模型消融测试结果:面向新概念学习的图像描述生成模型》
注:黑体数据为最优值。
为了分析本文Att-DCC模型在引入不同图像特征信息(图像视觉特征、物体语义标签、空间注意力机制生成的视觉上下文信息)对于图像描述生成的作用,本文进行了消融实验测试,测试了Att-DCC模型在3种信息作用下的模型性能:(1)视觉特征,直接采用全局视觉特征作为LSTM的视觉信息输入;(2)语义标签,将采用CNN进行图像分类的语义标签作为LSTM的视觉信息输入;(3)全局视觉特征+语义标签+注意力,即Att-DCC模型所采用的实验情况。测试结果如表1所示。
图表编号 | XD00197695300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.10 |
作者 | 谢雨杰、杜友田、张潇 |
绘制单位 | 西安交通大学智能网络与网络安全教育部重点实验室、西安交通大学智能网络与网络安全教育部重点实验室、西安交通大学智能网络与网络安全教育部重点实验室 |
更多格式 | 高清、无水印(增值服务) |