《表3 不同模型在MS COCO数据集上的评价结果对比》
在MS COCO数据集上将AFAR分别与Multimodal RNN[7]、DeepVS[16]、Google NIC[8]、gLSTM[17]、Soft-Attention[11]、Hard-Attention[11]模型进行性能对比,Multimodal RNN是双向循环神经网络的图像描述模型;DeepVS是引入Multimodal RNN结构并由对齐关系映射图像文本的图像描述模型;Google NIC是具有代表性的编码器-解码器结构的图像描述模型;gLSTM是将NIC模型结合LSTM网络的图像描述模型;Soft-Attention和Hard-Attention是空间注意力图像描述模型,前者将区域特征与权值相乘求和,后者只取权值最大的区域特征作为解码网络的输入。对比实验结果如表3所示,加粗数值表示当前最高。
图表编号 | XD00163214500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.10 |
作者 | 韦人予、蒙祖强 |
绘制单位 | 广西大学计算机与电子信息学院、广西大学计算机与电子信息学院 |
更多格式 | 高清、无水印(增值服务) |