《表3 叠加不同模块的效果》

《表3 叠加不同模块的效果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于多空间混合注意力的图像描述生成方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在线下验证实验中,本文叠加多空间注意力和视觉选择模块进行训练,融合成本文所提出的混合注意力进行优化模型。从表3的结果来看,在没有使用策略梯度微调模型的情况下,还是能够使结果达到比较好的效果。当加上策略梯度优化时能够极大地提升混合注意力模型解释特征的能力。这里的强化学习算是一种优化手段,本质上也是在复杂模型提供的参数空间中寻找最优的参数优化指标,最终还是混合注意力起到了作用,使得该模型的图像描述能力提升,获得了较高的评价分数。同时实验统计了编解码模型在前向的耗时,编码前向平均每帧平均耗时200 ms,解码前向每帧平均耗时40 ms。