《表3 基于交叉熵损失和基于强化学习训练模型在MSVD数据集上的性能对比》

《表3 基于交叉熵损失和基于强化学习训练模型在MSVD数据集上的性能对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于多模态信息的视频描述算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

表3展示了用三种不同的训练方式对本文提出的MIVCf模型进行改进的测试结果。其中MIVCf(Greedy)和MIVCf(Beam)表示使用交叉熵损失函数对提出的基准模型进行训练,Greedy表示使用贪婪搜索解码,Beam表示束搜索解码;MIVCf(CI-DER)表示将MIVCf(Greedy)作为预训练模型,然后利用基于强化学习训练算法来直接优化评价指标CIDER,对模型进一步优化训练得到的结果。从表中实验数据可以看出,MIVCf(CIDER)模型的评价指标得分均高于MIVCf(Greedy)和MIVCf(Beam),证明采用基于自判别序列训练的强化学习算法训练得到句子的质量效果好于贪婪搜索句子的质量。从表中可以看出,虽然模型直接优化的是CIDER指标,但是METEOR和BLEU@4都得到了相应提高。说明直接优化评价指标CIDER的策略梯度算法能够进一步对模型优化,提高视频描述生成句子的质量。