《表3 双流结构和单流结构》

《表3 双流结构和单流结构》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多模态视觉语言表征学习研究综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对于输入的文本特征向量和视觉特征向量,有两种方式进行融合:一种是文本特征和视觉特征拼接,然后接一个自动编码器进行融合;另外一种就是分别对文本特征和视觉特征进行独立编码,然后通过交叉注意力机制实现不同模态信息的融合.具体见表3.