《表3 双流结构和单流结构》
对于输入的文本特征向量和视觉特征向量,有两种方式进行融合:一种是文本特征和视觉特征拼接,然后接一个自动编码器进行融合;另外一种就是分别对文本特征和视觉特征进行独立编码,然后通过交叉注意力机制实现不同模态信息的融合.具体见表3.
图表编号 | XD00207321200 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.01 |
作者 | 杜鹏飞、李小勇、高雅丽 |
绘制单位 | 可信分布式计算与服务教育部重点实验室(北京邮电大学)、北京邮电大学网络空间安全学院、可信分布式计算与服务教育部重点实验室(北京邮电大学)、北京邮电大学网络空间安全学院、可信分布式计算与服务教育部重点实验室(北京邮电大学)、北京邮电大学网络空间安全学院 |
更多格式 | 高清、无水印(增值服务) |