《表1 多模态深度学习的各应用场景涉及的问题》

《表1 多模态深度学习的各应用场景涉及的问题》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多模态深度学习综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

多模态深度学习的发展给多模态机器学习带来了革命性的发展,使得多模态机器学习完成了巨大的飞跃。Baltru2aitis等人[10]总结了多模态机器学习的研究情况,提出围绕多模态机器学习及在其之后的发展中需要克服的五个挑战:模态表示、模态传译、模态对齐、模态融合和合作学习。本文在多模态深度学习发展的前期,总结当前多模态深度学习在不同的多模态组合和学习目标下,其实现过程中的四个挑战,即模态表示、模态传译、模态对齐和模态融合。合作学习(colearning)主要围绕数据与数据之间的关系,不涉及多模态深度学习中神经网络的构造。本文在自然语言、视觉、声音这三个方向上,针对各应用场景,如语音识别和生成、事件探测、图像和视频描述、面部识别和表情分析、跨媒体检索等,展开对各个挑战的论述。表1概括了多模态深度学习在各应用场景中涉及的主要问题。表中“+”表示应用场景涉及问题类别;“+”的个数表示应用场景完成问题的难度;“-”表示应用场景未涉及问题类别。