《表5 模型生成字幕与真实字幕的对比》
模型生成的字幕如表5所示。从表5可以看出,一方面,生成字幕在整体语义信息上与真实字幕高度一致。对于CUB-200-2011数据集,生成的字幕不仅可以指出图片中鸟的主要颜色,还可以准确描述诸如鸟喙、翅膀、尾巴和脖子等细节部位的特征。对于Oxford-102数据集,生成的字幕可以准确描述花瓣的颜色和形状以及花蕊的颜色。而生成字幕中部分单词存在拼写错误是由于数据集中用词不规范,导致在制作单词表的过程中将拼写错误的单词也收录其中。另一方面,生成字幕在主语、谓语及宾语等常用句子组成的使用上符合自然语言使用规则且无明显的语法错误。在保证准确表达原图片内容的基础上,生成的字幕与真实字幕存在一定的差异,具有多样性的特点。
图表编号 | XD00143029700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.16 |
作者 | 杜海骏、刘学亮 |
绘制单位 | 合肥工业大学计算机与信息学院、合肥工业大学计算机与信息学院 |
更多格式 | 高清、无水印(增值服务) |