《表3 本文模型与其他模型在Food-101数据集的比较》
注:加粗字体为最优结果。
此外,本文同时在食物图片识别领域与经常使用的食物图片数据集Food-101进行了比较,并取得了最好的结果,具体如表3所示。目前在Food-101数据上的识别率最高达到90.27%,该模型使用了基于残差算法的宽残差网络。本文采用以注意力网络为基础的多级卷积神经网络识别模型,在只有两级网络的情况下达到89.5%的正确率,在3级网络的时候达到91.4%的正确率,超过了其他所有模型。文献[14]采用基于注意力机制在同一张图片上生成多个注意力区域,然后对每个区域提取特征进行分类,达到了86.5%的正确率,低于本文的91.4%,主要原因是食物图片与鸟类图片的结构完全不同,没有清晰、明显的物理结构。同一张食物图片上多个区域的特征相关性很高,造成特征利用效率降低。同时也证明了本文设计的模型可以较好地定位食物目标细粒度区域。
图表编号 | XD0082897100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.16 |
作者 | 梁华刚、温晓倩、梁丹丹、李怀德、茹锋 |
绘制单位 | 长安大学电子与控制工程学院、长安大学电子与控制工程学院、长安大学电子与控制工程学院、长安大学电子与控制工程学院、长安大学电子与控制工程学院 |
更多格式 | 高清、无水印(增值服务) |