《表1 多分支注意力网络上层的参数》

《表1 多分支注意力网络上层的参数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《结合细粒度特征与深度卷积网络的手绘图检索》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

首先输入3幅图像:手绘图像、正样本自然图像和负样本自然图像。组成3元组图像对{(si,pi+,pi-)}iN=1,其中正样本自然图像与手绘图像的相似度大于负样本自然图像与手绘图像的相似度。将这3幅图像分别输入不同的分支中,手绘图像分支Net_S由4层卷积层和2层池化层组成,自然图像分支Net_N由5层卷积层和2层池化层组成。随着卷积层数的增加,特征的抽象性增大,对于自然图像,需要提取更抽象的特征与手绘特征进行匹配。所以在Net_N的第4层增加了1层卷积层,在不影响输出特征图大小的前提下,提高输出特征的抽象性,准确率提升1%,但如果继续增加卷积层,准确率反而下降,所以本文选择仅增加了1层。网络上层的具体参数如表1所示,其中第1层卷积使用15×15像素的卷积核,由于手绘图像缺少纹理信息,用较大一些的卷积核更适合草图建模,有助于捕获更多的结构化上下文信息,所以在网络中使用15×15的滤波器。在池化层中,传统的卷积神经网络(CNN)采用的最大池是2×2大小、步长为2,池化窗口没有重叠。为了提高准确性,使辨识度更高,对池化层进行重叠[10],采用3×3大小、步长为2的最大池,不需要额外的计算量,且能带来1%的改进。