《表1 多分支注意力网络上层的参数》
首先输入3幅图像:手绘图像、正样本自然图像和负样本自然图像。组成3元组图像对{(si,pi+,pi-)}iN=1,其中正样本自然图像与手绘图像的相似度大于负样本自然图像与手绘图像的相似度。将这3幅图像分别输入不同的分支中,手绘图像分支Net_S由4层卷积层和2层池化层组成,自然图像分支Net_N由5层卷积层和2层池化层组成。随着卷积层数的增加,特征的抽象性增大,对于自然图像,需要提取更抽象的特征与手绘特征进行匹配。所以在Net_N的第4层增加了1层卷积层,在不影响输出特征图大小的前提下,提高输出特征的抽象性,准确率提升1%,但如果继续增加卷积层,准确率反而下降,所以本文选择仅增加了1层。网络上层的具体参数如表1所示,其中第1层卷积使用15×15像素的卷积核,由于手绘图像缺少纹理信息,用较大一些的卷积核更适合草图建模,有助于捕获更多的结构化上下文信息,所以在网络中使用15×15的滤波器。在池化层中,传统的卷积神经网络(CNN)采用的最大池是2×2大小、步长为2,池化窗口没有重叠。为了提高准确性,使辨识度更高,对池化层进行重叠[10],采用3×3大小、步长为2的最大池,不需要额外的计算量,且能带来1%的改进。
图表编号 | XD0082898900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.16 |
作者 | 李宗民、刘秀秀、刘玉杰、李华 |
绘制单位 | 中国石油大学(华东)计算机与通信工程学院、中国石油大学(华东)计算机与通信工程学院、中国石油大学(华东)计算机与通信工程学院、中国科学院计算技术研究所智能信息处理重点实验室 |
更多格式 | 高清、无水印(增值服务) |