《表1 网络参数配置:静态图像中采用混合卷积结构进行人群密度估计》
由于透视失真,图像通常包含尺寸相异的头部,具有相同尺寸感受野的卷积核不可能捕获不同尺度的人群密度特征。所以使用具有不同大小的局部感受野的卷积核来学习从原始图像到密度图的映射,即具有较大感受野的卷积核在较大头部对应的密度图上进行建模更有效;同时为了减少计算复杂度(要被优化参数的数目),使用较少数量的卷积核用于具有较大卷积核的卷积层。例如,网络前端扩张率为2的卷积列,9×9大小的卷积核取16个,而7×7的取32个。后端结合前端卷积层的输出,通过转置卷积层还原图片大小,并采用大小为1×1的卷积核进行卷积用于生成高质量密度图。网络配置的详细介绍如表1所示。所有的卷积层都使用填充(padding)来保持以前的大小不变。卷积层的参数表示为“conv(kernel size)@(number of filters)”,最大池化层在步长2的2×2像素窗口上进行,转置(分数步长)卷积层表示为“conv Transposed(kernel size)@(number of filters)”,PRe LU被用于非线性激活层。
图表编号 | XD00133937800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.01 |
作者 | 范绿源、仝明磊、李敏、南昊 |
绘制单位 | 上海电力学院电子与信息工程学院、上海电力学院电子与信息工程学院、上海电力学院电子与信息工程学院、上海电力学院电子与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |