《表1 网络参数配置:静态图像中采用混合卷积结构进行人群密度估计》

《表1 网络参数配置:静态图像中采用混合卷积结构进行人群密度估计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《静态图像中采用混合卷积结构进行人群密度估计》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由于透视失真,图像通常包含尺寸相异的头部,具有相同尺寸感受野的卷积核不可能捕获不同尺度的人群密度特征。所以使用具有不同大小的局部感受野的卷积核来学习从原始图像到密度图的映射,即具有较大感受野的卷积核在较大头部对应的密度图上进行建模更有效;同时为了减少计算复杂度(要被优化参数的数目),使用较少数量的卷积核用于具有较大卷积核的卷积层。例如,网络前端扩张率为2的卷积列,9×9大小的卷积核取16个,而7×7的取32个。后端结合前端卷积层的输出,通过转置卷积层还原图片大小,并采用大小为1×1的卷积核进行卷积用于生成高质量密度图。网络配置的详细介绍如表1所示。所有的卷积层都使用填充(padding)来保持以前的大小不变。卷积层的参数表示为“conv(kernel size)@(number of filters)”,最大池化层在步长2的2×2像素窗口上进行,转置(分数步长)卷积层表示为“conv Transposed(kernel size)@(number of filters)”,PRe LU被用于非线性激活层。