《表2 大网络结构图:基于候选区域和并行卷积神经网络的行人检测》

《表2 大网络结构图:基于候选区域和并行卷积神经网络的行人检测》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于候选区域和并行卷积神经网络的行人检测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文采用卷积神经网络提取图像特征。由卷积神经网络的知识可知,理论上来说,网络结构越深能够提取到越抽象的特征,也就越有利于识别目标的分类。然而当检测的行人在图像中所占面积较小时,随着网络层数的加深,易因池化(Pooling)操作过多导致提取特征的丢失。由于图像中行人的大小可能差异很大,范围覆盖几十的像素高度到几百的像素高度,为了实现对图像中不同大小尺寸行人较好地检测,Yang等提出尺度依赖池化模型,基于输入图片的尺寸映射提取不同卷积层的特征,即利用深卷积层提取大目标的特征以及利用浅卷积层提取小目标的特征。该方法在一定程度上避免了深卷积层小目标提取的特征丢失问题,但同时也丢失了深卷积层中提取的小目标的高层抽象信息。Chen等通过提取小目标以及小目标的上下文信息(即小目标周围的像素信息),扩大了输入目标的尺寸,增强了小目标的特征,然后利用两条相同的卷积神经网络分别对小目标以及小目标的上下文信息进行特征提取,但是当目标的上下文信息比较单一时检测效果较差。上述方法前者是提取了单条卷积神经网络的深、浅层特征并输出到全连接层,后者是利用了两条相同的卷积神经网络,归根结底都是利用了单个卷积神经网络进行图像的特征提取。而本文在利用单个深层卷积神经网络(即大网络)进行特征提取的基础上,加入了一条浅层的网络结构(即小网络)进行补充。二者在卷积层数、卷积核尺寸、Channels(通道)数目以及池化层数目等方面存在明显差异。在本文的行人检测系统中,一张图像首先利用候选区域提取算法提取出候选框,接着这些候选框被同时输入大网络和小网络分别提取目标特征。文献[21]通过对卷积神经网络不同层级特征图进行可视化,发现不同的网络层级提取的特征也不一样,大网络层级较多,能够提取到目标的轮廓、形状等最具类别代表性的高级语义特征,可是当目标较小时,大网络提取的特征由于过多的池化降维会造成一定的损失,影响分类;小网络能够提取图像中目标的纹理、颜色等低层基础特征,由于层级和池化操作较少,不会像大网络一样造成特征过多丢失,但是小网络提取的简单特征对于目标的分类存在理解不足的问题。与单条网络只能提取深层特征或浅层特征(由网络层级数目决定)其中的一种输入全连接层不同,本文通过构建一大一小并行的卷积神经网络框架(PCNN),利用深、浅层网络实现了对目标高层抽象、代表性特征以及低层具象、基础特征的共同提取并保留,二者作为目标不同层次的特征,一起被输入到全连接层,能够在目标(尤其是小目标)的分类过程中互为补充,使得检测结果更加精确。下文的实验结果也验证了这一点。本文使用的并行网络的大、小网络结构分别见表2和表3。