《表4 各类算法实验数据对比》
如图6所示,Mask R-CNN[25]由两级组成,第一级结构与Faster R-CNN相同,用于扫描图像并生成建议区域,第二级分类建议并生成边界框和掩码。Mask R-CNN的结构具体分为5个部分:特征提取网络、特征组合网络、区域建议网络、ROI Align和功能性网络。特征提取网络的作用是对输入图像进行特征提取并生成特征映射图。特征组合网络重新组合特征映射图,从而表现出不同的特征信息。区域建议网络采用锚定(Anchor)技术来标定出图像中的候选框位置,利用非极大抑制(NMS)过滤出精准的候选框。ROI Align是一个引入双线性插值的池化过程,目的在于使离散的池化过程变成连续的过程,从而弥补感兴趣区域池化粗糙量化的问题,提高了定位候选框的准确性,实验数据如表4所示。
图表编号 | XD00115172300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 罗元、王薄宇、陈旭 |
绘制单位 | 重庆邮电大学光电工程学院、重庆邮电大学光电工程学院、重庆邮电大学光电工程学院 |
更多格式 | 高清、无水印(增值服务) |