《表3 批尺寸对实验结果的影响》
因此对于本分类实验来说,batch_size选择过小会导致修正方向不收敛,选择过大会由于迭代次数的减少造成参数修正过于缓慢,甚至计算机显存根本无法完成训练任务。因此实验选择批梯度下降法,在合理范围内增加batch_size,使网络模型达到最优收敛精度,提高内存利用率,控制训练振荡,提高数据处理速度和并行化效率,但这也会增加训练时间和收敛难度,降低模型稳健性。由于训练使用图像处理器(GPU)进行,当batch_size为2的幂次时效率更高,因此经调参后采用最优参数组合,设置学习率为0.0003,最大迭代次数为100000,batch_size设置为16、32、64、128、256进行比较分析,如表3所示。
图表编号 | XD00119123400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.10 |
作者 | 姜晓佳、高树辉 |
绘制单位 | 中国人民公安大学刑事科学技术学院、中国人民公安大学刑事科学技术学院 |
更多格式 | 高清、无水印(增值服务) |