《表1 DDPG参数设置:基于时空特征融合的端到端无人车控制》
网络训练基于TensorFlow开源框架,DDPG参数设置如表1所示。其中,梯度下降更新时的Batch_size是16,网络优化器选用Adam;ξ为软更新参数;ζ为奖励函数的折扣因子;Buffer size为经验回收时缓冲区大小。
图表编号 | XD004743500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.28 |
作者 | 刘东杰、赵津、席阿行 |
绘制单位 | 贵州大学机械工程学院、贵州大学机械工程学院、贵州大学机械工程学院 |
更多格式 | 高清、无水印(增值服务) |