《表3 参数设置表:基于深度强化学习的行星车路径规划方法研究》
算法的基础参数设置如表3所示。为了加快收敛速度,-贪婪法的参数从初始值1.0开始按照训练步数线性下降,如式(12)所示,直到?等于?final后不再变化。
图表编号 | XD00112166900 严禁用于非法目的 |
---|---|
绘制时间 | |
作者 | 周思雨、白成超 |
绘制单位 | 哈尔滨工业大学航天学院、哈尔滨工业大学航天学院 |
更多格式 | 高清、无水印(增值服务) |
算法的基础参数设置如表3所示。为了加快收敛速度,-贪婪法的参数从初始值1.0开始按照训练步数线性下降,如式(12)所示,直到?等于?final后不再变化。
图表编号 | XD00112166900 严禁用于非法目的 |
---|---|
绘制时间 | |
作者 | 周思雨、白成超 |
绘制单位 | 哈尔滨工业大学航天学院、哈尔滨工业大学航天学院 |
更多格式 | 高清、无水印(增值服务) |