《表3 参数设置表：基于深度强化学习的行星车路径规划方法研究》

《表3 参数设置表：基于深度强化学习的行星车路径规划方法研究》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于深度强化学习的行星车路径规划方法研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

算法的基础参数设置如表3所示。为了加快收敛速度，-贪婪法的参数从初始值1.0开始按照训练步数线性下降，如式（12）所示，直到?等于?final后不再变化。

图表编号	XD00112166900 严禁用于非法目的
绘制时间
作者	周思雨、白成超
绘制单位	哈尔滨工业大学航天学院、哈尔滨工业大学航天学院
更多格式	高清、无水印（增值服务）

查看“表3 参数设置表：基于深度强化学习的行星车路径规划方法研究”的人还看了

: 表3 区域三测试对比：改进A~*算法的智能车路径规划研究

: 表1 实验参数设置：基于深度强化学习的轨道式巡检机器人巡检驻点规划方法

: 表1 实验参数设置：基于深度强化学习的轨道式巡检机器人巡检驻点规划方法

: 表1 PPO算法参数：基于深度强化学习的三维路径规划算法

: 表2 即时回报参数设置：基于深度强化学习的弹道导弹中段突防控制

: 表3 参数配置表：基于深度递归强化学习的无人自主驾驶策略研究

《表2 动作划分表：基于深度强化学

《表5 奖励函数的设置：基于深度强