《表5 奖励函数的设置：基于深度强化学习的行星车路径规划方法研究》

《表5 奖励函数的设置：基于深度强化学习的行星车路径规划方法研究》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于深度强化学习的行星车路径规划方法研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

奖励函数的设置参见表5。其中，vt和vt-1分别为t时刻和t-1时刻行星车的速度信息；ωt和ωt-1为t时刻和t-1时刻行星车的角速度信息；dt和dt-1为t时刻和t-1时刻行星车相对终点的距离信息；θt和θt-1为t时刻和t-1时刻行星车相对终点的角度信息。

图表编号	XD00112167000 严禁用于非法目的
绘制时间
作者	周思雨、白成超
绘制单位	哈尔滨工业大学航天学院、哈尔滨工业大学航天学院
更多格式	高清、无水印（增值服务）

查看“表5 奖励函数的设置：基于深度强化学习的行星车路径规划方法研究”的人还看了

: 表1 区域一测试对比：改进A~*算法的智能车路径规划研究

: 表2 区域二测试对比：改进A~*算法的智能车路径规划研究

: 表3 区域三测试对比：改进A~*算法的智能车路径规划研究

: 表1 函数奖励值设置：基于区域扩张策略的势场强化学习算法路径规划研究

: 表1 蔓越莓信息表：一种基于概率路线图的月球巡航车路径规划算法

: 表1 实验参数设置：基于深度强化学习的轨道式巡检机器人巡检驻点规划方法

《表3 参数设置表：基于深度强化学

《表1 多中心临床试验数据》