《表5 奖励函数的设置:基于深度强化学习的行星车路径规划方法研究》
奖励函数的设置参见表5。其中,vt和vt-1分别为t时刻和t-1时刻行星车的速度信息;ωt和ωt-1为t时刻和t-1时刻行星车的角速度信息;dt和dt-1为t时刻和t-1时刻行星车相对终点的距离信息;θt和θt-1为t时刻和t-1时刻行星车相对终点的角度信息。
图表编号 | XD00112167000 严禁用于非法目的 |
---|---|
绘制时间 | |
作者 | 周思雨、白成超 |
绘制单位 | 哈尔滨工业大学航天学院、哈尔滨工业大学航天学院 |
更多格式 | 高清、无水印(增值服务) |