《表1 参数设置:基于深度强化学习的移动机器人路径规划》
在本文中,Turtlebot的速度设置为向前3 m/s,其他方向0.05 m/s,w=0.03 rad/s。IDDDQN方法参数设置如表1所示,其中探索因子ε初始值为1,ε∈(0.05,1)随着机器人迭代次数的增加线性递减。网络中采用均方根的随机梯度下降方法(RMSProp)更新参数,其中动量系数设置为0.95。每次通过重采样优选机制从缓存记忆单元D中按概率抽mini-batch大小为64的样本更新网络。奖赏值设置如公式(10)所示:
图表编号 | XD0067434300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.01 |
作者 | 董瑶、葛莹莹、郭鸿湧、董永峰、杨琛 |
绘制单位 | 河北工业大学人工智能与数据科学学院、河北工业大学河北省大数据计算重点实验室、河北工业大学人工智能与数据科学学院、河北工业大学河北省大数据计算重点实验室、河北工业大学人工智能与数据科学学院、河北工程大学、河北工业大学人工智能与数据科学学院、河北工业大学河北省大数据计算重点实验室、河北工业大学人工智能与数据科学学院、河北工业大学河北省大数据计算重点实验室 |
更多格式 | 高清、无水印(增值服务) |