《表1 每次迭代后的参数和损失函数》

《表1 每次迭代后的参数和损失函数》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于路径积分强化学习方法的蛇形机器人目标导向运动》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在图4(e)中,损失函数达到峰值4.243 m,这是因为训练过程碰到障碍物.每次迭代后的参数和损失函数如表1所示,第三次迭代后的损失函数r=0.027 m.实验结果表明,仅需3次迭代就能使损失函数收敛.