《表1 每次迭代后的参数和损失函数》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于路径积分强化学习方法的蛇形机器人目标导向运动》

在图4（e）中，损失函数达到峰值4.243 m，这是因为训练过程碰到障碍物.每次迭代后的参数和损失函数如表1所示，第三次迭代后的损失函数r=0.027 m.实验结果表明，仅需3次迭代就能使损失函数收敛.

图表编号	XD0038026400 严禁用于非法目的
绘制时间	2019.01.01
作者	方勇纯、朱威、郭宪
绘制单位	南开大学人工智能学院机器人与信息自动化研究所、南开大学人工智能学院机器人与信息自动化研究所、南开大学人工智能学院机器人与信息自动化研究所
更多格式	高清、无水印（增值服务）