《表4 不同算法在3个地图下的训练成功率》

《表4 不同算法在3个地图下的训练成功率》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于强化学习的两轮模型车控制仿真分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

按照算法对应的参数及模型车的奖惩规则进行实验,每一回合记录一次模型车奖励值,对三种强化学习算法在3种地图下的奖励值进行数据分析。由于回合数较多,用平均值替代每10个回合数的奖励值。模型车无碰撞行驶超过两圈的次数在总训练次数中所占的比例称为训练成功率,如表4所示。