《表4 不同算法在3个地图下的训练成功率》
按照算法对应的参数及模型车的奖惩规则进行实验,每一回合记录一次模型车奖励值,对三种强化学习算法在3种地图下的奖励值进行数据分析。由于回合数较多,用平均值替代每10个回合数的奖励值。模型车无碰撞行驶超过两圈的次数在总训练次数中所占的比例称为训练成功率,如表4所示。
图表编号 | XD00118919500 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.18 |
作者 | 晋帅、李煊鹏、何嘉颖、李纾昶、周敬淞 |
绘制单位 | 东南大学仪器科学与工程学院、东南大学仪器科学与工程学院、东南大学仪器科学与工程学院、东南大学仪器科学与工程学院、东南大学仪器科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |