《表3 测试路线的平均偏差》
注:“*”表示未完成测试路线。
本文对奖励函数中不同超参数ζ训练出的模型进行了测试:当ζ=0.1时汽车更加注重横向奖励,使其在各条路径平均偏差都比较小,但无法完成有较多转弯的R5和R6路线;ζ=0.5和ζ=0.6时所有路径均能完成,但ζ=0.6时偏差距离小于ζ=0.5时的偏差距离;ζ=0.9时无法完成R3和R5。综合训练过程中不同ζ的训练效果和不同ζ模型的测试结果,可以看出,ζ=0.6时算法学习性能强,测试稳定性高,超参数ζ设置为0.6最为合适。
图表编号 | XD00163200700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.10 |
作者 | 胡学敏、成煜、陈国文、张若晗、童秀迟 |
绘制单位 | 湖北大学计算机与信息工程学院、湖北大学计算机与信息工程学院、湖北大学计算机与信息工程学院、湖北大学计算机与信息工程学院、湖北大学计算机与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |