《表2 基于深度强化学习算法的自动驾驶模型训练环境、数据集和方法》

《表2 基于深度强化学习算法的自动驾驶模型训练环境、数据集和方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《视觉感知的端到端自动驾驶运动规划综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:WRC为World Rally Championship。

深度强化学习在基于视觉感知的端到端自动驾驶领域得到了较为广泛的应用。最初主要是利用基于值函数的强化学习方法来执行一些离散的驾驶动作(Yu等,2016;Wang和Chan,2017),随着众多基于策略的强化学习方法提出并成功应用于自动驾驶(Kendall等,2019;Jaritz等,2018),驾驶动作空间由离散变为连续,更加符合真实情况。由于强化学习中模型参数指数增长以及人为设定奖励函数较为困难,分层强化学习和逆向强化学习也相继被提出并成功应用于自动驾驶(Shi等,2019;Sharifzadeh等,2016)。表2总结了部分深度强化学习算法在自动驾驶领域的应用。