《表1 基于模仿学习算法的自动驾驶模型训练环境、数据集和方法》

《表1 基于模仿学习算法的自动驾驶模型训练环境、数据集和方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《视觉感知的端到端自动驾驶运动规划综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录
注:BDDV为Berkeley Deep Drive Video dataset,Sim4CV为A Photo-Realistic Simulator for Computer Vision Applications,TROCS为The Open Racing Care Simulator,CARLA为Center for Advanced Research on Language Acquisition。

为了达到模仿学习模型的训练目的,有两种设置可以应用(Attia和Dayan,2018):一种是被动设置,即向智能体提供按照最优策略执行全轨迹的训练集;另一种是主动设置,即允许智能体向专家提出动作查询,专家在特定时间内返回所需执行的动作。对应的两种较为流行的模仿学习的方法分别是行为克隆(behavioral cloning,BC)和DAgger。本文从行为克隆、DAgger的衍生模型以及其他方法3个方面介绍模仿学习。表1总结了模仿学习算法的部分应用。