《表4 基于模型行为克隆方法的优点和局限性》

《表4 基于模型行为克隆方法的优点和局限性》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《模仿学习方法综述及其在机器人领域的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

相对于基于模型的BC方法,无模型的BC方法因为不需学习系统动力学,所以不需迭代学习,容易实现。但是,在学习轨迹时,无模型BC并不能保证在给定系统中所学轨迹的适用性。为此,难以将无模型方法应用于可达到状态集受限的欠驱动系统中。与无模型BC方法相反,基于模型的BC方法应用系统动力学的信息学习策略。即使在欠驱动的状态下,通过学习前向模型,基于模型的行为克隆方法也可以找到近似于专家行为的合适的轨迹。但是,学习前向模型不是一件容易的工作,并且基于模型的BC方法常常需要迭代学习,时间成本和计算成本较大。表4总结了本文中基于模型行为克隆方法的优点和局限性。